Chapter12 通过样本求总体均值或比例的置信区间

样本均值、比例等于总体均值、比例的点估计量,这是无偏样本最可能的情况。但是这一情况仍有可能是错误的,因为毕竟是一个样本的结果。
置信区间:总体统计量在某一区间内的可信程度,这一区间成为置信区间。

如何从样本推导出总体统计量的置信区间

1.如何从样本推算总体均值的置信区间

image.png

当样本数量很大时,均值的抽样分布符合正态分布,均值抽样分布的期望为总体的均值。均值的抽样分布中:事件X为一个个样本均值。
标准正态分布常用置信区间与上下限的关系如下:

置信水平 标准正态分布的置信区间
90% [-1.64,1.64]
95% [-1.96,1.96]
99% [-2.58,2.58]

假设选择的置信水平95%,则:
\frac{x-\mu }{\sigma_{抽样分布} } 在[-1.96,1.96]之间时置信水平为95% ,即(X-u)/sigma \frac{x-\mu }{\sigma_{抽样分布} } 95%置信水平的置信区间为[-1.96,1.96]之间。
\mu是均值抽样分布的期望:
\mu=E((X1+X2+ Xn)/n) = E(Xi)
Xi为总体的独立观测值,E(Xi)是每个Xi的期望,为总体的均值。

所以,抽样分布的\mu即是待求总体的均值

因为 \frac{x-\mu }{\sigma_{抽样分布} }在区间[-1.96,1.96] (95%置信水平下)
所以总体均值\mu = x-\sigma_{抽样分布} *[-1.96,1.96]在这一范围内可能性为95%
X为一个个的样本均值。
\sigma_{抽样分布} = \sqrt{\sigma^2/n}为均值抽样分布的标准差 ,其中\sigma^2是总体的方差。

2.如何从样本推算总体成功比例的置信区间

样本成功比例为Ps = Xs/n ~N(p, pq/n) (n>30),
其中Xs~B(n,p), p为总体成功的概率。

样本成功比例抽样分布的期望为p,即总体的成功比例

样本成功比例抽样分布中事件X为一个个比例样本Ps
(X-p)/\sigma_{抽样分布} 95%置信水平的置信区间为[-1.96,1.96]之间。
所以总体成功比例 p = Ps-\sigma_{抽样分布}*[-1.96,1.96]在这一范围内可能性为95%。\sigma_{抽样分布}=\sqrt{pq/n},可以用某一次的Ps ,Qs = 1-Ps近似代替p和q。

总的来说就是求抽样分布的均值(期望)的范围,利用某一次抽样的均值或比例,以及抽样分布的方差来计算其范围。

当样本很小,总体方差未知时,需要通过样本估计总体方差,而小样本估计方差会偏小很多,因此不能近似为正态分布。
此时X均值的分布符合t分布,自由度V = n-1,n越小,v越小,t分布的形态越扁平。用样本方差s^2估计总体方差\sigma ^2
t分布的标准分为:T= \frac{\bar{X}-\mu}{s/\sqrt{n}}
通过置信区间,查表的标准分T的区间,X的均值为样本均值,s为样本方差(估计总体的方差),n样本大小已知,可以推算出总体均值u的范围。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

友情链接更多精彩内容