第八章 区间估计

参考书目为安德森的《商务与经济统计》,以下为个人的学习总结,如果有错误欢迎指正。有需要本书pdf的,链接在本文末尾。(仅限个人学习使用,请勿牟利)

第八章 区间估计

由于点估计量一般和总体参数有差异,所以经常在点估计上加减一个边际误差的值来计算区间估计。
区间估计:点估计\pm 边际误差

8.1 总体均值的区间估计:\sigma已知

计算边际误差,需要利用总体标准差\sigma或者样本标准差s

8.1.1 边际误差和区间估计

在Lloyd公司的例子中,每周要调查100名顾客的消费额,其中\bar x=82美元;总体标准差\sigma=20

根据公式:\sigma_{\bar x}=\frac{\sigma}{\sqrt{n}}=\frac{20}{\sqrt{100}}=2

image

通过查表,95%的值在均值左右\pm 1.96个标准差以内。所以\bar x的所有值有95%落在总体均值\mu左右\pm 3.92以内。

image

如何理解这个95%:我们相信有95%的把握,这个区间内包含总体均值。这个区间称作是在95%置信水平(confidence level)下建立的,其中0.95称作置信系数(confidence coefficient),区间称作95%置信区间(confidence interval)

总体均值的区间估计:\sigma已知
\bar x \pm z_{\alpha/2}\frac{\sigma}{\sqrt{n}}
1-\alpha为置信系数,z_{\alpha/2}表示标准正态概率分布上侧面积为\alpha/2时的z值。

比如构造95%的置信区间,那么置信系数1-\alpha=0.95,\alpha=0.05,\alpha/2=0.025
那么Lloyd公司的情况:\bar x=82,\sigma=20,n=100
82\pm 1.96\frac{20}{\sqrt{100}} 82\pm3.92

image

8.2 总体均值的区间估计:\sigma未知

t分布:是由一类相似的概率分布组成的分布族。每个t分布都对应一个自由度,且自由度增大,t分布的变异幅度减小,与标准正态分布更相似。t分布的均值为0.

image

我们还可以根据自由度和不同的上侧面积来确定概率:
image

当t无穷大时,面积和标准正态分布一致。

8.2.1 边际误差和区间估计

总体均值的区间估计:
\bar x \pm t_{\alpha/2} \frac{s}{\sqrt{n}}

s为样本标准差,1-\alpha为置信系数,自由度为n-1,上侧面积\alpha /2
自由度以后再说

8.2.2 应用中的建议

总体服从正态分布,则上述的置信区间是精确的,如果不服从,则为近似的。当总体分布有严重偏斜或包含异常点时建议n到50。

8.2.3 利用小样本

image

这个小样本从直方图发现,并不能支持我们得出总体服从正态分布的结论,但是我们也没有发现任何的偏斜或者异常点。因此,我们可以对这个小样本以t分布为依据进行区间估计。

8.2.4 区间估计方法小结

image

8.3 样本容量的确定

前面知道边际误差,我们令E为我们希望达到的边际误差:E=z_{\alpha /2}\frac{\sigma}{\sqrt{n}}

总体均值区间估计中的样本容量:
n=\frac{(z_{\alpha /2})^2\cdot \sigma^2}{E^2}

我们可以确定一个置信水平,比如95%,那么z_{\alpha /2}=z_{0.025}=1.96
再选一个我们期望的E(边际误差),即可计算我们需要多少样本容量。

当然了,前提是\sigma已知,对于未知的,我们可以用\sigma的计划值,初始值。

  • 过往研究对总体标准差的估计值作为\sigma的计划值
  • 选取一个初始样本的标准差作为\sigma的计划值
  • 可以用极差除以4粗略的作为\sigma的计划值

8.4 总体比率

总体比率的区间估计:
\bar p \pm z_{\alpha /2}\sqrt{\frac{\bar p(1-\bar p)}{n}}
z_{\alpha /2}为标准正态分布上侧面积为\alpha /2时的z值。

8.4.1 样本容量的确定

同样令E为边际误差:E=z_{\alpha /2}\sqrt{\frac{\bar p(1-\bar p)}{n}}

总体比率区间估计的样本容量:(由于\bar p未知,用p^*来作为计划值)
n=\frac{(z_{\alpha /2})^2p^*(1-p^*)}{E^2}

同样这里的p^*可以用下面的方法来确定一个计划值:

  • 用以往类似样本的比率作为p^*的计划值
  • 选一个初始样本的比率作为p^*的计划值
  • 判断或最优猜测作为p^*的计划值
  • 都不知道,则p^*=0.5,因为此时p^*(1-p^*)取最大值0.25,让样本尽可能大。

链接: https://pan.baidu.com/s/1fc0q-Q4kj3g-7Fr4MHZaqw 提取码: 333c 复制这段内容后打开百度网盘手机App,操作更方便哦

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容