参考书目为安德森的《商务与经济统计》,以下为个人的学习总结,如果有错误欢迎指正。有需要本书pdf的,链接在本文末尾。(仅限个人学习使用,请勿牟利)
第八章 区间估计
由于点估计量一般和总体参数有差异,所以经常在点估计上加减一个边际误差的值来计算区间估计。
区间估计:
8.1 总体均值的区间估计:已知
计算边际误差,需要利用总体标准差或者样本标准差
8.1.1 边际误差和区间估计
在Lloyd公司的例子中,每周要调查100名顾客的消费额,其中美元;总体标准差
根据公式:
通过查表,95%的值在均值左右个标准差以内。所以的所有值有95%落在总体均值左右以内。
如何理解这个95%:我们相信有95%的把握,这个区间内包含总体均值。这个区间称作是在95%置信水平(confidence level)下建立的,其中0.95称作置信系数(confidence coefficient),区间称作95%置信区间(confidence interval)
总体均值的区间估计:已知
为置信系数,表示标准正态概率分布上侧面积为时的z值。
比如构造95%的置信区间,那么置信系数,,
那么Lloyd公司的情况:,,
8.2 总体均值的区间估计:未知
t分布:是由一类相似的概率分布组成的分布族。每个t分布都对应一个自由度,且自由度增大,t分布的变异幅度减小,与标准正态分布更相似。t分布的均值为0.
我们还可以根据自由度和不同的上侧面积来确定概率:
当t无穷大时,面积和标准正态分布一致。
8.2.1 边际误差和区间估计
总体均值的区间估计:
s为样本标准差,为置信系数,自由度为n-1,上侧面积
自由度以后再说
8.2.2 应用中的建议
总体服从正态分布,则上述的置信区间是精确的,如果不服从,则为近似的。当总体分布有严重偏斜或包含异常点时建议n到50。
8.2.3 利用小样本
这个小样本从直方图发现,并不能支持我们得出总体服从正态分布的结论,但是我们也没有发现任何的偏斜或者异常点。因此,我们可以对这个小样本以t分布为依据进行区间估计。
8.2.4 区间估计方法小结
8.3 样本容量的确定
前面知道边际误差,我们令E为我们希望达到的边际误差:
总体均值区间估计中的样本容量:
我们可以确定一个置信水平,比如95%,那么
再选一个我们期望的E(边际误差),即可计算我们需要多少样本容量。
当然了,前提是已知,对于未知的,我们可以用的计划值,初始值。
- 过往研究对总体标准差的估计值作为的计划值
- 选取一个初始样本的标准差作为的计划值
- 可以用极差除以4粗略的作为的计划值
8.4 总体比率
总体比率的区间估计:
为标准正态分布上侧面积为时的z值。
8.4.1 样本容量的确定
同样令E为边际误差:
总体比率区间估计的样本容量:(由于未知,用来作为计划值)
同样这里的可以用下面的方法来确定一个计划值:
- 用以往类似样本的比率作为的计划值
- 选一个初始样本的比率作为的计划值
- 判断或最优猜测作为的计划值
- 都不知道,则,因为此时取最大值0.25,让样本尽可能大。
链接: https://pan.baidu.com/s/1fc0q-Q4kj3g-7Fr4MHZaqw 提取码: 333c 复制这段内容后打开百度网盘手机App,操作更方便哦