区间估计
1、总体均值的区间估计:已知情形
2总体均值的区间估计:未知情形
3、区间估计方法小结
总体均值的区间估计的两种方法:
对于已知的情形,利用标准正太分布和来计算边际误差并进行区间估计。
对于未知的情形,利用样本标准差 s 和 t 分布来计算边际误差并进行区间估计。
在绝大部分应用中,样本容量n30已经足够大。然而,如果总体服从或者近似服从正太分布,则可以采用更小的样本容量。对于未知情形,如果总体的分布是严重偏斜或者包含异常点时,建议将样本容量增加到n50。
4、样本容量的确定
5、总体比率
1)总体比率的区间估计
2)样本容量的确定
区间估计:总体参数估计值的一个区间,确定该区间将参数值纳入其中。在本章中,区间估计的形式是:点估计边际误差。
边际误差:为了建立总体参数的区间估计,从点估计值加上减去的值。
已知:在进行抽样之前,若历史数据或者其他信息给出了总体标准差的一个好的近似,称这种情形为已知,在区间估计中利用这个已知的值计算边际误差。
置信水平:与区间估计相关联系的置信度。例如,在使用区间估计方法得到的全部区间中,如果有95%的区间包含总体参数在内,则称区间估计是在95%的置信水平下构建的。
置信系数:用小数形式表示的置信水平。比如,95%置信水平的置信系数为0.95。
置信区间:区间估计的另一种叫法。
未知:在进行抽样之前,更普遍的情形是没有信息可用于估计总体标准差。我们称这种情形为未知。这时,在区间估计中计算边际误差是用的是样本标准差 s。
t分布:一类概率分布。当总体标准差未知而用样本标准差 s 对其进行估计时,该分布用于建立总体均值的区间估计。
自由度:t 分布的参数,当t分布用于计算总体均值的区间估计时,其自由度为n - 1,其中 n 是样本容量。