统计推断(区间估计)

一、置信区间的估计

1.统计推断:统计推断是基于样本统计量对总体参数给出统计学结论

2.常用方法:置信区间估计和假设检验

3.95%置信度的含义:100次抽样结果的100个95%置信区间中,平均而言有95个置信区间包含了真实的总体均数。置信度常用C表示

二、置信区间

(1)已知σ时μ的置信区间

1.样本量为n的简单随机抽样数据,估计总体均数μ的置信区间,当总体分布服从正态分布时,样本均数μ服从N(\mu,\frac{\sigma^2}{n})

2.对于一个观察到的样本,μ的置信度为C的置信区间为\overline{x}\pm z^\prime\times\sigma/\sqrt{n},其中\overline{x}为μ的估计值,z^\prime\times\sigma/\sqrt{n}为误差范围

3.z^\prime和C的关系为C越大则z^\prime越大


(2)置信区间的误差范围

1. 高置信度是指结果准确性高,误差范围小是指结果精确性高

2. 减小置信区间误差范围z^\prime\times\sigma/\sqrt{n}的方法:

①选择较低的置信度,从而得到更小的z^\prime

②选择更大的样本量n;

③减小σ


三、置信区间与样本量

1.合理的样本设计应在进行数据收集前先确定好统计推断方法,确定足够的样本量可使得后期置信区间的误差范围较小。

2.根据置信区间误差范围计算公式,计算简单随机抽样的样本量:

n=(z^\prime\times\frac{\sigma}{m})^2

3.实际应用中,样本量大小的选择,除上述公式计算结果外,还应考虑其他因素,如数据收集过程中所花费的成本等,确保研究方案实施的可行性。

4.严谨的设计通常会事先假定一个无应答率,并以此校正样本量的计算。


四、注意事项

1.公式不适用于所有抽样方法,不同的抽样方法需要采用不同估计公式。

2. 公式适用条件

(1)数据必须来自相应总体的简单随机抽样;

(2)个体间相互独立;

(3)事先假定总体标准差已知,实际研究中很可能无法得到总体标准差。

3.选用统计方法前需对数据进行探索性分析,检查异常值以及数据是否服从正态分布;

4. 统计分析无法拯救糟糕的数据;

5. 实际操作中的问题(如无应答与失访)会给抽样研究带来额外的误差,这些误差可能比随机抽样误差大得多,并且研究结果中这些误差并不能被误差范围所反映;

6. 统计推断的概率是指该方法重复进行的正确频率,但并不知道某一次结果的正确性。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容