置信区间

置信区间

在大部分科研文献里面，我们基本都能看得到置信区间这个词汇，比如95%的置信区间。
我们都知道的是，统计学的本意是通过样本的情况去预估整体，比如我们需要通过样本的均值去预估总体的均值，但是只有一个单一的点估计量比较单薄，一般我们都会使用置信区间这一个概念去定义总体的均值，以95%的执行区间为例，该数值表明的统计学意义是有95%的概率确信整体的均值位于该区间内。那么如何使用样本均值去预估整体的置信区间，主要可以通过以下几步：

1、选择整体统计量
选择使用样本的均值去预估整体的均值μ
2、求出其抽样分布
$E(\overline{x})= \mu \\ Var(\overline{x}) = \frac{\theta{^2}}{n}$
3、决定其置信水平
一般使用95%的置信区间，以95%的置信水平为例
4、求出置信上下限
利用置信水平和抽样分布求出了合适的置信区间。
简化的方法和公式
可以分布以下几种情况（markdown表格内不会插入公式，哎。。。。）
总体为正态分布：θ²已知，n可大可小，X为样本的均值，可以通过以下简单公式计算
$(\overline{X}- c\frac{\theta}{\sqrt{n}} ,\overline{X} + c \frac{\theta}{\sqrt{n}})$
总体分布非正态：θ²已知，n非常大，X为样本的均值，可以通过以下公式进行计算
$(\overline{X}- c\frac{\theta}{\sqrt{n}} ,\overline{X} + c \frac{\theta}{\sqrt{n}})$
总体分布为正态或非正态：θ²未知，n很大（至少30），X为样本的均值，s²为样本的方差，可以通过下式计算置信区间
$(\overline{X}- c\frac{s}{\sqrt{n}} ,\overline{X} + c \frac{s}{\sqrt{n}})$
总体为二项分布:n很大，p_s为样本比例，q_s为1-p_s，置信区间计算公式如下
$(p_s - c\frac{p_s q_s}{\sqrt{n}} ,p_s + c \frac{p_s q_s}{\sqrt{n}})$
c值取决于所需要的置信水平，只要以正态分布作为试验基础，就可以使用以下数值

置信水平	C值
90%	1.64
95%	1.96
99%	2.58

参考资料

《深入浅出统计学》

最后编辑于：2021.05.20 10:44:04

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

置信区间

参考资料

相关阅读更多精彩内容

友情链接更多精彩内容