置信区间

在大部分科研文献里面,我们基本都能看得到置信区间这个词汇,比如95%的置信区间。
我们都知道的是,统计学的本意是通过样本的情况去预估整体,比如我们需要通过样本的均值去预估总体的均值,但是只有一个单一的点估计量比较单薄,一般我们都会使用置信区间这一个概念去定义总体的均值,以95%的执行区间为例,该数值表明的统计学意义是有95%的概率确信整体的均值位于该区间内。那么如何使用样本均值去预估整体的置信区间,主要可以通过以下几步:

  • 1、选择整体统计量
    选择使用样本的均值去预估整体的均值μ
  • 2、求出其抽样分布
    E(\overline{x})= \mu \\ Var(\overline{x}) = \frac{\theta{^2}}{n}
  • 3、决定其置信水平
    一般使用95%的置信区间,以95%的置信水平为例
  • 4、求出置信上下限
    利用置信水平和抽样分布求出了合适的置信区间。
    简化的方法和公式
    可以分布以下几种情况(markdown表格内不会插入公式,哎。。。。)
  • 总体为正态分布:θ2已知,n可大可小,X为样本的均值,可以通过以下简单公式计算
    (\overline{X}- c\frac{\theta}{\sqrt{n}} ,\overline{X} + c \frac{\theta}{\sqrt{n}})
  • 总体分布非正态:θ2已知,n非常大,X为样本的均值,可以通过以下公式进行计算
    (\overline{X}- c\frac{\theta}{\sqrt{n}} ,\overline{X} + c \frac{\theta}{\sqrt{n}})
  • 总体分布为正态或非正态:θ2未知,n很大(至少30),X为样本的均值,s2为样本的方差,可以通过下式计算置信区间
    (\overline{X}- c\frac{s}{\sqrt{n}} ,\overline{X} + c \frac{s}{\sqrt{n}})
  • 总体为二项分布:n很大,ps为样本比例,qs为1-ps,置信区间计算公式如下
    (p_s - c\frac{p_s q_s}{\sqrt{n}} ,p_s + c \frac{p_s q_s}{\sqrt{n}})
    c值取决于所需要的置信水平,只要以正态分布作为试验基础,就可以使用以下数值
置信水平 C值
90% 1.64
95% 1.96
99% 2.58

参考资料

《深入浅出统计学》

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容