在大部分科研文献里面,我们基本都能看得到置信区间这个词汇,比如95%的置信区间。
我们都知道的是,统计学的本意是通过样本的情况去预估整体,比如我们需要通过样本的均值去预估总体的均值,但是只有一个单一的点估计量比较单薄,一般我们都会使用置信区间这一个概念去定义总体的均值,以95%的执行区间为例,该数值表明的统计学意义是有95%的概率确信整体的均值位于该区间内。那么如何使用样本均值去预估整体的置信区间,主要可以通过以下几步:
- 1、选择整体统计量
选择使用样本的均值去预估整体的均值μ - 2、求出其抽样分布
- 3、决定其置信水平
一般使用95%的置信区间,以95%的置信水平为例 - 4、求出置信上下限
利用置信水平和抽样分布求出了合适的置信区间。
简化的方法和公式
可以分布以下几种情况(markdown表格内不会插入公式,哎。。。。) - 总体为正态分布:θ2已知,n可大可小,X为样本的均值,可以通过以下简单公式计算
- 总体分布非正态:θ2已知,n非常大,X为样本的均值,可以通过以下公式进行计算
- 总体分布为正态或非正态:θ2未知,n很大(至少30),X为样本的均值,s2为样本的方差,可以通过下式计算置信区间
- 总体为二项分布:n很大,ps为样本比例,qs为1-ps,置信区间计算公式如下
c值取决于所需要的置信水平,只要以正态分布作为试验基础,就可以使用以下数值
置信水平 | C值 |
---|---|
90% | 1.64 |
95% | 1.96 |
99% | 2.58 |