么什么是置信度(Confidence Level)?
我们看这样一个简单的例子,你扔了14次的钢镚,有8次正面朝上,6次背面朝上,你有多大的把握说钢镚不均匀,正面朝上的概率更大,这个把握就是置信度。
衡量置信度的方法有很多,有一种被称为“T-测试”( 也叫T检验)的方法,它可以告诉我们在看到某种看似有偏差的现象时,有多大的可能性可以判断这种偏差是因为随机性造成的,而非真正存在偏差。
具体到刚才这个扔钢镚的例子,如果14次有8次正面朝上,我们是否敢说这个“钢镚铸造有偏差”呢?
这里面有两种可能,其一是偏差确实存在。另一个原因是,它就是偶然造成的。那么这两种情况的可能性各是多大呢?
从数学上可以算出,前者的可能性是57%,后者是43%。也就是说,钢镚铸造有偏差这件事有可能是真的,但是我们不太确定。我们把自己有多么确定这件事也量化地衡量一下,它就是置信度。
具体到这个问题,置信度是57%,当然相反的结论“这个钢镚没有铸造问题”的置信度是43%,在统计上,我们一般认为,置信度不到95%的结论不大能相信。
那么怎么才能够提高置信度呢?通常的办法就是要增加所统计的样本的数量。
如果一直保持8:6这个正反面的比例,我们扔得次数越多,最后就越有把握说,“钢镚两面不均匀”。根据T-测试原理的计算公式可以得知,大概扔140次就能说置信度达到95%了。当然如果扔到几千次, 我们的置信度就能达到99%。也就是说,扔了140次以后,我们有95%的把握说,这个钢镚两面不匀,它造成了80:60的偏差。而运气的因素,只占剩下的5%。
置信度计算公式:
n =Z^2*S^2/d^2
其中:
n代表所需要样本量
Z:置信水平的Z统计量,如95%置信水平的Z统计量为1.96.
S:总体的标准差;
d :置信区间的1/2,在实际应用中就是容许误差,或者调查误差.