“一般零假设是想推翻的,备择假设是想证实的。”
当我们根据假设检验思想最终计算出结果并做出结论时,谁也不敢保证结论一定是正确的,任何结论都有错误的可能。
比如,
你做出嫌疑人有罪的结论,就存在冤枉好人的风险;你做出嫌疑人无罪的结论,就存在纵容恶人的风险。这实际上就是假设检验中的两类错误,我们通常称之为Ⅰ型错误和Ⅱ型错误。
1、一个例子
有一家化工厂, 一直在排放污染物。环保署接到举报,于是派调查人员前去展开调查。根据环保署的标准,排放浓度的上限是万分之三。所以调查人员就进行抽样调查,随机抽取了几个排放点,检测排放的污染物的浓度。经过调查人员的努力,调查结果出来了,排放浓度是万分之四,高于排放标准上限。那么现在问题来了:要不要让它关门整顿?
根据之前的理解,我们只是抽样而已,实际上工厂到底有没有达到上限,都是概率问题!
2、判断该工厂的排污浓度是否超标?
其实这里要用到假设检验思想,先设定原假设,即这家工厂的排污浓度没有超标(一般原假设是"否"设定)。
然后,根据收集的数据进行统计推断,最后计算统计量和P值,做出统计学结论。
结论只可能有两种:
一是认为超标;二是认为没有超标。
而事实也有两种:
一是实际上真的超标了;二是实际上并没有超标。
组合图如下:
所谓Ⅰ型错误,就是环保署冤枉了该厂,本来该厂的排污浓度并未超标,但环保署认为它超标了。在这种情况下,该厂吃亏了(无缘无故被勒令停工好几个月)。所谓Ⅱ型错误,就是你放纵了该厂,本来该厂的排污浓度超标了,环保署却认为它没有超标。在这种情况下,附近老百姓吃亏了(继续忍受污染)。
Ⅰ型错误和Ⅱ型错误通常又称为假阳性错误和假阴性错误, 一般用α和β来表示。
它们在不同领域有不同的含义。(可以参考GWAS分析中的假阳性和假阴性)
3、假阳性和假阴性之间的关系
Ⅰ型错误和Ⅱ型错误是一种此消彼长的关系,Ⅰ型错误增大,Ⅱ型错误会减少;反之,Ⅰ型错误减少,Ⅱ型错误会增大。
一个例子:
上图显示的是一组高血压人群和一组非高血压人群的收缩压分布情况,左边曲线下代表非高血压人群,右边曲线下代表高血压人群。可以看出,这两个人群有一定的交叉,换句话说,有一部分高血压人群会被误判为非高血压,有一部分非高血压人群会被误诊为高血压。
144mmHg作为划分标准(图中左边竖线),即大于147mmHg认为是高血压,否则认为是非高血压。
此时误诊率会比较高!
152mmHg作为划分标准(图中右边竖线),即大于152mmHg认为是高血压,否则认为是非高血压。
此时漏诊率会比较高!
重点理解下这俩错误的关系:
因此,如果提高标准,让标准更为苛刻,则可以降低假阳性,但同时会提高假阴性。同样,如果降低标准,让标准更为宽松,则可以降低假阴性,但同时会提高假阳性。
4、哪种错误更严重呢?
这取决于你站在哪一方。即你的目的是如何的!
从环保署的角度来看,可能Ⅰ型错误更严重,因为错误地控告该工厂,可能导致该工厂恶狠狠地反咬一口,环保署需要支付高额的赔偿金。从附近居民的角度来看,Ⅱ 型错误更严重,因为如果该工厂的排污浓度超标但环保署没有发现,那该工厂会继续排放污染物,危害居民健康。
目前,一般习惯上Ⅰ型错误设为0.05,把Ⅱ型错误设为0.1和0.2。但这并非固定的,如果你发现犯Ⅰ型错误特别严重,那就可以降低Ⅰ型错误的标准,如设为0.01。(这个标准是如何设置的呢?为什么0.05?Ⅰ型错误设置为0.05的意义何在?后续会更新)
我的理解是犯Ⅰ型错误的概率如果小于0.01,那么我基本认为就是这个结果了,即使误诊我也认了,因为概率太低了。