一、假设检验的两种方式
- 拒绝域检验
依据显著性水平α和构造统计量的分布形态,确定拒绝域范围。计算样本统计值,看是否落在拒绝域内,如果落在拒绝域内,则拒绝原假设。 - P值检验
P值为,当假设原假设(H0)为真时,所得到的样本观测结果或更极端结果出现的概率。如果该值小于显著性水平,则拒绝原假设。
P值的3个影响因素:
1)样本观测值与总体参数的差异
2)样本的个数
3)被假设参数的总体分布 - 拒绝域检验和P值检验比较
1)拒绝域的优点是进行决策的边界明显,但是进行决策面临的风险也是笼统的
2)P值检验反映了样本观测值和总体参数不一致的概率,可以提供更丰富的信息。同时,可以依据不同的P值和显著性水平,决定是否拒绝原假设。
二、两类错误
- α错误或弃真错误:原假设H0为真,我们却拒绝了原假设。
- β错误或取伪错误:原假设H0为假,我们却接受了原假设。
注意:α+β≠1。在样本量一定的情况下,不可能同时减小两类错误;如果想同时减小两类错误,只能增加样本量;一般情况下,首先控制α错误,主要原因是,原假设H0是什么常常是明确的。
三、两类错误与贝叶斯公式
例子:现研发了一种用于临床上治疗癌症的药物,为了检测该药物对癌症治疗是否有效果,抽取样本通过临床试验来观察该药物的效果。假设该药物在实际无效的情况下,由于样本的随机性通过试验判断药物为有效的概率为5%;药物在实际有效的情况下,通过试验可以正确识别出药物为有效的概率是90%。假设由于医药水平所限,一般用于治疗癌症的药物有效性在10%。那么,如果该药物在试验过程中被判定为有效,它实际对治疗癌症确实有效的概率是多少?
分析:通过假设检验的方式来判定一种药物是否有效,原假设为:该药物对治疗癌症无效果;备择假设为:该药物对治疗癌症有效果。由下表可知,在原假设为真的情况下,结果为显著(即判定药物有效)的概率为5%,这也是第一类错误α(医学上称假阳);在备注假设为真的情况下,结果不显著(即判定药物无效)的概率是10%,这就是对应的第二类错误β(医学上称假阴)。
在试验结果显著(即判定药物是有效的)的条件下,它实际药物效果有效的概率计算采用贝叶斯公式:
最终得到结果为66.7%。可见,如果通过试验判定为有治疗效果的100种药物中,只有不到67种是真正有效果的。这是因为一种药物它本身对治疗癌症有实际效果的概率太低了,即先验概率p(实际药物有效)太小了,即使似然概率p(结果显著|实际药物有效)很大,整体概率也偏小。