统计推断是由概率模型证明的推理,本节介绍假设检验的一些基础概念。
假设检验是指根据以往的经验和已知信息对总体提出假设,然后利用样本信息检验假设是否符合事实,最后作出接受还是拒绝这个假设的判断。根据检验内容是否涉及总体分布而分为参数的假设检验和非参数检验。
统计假设,简称为假设,通常用字母H表示,针对某一个问题,我们一般会提出两个完全相反的假设,并将其中的一个称为原假设或者零假设,用H0表示。而另一个假设则称为对立假设或者备择假设,用H1或者Ha表示。
接下来我们来看个例子:
例1: An automobile manufacturer advertises that its new hybrid car has a mean mileage of 50 miles per gallon.
Now, suppose you sample 25 cars, and find the average is 47 miles per gallon, with a standard deviation of 5 miles per gallon. Can you say that the advertisement is false?
针对该问题,我们提出的假设是:
H0 :μ0 =50;Ha :μ0 <50
关于总体参数θ的假设有三种情况:
(1) H0:θ>=θ0 H1:θ<θ0
(2) H0:θ<=θ0 H1:θ>θ0
(3) H0:θ=θ0 H1:θ!=θ0
以上三种情况中,(1)(2)称为单边检验,(3)称为双边检验。
那么我们要如何对提出的各种不同假设进行检验呢?
一般地,在假设检验问题中,若寻找到某个统计量,其取值大小和原假设H0是否成立有密切联系时,我们将该统计量称为该假设检验问题的检验统计量,而对应于拒绝原假设H0时,样本值的范围称为拒绝域,其补集为接受域。
因为我们是根据样本推断总体,由于抽样的随机性,所以也有可能推出错误的结论。因此,在假设检验推断中可能会出现下述四种情况:
拒绝了一个真实的原假设,我们称为第I类错误或者弃真错误,而接受了一个错误的假设,我们称为第II类错误或者取伪错误,用α表示第I类错误的概率,β表示第II类错误的概率。
α=P(第I类错误)=P(拒绝H0|H0是真实的)
β=P(第II类错误)=P(接受H0|H0是错误的)
通常在假设检验中,我们会确定一个显著水平α,常取0.05或者0.01以控制第I类错误的概率,即要求检验犯第I类错误的概率不超过α,然后在满足这个约束条件的检验中,再寻找检验使得犯第II类错误的概率尽可能晓。上述即为假设检验理论中的奈曼-皮尔逊原则。
通常犯这两类错误的概率相互制约,当α减小时,β会增加,所以如果想要同时使得犯两类错误的概率都很小,就必须有足够大的样本容量。
提到这两类错误,我们就要介绍几个在生物统计中经常碰到的概念:特异性(specificity)和敏感性(sensitivity):
所以也就是:
那么我们经常提到的P值又是什么呢?
当原假设H0为真时,检验统计量取比观察到的结果更为极端的数值的概率,称为P_值,我们会使用该值来衡量拒绝H0的理由是否充分,P_值较小说明观察到的结果在一次实验中发生的可能性较小,拒绝H0的理由越充分;相反,P_值越大说明观察到的结果在一次试验中发生的可能性较大,所以没有足够的理由拒绝H0。
当假设检验的显著性水平为α,若P_值小于等于α,则拒绝原假设,此时我们称检验结果在水平α下是统计显著的。
最后我们通过一个例子学习在假设检验的过程中上述概念都如何被运用:
例2 设某种清漆的9个样品,其干燥时间(以小时计)分别为:
6.9 6.7 5.8 7.0 6.8 5.2 7.1 5.6
根据以往经验,干燥时间的总体服从正态分布N(6.0,0.36),现根据样本检验平均干燥时间是否与过去有显著差异?