一、 要想回答一个统计学问题,先得把它转换成一个假设(Hypothesis)。
假设可以简单地理解为:以陈述句写出的能被用来检验的一句话。然后,根据检验得出的结果,确定这个假设可被接受或拒绝。
零假设(Null hypothesis, ):用来检验的假设;必须被写成要么是真、要么是假这样类型的陈述句。所以,相应于每个零假设都有一个备择假设(Alternative hypothesis,
)。
建立和检验假设需要知道的要点:
(1)有两种假设(说),如果其中一种更简单,那就优先相信这种更简单的假设;除非有充足的证据支持更复杂的那个假设(假说、理论)。
(2)通常假设两组结果之间不存在差异,比假设它们之间有差异更简单。
(3)把零假设置于优先地位;不要拒绝零假设,除非有足够的统计证据反对零假设。
由假设检验得出的结果是:拒绝零假设或不拒绝零假设。如果得出的结论是不拒绝零假设,这并不一定表示零假设是正确的(真);而只是表示没有足够的证据反对零假设而支持备择假设。假设检验永远也不能证明零假设是正确的。同样的道理,拒绝零假设也永远不能证明备择假设是对的。
二、 为了决定是否接受或拒绝零假设,就必须针对结果设置显著性水平(The level of significance, α)。
一般地,
α=0.05 显著(置信区间95%,P = 1-0.95=0.05),最常用;
α=0.01 非常显著(置信区间99%,P = 1-0.99=0.01),很强的统计证据;
α=0.001 极其显著(置信区间99.9%,P = 1-0.999=0.001),很少用。
有了显著性水平,我们就能说群体之间是否存在显著差异(Significant difference)。如果说存在显著差异,那意思就是,群体之间的差异不是随机因素造成的,不是因为实验失误造成的;群体之间的差异挺大的、大到了不能说这种差异是不重要的。
另外,P值小(比如0.001)并不表示统计上差异大。P值反映的是你在多大程度上肯定这个差异是真地存在的,而并不表示这个差异的大小。