在进行假设检验过程中,包括t检验,F检验,非参数检验以及卡方检验等,最后均是通过P值是否大于0.05或0.01进行评价,认为两组或多组的差异是否有统计学意义。
一般来讲,P<0.05或P<0.01,我们认为比较的两组差异有统计学意义,但是能认为P<0.05的两组差异显著,而P<0.01两组差异极其显著,这里比较P值的大小是没有意义的。在T检验中,P值是通过样本例数N,检验水平α,以及检验统计量t值计算得到的,也就是在α=0.05的情况下,计算得到的检验统计量t>tα/2,n , 进而推算的P<α=0.05,也就是说P值是与检验α水平,N相关的,而与样本之间差异的大小无关。
一个简单的例子,男性和女性总体身高肯定是存在差异的,假设我们设置检验水平α=0.05,H0:两组身高无显著差异,N=1000。进行假设检验,得到检验统计量t >t0.05/2,1000=1.96,即P<0.05,那么我们拒绝H0,认为两组在检验水平α=0.05的情况下,两组差异有统计学意义。
同样的,假设我们设置检验水平α=0.01,H0:两组身高无显著差异,N=1000。进行假设检验发现检验统计量t>t0.01/2,1000=2.58,即P<0.01,那么我们拒绝H0,认为两组在检验水平α=0.01的情况下,两组差异有统计学意义。也就是两组数据的差异就再那里不增不减,不会因为我们P值大小,差异会发生变化。因为在假设检验过程中采用了不同的检验水平,只能说我们更有把握认为男女身高有差异了。
此外,统计学差异和生物学意义也要辩证的去看待。
1:无统计学差异而有生物学意义
Α,B两组艾滋病患者采用不同的药物治疗,其中Α组1例患者被完全治愈,在统计分析上是无统计学意义的,但是却具有明显的生物学意义,你可以对这例患者进行深入的研究,或许就可以打开解救艾滋病患者的大门。
2:有统计学差异而无生物学意义
检验一组高血压患者采用药物治疗前后血压变化水平发现,药物治疗后患者血压评价降低10mmHg,两组配对t检验,差异有统计学意义,但是临床上认为降血压药物要达到15 mmHg的治疗效果才会有意义。这个问题还可以引申为有统计学意义,但不一定有实际意义。比如分析两种事件的相关性,小红在10岁的时候,门口种下了一颗小树苗,每年统计小红的身高和小树苗的高度变化,10年之后,对小红的身高和小树苗的高度进行统计发现,两者呈显著正相关,有显著的统计学意义,但是显然两者之间不会有什么实际的生物学意义。
所以,统计学差异并不等于生物学意义,还要结合具体的临床或统计标准进行分析。在我们还在探讨P值的时候,Nature上已有几百位科学家联名批判P值在科研中的滥用了w(゚Д゚)w。文章题目:Scientists rise up against statistical significance
转自“医学统计园”微信公众号,欢迎扫描二维码关注