当我们在使用t检验的时候大多数时候都是小样本为主,尤其是临床试验中,用较少的样本来推断其所代表的总体是否有差异是我们的最终目的,
但是当样本量较大时,专业统计得到的结果可能与真实情况有差别。因为对于大样本,轻微的差别就会导致t值变化很大,从而掩盖了数据间真实的情况。
通过上图两独立样本t检验的公式可以看出,决定t值大小的因素有样本均数X,样本数n和标准差S,大样本量势必影响t值的大小。
一味地去关注P是否小于0.05,而忽略了数据本身的情况是不可取的。关于正确理解P值的含义,我在此推荐程开明老师的这篇文献。由于篇幅所限,在此就不过多展开。
今天我主要说的是如何通过效应量指标来辅助解读P值,其他方法我会在之后的文章中尽量补充。
效应量的概念:
效应量是指由于因素引起的差别,是衡量处理效应大小的指标。与显著性检验不同,这些指标不受样本容量影响。它表示不同处理下的总体均值之间差异的大小,可以在不同研究之间进行比较。平均值差异、方差分析解释比例、回归分析解释比例需要用效应量描述。效应量不受样本容量的影响。当样本容量大得到显著时,有必要报告效应量大小。(来自百度百科)
Cohen’s d用于t检验,表明两个均数之间的标准差异;
η²(偏η²)主要用于方差分析(ANOVA),表明与变量X的水平变化有关的变量Y的变化比率。
翻译成白话就是:
1、效应量不受样本量的影响,真实反映效应大小情况。
2、讨论自变量和因变量强度关系时,也不受样本量影响。(比如在回归分析中)
3、同样在回归分析中,通过效应量指标可以真实得出自变量对因变量的重要程度,尤其在建模找危险因素时很有用。
4、当效应量较小时,就算P值<0.05,也不能轻易下结论。
案例说明:
为了方便理解,我举个例子来说明效应量指标的实际意义。
一项开展我国男婴体重的调查,统计结果显示北方5385人平均体重为3.08kg,南方4896人平均3.10kg,3.08kg和3.10kg实际相差0.02kg,结论应该是南北方男婴出生体重相差不大才对。但此时如果使用t检验,得出的结果确是t=2.93,P=0.0034,差异有统计学意义。
此时如果坚持统计学结论,则会得到一个不真实的结论。因为在样本量较大的时候,P值会趋于小概率。
Cohen's d 的计算:
很遗憾SPSS无法计算这个指标,但我会介绍另一款统计软件(JASP)可以轻易计算,在此之前我们先看看该指标的计算公式。
独立样本t检验:
ES=(m1-m2)/s-pooled,m:均值,s-pooled:联合方差
配对样本t检验:
ES=(m1-m2)/s,m:均值,s:差值的标准差
Cohen’s d 的结果解读标准:
以上两个标准都可以,任选一个就行。
由于不想篇幅过长影响阅读,本篇先了解一下效应量指标的使用背景,下一篇将通过具体的案例向大家展示,并且如何使用JASP这款软件获得Cohen's d效应量指标。拜拜。