转自:https://blog.csdn.net/weixin_39608748/article/details/112719490
前言:部分文章可能没有提供原始数据,可能只报告了t检验、ANOVA方差分析或者卡房检验等结果,如何计算效应量(Hedges’g)大小和标准误呢?
1. Hedges’g介绍
在处理连续的结果数据时,通常会计算标准化平均差异(standardized mean difference,SMD)作为每个研究的结果及汇总指标(summary measure)(Borenstein et al. 2011)。常用的SMD值如下。
在单次试验中计算SMD时,常用格式是Cohen’ d(Cohen 1988)。但是,在小规模研究中,采用这种简易方式计算的SMD会显示出轻微的偏差,高估了效应量(Hedges 1981)。
Hedges'g是类似的汇总指标,但可以控制这种偏差。它使用略有不同的公式来计算合并方差Spooled,S∗pooled。根据Hedges和Olkin的公式,可以进行从d到g的转换(Hedges and Olkin 1985)。
这可以在R中使用带有以下参数的hedges_g函数:
• d: Cohen’s d值
• totaln: 总样本量N
hedges_g(d = 0.75, totaln = 50)
注:Hedges’g是meta分析中常用的格式,也是RevMan中的标准输出格式。因此,我们强烈建议您在元分析中也使用此度量方式。在meta的metabin和metacont函数中,如果我们设置sm=“SMD”,则会自动计算出每个研究的Hedges’g。但是,如果您使用metagen函数,则首先需要自己计算出每个研究的Hedges’g。
为了计算效应大小,我们将使用Daniel Lüdecke的esc软件包(Lüdecke2018)。
install.packages(“ esc”)
library(esc)
2. 根据Mean和SD计算Hedges’g
根据两个试验组的Mean,Standard Deviation和样本量计算Hedges’g,可以使用esc_mean_sd函数和以下参数。
·grp1m:第一组的Mean(例如干预)。
·grp1sd:第一组的Standard Deviation。
·grp1n:第一组的sample size。
·grp2m:第二组的Mean。
·grp2sd:第二组的Standard Deviation。
·grp2n:第二组的sample size。
·totalsd:如果未报告每个试验组Standard Deviation,则为full sample standard deviation。
·es.type:我们想要计算的效果量度。在我们的例子中是“g”。但是我们也可以使用“d”来计算Cohen’s d。
esc_mean_sd(grp1m = 10.3, grp1sd = 2.5, grp1n = 60,grp2m = 12.3, grp2sd = 3.1, grp2n = 56, es.type = "g")
3. 根据回归系数(regression coefficient)计算Hedges’g
3.1 非标准化回归系数(Unstandardized regression coefficients)
对于非标准化的回归系数,我们可以使用esc_B函数和以下参数:
·b:非标准化系数b(the “treatment” predictor)。
·sdy:因变量y(例如,结果变量)的standard deviation。
·grp1n:第一组参与者的数量。
·grp2n:第二组参与者的数量。
·es.type:我们想要计算的效果量度。在我们的例子中是“g”。但是我们也可以使用“d”来计算Cohen’s d。
代码示例如下
esc_B(b=3.3,sdy=5,grp1n = 100,grp2n = 150,es.type = "g")
3.2 标准化回归系数(standardized regression coefficients)
对于非标准化的回归系数,我们可以使用esc_beta函数与以下参数:
·beta:标准化系数β(the “treatment” predictor)。
·sdy:因变量y(例如,结果变量)的标准偏差(standard deviation)。
·grp1n:第一组参与者的数量。
·grp2n:第二组参与者的数量。
·es.type:我们想要计算的效果量度。在我们的例子中是“g”。但是我们也可以使用“d”来计算Cohen’s d。
esc_beta(beta=0.7, sdy=3, grp1n=100, grp2n=150, es.type = "g")
4. 根据单因素方差分析(one-way ANOVA)计算Hedges’g值
我们可以根据两组单因素方差分析的F值推导出标准化平均差(SMD)。只要你找到F值对应的自由度(df),就可以检测这些方差分析结果。在两组的单因素方差分析中,自由度应该总是从1开始(比如 F1,147= 5.31)。这个转换的公式如下:
根据F值计算Hedges’g值,可以使用带有以下参数的esc_f函数:
• f: 方差分析的F值
• grp1n: 第一组的参与者人数
• grp2n: 第二组的参与者人数
• totaln: 总样本量(如果未报告各个组的人数)
• es.type: 我们要计算的效应量度。在本例中用 "g"。但是我们也可以使用 "d" 来计算Cohen’s d。
esc_f(f=5.04,grp1n = 519,grp2n = 528,es.type = "g")
5.根据均值(Mean)和标准误(SE)计算Hedges’g值
根据均值和标准误计算Hedges’g时,我们简单地利用了这样一个事实:当考虑样本量时,标准误不超过标准差。
我们可以使用带有以下参数的esc_mean函数,来计算Hedges’g值:
• grp1m: 第一组的均值
• grp1se: 第一组的标准误
• grp1n: 第一组的样本量大小
• grp2m: 第二组的均值
• grp2se: 第二组的标准误
• grp2n: 第二组的样本量大小
• es.type: 我们要计算的效应量度。在本例中用 "g"。但是我们也可以使用 "d" 来计算Cohen’s d。
代码示例如下:
esc_mean_se(grp1m = 8.5, grp1se = 1.5, grp1n = 50, grp2m = 11, grp2se = 1.8, grp2n = 60, es.type = "g")
6. 根据相关(correlation)计算Hedges’g值
对于被试人数相等的两组(n1=n2),我们可以利用下面的公式从点二列相关(the pointbiserial correlation)中得出标准化平均差(SMD)。
当被试数不相等时:
要将rpb值转化为Hedges’g值,我们可以使用带有以下参数的esc_rpb函数:
•r: r值,必须给出r或者它的p值
•p: 相关性p值,必须给出r或者它的p值
•grp1n: 第一组的被试人数
•grp2n: 第二组的被试人数
•totaln: 总样本量(如果未报告各个组的人数)
•es.type: 我们要计算的效应量度。在本例中用 "g"。但是我们也可以使用 "d" 来计算Cohen’s d。
代码示例如下:
esc_rpb(r = 0.25, grp1n = 99, grp2n = 120, es.type = "g")
7. 根据独立样本t检验计算Hedges’g值
标准化平均差(SMD)也可以从独立样本t检验得出,公式如下:
要根据t检验计算Hedges’g值,我们可以使用带有以下参数的esc_t函数:
•t: t检验中的t值,必须给出t或者它的p值
•p:t检验中的p值,必须给出t或者它的p值
•grp1n: 第一组的被试人数
•grp2n: 第二组的被试人数
•totaln: 总样本量(如果未报告各个组的人数)
•es.type: 我们要计算的效应量度。在本例中用 "g"。但是我们也可以使用 "d" 来计算Cohen’s d。
代码示例如下:
esc_t(t = 3.3, grp1n = 100, grp2n = 150,es.type="g")
8. 在多重比较情况下计算效应值
许多随机对照试验不仅包括单个干预组和对照组,而且将两种或多种干预措施的效果与对照组进行了比较。
在这种情况下,将一项研究中的干预组和对照组的所有条件进行比较,简单地纳入到一项元分析可能会很诱人。但是,研究人员应该放弃这种做法,因为这意味着对照组在元分析中被使用了两次,从而“双倍计算”(double-counting)了对照组的参与者。效应大小是相关的,不是独立的,双倍计算对照组是将其视为参与者源自于独立样本,这会导致分析单位误差 (unit-of-analysis error)。
有两种方法可以解决此问题:
拆分对照组的参与者人数N:在某种程度上控制分析单位误差 (unit-of-analysis error) 的一种方法是在两个干预组之间拆分对照组的参与者数量。因此,如果您的对照组有N = 50个参与者,则可以将对照组分为两个均值和标准偏差相同的对照组,每个组有N = 25个参与者。在此准备步骤之后,您可以计算每个干预组的效果大小。由于此过程只能部分消除分析单位误差,因此通常不建议这样做。但是,此程序的一大优点是它使研究部分之间的异质性研究成为可能。
另一个选择是把干预组的结果合并成一组,与对照组进行比较。尽管此过程存在实际操作的的局限性(有时,这意味着要把来自极其不同类型的干预组的结果合并为一组),但摆脱了分析单位误差的问题,因此从统计学的角度出发建议这样做。具体计算如下:
合并效果大小(合并的均值,标准偏差和N),使用以下公式: