1.定义
多元统计分析中,交互作用是指某因素A的作用随其他因素B水平的不同而不同,或者说两因素同时存在时的作用不等于两因素单独作用之和(相加交互作用)或之积(相乘交互作用)。目前多采用在回归方程中纳入因素乘积项的方法进行分析。其中,线性回归模型为相加模型,乘积项反映因素间是否有相加交互作用(后有证明);而logistic回归或Cox回归模型为相乘模型,乘积项反映因素间是否有相乘交互作用(后有证明)。
2. 评价交互作用的意义
①Subgroups:识别对某干预受益最大的人群(亚组)To identify the subgroups of individuals in which the intervention or treatment is likely to have the largest effect (resources to implement interventions may be limited).
②Covariates:识别最可能施加干预的协变量以降低主要暴露因素的效应(另一主要暴露因素不容易施加干预的情况下)To find other covariates to be intervened upon to eliminate much or most of the effect of the primary exposure of interest (it may not be possible to intervene directly on the primary exposure of interest).
③Mechanism:揭示暴露影响疾病发生的机制To provide insight into the mechanisms for the outcome.
④Power:提高评价某暴露对结局影响总效应的把握度To help increase power in testing for the overall effect of an exposure on an outcome.
⑤Model:仅从纯统计学角度,包含交互作用项的模型拟合数据更好To fit the data better when the model includes the additional flexibility allowed by an interaction term.
3. 生物学交互作用的评价应该基于相加尺度
Rothman认为,生物学交互作用的评价应该基于相加尺度而非相乘尺度[Rothman KJ,Greenland S,WalkerAM.Concepts of interaction.Am J Epidemiol,1980, 112(4):467-470]。判断公共卫生负担大小的依据是病例数的多少,公共卫生更多地关注危险因素暴露后或采取干预措施后对病例数绝对值的影响(而非改变的倍数),因而只有加法模型适合评估危险因素效应。这一点与通常认为RR具有病因学意义,而归因危险度(attributable risk,AR),也称率差(rate difference,RD)或超额危险度(excess risk)更具有公共卫生学的意义相似。
4. 交互作用中相关回归模型
4.1多重线性回归
4.2 Logistics回归和COX回归
※※※数据结构整理成如下形式:
4.2.1 OR10、OR01和OR11的求解
方法1:直接法——用A和B构建乘积项A×B
此处需要注意,在Logistics回归中评价相乘交互作用的指标是:
这说明Logistics回归模型中乘积项的OR值反映的是相乘交互作用而非相加交互效应。
方法2:设置哑变量法
无论采用以上哪种方法,都可以很方便的在SPSS或者R中得到相应的OR值。
5. Logistics回归模型相加交互效应(additive interaction)的评价指标
根据上述可知,Logistics回归模型中乘积项的OR值反映的是相乘交互作用而非相加交互效应;而生物学交互作用的评价应该基于相加尺度而非相乘尺度。因此如何对Logistics回归模型相加交互效应进行评价分析呢?
Rothman和Hosmer提出了针对评价Logistics回归模型相加交互作用的三个指标,即
6. 对RERI、AP和S及其可信区间的计算方法(见下篇https://www.jianshu.com/p/20094d1014e1)
方法1. SPSS联合EXCEL法
具体操作参见:https://dwz.cn/eH9uOuur 中第四部分。
方法2. 使用R语言
参考https://osf.io/7ccpp/给出的自制R函数additive_interactions。
7. 交互作用与混杂的联系和区别
混杂:The association between X (exposure) and Y (outcome) is distorted by the presence of another variable C (confounder).
相同点:
①都关心第三个因素如何影响暴露因素和疾病间的联系;
②都可导致暴露因素和疾病间联系的大小或方向发生改变。
不同点:
另可参考学习:https://dwz.cn/LFwSvILU
8. 参考资料:
1. logistic回归模型中交互作用的分析及评价:10.3321/j.issn:0254-6450.2008.09.019
2. 山西医科大学余红梅教授讲课课件:https://wenku.baidu.com/view/9555e7eef08583d049649b6648d7c1c709a10b30.html?from=search
3. 微信公共号文章https://dwz.cn/eH9uOuur
4. 微信公共号文章https://dwz.cn/LFwSvILU