R数据分析:交叉滞后模型基础与实例解析

最近问纵向数据分析的同学贼多,像潜增长,GEE,多水平,之前都有写,今天偷空出个简易的交叉滞后教程哈,大家只要遇到像causal models,cross- lagged panel models,linear panel models 和autoregres-sive cross- lagged models 这些,都要反应过来他们都是一个东西,都叫面板模型,统一的数据特点就是把变量纵向测量很多波,然后想探讨变量间的关系,最简单的情形就是两波的时候啦,如下图:

我们看着这个图,可以自然而然地写出来这两个方程:

上面式子中的β1和β3叫做自相关系数,描述了此构象的稳定性。越大越稳定,很好理解哈。

β2和β4叫做交叉滞后系数,表示一个构象对滞后的另外一个构象的作用。这个系数是在控制自身预测作用后体现出来的一个变量对滞后一期的另外一个变量的作用,所以叫做滞后效应,其相对于传统回归的优势就在于其控制了自回归效应,然后在面板数据中我们既可以让x1影响y2,也可以让y1影响x2,图中就有一个交叉,所以就叫交叉滞后模型

The fact that prior levels of the outcome construct are controlled for allows one to rule out the possibility that a cross-lagged effect is due simply to the fact that X and Y were correlated at time 1.

当然啦,上面的例子都是两个构象和两个时点的情况,该模型也可以延伸到多个构象和多个时间点,相应的系数都是一个意思。

The preceding model can be extended to more than two occasions and more than two constructs. The autoregressive and cross-lagged effects retain the same meaning.

交叉滞后的优势

搞纵向数据的时候我们其实是需要一个变量随时间变化的假设或者理论的,但是交叉滞后模型并没有这个一个假设,我们只是单纯地将自回归效应加进去而已,所以有人其实是不赞成这种方法,反而更加倾向于潜增长或者GEE等明确变异关系的方法:

path models, such as the panel model,should be avoided because they do not begin with an explicit statement of the expected change process

但是对变量间的具体变化并不关心的时候,交叉滞后不失为一种好方法,好处体现在:

对相互作用(Reciprocal Effects)的研究上

相互影响的关系其实是很多的,比如母亲和子代相互影响,人和环境相互影响等等,交叉滞后模型可以让这种关系的研究变得更容易,比如你可以很容易地通过交叉滞后模型知道到底是x在影响y还是y在影响x,或者是相互都有影响,以及每个路径的强度:

Results from a panel analysis can be used to determine whether cross-lagged effects occur in both directions (i.e., whether X1 predicts Y2 and Y1 predicts X2) and to assess the relative strength of the cross-lagged effects. For example, data based on the observation of a parent–child dyad could be analyzed to see whether a parent’s behavior affects the child’s subsequent behavior or the child’s behavior affects the parent’s subsequent behavior and even to see which of the two cross-lagged effects is stronger.

对中介效应(Mediation)的研究上

很多人都是随便拉3个有关系的变量就开始做中介,这个不好评价,水水论文嘛,但是更好更清晰地说明中介效应的存在,应该使用面板数据的分析:

The longitudinal nature of the data from the panel design provides an advantage over mediation models estimated using cross-sectional data

对调节效应(Moderation)的研究上

通常我们检验调节作用的方法是将自变量和调节变量的积放在回归模型中,这种情况只适用于显变量的时候,如果你的调节变量是个潜变量使用交叉滞后面板模型就会更加容易。

交叉滞后中的测量不变性

测量不变性之前文章有写,这个不是说我们要测定构象是不变化的,而是评估我们测量真实性的一个指标:

It addresses only the equivalence of measurement of the construct to ensure that the differences in the constructs are true differences

测量不变性的基本逻辑在于:如果一个构象随时间改变,那么它所有的显变量都应该是向同一个方向改变同样的数量:

The basic idea of factorial invariance is that if the construct changes over time, then this change is conveyed as changes in all the indicators in the same direction and the same amount.

如果显变量的改变出了矛盾的情况就说明测量不变性不再满足,需要注意的是测量不变性是对潜变量而言的,在只有显变量的结构模型中是没有测量不变性的

交叉滞后面板模型和因果推断

一段时间以来,人们会想当然地说面板可以说明因果关系,因为面板模型它测量了很多波数据,满足两个很重要的因果推断的前提,一个是时间先后,一个是对自身和其余混杂的控制:

Two fundamental aspects of causal inference:

First, by measuring putative causes prior to the effects, temporal precedence of the cause is supported, and

Second, by simultaneously modeling the unique effect of several causes, it may be possible to support a causal explanation of one variable over another.

但是仅凭面板数据推因果也是有问题的,首先你是不能独立地操纵你所谓的原因变量的,你没法检验,第二有可能你会忽略了其它的预测因子,所以使用交叉滞后模型做因果推论也是需要谨慎的:

the putative causes often cannot be manipulated or cannot be manipulated independently from other variables in the model. In addition,proper causal inference rests on model assumptions such as including all relevant predictors.As noted earlier, this assumption can be difficult to establish.

总的评价就是这个方法可以作为提示因果关系的尝试,但是下因果结论是要审慎的。

交叉滞后的时间间隔

通常情况下我们的数据都是等时间间隔的,比如每隔3个月测一次,每隔2周测一次,这种等时间间隔蕴含这一个假设就是x对y的滞后效应和y对x的滞后效应都是等时间间隔的:

Most panel designs measure all variables on a fixed lag schedule. The fact that all variables are measured at the same time implicitly assumes that the time for the cross-lagged effect of X on Y and Y on X is the same

这个假设一定对吗?不好说

所以大家在选择随访时间的时候也需要注意间隔,至少你得提前找找参考文献嘛。

实例解析

在这个例子中我想要研究母亲的抑郁症状和孩子的内化问题之间的关系,现在的文献中有两种观点:一种是抑郁母亲的孩子更容易有问题,另一种是有问题的孩子的母亲会更容易抑郁,到底哪种对呢?

今天就用交叉滞后面板模型来解决这个问题,我们的数据中抑郁是用21条目的CES-D测的,孩子的内化问题用的是CBCL测得的,在做结构模型之前我们得验证数据的测量不变性(见之前的文章:文献解读:纵向数据的测量不变性和交叉滞后模型(一) 文献解读:纵向数据的测量不变性和交叉滞后模型(二) )结果如下:

交叉滞后分析的结果如下图(p均<0.01),可以用lavaan做,也可以用Mplus做:

从结果数据中可以看到构象间的稳定性还是不错的,母亲抑郁对孩子问题的滞后效应是显著的0.12,就是说在控制了孩子之前问题水平的情况下,母亲越抑郁,孩子就越容易有问题;同时,孩子问题对母亲抑郁也有滞后效应0.2,就是说在控制了母亲先前抑郁水平的时候,有问题的孩子的母亲依然更加容易抑郁。

就是说母亲抑郁和孩子问题是相互的--reciprocity

所以忙活了半天,交叉滞后模型依然没能给我们提示准确的因果方向

Consistent with our previous discussion of the use of panel models for causal inference,we do not see these results as support for a causal effect of maternal depressive symptoms on child internalizing behavior or of child internalizing behavior on maternal depressive symptoms.

这个也是可以接受或解释的:毕竟我们只考虑了两个变量嘛。

The present analyses identify an interesting association that warrants further research, but with only two variables in the model and given the impossibility of manipulating either maternal depressive symptoms or child internalizing behavior, the results should not be used to bolster a causal claim without further supporting evidence.

本文参考文献:

Selig, James & Little, Todd. (2012). Autoregressive and cross-lagged panel analysis for longitudinal data.

Little, Todd & Preacher, K & Selig, James & Card, N. (2007). New developments in latent variable panel analyses of longitudinal data. International Journal of Behavioral Development. 31. 357-365.

小结

今天给大家简单写了交叉滞后的基本知识,感谢大家耐心看完,自己的文章都写的很细,代码都在原文中,希望大家都可以自己做一做,请关注后私信回复“数据链接”获取所有数据和本人收集的学习资料。如果对您有用请先收藏,再点赞转发。

也欢迎大家的意见和建议,大家想了解什么统计方法都可以在文章下留言,说不定我看见了就会给你写教程哦,另咨询代做请私信。

R数据分析:交叉滞后模型非专业解释

文献解读:纵向数据的测量不变性和交叉滞后模型(一)

文献解读:纵向数据的测量不变性和交叉滞后模型(二)

R数据分析:再写stargazer包,如何输出漂亮的表格

R数据分析:如何用R做数据模拟

R数据分析:ROC曲线与模型评价实例

R数据分析:用R语言做潜类别分析LCA

R可视化:如何用R做一个让别人一目了然的图

R数据分析:用R语言做meta分析

R数据分析:使用R语言进行卡方检验

R数据分析:如何在R中使用mutate

R数据分析:著名的“三门问题”的R语言模拟

R语言:利用caret的dummyVars函数设置虚拟变量

R数据分析:贝叶斯定理的R语言模拟

R文本挖掘:情感分析

R数据分析:如何用R做验证性因子分析及画图,实例操练

R数据分析:有调节的中介

R数据分析:如何用R做多重插补,实例操练

R数据分析:倾向性评分匹配完整实例(R实现)

R数据分析:如何用R语言做meta分析,写给小白

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容