R语言 结构方程教程(一)

版权归作者所有,任何形式转载请联系作者。

在网上看过许多关于SEM的文章,觉得说的要么太过简单,或者太过于繁琐,或者关于统计知识的太多,对文科生很不友好,特别是使用SEM的往往是语言学类的文科生。作为豆瓣的第一篇文章,讲讲结构方程我想是很合适的,希望这篇文章能在以后,对我关心的人和关心结构方程的朋友们有所帮助。

结构方程是社科比较常用的量化方法,是因子分析的加强版,同时融合了回归等技术。SEM的目标是探索变量之间的关系(EFA)以及确认一个已经构建好的模型(CFA)。

一些语言学、文学在计量化方面经常使用SEM,心理学/问卷调查上也常用SEM探索相关关系。

SEM往往可以以图表的形式说明变量之间的影响,其中又以不同形状代表了变量的不同性质。

1.变量

结构方程中的变量分为两种:潜在变量与人工变量,其中潜在变量往往是无法直接测量到的,或者是一种抽象的事物。比如一个人的幸福感,这就是抽象的。而人工变量是可以被直接测量的,比如测量他的收入水平、睡眠质量等等。这样,潜在变量:幸福感,就可以通过人工变量反映出来。结构方程也正是要探索这些变量之间的关系。

其中在结构方程图中,潜在变量使用圆形,人工变量使用方形。(随机误差项也使用圆形,稍后我们会提到)


2.结构方程的目标

2.结构方程的目标


以上面这张图为例,其中IQ与学术分数,是潜在变量,单向的箭头表明了影响(表现)的关系。IQ表现在学术的分数上。而同时学术分数表现在GPA/ACT/GRE这三个标化成绩上。而IQ本身可以被设计/记忆的数字长度/理解力矩阵所测量。

其中方形的是我们可以获得的数据,圆形的也就是我们需要通过方形才能推断的潜变量。

3.实例

可能看到这里还有一些迷糊,接下来我们直接上手体验一下SEM,或许能有更直观的感受。

实验需要的材料:

RStudio / lavaan 包,关于Rstudio可以到官网直接下载,lavvan包在Rstudio内输入:

install.package('lavaan')

再使用 library(lavaan)调用即可。

这里的实例我们使用了Holzinger 1939 的数据。

如图:先调用lavaan包,载入数据。通过head命令简略的查看数据。(如果对基础的R语言不太了解的,在末尾我会附上一本简单教程,可以快速上手)


其中x1~x9是测量的数据,分别对应了不同方面的能力,有文字记忆长度/数字识别速度等等,我们通过这些人工变量,探索潜变量——一个人的视觉速度。



#an example给出了模型的例子,也就是潜变量=~人工变量相加。将其存入model这个变量中。

我们的模型同上。即visual.model


使用cfa命令(验证性分析),建立模型,指明数据集。

接下来使用summary便会给出结果,结果较多,其中只需要看懂几个:

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。