结构方程模型(Structural Equation Mode血g, SEM) 可用于多种实用的场景,如多因变量分析、潜变量分析、中介变量分析等。它可以看作路径分析( Path Analysis)和验证性因子分析(Confrrmatory Factor Analysis) 的组合。
1、路径分析
血压到底是自变量还是因变量?-引申出内生变量(Endogenous Variable)和外生变量(Exogenous Variables)的概念。
简单来说,内生变量就是会受到其他变量影响的变量,外生变量就是不受任何其他变量的影响、但是会影响其他变量的变量。外生变量肯定是自变量,但内生变量可能是自变量,也可能是因变量。在图10.20 中,体重就是外生变量,血压和血糖是内生变量,血压既是自变量又是因变量。
2、验证性因子分析
(1)潜变量和显变量
在传统的广义线性模型中,各自变量或因变量都是通过“直接”测量或调查而获得的,但有些变量却是难以直接测得的,如学习能力、幸福指数、抑郁状态等。这种无法直接测得的变量称为潜变量(Latent Variables), 与此对应,可以直接测得的变量称为显变量(Observed Variables)。
(2)潜变量虽然无法直接获得,但却是存在的,而且在背后支配着显变量。例如,一名学生的考试成绩是可以直接观测的显变量,它可能是由学习能力这一潜变量决定的;再如,一个人的抑郁状态是潜变量,可能决定着他的“能否很快入睡""感到沮丧”等可直接回答的问题。
3、验证性因子分析
(1)潜变量与显变量之间是有一定关系的,如"焦虑”这一潜变量是如何支配“我睡不着觉”和"我心里觉得烦乱”这两个显变量的?
(2)在验证性因子分析中,通过以下模型将潜变量和显变量联系起来:
其中, X1,X2, …是显变量, F1,F2,··,Fm 是潜变量。各潜变量通过系数a11 、a21 等支配显变
量X1 、X2 等,而ε等则是无法解释的误差。
(3)如潜变量“焦虑"与显变量“我睡不着觉”和"我心里觉得烦乱”之间的关系可以表达为
只要能求出a1、a2, 便可以知道焦虑是如何支配“我睡不着觉”和"我心里觉得烦乱”这两个显变量的。
4、因子载荷(Factor Loading)
(1)上述公式与线性模型的公式很相似。其实a1、a2等作为系数,其含义也与线性模型中差不多,如a1表示焦虑每增加1个单位,“我睡不着觉”的预期改变量; a2表示焦虑每增加1个单位,“我心里觉得烦乱"的预期改变量。
(2)不过与线性模型不同的是,在验证性因子分析中,该系数不叫回归系数,而被称为因子载荷(Factor Loading), 它反映了潜变量与显变量之间的关系。因子载荷越大,表明潜变量与显变量的关系越密切。
(3)在验证性因子分析中, 一个很关键的问题是确定潜变量,这一点是由专业知识来决定的。
例如:
这里有两种潜变量,六种显变量。而下图则是因子载荷分析,最终确定关系密切者。
抑郁与“感到没希望”的关系较密切,焦虑与“神经紧张"的关系较密切。
5、结构方程模型
路径分析可以探索(显)变量之间的直接和间接关系,验证性因子分析可以分析潜变量与显变量之间的(直接)关系,结构方程模型则将二者结合,可以同时分析带有潜变量的直接和间接关系。
6、结构方程的一个例子
下表是调查了100人的5个变量的协方差结构,目的是了解家庭状况对学生抑郁是否会有影响。
(1)假定家庭状况(潜变摄)用父母学历评分和家庭氛围评分(显变量)来体现,学生抑郁(潜变量)用学生情绪评分、学生认知评分和学生动机评分(显变量)来体现。并且假定路径为:家庭状况会影响学生的抑郁状态。
(2)最终我们得到的结构方程模型如下图所示。图中, f1表示潜变量家庭状况,f2表示潜变量学生抑郁。
(3)在结构方程模型中, 一般用矩形表示显变量,用椭圆形表示潜变量。
(4)结构方程模型中的系数解释其实与传统线性模型类似,都可以反映某一变量增加1个单位所导致的另一变量的变化。