1.定义
因子分析:即对信息的浓缩。比如领导说了14句话,将其浓缩为4个关键词
2. SPSSAU操作步骤
(1)将要分析的项导入右边的分析框
然后选择“开始因子分析”
(3)解读出现的结果
-
KMO值大于0.6,p值小于0.05说明可以做因子分析
-
如果没有设置因子个数,软件默认根据特征根值大于1的数量来选择因子个数。在这个案例中,有2个因子(因为只有两个特征根大于1)
(4)设置有4个因子
(5)观察方差解释率表格
- 看到第3个、第4个因子的方差解释率小于1,但是没有关系
- 方差解释率:领导讲了14句话,你想用4个关键词代替,那么这4个关键词每个关键词可以浓缩出来多少信息呢?如图,第1个关键词可以提炼出来54.45%的信息,以此类推
- 累积百分比:第1个关键词和第2个关键词一共提炼62.248%信息;第1/2/3个关键词一共提炼了67.899%的信息,以此类推
-
旋转后方差解释率:就是软件帮你打磨一下,不要让有的因子提取的信息太多,有的因子提取的信息太少。一般用的是旋转后的方差结实率。这个例子中四个因子可以提权73.145%的信息,已经比较高了,一般情况下大于50%就ok了
(6)旋转后因子载荷系数表格
- 这个表格是为了看领导讲的哪句话要让在哪个浓缩后的因子下边
- 容易出现两种情况:首先是“张冠李戴”,如B2/B3/B4都和因子1关系比较大,但是B1跑到因子2这里了,与预期也不符合,这种情况要一般要踢出去,D3也是;其次是“纠缠不清”,如A1和因子1、因子3都有关系,那么要放在因子1还是因子3呢?要么结合专业知识判断要放在哪个因子下边,要么就是要看看哪个绝对值更大一些。纠缠不清很正常
-备注:不可以A或B都对应因子2或者因子3哦,那样子就没有意义了
-
把B1、D3删除以后看:A1出现了张冠李戴,B、C、D都没有问题,删掉A1
(7)删掉A1:
-
直到得到的对应关系和你的预期是一样的才可以进行命名,所以这也是一个不段反复的过程
(8)排序:就是顺序变变
- 共同度值:共同度值若小于0.4,也需要剔除掉的
-
共同度值:变量的共同度是因子载荷矩阵的第i行的元素的平方和
(9)成分得分系数表
-
备注:就是写出因子间的数学表达式
(10)碎石图
- 就是把特征根值画了图,从数学上去分析区分几个因子比较合适
3. 因子分析的作用和意义
(1)探索分析:就是探索可以分为几个因子,关系如何
(2)计算权重:得到4个关键词,他们分别的权重比例是多少
-
就是这个图,一般是看旋转后的权重,权重一般加和为1,这里不为1,因子1的权重计算为21.407/78.213,以此类推
(3)效度分析:就是生成新的变量
- 备注:生成一个新的变量,用于后续的分析
(4)用因子得分用于后续的分析
(5)因子综合得分:如研究企业综合竞争力怎么样,这个时候要用综合得分:选中,选择综合得分
4.因子分析的stata实现
链接1:stata与因子分析的实现:https://zhuanlan.zhihu.com/p/111446098
链接2:SPSSAU的因子分析:https://www.bilibili.com/video/av71184547