主成分分析

  前提:变量间存在大量的重复信息,直接分析会因为变量间的多重共线性而导致许多问题
 应用目的:信息浓缩——如何通过少数的几个主分量,使它们尽可能多地保留原始变量的信息,且彼此间互不相关
注意:更多的是研究目的的中间步骤,而非最终的结果

一:案例选用(economy.sav)
(1)分析步骤
@1:对原来的p个指标进行标准化,以消除变量在数量级或量纲上的影响。
@2:根据标准化后的数据矩阵求出协方差或相关矩阵
@3:求出协方差矩阵的特征值和特征向量
@4:确定主成分,在可能的情况下结合专业知识为各主成分赋予适当的专业解释
spss中没有把主成分分析作为一种独立的分析方法,而是和因子分析共用一个过程,因此会输出许多因子分析中的结果,但不影响分析结果.


1.png

2.png
(2) 操作步骤
分析—》降维—》因子—》选择—》确定(其它选项可自行尝试,这里不做讨论)
3.png

4.png

5.png

(3)结果展示


6.png

7.png

8.png

成分矩阵中:系数的绝对值越大表示变量的越大的部分被包含在其中,表示新的成分包含此变量的越大部分信息,可以依据此为新的主成分赋予新的专业解释。
不妨试试用散点图看看究竟哪些变量合在一起,成为一个主成分的。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容