简明PCA 的图解释

一般来说,PCA分析2个图够了,以iris数据为例,在经过PCA分析后,我们可以得到第一章碎石图,表示PC1,2,3,4的特征向量值,可以据此选择保留的主成分(通常选择特征向量值超过2的变量),此图显示出1个主成分可以保留。

image.png

此外,可以有另外2个基于特征向量值选择主成分的标准,即 Kaiser-Guttman 标准和 Broken Stick 标准,这些标准可以反应主成分对于解释原始数据的贡献程度

image.png

依据Kaiser-Guttman 标准,仅应该保留主成分1,上图中仅PC1超过了平均值,下图中仅PC1超过了红色柱形图。

在选择了PC后,需要考虑变量对于PC的贡献,下图中,Petal Length,Width, Sepal Length对于PC1的贡献大,即方向偏向x轴方向;而Sepal width对PC2的贡献大,方向偏向y轴。长度越长,相对影响越大。

image.png
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容