在实际问题的研究中,为了全面系统地分析和研究问题,必须考虑许多指标,这些指标能从不同的侧面反映研究对象的特征,但在某种程度上存在信息的重叠,具有一定的相关性。实际上,在许多情况下众多变量间有一定的相关关系,人们希望利用这种相关关系对这些变量加以“改造”,用维数较少的新变量反映原变量所提供的大部分信息,通过对新变量的分析达到解决问题的目的。
1. 基本思想
主成分分析就是把原有的多个指标转化成少数几个代表性较好的综合指标,这少数几个指标能够反映原来指标大部分的信息(85%以上),并且各个指标之间保持独立,避免出现重叠信息。主成分分析主要起着降维和简化数据结构的作用。
主成分分析