PCA简介
相关背景
在许多领域的研究与应用中,往往需要对供应的多个变量进行大量的采集,收集大量数据以便进行分析但寻找规律。多变量大样本会为研究和应用提供大量的信息,也提供了大量的信息。在一定程度上增加了数据采集的工作量,更重要的是在大多数情况下,许多变量之间可能存在相关性,从而增加了问题分析的复杂性,同时对分析带来了不便。一个进行分析,分析往往是孤立的指标,而不是综合的。 发布会事件会损失很多信息,容易产生错误的结论。
因此需要找到一个合理的方法,在减少需要分析的方法的同时,尽量减少原因收集信息的损失,以达到对所收集的数据进行全面分析的目的。由于各变量间的相关关系,因此有可能用具体的综合指标分别代表综合存在于各个变量中的各种信息。主要成分分析(PCA)与因素分析就属于这类降维的方法。