重点
1 作用
2 算法过程
作用
1 Feature之间不是相互独立,存在相关性,造成特征冗余。增加计算量。PCA可以改善这一情况
2 高维度数据可视化
算法过程
步骤
有一个矩阵,维度(m,n),m个采样数据,每个数据有n个feature。
1 特征去均值,标准化(归一化)
2
(1) 求或的特征值()和特征向量(),其中维度:
(2) ,维度:
(3)按照从大到小的顺序,取的对应的列。取前列得到矩阵,维度
的取值标准是,要求将后,前个元素累加和comsum > 95%总和。
(4) ,维度:
前个即主成分(主方向)。这样,就实现了从到维的降维。
注意!!!
必须对数据进行预处理,去均值化,标准化。