PCA算法被用来提取数据中主要的特征分量,通常是用来做高纬度的降维使用。PCA的原理涉及到数学中的向量空间和基。
就像Pic1中,一组数据在原始坐标系x,y中,原始基为(1,0)和(0,1),也就是x,y轴方向的单位向量。找到数据的中心点,找出主轴x’,数据在x‘轴方向上的变化最大,x’,y'的单位向量构建出一组新的基。
完成新的向量空间的构建后,假设每一个坐标点代表一个数据点,每个数据点包含了连个维度的信息(x,y)。为了达到降维的目的,将图中的每个点映射到新的x'轴,那么二维的信息变成一维的分布形式。