PCA算法的理解

PCA算法被用来提取数据中主要的特征分量,通常是用来做高纬度的降维使用。PCA的原理涉及到数学中的向量空间和基。


Pic 1

就像Pic1中,一组数据在原始坐标系x,y中,原始基为(1,0)和(0,1),也就是x,y轴方向的单位向量。找到数据的中心点,找出主轴x’,数据在x‘轴方向上的变化最大,x’,y'的单位向量构建出一组新的基。

完成新的向量空间的构建后,假设每一个坐标点代表一个数据点,每个数据点包含了连个维度的信息(x,y)。为了达到降维的目的,将图中的每个点映射到新的x'轴,那么二维的信息变成一维的分布形式。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容