统计-降维:主成分分析PCA(principal Component Analysis)

PCA:无监督的分类器

PCA的原理:

1. 拿二维数据举例,先画出一条直线,将点映射到直线上
2. 计算SS,即每个点到原点距离平方和,旋转直线,让SS达到最大,此时的直线就叫PC1
image.png
每增加4个基因1, 增加1个基因2,说明是基因1主导的PC1
image.png
与PC1垂直的直线就是PC2
3. 将PC1和PC2旋转成垂直的,计算variation以及PC1和PC2各自占的比例

4. 如果基因数增多,就先确定PC1,再在各个维度上画很多垂直的PC2,PC3,PC4……挑选variation最大的两个PC画图
image.png

image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容