1. 背景介绍
主成分分析(Principal Component Analysis,PCA), 是一种对数据进行简化分析的技术,这种方法可以有效的找出数据中最“主要”的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭示隐藏在复杂数据背后的简单结构。其优点是简单且无参数限制。通过分析不同样品OTU(97%相似性)组成可以反映样品间的差异和距离
工具链接:http://www.cloud.biomicroclass.com/CloudPlatform/SoftPage/PCA
2. 操作方法
2.1. 上传矩阵表格文件
可以选择输入文件或手动输入两种上传数据的方式,云平台支持的格式为txt格式的二维矩阵文件,示例文件如下。第一列为基因ID,第一行为样本名,每一列对应的为这个样本对应基因经过归一化后的表达量。将这个矩阵文件上传到“1. 上传矩阵表格文件”
1.1. 参数选择
可选参数包括是否显示样本名、是否归一化和是否按分组绘图三种,选择不同的参数,绘制图片的显示效果也不同。
默认参数是:进行归一化、不显示样本名和不按分组绘图
1.1.1. 不按分组绘图,直接点击“提交”即可
1.1.2. 按分组进行绘图
这一步可以选择手动输入或者上传文件,可以选择是否绘制分组圈,示例文件格式如下图,第一列为样品名,第二列为分组编号。上传文件后点击“提交”即可。
1.2. 查看任务
提交任务后,点击界面右侧的“PCA历史任务”模块,可以看到任务编号、提交时间、结束时间和状态。
通过点击界面“我的任务”可以查看任务编号、软件名称和状态等信息,点击任务编号,即可查看分析结果。
在任务详情界面,展示的是任务参数、结果文件列表和在线调整图片3个区域,提供结果文件下载和图片调整功能。
2. 示例图片
根据设置的不同参数会产生不同的示例图片,下方图片仅供参考
3. 结果文件列表
结果文件包括PCA结果图、PCA值表格和特征向量矩阵表格,其中PCA结果图可以根据参数进行在线调整