文章1 蛋白糖基化修饰

视频：https://www.bilibili.com/video/BV1hz4y1r74a

数据：

1样本临床信息矩阵包括多种肿瘤样本

2蛋白总体表达量矩阵 100多个样本X8000多个蛋白

3SPEG糖基化修饰矩阵样本X糖基化肽段量

4IGP糖基化修饰矩阵样本X糖基化肽段量

此图信息量巨大，很有聚类分析的代表性

对三种组学的样本进行聚类，发现聚类结果具有保守性（一致性），区分了患者的亚群

这里使用z-score的log表达量，选择了变异系数最大的50个基因进行聚类，为的就是让差异变大，更好的区分亚群

然后计算每个组的每个亚群和其他组亚群之间的相关性，（每个亚群取均值），发现IGP作为分类标准分的效果最好

然后可以用每个样本的聚类信息与样本的临床信息之间再做相关性分析，比如

样本A 样本B 样本C 样本D 样本E

聚类 1 2 2 3 3

肿瘤类型 1 2 3 1 3

就可以计算聚类和肿瘤类型的相关性

在样本层面的聚类后又对基因层面进行聚类，利用IGP数据把基因聚成3类，分别是得出每个类的相关通路

基因层面每个类也进行了对每个类和糖基化修饰类型的关系，发现也高度相关

自己对基因聚类完了以后，还可以用其他人研究出来的基因划分标准进行划分，比较自己的聚类和标准的分类

用基因类型去看这些样本类之间的表达量变化

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

多组学学习-案例统合分析