主要是来自纪伟讲测序的组学相关视频和专栏
文章1 蛋白糖基化修饰
视频:https://www.bilibili.com/video/BV1hz4y1r74a
数据:
1样本临床信息矩阵 包括多种肿瘤样本
2蛋白总体表达量矩阵 100多个样本X8000多个蛋白
3SPEG糖基化修饰矩阵 样本X糖基化肽段量
4IGP糖基化修饰矩阵 样本X糖基化肽段量
1 聚类!
对三种组学的样本进行聚类,发现聚类结果具有保守性(一致性),区分了患者的亚群
这里使用z-score的log表达量,选择了变异系数最大的50个基因进行聚类,为的就是让差异变大,更好的区分亚群
然后计算每个组的每个亚群和其他组亚群之间的相关性,(每个亚群取均值),发现IGP作为分类标准分的效果最好
然后可以用每个样本的聚类信息与样本的临床信息之间再做相关性分析,比如
样本A 样本B 样本C 样本D 样本E
聚类 1 2 2 3 3
肿瘤类型 1 2 3 1 3
就可以计算聚类和肿瘤类型的相关性
在样本层面的聚类后又对基因层面进行聚类,利用IGP数据把基因聚成3类,分别是得出每个类的相关通路
基因层面每个类也进行了对每个类和糖基化修饰类型的关系,发现也高度相关
自己对基因聚类完了以后,还可以用其他人研究出来的基因划分标准进行划分,比较自己的聚类和标准的分类
用基因类型去看这些样本类之间的表达量变化