蛋白组学的思路——之前时公司做的,已经分析过了,我只是尝试自己做一下。
1、得到蛋白原始数据,raw
2、搜库,用各种软件,自己体会的时MaxQuant,但是还没这个水平,最终放弃。参考https://www.jianshu.com/p/1bcd7dcd99f0,但是该没那么简单,公司用的软件时Proteome Discoverer,收费,数据库用的Uniport的。
3、得到匹配数据,然后不同组比较,得到fold-change(变异系数),这个就是log2(B/A)就是B相对于a的变异系数,这次试验取的是大于1.2或者小于0.83(0.83就是1.2的倒数)的蛋白,这就是差异蛋白了,实际上所选择的就是小于-0.27的为表达下降,大于0.27的就是表达上升,变异系数一般也可以选择1.5与0.6或者2与0.5,根据差异蛋白多少决定,200-500个蛋白比较合适。
4、GO富集分析与KEGG富集分析
具体的GO分析参考GO富集分析(转载)
[基因组学]使用biomaRt做水稻ID转换及相关信息的填充
富集分析其实就是将差异蛋白进行注释,然后看差异蛋白在GO数据库与KEGG通路的不同Term下的多少与分布情况,然后绘制散点图热图柱状图。(定义不准确,还要多学习)
KEGG参考这里https://zhuanlan.zhihu.com/p/107225881?utm_source=cn.wiz.note
还有一些没弄明白的,比如火山图聚类分析热图等。