高低风险组差异化分析后,得到差异基因
对这些差异基因做go,kegg,gsea分析
现在对gsea还是不是很清楚要表达的是什么?
但是似乎和go,kegg通用,也可以做这些
尝试做一下go,kegg还有GSEA这些
https://mp.weixin.qq.com/s?src=11×tamp=1641312620&ver=3538&signature=wkEQmhI0pxA94lWBwmUBcSzn8NOr6Tsoij4OeJdZXVPwtec3M6YpxmEQk-kLTdqk1CAbjHRS5jor*zMIx2ZfrwHLEh2KqDhniFALF0gbhJOyYXtzeFt6nXxjiaoNh*5S&new=1
GSEA介绍及做图
GSEA vs. DEGs
DEGs多聚焦于单个基因;GSEA是在基因集水平上比较不同生物学系统(不同样本)间的转录组差异。
#也是比较差异,那就是需要差异基因,还需要一个与这些差异基因有关的表型
结果稳健性更好,在不同团队研究结果中的生物学意义的可重复性和解释性更好。
高度灵活性,主要体现在基因集的来源。可以使用公共数据库如MsigDb,还可以根据研究目的自己构建。
总的来说,GSEA富集分析有以下三个要点:
input data1 :样本的全基因组RNA测序数据及样本的表型标签信息【样本数尽量多一些,否则假阳性高】
input data 2:基于某个合适的指标(如差异倍数FC)对所有基因排序,获得排序基因列表L = {g1, g2, g3, g4, …… gN};【可根据研究需要,制定个性化排序方案,如基于与兴趣TF的相关性。】
input data 3:基因集S【具有充分个性化空间。可自己定义,也可以人工筛选和矫正。】
input data 4:指定计算过程中权重值p。