上一期给大家简单介绍了
今天我们用前面讲差异表达分析时,用到的TCGA数据库中的CHOL这套数据的差异表达分析结果来举例。TCGA数据差异表达分析可以参考前面的文章。
当然circleplot这个函数,对于GEO数据库中的数据,也同样适用。只需要得到相应的差异表达分析结果就可以。GEO中数据差异表达分析可以参考前面的文章。
如果我们仔细研究circle_dat这个函数,你会发现。这个函数对差异表达分析的结果,要求其实很简单。只需要包含两列,第一列是基因的名字,第二列是差异表达分析的倍数改变logFC。☞circleplot展示GO富集分析结果文中,我们给出了一个例子
而对GO富集分析结果的要求也仅限于,包含category(BP,MF,CC),ID:GO号,term:GO条目的具体名称,富集分析矫正之后的p-value,还有富集到每个GO条目上的具体的基因名称。☞circleplot展示GO富集分析结果文中,我们也给出了一个例子。其实DAVID富集分析也可以得到类似的结果。
☞基因富集工具DAVID介绍(四)-GO富集分析及柱形图展示
因此我们只需要将自己差异表达分析得到的结果,格式处理成circle_dat需要的格式。然后进行GO富集分析,将GO富集分析的结果也处理成circle_dat需要的格式即可。
完整GO富集分析+数据格式处理+circleplot的R代码+详细注释☟☟☟