写在前面
前段时间,推过两个教程,分别是:
1.《零基础快速完成基因功能注释 / GO / KEGG / PFAM...》
2.《「GO富集分析」从原理到实践 ~ 零基础掌握》
可以说,如果这系列教程还不完整,那么缺少的就是一个 KEGG 通路富集分析教程。而这个功能,也是 TBtools 的基本功能之一。很多时候,我更多撰写或讲演 GO 富集分析相关内容,而忽略了 KEGG 通路富集相关。主要原因是,前者懂了,后者往往也就懂了,毕竟富集分析原理一样,只是注释信息有不同。
当然,在具体软件使用上也有点点区别,甚至有不少时候,KEGG Pathway 富集分析能提供我们更为具体的分析结果。
使用 TBtools 进行 KEGG Pathway 通路富集分析
使用这一功能,首先是打开对应功能
可以看到界面
注意到不同选项:
- 设置一个KEGG数据库文件,一般在 TBtools 中,叫做 .KEGG.BackEnd 文件,类似 Gene Ontology 的 go-basic.obo 文件;这一文件可以用《TBtools Cookbook》中找到下载位置
https://www.yuque.com/cjchen/hirv8i/ghaxyl
也可以通过在选择 6. 中选项,并点击 7. Mack One Backend File From Web 来准备。不过这依赖于当前网络与KEGG官网网络的通畅程度。一般建议直接从Cookbook 给出的链接下载。
设置KEGG 注释信息文件,基因ID和KEGG Knum各一列,使用制表符分隔。如果不知道如何准备,建议参考前述教程《零基础快速完成基因功能注释 / GO / KEGG / PFAM...》。
设置基因选择集 ID 列表,一行一个ID,可以是差异表达基因集合,或者 GWAS 定位到的区间基因ID,或者是各类合理方式获得的基因ID集合
设置一个输出目录,或可以给出输出文件名字前缀
点击 Start 即可开始
查看富集分析结果
输出两个结果
一般只看.final.xls文件
具体含义,请参考《「GO富集分析」从原理到实践 ~ 零基础掌握》并自行理解。
当然,如果你想可视化
与 GO 富集分析可视化同个功能
输出结果如下
具体用户感兴趣一些可视化参数,请自行调整。
写在最后
Emmm,果然,我还是不太想写。不过我仍然相信,通过这个教程,大伙可以点点点,完成 KEGG Pathway通路富集分析。