对于非模式物种,需要做GO或KEGG富集,可以尝试使用EGGNOG-Mapper来对你的物种序列进行快速注释。在注释结果文件中,可以同时获得序列映射上的GO号或KO号,直接提取出来即可。
EGGNOG-Mapper可以直接使用网页版,也能在服务器上进行本地化。由于比对调用的是diamond,因此运行速度很快,2W+基因只需要十来分钟,推荐直接使用网页版。
一、EGGNOG-Mapper网页注释
http://eggnog-mapper.embl.de/
运行提交的任务(很重要,需要自己手动运行)
1.进入收件箱,选择click manage your job
-
start your job
-
运行结束,进入下载连接
二、下载数据的预处理
eggNOG-mapper Helper
输出文件中,大家可能最关注的有其中四个:
out.emapper.annotations.description.txt,对应的功能文本描述
out.emapper.annotations.GO.txt,对应的是GO注释结果,可直接用于 TBtools GO富集分析,当注释背景文件
out.emapper.annotations.KEGG_Knum.txt,对应的是KEGG注释结果,可直接用于 TBtools KEGG富集分析,当背景注释文件
out.emapper.annotations.pfam.domain.txt,对应的是PFAM结构域注释,注意,这个注释结果是定性的,即有无某结构域,如果一个序列有多个相同结构域,只会显示一个