这两天在基因课上学了一下eggnog-mapper,先看文章,然后看视频课程,正好工作有需要对一批转录本进行功能注释。捣鼓一下,在基因课的服务器上操作的,特此记录一下。
- 文章:Fast genome-wide functional annotation through orthology assignment by eggNOG-mapper
- 使用文档
- hoptop笔记
- 刘小泽
基本信息两位师兄都是珠玉在前,我就不说了。下面说一下我的使用感受。
我要功能注释的蛋白序列文件大概有18M,使用
grep ">" text.pep.fa | wc -l
# 33932
那么推荐应该用diamond模式,命令如下:
nohup python2 /pub/software/eggnog-mapper-1.0.3/emapper.py -m diamond -i text.pep.fa -o Tea_annotation --usemem --cpu 6 &
报错:Error: Database was built with a different version of diamond as is incompatible.,与链接里面发生的问题一样。随后我用他的解决办法发现需要使用 /pub/software/eggnog-mapper-1.0.3/bin/diamond的 diamond命令,而这个是0.8.22的老版本我使用的conda安装的0.9.21新版本。所以作者说只能使用这里面的老diamond。因此我就需要将老版本加入环境变量并覆盖新版本。办法是只要在环境变量加入的位置放在新的后面就可以覆盖。果然就解决了。花了可能三四个小时不到就完成了。前一天作死用hmmer模式跑结果十多个小时就跑出来20个结果。果然diamond真快!
BTW:我想把实验室的服务器也装上eggnog-mapper,困难的是服务器下载那些数据库文件太慢了,而那些文件加起来可能有70多G。所以只能本地下载,再上传到服务器上,不知道最后能不能运行成功。只能走一步,看一步。
结果证明是完全可行的!