Diamond构建本地nr蛋白库报错Error: Invalid taxonomic rank.怎么办?

w因课题需要,采用diamond构建本地nr蛋白库,运行了数小时后得到一个报错,报错信息为Error: Invalid taxonomic rank.

搜索半天没得到解决方法,最终通过微信群中的大佬指点迷津,得以解决。现将具体构建步骤和解决办法记录,以供大家参考。

一、nr数据库及tax信息下载

(1)nr.gz和nr.gz.md5  

linux下载方法:wget -c https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz*

windows下载方法:Index of /blast/db/FASTA (nih.gov)

下载完成后,使用如下命令检查nr.gz的完整性

md5sum -c nr.gz.md5

(2)prot.accession2taxid.gz和taxdump.tar.gz下载(注意和nr)

wget  -c              https://ftp.ncbi.nlm.nih.gov/pub/taxonomy/accession2taxid/prot.accession2taxid.gz*

wget  -c     https://ftp.ncbi.nlm.nih.gov/pub/taxonomy/taxdump.tar.gz*

diamond下载

二、建库

diamond makedb --in nr.gz --db nr --taxonmap prot.accession2taxid.gz --taxonnodes nodes.dmp

其中nodes.dmp来自taxdump.tar.gz

报错:

Error: Invalid taxonomic rank.

解决办法:

更新diamond版本,原来diamond为0.9.3.1,更新为v2.0.15得以解决。

下载链接为https://github.com/bbuchfink/diamond/releases/(请务必下载与taxdump相匹配的版本)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容