metawrap-classify板块报错的解决办法

Metawrap是一款非常强大的宏基因组数据分析包,包括宏基因组数据分析所需的所有模块:序列质控、物种注释、组装、单菌基因组分箱分析、单菌提纯、单菌重组装、单菌定量、单菌分类和注释和单菌基因组可视化。

正因为其功能强大,其依赖的数据库和软件较多。数据库的版本、软件版本与metawrap本身的版本要相匹配,否则会出现错误。

metawrap 功能模块 (https://github.com/bxlab/metaWRAP )

Classify 模块的报错

我在运行前几个模块都没有出错,但是到classify模块时开始出错

错误1

出错提示为“The file··· nt.00.nhd doesnt exist”

按照提示,我首先检查了config文件中的路径,是没有问题的;接着检查了数据库,里面的确不存在nt.00.nhd 文件。因此我又重新下载nt数据库(wget "ftp://ftp.ncbi.nlm.nih.gov/blast/db/nt.*.tar.gz"),但是下载后的压缩包无法解压缩(可能是由于数据库太大,60-70g,下载不稳定)。


报错1

后面在网上搜索到一些快速稳定地下载数据库的方法,我先是使用aspera的方法(ascp -v -k 1 -T -l 400m -i /home/crusta/.aspera/connect/etc/asperaweb_id_dsa.openssh anonftp@ftp.ncbi.nlm.nih.gov:/blast/db/nt.00.tar.gz ./ ),但是一次只能下载一个分库,将00改成*就报错。后面在师姐的推荐下使用了rsync -av --progress rsync://ftp.ncbi.nlm.nih.gov/blast/db/nt.*.tar.gz,能稳定的下载nt库并解压缩,解压后的文件确实跟原始的数据库不一样,但里面依然没有nt.00.nhd 文件,运行metawrap classify命令依然报错。


原本的库-每个分库里面包含3个文件


更新的库-每个分库里面包含6个文件

本来决定要放弃了,但是突然想起前两天GitHub上面一段note(https://github.com/bxlab/metaWRAP/blob/83e3fe342684119cb6a26a648a12d30d9196cf87/installation/database_installation.md?plain=1),提示如果blast版本超过2.6,需要下载nt库的v4版本(但前两天还没有解决稳定下载数据库的问题,并且我运行blastn -version 显示“blastn:2.6.0+,Package: blast 2.6.0, build···”,也不知道算不算超过,所以当时我忽略这个提示)。

下载nt数据库的代码

随后运行rsync -av --progress rsync://ftp.ncbi.nlm.nih.gov/blast/db/v4/nt_v4.*.tar.gz .下载nt库,解压缩后“for a in nt_v4.*.tar.gz; do tar xzf $a; done”,确实有nt.00.nhd文件

V4版本-一个分库里面有10个文件

看到有nt.00.nhd文件后,我确实大松一口气,终于可以运行这个模块了,更改了config文件中的路径,成功运行上了。

但四十分钟之后,出现了第二个错误

错误2

错误提示Failed to run taxator. Exiting····


错误2

又一顿查找,在GitHub上有该问题的解决方法(https://github.com/bxlab/metaWRAP/issues/287),需要替换两个文件


解决办法

替换之后,要注意添加两个文件的运行权限,否则会提示permission denied。

chmod +x /···/classify_bins.sh

chmod +x /···/prune_blast_hits.py


最后运行classify模块,成功得到bin_taxonomy.tab。


想说,碰到问题多看GitHub!后续有问题再继续更新

参考:

1.https://github.com/bxlab/metaWRAP

2.https://github.com/bxlab/metaWRAP/blob/83e3fe342684119cb6a26a648a12d30d9196cf87/installation/database_installation.md?plain=1

3.https://github.com/bxlab/metaWRAP/issues/287

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,904评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,581评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,527评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,463评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,546评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,572评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,582评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,330评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,776评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,087评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,257评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,923评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,571评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,192评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,436评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,145评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,127评论 2 352

推荐阅读更多精彩内容