1. 简介
antiSMASH基于聚类检测,通过核心生物合成酶来鉴定45种不同类型的次级代谢产物合成途径。使用内置的ClusterBlast算法,将识别的目标簇与antiSMASH数据库中已知簇进行比较。
2. 安装
2.1 创建并进入安装的基本环境
conda create -n antismash_5.2.0 python=3.7 #实际下载python=3.7.9
conda activate antismash_5.2.0
2.2 借助conda环境安装依赖包
conda install hmmer2 hmmer diamond fasttree prodigal blast muscle glimmerhmm
conda install meme=4.11.2 #官方文档建议安装版本
2.3 下载并安装antismash_5.2.0
wget https://dl.secondarymetabolites.org/releases/5.2.0/antismash-5.2.0.tar.gz
tar -zxf antismash-5.2.0.tar.gz
pip install ./antismash-5.2.0
2.4 下载相应数据库
download-antismash-databases
注:
① 如下载失败,可安装较低版本得biopython,方法见踩坑。
② 如数据库下载太慢,可以参考:周亮亮博客。
2.5 验证antiSMASH是否安装成功
antismash --check-prereqs
只要出现"All prerequisites satisfied"即安装成功。
3. 使用
antismash --cb-general --cb-knownclusters --cb-subclusters --asf --pfam2go --smcog-trees --genefinding-gff3 文件a.gff 文件b.fa
注意:
① 可以直接使用.gbk格式的文件。
② 文件b为完整的基因组序列。
4. 踩坑之旅
4.1 第一次安装
利用conda安装,好家伙,直接失败。
4.2 第二次安装
-
过程:
由于conda直接安装失败,于是按照官方文档,利用conda环境辅助安装依赖包,然后安装antismash。 -
失败:
用conda创建的环境,python=3.8.5,对于官方测试的依赖包blast=2.60版本过高。 -
解决办法:
按照官方文档已测试的版本,建立python=3.5.3的环境重新安装。
4.3 第三次安装
-
失败:
blast=2.6.0可以安装上了,但是安装meme=4.11.2时,python版本又不合适了。 -
解决办法:
安装python=3.6总可以了吧!
4.4 第四次安装
-
失败1:
在下载数据库时出现:
-
解决办法1:
降低biopython的版本
pip3 uninstall biopython
pip3 install biopython==1.76
-
失败2:
数据库下载完成后,在最后一步验证时出现以下问题:
-
解决办法2
根据周亮亮博客的方法,安装antiSMASH_5.1.2。
4.5 第五次安装
-
失败:
创建python=3.6后继续安装,在最后一步出现以下问题:
-
解决方法:
直接从github上找到了正确的安装方法
5. 安装经验总结
- 根据可以百度到的具体成功安装实例进行安装,在时间上最好是就近的,选择好之后,就全程照着去做。
- 两次尝试失败之后,需要从官方的安装文档入手。
- 如果按照官方的文档安装仍然失败,可以在github网站上查找相关的软件网页,通常会有软件的作者进行解答。