bakta:细菌基因组注释更好的选择

新软件(其实出了很久了),这两天部署好用了一下,感觉很不错。

安装

直接conda
conda install bioconda::bakta
软件最新版要6.0的数据库,软件主页提供的备用下载源下载的是5.1(反正我下载那会是),这个需要注意。当然网络“畅通”的话用正式源就能下载得到。
推荐的还是软件直接下载,我用light的数据库,轻量版本。
bakta_db download --output <output-path> --type [light|full]

使用

最基础就是指定输入输出文件和数据库路径即可:
bakta 你的.fasta --output 输出文件夹/ --db 你的数据库/全路径/
留意输出文件夹是否已经提前创建,可以在命令后加--force来强制输出到文件夹,运行前确保重要文件不存在于输出文件夹避免出现丢失问题。
bakta 你的.fasta --output 输出文件夹/ --db 你的数据库/全路径/ --force
一次注释只能提供一个fasta文件,批量注释需要自行撰写脚本进行。

输出结果

注释后获得的文件列表:


示例

有基因组的圈图,感觉真的方便,一般使用用途已经足够了:


GCF_000829055.1_ASM82905v1_genomic.png

相比prokka,获得的注释信息会更加的丰富,很多假定蛋白都有了对应的基因及产物结果,当然需要看你是什么菌了,反正我的是这样=。=

引用

bakta主页
注释菌株:Lacticaseibacillus casei DSM 20011 = JCM 1134 = ATCC 393 genome assembly ASM82905v1 - NCBI - NLM

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容