【基因组注释】同源注释比对软件tblastn、gamp和exonerate比较

基因结构预测中同源注释策略,将mRNA、cDNA、蛋白、EST等序列比对到组装的基因组中,在文章中通常使用以下比对软件:

  • tblastn
  • gamp
  • exonerate
  • blat

根据我的实测,以上软件整体都比较慢。gmap可设置多线程来提升速度。tblastn虽然也可以,但对提速没什么影响。exonerate和gamp巨吃内存。
以下是跑的资源情况。我的组装基因组约400Mb。tblastn的查询序列311764条,gmap的查询序列1483791条,exonerate的查询序列43632条。

image.png

另有一款软件 spaln:https://github.com/ogotoh/spaln,据说很快。但文档比较费解,我懒得摸索,暂时还没用起来。

因此,我的建议是如果你的服务器配置很高,首选gmap多设线程。配置不高或者想快速获得结果情况下,可拆分query序列(蛋白/cDNA/mRNA/EST),进行并行比对,最后进行合并。尤其是tblastn之类的软件,必须这样才行。否则建议尝试用spaln(影响力较低,没用过,还不好说)。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容