BUSCO 做基因组评价

Benchmarking Universal Single-Copy Orthologs (BUSCO)是用于评估基因组组装和注释的完整性的工具。在相近的物种之间总有一些保守的序列,而BUSCO就是使用这些保守序列与组装的结果进行比对,鉴定组装的结果是否包含这些序列,包含单条、多条还是部分或者不包含等等情况来给出结果。通过与已有单拷贝直系同源数据库的比较,得到有多少比例的数据库能够有比对,比例越高代表基因组完整度越好。


方法一:指定数据库

#选择数据库
busco --list-datasets

#  使用不同数据库进行 BUSCO 分析
busco -m prot -i pep.fasta -o viridiplantae_odb10 -l viridiplantae_odb10 -c 4

会生成busco_downloads文件夹

方法二:自动选择数据库

# 使用不同数据库进行 BUSCO 分析
busco -m prot -i Sind.pep.fasta -o auto-lineage-euk --auto-lineage-euk -c 4 
  • 统计结果


画图

将结果都放在一个新建的result文件夹里

generate_plot.py -wd result

BUSCO安装比较复杂 推荐使用conda或者singularity容器

欢迎关注Bioinfor生信云!

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容