5-【ANI、AAI、dDDH】的安装和使用(2021.2.4)

安装时间:2021.2.4


1. 简介

目前原核生物常用的分的界定标准有三种,包括基因组之间的平均氨基酸均一性(Average Nucleotide Identity, ANI),平均氨基酸均一性(Average Amino acid Identity, AAI),DNA杂交(DNA-DNA hybridization, DDH)。其中ANI作为种间判定的依据用的较多,同时,种间ANI的阈值根据不同的情况,在95%-96%之间波动,较多以95%为阈值。通常种间的界定阈值为DDH=70%,ANI=95%,AAI=95%。


2. fastANI

2.1 安装

conda install fastANI

2.2 使用

  1. 一对一的比对计算
fastANI -q genome1.fa -r genome2.fa -o output.txt
  1. 一对多的比对计算
fastANI -q genome1.fa --rl genome_list.txt -o output.txt
  1. 多对多的比对计算
 fastANI --ql query.list --rl reference.list --matrix -o output.file -t 20

注意:query.list和reference.list文件内容为所比对基因组文件的名称,一个基因组名称独立成一行。


3. compareM

基因组之间的平均氨基酸的计算工具较少,同时其用于界定种间并不被普遍接受。

3.1 安装

conda create -n compareM python=3.6
conda activate python3.6
conda install comparem

3.2 使用

comparem aai_wf  <input_files>  <output_dir>

注意:
① input_files为包含基因组文件名称的文件,每个基因组文件名单独成行
② 文件名以.fa结尾
③ 包含基因组文件名的文件最后不能有空行


4. GGDC

  • dDDH的计算暂时只找到一个网页版本的工具GGDC
  1. 该网页版本工具一次最多只能提交75个基因组序列
  2. 采用三种不同的计算公式,得出三种不同的结果。推荐采用第二种,因为公式2与基因组的长度无关。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容