MLST
软件下载地址:https://github.com/tseemann/mlst
MLST在线分析:https://cge.food.dtu.dk/services/MLST/
或者pubmlst也可以(官网:https://pubmlst.org/)
MLST(Multi-Locus Sequence Typing)是一种基于核酸序列的细菌分型技术,主要用于微生物种群中菌株的分型鉴定。MLST通过细菌内保守但具有足够多态性的基因座(loci)(通常是6到10个)的核苷酸序列来区分不同的菌株
【图片来源:https://zhuanlan.zhihu.com/p/691756107】
##install [or conda install]
git clone https://github.com/tseemann/mlst
cd mlst
make
#conda安装
conda install -c conda-forge -c bioconda -c defaults mlst
##usage
mlst [--scheme <scheme_name> --legacy] [--csv] contigs.fa [--threads 10] > mlst.tsv
#--scheme:指定菌种数据库的MLST方案名称,mlst --list可查看所有菌种数据库,不填会自动选
#--legacy:添加表头,其标题包含特定于该方案的等位基因名称
#contigs.fa:输入文件( FASTA/GenBank/EMBL文件,可gz文件),多个文件可以一起运行,如kp*.fna
#--csv:输出csv格式,默认tsv
#--threads:线程数
#for example
mlst 1.fna >mlst.tsv
mlst --scheme klebsiella --legacy --thread 10 1.fna > mlst.tsv
##results
#It returns a tab-separated line containing:
#the filename, the matching PubMLST scheme name, the ST (sequence type), the allele IDs
1.fna klebsiella 22 gapA(1) infB(1) mdh(1) pgi(1) phoE(1) rpoB(1) tonB(1)
在 MLST 分析中,通常会选择几个保守的基因(例如 7 个核心基因),对这些基因进行测序并比较其序列。根据每个基因的序列变异,给每个菌株分配一个唯一的 ST 号。这个 ST 号是由每个基因的序列类型组合而成的。
Reference:
https://www.jianshu.com/p/dab889d8d28e
https://zhuanlan.zhihu.com/p/691756107