推荐看国家疾控的文章“新型冠状病毒基因组序列的网络平台与基因分型-宋洋”,写的非常详细,目前有四种分型方法:“ 中国分型法”、“Pangolin 分型法”、“GISAID 分型法”和“Nextstrain 分型法”。
中国分型法:
主要用L与S基因型与进一步的家系(lineage)划分,分型方法很简单直观,在国内各大新闻中都会看到这种写法。
Pangolin 分型法(https://cov-lineages.org/pangolin.html):
“Phylogenetic Assignment of Named Global Outbreak Lineages(以系统发育归类命名全球暴发分支)”。研究基于GISAID 数据库中
当时27 767 个SARS⁃CoV⁃2 基因组序列的系统发育提出了一个合理和动态的命名,即使用一个系统发育框架来识别当下活跃的病毒分支。
以A,B为主分支,最近比较火的,英国发现的变异病毒“B1.1.7”,就是基于这种分型方法。
可以在线分析数据(https://pangolin.cog-uk.io/),把fasta文件拖拽上去即可。
Nextstrain分型法
Nextstrain 团队同样开发了一种型别划分的方法,他们建议按病毒估计出现的年份顺序和字母顺序命名主要的簇,例如主簇19A、19B、20A。这样命名可以每年更新,并减少字母的使用带来命名的混乱。
Nextclade
推荐一个画ncov系统发生树的工具,Nextclade(https://clades.nextstrain.org/),分析速度很快,结果也很准确。
Nextclade can not do such phylogenetic analysis in the browser. Instead, we perform clade assignment sequence-by-sequence on the basis of signature mutations. This is expected to be slightly less sensitive, but will still give the correct answer in most cases.
画出来的图很大,不好辨认,只要点击对应的进化枝,就能放大图片,就能看清楚了。