大家肯定都听说过新冠病毒分型,像什么包括阿尔法、贝塔、德尔塔、奥密克戎变异株BA.2.12和BA.2.12.1。。。。这些分型是怎么来的?
- 流感病毒的HA 和NA 基因。
- 呼吸道合胞病毒(RSV)的G 基因。
- 新冠病毒编码S蛋白的基因
- 诺如病毒VP1 基因突变和插入/缺失(InDel)
呼吸道合胞病毒系统发育树
通过将这些基因构建系统发育树,将具有共同祖先的病毒分为不同基因型。那么问题来了。要想分型我必须要有某一个病毒的数据库,并且有官方的分型命名,然后自己才能构建发育树,看属于那一个分型
NextClade应用而生(相信进行过新冠基因分型的朋友一定用过)
Nextclade 和Nextstrain 是由Trevor Bedford 和Richard Neher 主导开发的开源项目。
Trevor Bedford
Richard Neher
通过实时可视化病毒基因组数据,帮助研究人员追踪病毒的传播和演化。Nextclade 是 Nextstrain 项目中的一部分,用于处理基因组序列的具体分析。
开发支持
Nextclade 和 Nextstrain 的开发得到了多个机构的支持,包括:
支持的病毒
(1)SARS-CoV-2
(2)流感病毒
- 甲型流感病毒(Influenza A)包括 H1N1、H3N2 等亚型。
- 乙型流感病毒(Influenza B)Victoria 和 Yamagata 两个系。
- 流感病毒的基因型分类和突变追踪。
- 疫苗株匹配分析。
(3)猴痘病毒(Monkeypox virus)
- 基因组分型。
- 突变追踪。
(4)登革热病毒(Dengue virus)
(5)呼吸道合胞病毒(Respiratory Syncytial Virus,RSV)
RSV A 型和 B 型。
- 基因型分类(如 ON1、BA)。
- 突变注释。
(6)人乳头瘤病毒(Human papillomavirus,HPV)
(7)诺如病毒(Norovirus) 支持 VP1 基因序列的分析和基因型注释。 基因型分类(如 GII.4、GII.17)。
选择参考基因组和数据库
3. 数据来源
Nextclade 的支持病毒种类主要根据全球公共健康需求动态更新,数据来源包括:
如何使用
核心功能
1.序列比对(Alignment)
2.质量控制(Quality Control, QC)
- 序列覆盖范围(如是否缺失关键基因区)。
- 碱基“未定义”(N)比例过高。
- 测序错误(例如高比例的非标准碱基)。
3.克莱德分类(Clade Assignment)
4.突变检测(Mutation Calling)
- 单碱基替换(Substitution)。
- 插入(Insertion)。
- 缺失(Deletion)。
5.系统发育树分析(Phylogenetics)
6.可视化和报告
- 突变列表及其功能影响。
- 系统发育树位置。
- 克莱德分类。
使用流程
在线版本
访问网站打开Nextclade 网站,无需注册即可使用。
上传序列
选择参考数据集
运行分析
查看结果
本地版本(Nextclade CLI)
对于需要高通量分析或隐私保护的用户,Nextclade 提供了命令行工具(CLI),可本地运行。
安装 Node.js 后运行
npm install --global @nextstrain/nextclade
获取参考数据
nextclade dataset get --name <virus-name>
nextclade dataset get --name sars-cov-2
运行分析
nextclade run --input-fasta input.fasta --output-csv output.csv
查看结果
Nextclade的优势
实时更新
多功能整合
灵活易用
广泛适用性
典型应用场景
病毒基因组质量评估
疫情监测与追踪
疫苗和药物研究
流行病学研究
相关链接和资源
可以参考 Nextstrain 的官方文档或社区论坛。