NextClade --病毒分析分型利器

大家肯定都听说过新冠病毒分型,像什么包括阿尔法、贝塔、德尔塔、奥密克戎变异株BA.2.12和BA.2.12.1。。。。这些分型是怎么来的?

  • 基因组序列的差异通过比对不同病毒株的全基因组序列,寻找关键的变异区域。
  • 特定基因的差异(此点常用)一些基因(如编码表面蛋白的基因)变异较快,因此常用于分型。
    • 流感病毒的HA 和NA 基因。
    • 呼吸道合胞病毒(RSV)的G 基因
    • 新冠病毒编码S蛋白的基因
    • 诺如病毒VP1 基因突变和插入/缺失(InDel)

    呼吸道合胞病毒系统发育树

    通过将这些基因构建系统发育树,将具有共同祖先的病毒分为不同基因型。那么问题来了。要想分型我必须要有某一个病毒的数据库,并且有官方的分型命名,然后自己才能构建发育树,看属于那一个分型

    NextClade应用而生(相信进行过新冠基因分型的朋友一定用过)

    Nextclade 和Nextstrain 是由Trevor Bedford 和Richard Neher 主导开发的开源项目。

  • Trevor Bedford

  • 机构:美国西雅图的Fred Hutchinson 癌症研究中心(Fred Hutch Cancer Center)
  • 专业领域:病毒进化、流行病学建模和生物信息学。
  • Richard Neher

  • 机构:瑞士巴塞尔大学的生物系统科学与工程研究所(Biozentrum, University of Basel)
  • 专业领域:分子进化、生物物理学和病毒基因组学。
  • 通过实时可视化病毒基因组数据,帮助研究人员追踪病毒的传播和演化。Nextclade 是 Nextstrain 项目中的一部分,用于处理基因组序列的具体分析。


    开发支持

    Nextclade 和 Nextstrain 的开发得到了多个机构的支持,包括:

  • 比尔及梅琳达·盖茨基金会(Bill & Melinda Gates Foundation)
  • 美国国家卫生研究院(NIH)
  • 欧洲研究理事会(ERC)
  • 支持的病毒

    (1)SARS-CoV-2

      (2)流感病毒

      • 甲型流感病毒(Influenza A)包括 H1N1、H3N2 等亚型。
      • 乙型流感病毒(Influenza B)Victoria 和 Yamagata 两个系。
      • 流感病毒的基因型分类和突变追踪。
      • 疫苗株匹配分析。

      (3)猴痘病毒(Monkeypox virus)

      • 基因组分型。
      • 突变追踪。

      (4)登革热病毒(Dengue virus)

        (5)呼吸道合胞病毒(Respiratory Syncytial Virus,RSV)

                RSV A 型和 B 型。

        • 基因型分类(如 ON1、BA)。
        • 突变注释。

        (6)人乳头瘤病毒(Human papillomavirus,HPV)

          (7)诺如病毒(Norovirus)        支持 VP1 基因序列的分析和基因型注释。        基因型分类(如 GII.4、GII.17)。
          选择参考基因组和数据库



          3. 数据来源

          Nextclade 的支持病毒种类主要根据全球公共健康需求动态更新,数据来源包括:

        • GISAID(全球流感和新冠病毒共享数据库):特别是 SARS-CoV-2 和流感病毒。
        • GenBank(NCBI 病毒数据库):支持所有病毒基因组的公开序列。
        • 其他研究机构提供的数据集世卫组织、欧盟 ECDC。
        • 如何使用

          核心功能

          1.序列比对(Alignment)

        • 将用户上传的病毒基因组序列与参考序列进行比对。
        • 支持核酸序列(如FASTA格式)的输入,比对结果直观显示碱基替换、插入和缺失。
        • 2.质量控制(Quality Control, QC)

        • 自动评估基因组序列的质量,标记可能存在问题的区域:
          • 序列覆盖范围(如是否缺失关键基因区)。
          • 碱基“未定义”(N)比例过高。
          • 测序错误(例如高比例的非标准碱基)。
        • 提供明确的评分,便于筛选高质量序列。
        • 3.克莱德分类(Clade Assignment)

        • 根据 Nextstrain 定义的分类系统,将病毒序列分配到特定的克莱德(Clade)。
        • 克莱德代表病毒的进化分支,例如 SARS-CoV-2 的20A、20B、21J等分类,有助于追踪病毒的传播和演化趋势。
        • 4.突变检测(Mutation Calling)

        • 自动识别序列中的关键突变,包括:
          • 单碱基替换(Substitution)。
          • 插入(Insertion)。
          • 缺失(Deletion)。
        • 突变会与参考序列注释进行比较,标出功能相关位点(如非同义突变)。
        • 5.系统发育树分析(Phylogenetics)

        • 将序列映射到现有的系统发育树中,显示用户序列与已知病毒株的进化关系。
        • 帮助研究人员了解病毒株之间的亲缘关系。
        • 6.可视化和报告

        • 提供交互式的可视化界面,显示分析结果:
          • 突变列表及其功能影响。
          • 系统发育树位置。
          • 克莱德分类。
        • 支持生成详细的结果报告,供后续研究和发表使用。

        • 使用流程

          在线版本

        • 访问网站打开Nextclade 网站,无需注册即可使用。

        • 上传序列

        • 点击“Upload Sequences”按钮,上传病毒基因组序列(支持 FASTA 格式)。
        • 多条序列可同时上传,便于批量分析。
        • 选择参考数据集

        • 根据需要选择分析的病毒类型(如 SARS-CoV-2、流感病毒等)。
        • 使用 Nextstrain 提供的最新参考数据集,确保结果准确。
        • 运行分析

        • 点击“Run Analysis”,工具将自动完成比对、QC、突变检测和克莱德分类。
        • 查看结果

        • 每条序列的质量评分、突变列表和克莱德分配。
        • 系统发育树中高亮显示序列位置。
        • 分析完成后,页面显示结果:
        • 支持下载详细报告(CSV/JSON格式)。

        • 本地版本(Nextclade CLI)

          对于需要高通量分析或隐私保护的用户,Nextclade 提供了命令行工具(CLI),可本地运行。

          安装 Node.js 后运行

          npm install --global @nextstrain/nextclade

        • 获取参考数据

        • 下载对应的病毒参考数据:
          
          
          nextclade dataset get --name <virus-name>
          
          
          nextclade dataset get --name sars-cov-2
        • 运行分析

        • 使用以下命令处理序列文件:
          
          
          nextclade run --input-fasta input.fasta --output-csv output.csv
        • 查看结果

        • 本地生成的文件包括突变列表、质量控制评分和克莱德分类结果。

        • Nextclade的优势

        • 实时更新

        • 数据库和分析模型根据最新病毒信息实时更新,特别适合追踪快速变异的病毒(如 SARS-CoV-2)。
        • 多功能整合

        • 集成比对、QC、突变分析和系统发育树等功能,减少工具切换的麻烦。
        • 灵活易用

        • 提供在线和离线两种版本,满足不同场景需求。
        • 直观界面适合非专业人员,CLI支持高效批量分析。
        • 广泛适用性

        • 支持多种病毒类型(包括冠状病毒、流感病毒、登革热病毒等),不仅局限于 SARS-CoV-2。

        • 典型应用场景

        • 病毒基因组质量评估

        • 通过质量控制功能筛选高质量基因组序列,用于后续分析。
        • 疫情监测与追踪

        • 使用克莱德分类和系统发育树分析病毒的传播和演化路径。
        • 疫苗和药物研究

        • 突变分析有助于识别抗原性变化或抗药性相关位点。
        • 流行病学研究

        • 研究病毒在不同地理区域的变异模式。

        • 相关链接和资源

        • Nextclade 官网  https://clades.nextstrain.org/
        • Nextstrain 文档  https://docs.nextstrain.org/
        • Nextclade CLI GitHub  https://github.com/nextstrain/nextclade
        • 可以参考 Nextstrain 的官方文档或社区论坛。

          ©著作权归作者所有,转载或内容合作请联系作者
          平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

          推荐阅读更多精彩内容