3+2生信分析模式下对肠道微生物的解读|Metabolic modelling reveals the aging-associated decline of host–microbiome m...

文献解读概述

这篇文献发表在 Nature Microbiology (2025 年 4 月,Volume 10, pp. 973–991),标题为 Metabolic modelling reveals the aging-associated decline of host–microbiome metabolic interactions in mice。作者团队来自德国多家机构(如 Kiel University、Jena University Hospital 等),通讯作者为 Christoph Kaleta。

文献核心内容

  • 研究背景与目的:衰老伴随肠道微生物组的显著变化,但微生物组与宿主衰老的分子机制尚不清楚。文章结合宏基因组学、转录组学和代谢组学数据,使用代谢建模(metabolic modelling)来表征小鼠衰老过程中宿主-微生物组的代谢互动。重点揭示了微生物组代谢活性下降如何导致宿主代谢变化(如核苷酸代谢下调、肠道屏障功能减弱和系统炎症增加),并提出这些路径可作为未来抗衰老疗法的靶点。
  • 实验设计:使用 52 只雄性 C57BL/6J/Ukj 小鼠(年龄从 2 月到 30 月,代表成年到晚年),采集粪便(用于宏基因组)、结肠/肝脏/脑组织(用于转录组)。额外有无菌(germ-free)小鼠队列用于验证微生物组依赖的宿主基因。总数据包括:167 Gbp Illumina 短读序(shotgun)和 13.7 Gbp PacBio 长读序(long-read)。
  • 关键发现
    • 重建了 181 个宏基因组组装基因组(MAGs),主要来自 Bacillota 和 Bacteroidota 门。
    • 微生物组代谢活性随年龄下降,伴随有益菌间互动减少和宿主炎症增加。
    • 宿主-微生物组互动主要涉及核苷酸、维生素和短链脂肪酸代谢;衰老导致这些互动减弱。
    • 使用约束-based 代谢建模(如 FBA)和 EFMs 采样预测互动,并通过无菌小鼠和代谢组数据验证。
  • 意义:文章强调微生物组是宿主衰老的重要驱动因素,提出基于微生物组的抗衰老疗法潜力。方法整合多组学数据,提供了一个从宏基因组到代谢网络的系统框架。
  • 局限性:仅使用雄性小鼠;MAGs 质量中等(80% 完整性,<10% 污染);建模依赖人类代谢重建(Recon 2.2),可能有物种偏差。

文章结构:引言、结果(MAG 重建、宿主-微生物关联、衰老变化)、讨论、方法(详细生信流程)。补充材料包括扩展数据图和表格(如 Supplementary Table 1.2 为 MAG 元数据)。

生信分析方法解读(重点聚焦 Illumina + PacBio 的 binning)

文章的生信分析主要围绕宏基因组数据处理、MAG 重建、代谢建模和多组学整合。以下按流程分步解读,特别强调用户关注的 Illumina 二代短读序 + PacBio 长读序的 hybrid binning。这些细节主要来自文章的 Methods 部分(页面 11-13 和补充方法)。

1. 数据采集与质量控制(Sequencing & QC)

  • 测序平台
    • Illumina shotgun sequencing:使用 Illumina NexteraXT Library Kit 制备文库,52 个样本在 Illumina NextSeq 500 上测序(2 × 150 bp paired-end,总 167 Gbp)。每个样本的读序合并后进行 QC。
    • PacBio long-read sequencing:在 FLI Leibniz Institute 使用 SMRTbell Template Prep Kit 制备文库(剪切到 75 kb,BluePippin 大小选择 >6 kb)。8 个年龄匹配的样本池化,在 PacBio RSII 上测序(平均读长 7.8-9.7 kb,总 13.7 Gbp)。输出为 circular consensus sequences (CCS) 和 subreads。
  • 质量控制(QC)
    • Illumina 读序:使用 Cutadapt (v1.12) 去除适配器(≥3 bp 重叠,Phred+33 <30 剪切 3' 端);Prinseq lite (v0.20.4) 滑动窗口过滤(步长 5 bp,窗口 10 bp,平均质量 <30,最小长度 50 bp)。
    • 去除宿主污染:Bowtie (v2.2.5) 映射到小鼠参考基因组 (GRCm38.99),保留未映射读序。
    • PacBio 读序:直接使用 SMRTportal 处理成 CCS 和 subreads,无额外过滤(但在 assembly 中使用 filtered subreads)。
    • 结果:无显著年龄组间读序深度或污染差异(Kruskal-Wallis 测试 + Dunn's post-hoc)。

2. 组装与 Binning(Assembly & Binning) - 用户重点

  • Hybrid Assembly(混合组装):这是关键步骤,使用 Illumina 短读(高覆盖)和 PacBio 长读(高分辨率)结合,提高 MAG 质量和完整性。
    • 工具:metaSPAdes (SPAdes v3.13.1) 在 hybrid 模式下运行,k-mer 大小为 21、33、55、77。
    • 输入:
      • Illumina:所有样本的 QC 后 paired-end 读序(forward + reverse 合并)。
      • PacBio:8 个长读库(filtered subreads + CCS)。
    • 输出:全队列 scaffolds(总 367 Mbp)。
    • 过滤:最小长度 1,000 bp,覆盖深度 ≥7.7815(基于 coverage vs. length 散点图确定阈值,参考 Bowers et al., 2017)。
  • Mapping Back:QC 后 metagenomic 读序用 Bowtie (v2.2.5) 映射回 filtered scaffolds(插入大小 0-1,000 bp,very sensitive,非确定性,fr stranded,end-to-end)。计算覆盖深度用 MetaBAT 的 jgi_summarize_bam_contig_depths。
  • Binning(分箱):使用多工具方法,提高准确性。
    • 工具:
      • MetaBAT (v2.12.1):基于覆盖深度和 tetranucleotide 频率。
      • CONCOCT (v1.1.0):scaffolds 切成 10 kbp chunks。
      • MaxBin (v2.2.4):基于 Markov 模型。
    • 总 bins:252 个(3 个工具结合)。
  • Bin Refinement & Quality Check
    • 精炼:DAS Tool (v1.1.2) 整合 3 个 binner 的结果。
    • 质量评估:CheckM (v1.1.2),选择 ≥80% 完整性(completeness)和 ≤10% 污染(contamination)的 bins(181 个 MAGs)。其中 25 个为 high-quality(>90% 完整,<5% 污染,含 23S/16S/5S rRNA 和 ≥18 tRNA),其余 medium-quality。文章使用较宽松阈值以覆盖更多物种,但强调对代谢建模影响小(gap filling 可补偿)。
    • 为什么 hybrid binning?Illumina 提供高覆盖(准确性),PacBio 解决重复序列和 contig 连接,提高 MAG 完整性(genome size 0.9-6.7 Mbp)。结果:MAGs 主要来自 Bacillota (97) 和 Bacteroidota (65),丰度 >1% 的多为 Muribaculaceae。
  • 注释(Annotation)
    • 分类:GTDB-Tk (v2.1.1, database r214),175 个匹配已知 taxa,6 个未知 (UNK_)。
    • tRNA:tRNAscan-SE (v2.0.9)。
    • 16S rRNA:barrnap (v0.9, bacteria mode)。
    • 丰度计算:MAG 平均覆盖深度,标准化后与年龄相关(线性模型,FDR ≤0.05)。

3. 代谢建模与功能分析(Metabolic Modelling)

  • MAG 到代谢网络:gapseq (v1.2) 重建 genome-scale 代谢模型(gap filling 启用)。营养输入基于小鼠饲料 (V1534-300),假设日摄入 3.5 g。
  • 社区 FBA:使用 sybil 和 MicrobiomeGS2 (CPLEX solver) 预测微生物生长率和互动。生态关系用 EcoGS 包分类(竞争、寄生等)。
  • 宿主-微生物整合:Recon 2.2 (人类代谢重建) 代表宿主组织(结肠/肝/脑),结合微生物模型成 metamodel。使用 fastcore (v1.0) 构建上下文特异模型;EFMSampler 采样 elementary flux modes (EFMs) 预测互动。
  • 增长率验证:CoPTR 基于 peak-to-trough ratio (PTR) 从 MAGs 估计增长率,与 FBA 相关。

4. 多组学整合与统计(Multi-Omics Integration)

  • 转录组:DESeq2 (v1.40.2) 归一化(variance-stabilizing transformation),ppcor (v1.0) 计算部分相关(Spearman,校正年龄/批次)。
  • 功能注释:GO (生物过程),MetaCyc (途径)。超几何测试 (phyper) 富集,FDR 校正。
  • 衰老相关:线性模型相关年龄变化;无菌小鼠验证微生物依赖基因。
  • 代谢组:独立队列 (83 只小鼠),HILIC-UPLC-MS/MS 测量粪便代谢物,验证模型预测。
  • 统计:Kruskal-Wallis, Dunn's test, Benjamini-Hochberg FDR 等(R 包如 DescTools)。

5. 个人总结:Illumina + PacBio Binning 的优势与注意

  • 优势:Hybrid assembly (metaSPAdes) 结合短读准确性和长读连续性,提高 MAG 质量(减少 gaps)。多 binner + DAS Tool 减少假阳性。结果:181 个可靠 MAGs,用于下游代谢建模。
  • 潜在问题:PacBio 数据量少 (13.7 Gbp vs. 167 Gbp),可能覆盖不均;阈值主观(覆盖 7.7815);中等质量 MAGs 需 gap filling。
  • 可复现:所有代码/数据在 Zenodo 存档;补充表格详尽。

看没看懂都点个赞呗~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容