01文章信息
发表杂志名称:International Journal of Biological Macromolecules
中文标题:通过整合泛癌分析识别肠道微生物群在肿瘤进展和免疫治疗耐药中调控的核心基因表达改变
英文标题:Identification of Core gene expression alterations regulated by gut microbiota in tumor progression and immunotherapy resistance through integrative pan-cancer analysis
影响因子:8.5
发表日期:2025 年 8 月 15 日
01研究概述
肠道微生物群通过激活或抑制基因表达对宿主产生系统性影响,但其在肝细胞癌(HCC)进展中的精确作用及下游靶点尚不明确。研究人员开发了微生物相关特征(MAS)评分,以表征 33 种癌症类型和 29 种正常组织中肠道微生物群诱导的转录改变。MAS 评分与基因组改变、免疫微环境特征存在癌症类型特异性关联,可作为多种恶性肿瘤免疫治疗反应性和复发的潜在临床生物标志物。单细胞 MAS 量化显示肿瘤组织中微生物驱动的基因激活高于正常组织,空间转录组学揭示肝细胞癌转移中微生物介导的关键基因表达激活增强。通过机器学习算法,确定了 7 个微生物调控的预后基因,其中 RHEB 是最不利的预测因子,并经实验验证。该研究为量化微生物驱动的转录活性及其在癌症中的临床意义提供了综合框架。
01研究结果
图 1:研究流程图
作者展示了本研究的整体框架流程,包括三个步骤。第一步是定义 MAS 评分,收集 146 个受微生物调控的基因,运用 SSGSEA 等方法得到 MAS 评分及 NES1 - NE52。第二步是多组学关联分析,对 33 种 TCGA 癌症类型进行 RNA - Seq、ScRNA - Seq、ST - Seq 等分析,探究 MAS 评分的异质性。第三步是利用 LOOCV 框架开发简化的 MAS 模型,针对 4 个免疫治疗队列、1 个肿瘤复发队列等,通过 101 种算法组合确定最优模型。该图清晰呈现了研究的整体设计和实施步骤。

图 2:转录组水平上癌症和组织中 MAS 相关基因分子活性的综合量化
(图 2A)作者展示了 MAS 相关基因富集的 GO 通路柱状图,发现其主要富集在与炎症和免疫反应相关的通路,如 Toll 样受体信号通路等。
(图 2B)通过 KEGG 通路富集柱状图,表明 MAS 相关基因还涉及 IL - 17 信号通路等多种通路。
(图 2C)呈现了不同癌症类型的平均 MAS 评分,从内圈到外圈展示了癌症类型和对应的平均 MAS 评分。
(图 2D)展示了 GTEx 数据集中正常组织的平均 MAS 评分。
(图 2E)对比了肿瘤(红色)和邻近正常组织(绿色)的 MAS 评分,发现 TCGA 中大多数癌症类型的肿瘤 MAS 评分高于正常组织。
(图 2F)热图显示了 33 种 TCGA 癌症类型中 MAS 评分与标志性基因集的 GSVA 评分之间的相关性,MAS 评分与 MYC 靶标、PI3K - AKT - MTOR 等致癌通路呈正相关。
总体而言,该图综合量化了 MAS 相关基因在癌症和组织中的分子活性及其与致癌通路的关联。

图 3:MAS 相关分子活性的变异性及与肿瘤微环境相关的免疫特征
(图 3A)热图显示了 10 个单细胞数据集中正常和肿瘤来源的不同细胞类型(上皮 / 恶性细胞、淋巴细胞、髓系细胞和基质细胞)的平均 MAS 评分,肿瘤组织来源细胞的 MAS 评分总体高于正常组织。
(图 3B - E)箱线图展示了四种细胞类型(上皮 / 恶性细胞、淋巴细胞、髓系细胞、基质细胞)在正常和肿瘤组中的 MAS 评分差异,其中上皮 / 恶性细胞和基质细胞的差异显著。
(图 3F)UMAP 图显示了 HCC 单细胞数据集(GSE149614)患者的主要细胞类型。
(图 3G)比较了肿瘤和相应正常组织中不同细胞类型的 MAS 评分,肿瘤细胞的 MAS 评分更高。
(图 3H)柱状图显示了上皮 / 恶性细胞中 MAS 高组和低组之间差异表达基因的 GO 富集分析中生物过程分类的顶级条目,MAS 高组细胞在 MAPK 级联反应等过程中活跃。
(图 3I - J)热图展示了 HCC 单细胞数据集中基于恶性细胞和免疫细胞类别的不同细胞类型之间相互作用的数量和强度,MAS 高组的细胞间通讯更强。
(图 3K)展示了 MAS 高组与低组相比不同受体 - 配体对的信号传导和通讯概率的增减,如 APP - CD74 等通路在 MAS 高组中活跃。
该图揭示了 MAS 相关分子活性的变异性以及与肿瘤微环境相关的免疫特征。

图 4:MAS 评分与转移之间关联的鉴定
(图 4A)热图显示了每个上皮细胞簇的大规模 CNV 谱,红色和蓝色分别代表高和低 CNV 水平,以 T 细胞和 B 细胞为参考细胞。
(图 4B)箱线图显示了不同上皮细胞簇和参考细胞的 CNV 评分,Epi - 10 和 Epi - 11 的 CNV 评分较低,类似正常参考细胞。
(图 4C)箱线图显示了恶性和非恶性细胞之间 MAS 评分的差异,恶性上皮细胞的 MAS 评分高于非恶性细胞。
(图 4D)箱线图显示了转移组织和肿瘤细胞之间 MAS 评分的差异,转移组织细胞的 MAS 评分更高。
(图 4E)柱状图展示了不同细胞类型中恶性和非恶性细胞的数量,MAS 高组中恶性细胞占主导。
(图 4F)UMAP 图显示了转移相关单细胞数据集 GSE149614 的重新识别细胞类型。
(图 4G)UMAP 图展示了细胞的 CytoTRACE 评分分布,恶性细胞从 MAS 低组到高组有分化趋势。
(图 4H - I)展示了四种细胞类型在 MAS 高组和低组中的分布及通过 CytoTRACE 预测的排序,MAS 低组中的淋巴细胞等更不成熟。
(图 4J)展示了转移组和肿瘤组之间顶级转录因子调控网络,RAS 值存在显著差异。
(图 4K)展示了转移组织来源细胞中 transcription factor 调控网络的 RSS,HMGA2 regulon 在转移组中最活跃。
(图 4L - M)展示了 HMGA2 及其靶基因网络以及靶基因富集的 KEGG 通路,涉及 Wnt 等通路。
此图鉴定了 MAS 评分与肿瘤转移之间的关联及相关机制。

图 5:泛癌转录组水平上 MAS 评分对免疫微环境浸润和免疫状态的影响
(图 5A)热图显示了使用 cibersort 算法计算的免疫细胞浸润与 MAS 评分之间的 Pearson 相关系数,MAS 评分与 CD8 T 细胞等浸润呈正相关。
(图 5B)热图展示了 MAS 组之间免疫调节基因表达的差异,这些基因分为共刺激因子、共抑制因子等七类。
(图 5C - D)比较了泛癌中 MAS 高组和低组中 PDCD1 和 CD274 的表达,MAS 高组中这些免疫检查点分子表达上调。
(图 5E - H)比较了免疫治疗队列(GSE126044、IMvigor210、GSE140901、GSE91061)中应答者和非应答者的 MAS 评分,应答者的 MAS 评分更高。
(图 5I)展示了按 MAS 评分分层的复发可能性(GSE14520,肝肿瘤),高 MAS 评分与更高的复发可能性相关。
该图表明 MAS 评分在泛癌转录组水平上对免疫微环境和免疫治疗反应有重要影响。
图 6:MAS 评分作为免疫治疗反应标志物的潜力
(图 6A)UMAP 显示了免疫治疗单细胞 RNA 测序数据集中的细胞分布。
(图 6B)展示了正常和肿瘤组织来源的细胞类型之间 MAS 评分的差异,肿瘤来源细胞的 MAS 评分更高。
(图 6C)展示了应答者和非应答者组来源的细胞类型之间 MAS 评分的差异,除髓系细胞外,应答者的其他细胞类型 MAS 评分更高。
(图 6D)比较了上皮亚群和正常参考细胞的推断 CNV 评分。
(图 6E)UMAP 显示了免疫治疗队列的重新识别细胞类型。
(图 6F - G)展示了 MAS 组之间细胞间通讯的数量和强度差异,MAS 高组的相互作用更强烈,基质细胞显著增强了相互作用。
(图 6H)展示了 MAS 高组和低组之间整体信号通路的差异,APP、MIF 等促肿瘤通路在 MAS 高组更活跃。
此图体现了 MAS 评分作为免疫治疗反应标志物的潜力。

图 7:空间转录组揭示 MAS 评分与肿瘤免疫微环境的关联
(图 7A)细胞的区域划分,按亚组分布着色。
(图 7B)不同空间分布(肿瘤、界面、正常)中各种细胞的 MAS 评分,从正常到过渡再到肿瘤区域,平均 MAS 评分逐渐增加。
(图 7C - H)六个接受抗 PD - 1 治疗的 HCC 患者(三个应答者和三个非应答者)的 ST 数据的斑点注释。
(图 7I)不同免疫治疗反应的患者样本的 MAS 评分,应答者组在所有分析的斑点中均显示出更高的 MAS 评分。
(图 7J - K)APP 和 MIF 信号通路网络中每两个细胞斑点之间的相互作用,免疫治疗后肝细胞 / HCC 细胞与免疫细胞之间的相互作用发生反转。
该图通过空间转录组揭示了 MAS 评分与肿瘤免疫微环境及免疫治疗效果的关联。
图 8:HCC 中简化的 MAS 预测模型的开发和评估
(图 8A)热图显示了训练(TCGA - LIHC)和测试(ICGC - LIRI)数据集中 101 种组合的 C 指数,最优预测模型(Lasso + 随机生存森林,RSF)的平均 C 指数为 0.779。
(图 8B)在 TCGA - LIHC 训练队列中,当惩罚似然偏差达到最小值时确定最佳 λ 值。
(图 8C)以随机生存森林中的错误率作为分类树的函数,计算预测基因的袋外重要性值,确定了 7 个显著的 MAS 基因。
(图 8D)确定训练数据集中 MAS 评分的最佳截止值。
(图 8E - F)训练和测试队列中 MAS 评分的 Kaplan - Meier OS 曲线,MAS 高组患者的总生存期显著低于低组。
(图 8G - H)简化的 MAS 预测模型在训练和测试数据集中的 ROC 图,显示出较好的性能。
此图介绍了 HCC 中简化的 MAS 预测模型的开发和评估情况,该模型具有较好的预后预测能力。
图 9:简化的 MAS 预测模型对 HCC 临床和免疫特征的影响
(图 9A)森林图显示了 TCGA - LIHC 数据集中 MAS 评分和其他临床特征的多变量 Cox 回归结果,MAS 评分等是独立预后因素。
(图 9B)小提琴图显示了简化的 MAS 预后模型中的关键基因在高和低 MAS 组之间的表达水平差异。
(图 9C)通过 MCPcounter、cibersort 和 xcell 算法评估的 MAS 组之间免疫细胞亚群的浸润丰度。
(图 9D)MAS 组之间免疫细胞浸润丰度的差异,MAS 高组中单核细胞谱系等浸润增加。
(图 9E)简化 MAS 模型中免疫细胞丰度与关键基因表达的相关性分析。
(图 9F)不同临床阶段样本的 MAS 评分,MAS 评分与疾病阶段相关。
该图探讨了简化的 MAS 预测模型对 HCC 临床和免疫特征的影响。

图 10:RHEB 敲低抑制 HCC 细胞的增殖和迁移能力
(图 10A)单变量 cox 回归分析的森林图,显示了 7 个关键基因的 HR 及 95% CI 等。
(图 10B)肠道微生物群 - 靶标 - HCC 网络。
(图 10C)TCGA 和 ICGC 数据库中 HCC 队列中 7 个微生物群调控的预后基因的表达水平,RHEB 在肿瘤组织中高表达。
(图 10D)HPA 数据库中 HCC 肿瘤和正常组织中 RHEB 蛋白水平,肿瘤组织中 RHEB 蛋白水平高。
(图 10E)RHEB 表达与 HCC 患者总生存期的关联,高 RHEB 表达与较差的总生存期相关。
(图 10F)qRT - PCR 验证 HCCLM3 细胞中 RHEB 的敲低效果。
(图 10G - H)CCK8 测定和集落形成测定显示 RHEB 敲低的 HCCLM3 和 Huh7 细胞的细胞活力降低。
(图 10I - J)Transwell 和伤口愈合测定表明 RHEB 敲低的 HCCLM3 和 Huh7 细胞的迁移能力降低。
此图验证了 RHEB 在 HCC 细胞增殖和迁移中的作用,敲低 RHEB 可抑制这些能力。

本研究通过开发微生物相关特征(MAS)评分,整合泛癌分析探究了肠道微生物群调控的基因表达改变在肿瘤进展和免疫治疗耐药中的作用。研究发现 MAS 评分与多种癌症的基因组改变、免疫微环境及临床结局相关,可作为免疫治疗反应和复发的潜在生物标志物。在肝细胞癌(HCC)中,通过机器学习确定了 7 个微生物调控的预后基因,其中 RHEB 经实验验证为不利预测因子,敲低 RHEB 可抑制 HCC 细胞的增殖和迁移。整体而言,该研究为理解肠道微生物群诱导的基因表达变化对肿瘤的影响提供了综合框架,简化的 MAS 模型在 HCC 预后预测和个性化医疗中具有潜力。