一、文章信息
发表杂志名称:Journal of Translational Medicine
中文标题:机器学习结合单细胞和空间转录组学揭示胶质母细胞瘤中基底膜相关基因特征
英文标题:Machine learning-enhanced discovery of a basement membrane-related gene signature in glioblastoma via single-cell and Spatial transcriptomics
影响因子:7.5
发表日期:2025年11月20日
二、研究概述
胶质母细胞瘤(GBM)具有复杂的侵袭性和异质性,严重阻碍肿瘤的彻底根除,而基底膜(BM)侵袭是胶质瘤细胞扩散和转移的前提,显著影响患者预后。本研究整合4个GBM患者队列,通过二元分类机器学习筛选基底膜相关候选基因,构建了包含4个核心基因(FOS、ADM、PLOD3、AEBP1)的BMRGs风险模型。该模型能有效区分高、低风险患者,且高风险组与M2样巨噬细胞浸润增加、CD8+T细胞减少相关,对免疫治疗敏感性降低但对部分化疗药物更敏感。结合单细胞和空间转录组学发现,高BMRGs表达的肿瘤细胞具有更强的细胞间通讯功能,且FOS可调控其他三个基因的表达。研究通过独立队列验证,为GBM的预后评估和个性化治疗提供了新的分子靶点和策略。
三、论文核心解读
(一)研究目标与解决的实际问题
核心目标:明确基底膜(BM)相关基因(BMRGs)与胶质母细胞瘤(GBM)的分子关联,构建可靠的BMRGs风险模型,揭示其在GBM预后、免疫微环境及治疗响应中的作用。
解决的实际问题:
现有GBM预后模型准确性不足、实用性有限,缺乏基于BM相关机制的特异性预测工具;
GBM侵袭性和异质性导致治疗效果差、复发率高,需明确BM相关分子机制以开发针对性治疗策略;
免疫治疗在GBM中的响应差异较大,需找到能预测免疫治疗敏感性的生物标志物。
(二)研究方法与目的(表格汇总)
表1 数据收集与预处理方法
| 方法类型 | 具体方法 | 核心目的 |
|---|---|---|
| 数据来源 | 整合GEO、EGA、TCGA、GTEx等数据库的4个GBM队列(614例GBM+44例正常组织) | 获取大样本量、多平台数据,确保结果通用性 |
| 批次效应处理 | sva R包的ComBat函数 | 消除不同队列间的技术差异,保证数据可比性 |
| 候选基因筛选 | 结合手动整理的222个BMRGs和Genecard数据库2466个相关基因,共2518个候选基因 | 全面覆盖BM相关基因,避免遗漏关键靶点 |
表2 生信分析方法
| 分析类型 | 具体方法 | 核心目的 |
|---|---|---|
| 差异基因分析 | limma R包(adj.P.Val<0.05 & log2FC>1) | 筛选GBM与正常组织间差异表达的BMRGs |
| 机器学习筛选 | 14种二元分类算法(NN、Lasso、SVM等) | 筛选出在10种以上最优模型中出现的核心BMRGs |
| 风险模型构建 | 单变量Cox回归+10种ML算法组合(RSF、Lasso等) | 构建高准确性、稳定的BMRGs预后模型 |
| 免疫分析 | CIBERSORT、xCell、ssGSEA算法 | 比较高/低风险组的免疫细胞浸润差异 |
| 治疗响应预测 | TIDE、IRnet算法(免疫治疗);OncoPredict(化疗药物敏感性) | 预测不同风险组的治疗响应差异 |
表3 单细胞与空间转录组分析方法
| 分析类型 | 具体方法 | 核心目的 |
|---|---|---|
| 单细胞数据处理 | Seurat包质控、Harmony算法批次校正 | 获得高质量、无批次效应的单细胞数据集 |
| 细胞通讯分析 | CellChat R包 | 分析高/低BMRGs表达肿瘤细胞的细胞间通讯差异 |
| 基因调控网络 | SCENIC算法(pySCENIC) | 揭示BMRGs间的调控关系(如FOS的调控作用) |
| 空间共定位分析 | semla R包的mapfeatures函数 | 验证BMRGs在GBM组织中的空间共定位关系 |
表4 实验验证方法
| 实验类型 | 具体方法 | 核心目的 |
|---|---|---|
| 临床样本验证 | 免疫组化(IHC)、多重免疫荧光(mIF) | 验证BMRGs在独立队列(17例患者)中的表达及共定位 |
| 细胞实验 | siRNA干扰FOS表达、qRT-PCR、CCK-8 assay | 验证FOS对ADM/AEBP1/PLOD3的调控及对细胞活力的影响 |
(三)实验/分析设计逻辑与结果解读(按Figure顺序)
1. Figure 1:GBM中候选BM基因的筛选(二元分类机器学习)
设计逻辑:先通过数据整合和批次校正确保数据可靠性,再通过差异基因分析和多机器学习算法筛选核心BMRGs,为后续模型构建奠定基础。
关键步骤与结果:
Figure 1A-B:对4个独立GBM队列进行PCA分析,显示批次校正前样本聚类分散(受技术差异影响),校正后聚类更集中,数据可比性提升;
Figure 1C:Venn图显示手动整理的BMRGs与数据库筛选基因的重叠情况,最终确定2518个非冗余候选基因;
Figure 1D:火山图筛选出217个GBM与正常组织的差异表达BMRGs(adj.P.Val<0.05 & log2FC>1);
-
Figure 1E-F:通过14种机器学习算法的AUC和F-score评估,筛选出在10种以上最优模型中出现的86个核心BMRGs,这些基因是GBM中BM相关的关键分子。
2. Figure 2:GBM中BM基因的综合特征分析
设计逻辑:明确核心BMRGs在GBM分子亚型中的表达模式、参与的信号通路及蛋白相互作用,揭示其生物学功能。
关键步骤与结果:
Figure 2A-D:ssGSEA分析显示,BMRGs活性在GBM间充质亚型(Mesenchymal)中最高,原神经亚型(Proneural)中最低(与侵袭性表型一致);
Figure 2E:PROGENy通路分析表明,BMRGs活性与缺氧、PI3K、VEGF等肿瘤相关通路呈显著正相关;
Figure 2F:PPI网络分析显示86个核心BMRGs间存在复杂的蛋白相互作用,节点大小反映基因重要性;
-
Figure 2G-J:GO/KEGG富集分析显示,BMRGs主要参与ECM组织、生长因子结合、PI3K-Akt等通路,与肿瘤侵袭和微环境调控密切相关。
3. Figure 3:BMRGs风险模型的构建与验证
设计逻辑:基于核心BMRGs构建预后模型,通过多队列验证评估模型的准确性和稳定性,明确风险评分与患者预后的关联。
关键步骤与结果:
Figure 3A:单变量Cox回归分析筛选出31个与GBM预后相关的BMRGs;
Figure 3B:整合10种ML算法构建117个模型,通过C-index评估,确定RSF+Lasso组合模型为最优(平均C-index=0.607),包含4个核心基因(FOS、ADM、PLOD3、AEBP1);
Figure 3C:Kaplan-Meier生存分析显示,高风险组患者总生存期显著短于低风险组(所有队列均验证);
-
Figure 3D:1/2/3年ROC曲线显示,模型在各队列中均具有良好的预后预测准确性(AUC值较高)。
4. Figure 4:与已发表GBM风险模型的比较
设计逻辑:通过与40个已发表模型的对比,验证本研究BMRGs模型的优越性和实用性。
关键步骤与结果:
Figure 4A:C-index比较显示,BMRGs模型在4个队列中排名分别为第2、第1、第11和第4,整体优于多数现有模型;
Figure 4B-C:1年和2年AUC值排名显示,模型在短期预后预测中表现突出(除TCGA-GBM队列外均排名前2);
Figure 4D:3年AUC值排名显示,模型长期预测能力略有下降,但仍具有竞争力;
-
核心结论:BMRGs模型仅含4个基因,实用性强,在2年内预后预测中优势显著。
5. Figure 5:BMRGs风险评分对GBM免疫微环境的影响
设计逻辑:分析高/低风险组的免疫细胞浸润差异,揭示BMRGs与肿瘤免疫微环境(TME)的关联。
关键步骤与结果:
Figure 5A-C:通过ssGSEA、xCell、CIBERSORT三种算法验证,高风险组M2样巨噬细胞、调节性T细胞(Treg)浸润增加,低风险组CD8+T细胞、树突状细胞(DC)浸润增加;
Figure 5D-E:TimiGP分析显示,巨噬细胞、CD8+T细胞在低风险组中为有利预后因素,在高风险组中为不利因素;
-
核心结论:高BMRGs风险评分与免疫抑制性TME相关,可预测免疫细胞浸润模式。
6. Figure 6:基于风险分组的免疫治疗敏感性分析
设计逻辑:通过TIDE和IRnet算法预测不同风险组的免疫治疗响应,明确BMRGs模型在免疫治疗决策中的价值。
关键步骤与结果:
Figure 6A-E:TIDE分析显示,高风险组CAF、MDSC浸润增加,T细胞排斥特征增强,TIDE评分更高,提示免疫治疗敏感性降低;
Figure 6F-G:IRnet分析显示,高风险组PD-1/CTLA4免疫治疗获益评分更低;
Figure 6H-I:相关性分析显示,风险评分与CTLA4、CD276等免疫检查点基因表达正相关,高风险组免疫检查点基因表达更高;
-
核心结论:低BMRGs风险患者更适合免疫检查点抑制剂治疗。
7. Figure 7:基于风险分组的化疗药物筛选
设计逻辑:通过药物敏感性分析,为不同风险组患者筛选潜在有效化疗药物,提供个性化化疗策略。
关键步骤与结果:
Figure 7A:IC50分析显示,高风险组对喜树碱(Camptothecin)、阿糖胞苷(Cytarabine)等5种药物更敏感,低风险组对多拉米莫德(Doramapimod)更敏感;
Figure 7B:相关性分析验证,上述药物IC50值与风险评分呈负相关(高风险组IC50更低,敏感性更高);
Figure 7C:药物靶点分析显示,高/低风险组中药物靶点基因表达存在显著差异;
-
核心结论:BMRGs风险评分可指导化疗药物选择,实现精准化疗。
8. Figure 8:基于BMRGs特征的GBM单细胞水平解析
设计逻辑:通过单细胞RNA-seq揭示BMRGs在不同细胞类型中的表达模式,明确高BMRGs表达细胞的特征。
关键步骤与结果:
Figure 8A:整合32例GBM患者的单细胞数据,获得109,913个细胞,UMAP图显示细胞聚类情况;
Figure 8B-C:鉴定出9种细胞类型(间充质GBM、经典GBM、T细胞等),并明确各细胞类型的标志基因和生物学功能;
Figure 8D-E:ssGSEA分析显示,BMRGs在间充质GBM细胞、内皮细胞(ECs)和周细胞/CAFs中表达最高,且在间充质GBM亚型中表达显著高于其他亚型。

9. Figure 9:高BMRGs评分GBM细胞的增强型细胞通讯能力
设计逻辑:分析高/低BMRGs表达肿瘤细胞的细胞间通讯差异,揭示其在TME调控中的作用。
关键步骤与结果:
Figure 9A:根据BMRGs评分将肿瘤细胞分为高/低BM组,UMAP图显示两组细胞分布;
Figure 9B-F:细胞水平GSEA显示,高BM组肿瘤细胞富集TNFA信号、缺氧、EMT等通路;
Figure 9G-H:CellChat分析显示,高BM组肿瘤细胞的传入和传出通讯强度更高,在胶原、TNF、VEGF等信号通路中作为“发送者”“接收者”的中心性评分更高;
-
核心结论:高BMRGs表达的肿瘤细胞具有更强的细胞间通讯能力,可调控TME以促进肿瘤进展。
10. Figure 10:空间转录组学观察到的BMRGs共表达
设计逻辑:通过空间转录组学验证BMRGs的空间共定位关系,揭示FOS的调控作用。
关键步骤与结果:
Figure 10A-E:SCENIC分析显示,FOS(转录因子)的调控子活性与FOS、ADM、PLOD3、AEBP1的mRNA表达一致;
Figure 10F-G:空间转录组图显示,在原发性和复发性GBM中,FOS与ADM、PLOD3、AEBP1均存在空间共定位;
-
核心结论:FOS可能调控ADM、PLOD3、AEBP1的表达,且4个基因在空间上协同作用。
11. Figure 11:独立队列的IHC和多重免疫荧光验证
设计逻辑:通过临床样本实验验证BMRGs的表达及共定位,确认模型的临床可行性。
关键步骤与结果:
Figure 11A:CPTAC数据库分析显示,ADM、PLOD3、AEBP1、FOS在GBM中蛋白丰度显著高于其他癌症;
Figure 11B:IHC结果显示,GBM样本中BMRGs表达显著高于低级别胶质瘤(LGG);
Figure 11C:多重免疫荧光显示,FOS与ADM、PLOD3、AEBP1在GBM细胞中共表达;
-
核心结论:BMRGs在GBM中高表达且共定位,模型具有临床应用潜力。
12. Figure 12:FOS依赖的ADM/AEBP1/PLOD3轴调控GBM细胞活力
设计逻辑:通过细胞实验验证FOS对其他三个BMRGs的调控作用及对肿瘤细胞增殖的影响。
关键步骤与结果:
Figure 12A-B:siRNA干扰FOS后,U138-MG和U251-MG细胞中FOS表达显著下调;
Figure 12C-D:FOS干扰后,ADM、AEBP1、PLOD3的mRNA表达显著降低;
Figure 12E-F:CCK-8实验显示,FOS干扰后肿瘤细胞活力在24h、48h、72h均显著下降;
核心结论:FOS通过调控ADM/AEBP1/PLOD3轴促进GBM细胞增殖,为治疗靶点提供实验依据。

(四)研究总结
本研究围绕基底膜(BM)与胶质母细胞瘤(GBM)的关联展开,通过整合多队列临床数据、结合机器学习、单细胞及空间转录组学技术,系统解析了BMRGs在GBM中的作用及机制。研究成功筛选出86个核心BMRGs,构建了包含4个基因(FOS、ADM、PLOD3、AEBP1)的预后风险模型,该模型在预测GBM患者生存期、免疫治疗响应及化疗药物敏感性方面表现优异,且实用性强于多数现有模型。机制上,高BMRGs表达与GBM间充质亚型、免疫抑制性微环境(M2样巨噬细胞浸润增加、CD8+T细胞减少)相关,且高BMRGs肿瘤细胞具有更强的细胞间通讯能力;FOS作为关键转录因子,可调控其他三个基因的表达,共同促进GBM进展。研究通过临床样本验证和细胞实验确认了模型的可靠性和分子机制,为GBM的精准预后评估和个性化治疗(免疫治疗+化疗)提供了新的理论依据和工具,具有重要的临床转化价值









