背景 巨噬细胞在肺腺癌(LUAD)的肿瘤免疫微环境(TIME)形成和肿瘤进展中起关键作用。然而,很少有研究全面系统地描述LUAD中巨噬细胞的特征。
方法 这项研究利用GSE189487数据集的单细胞RNA测序数据鉴定了巨噬细胞相关标志物。开发了一种基于10种算法的集成机器学习程序,用于在癌症基因组图谱(TCGA)、GSE 30219、GSE31210和GSE72094数据集中构建巨噬细胞相关指数(MRI)。使用几种算法来评估MRI与TIME和免疫治疗相关生物标志物的相关性。使用GSE91061数据集评估MRI在预测免疫治疗应答中的作用。
结果 Lasso算法和plsRCox组合构建的最佳MRI是LUAD的独立风险因素,在预测LUAD患者的总生存率方面表现出稳定和强大的性能。MRI评分低的患者具有较高的TIME评分,较高的免疫细胞水平,较高的免疫表型评分和较低的肿瘤免疫功能障碍和排斥(TIDE)评分,表明对免疫治疗的反应更好。MRI评分低的化疗和靶向治疗常用药物的IC50值高于MRI评分高的药物。此外,由MRI发展的生存预测诺模图在预测LUAD的1年、3年和5年总生存率方面具有良好的临床应用潜力。
结论 作者的研究首次构建了具有10种机器学习算法的LUAD共识MRI。MRI对LUAD的危险分层、预后判断及治疗方法的选择有一定的参考价值。
机器学习目前在肿瘤和非肿瘤生信中越来越常见,不管是构建模型还是筛选关键基因,都有很出色的发挥。想做类似分析的朋友,欢迎交流!
研究结果
单细胞分析揭示细胞亚型和巨噬细胞相关标志物
采用严格的质量控制指标进行预处理,作者从6种LUAD组织中获得了17579份高质量细胞样本(图2A)。在标准化后,在基因数目和测序深度之间获得强正相关性,Pearson相关系数为0.94(图2B)。UMAP分析在所有细胞样品中鉴定了11个簇(图2C)。接下来,使用来自人原代细胞图谱的参考数据,将SingleR技术用于细胞类型注释。结果,簇0、2、3、4、7、8和10被鉴定为巨噬细胞,簇1、5和9被鉴定为上皮细胞(图2D)。此外,组织干细胞支配簇6(图2D)。基于“Seurat”软件包的“FindAllMarkers”功能,在对应于巨噬细胞的簇中显著高表达的基因被鉴定为巨噬细胞相关标志物。共有703个标记基因为巨噬细胞相关基因。
图 2 LUAD中巨噬细胞相关基因的鉴定
LUAD中与临床结局相关的关键模块识别
使用703个巨噬细胞相关基因构建WGCNA,以确定与LUAD患者生存状态和生存时间相关的关键模块。在将软阈值β设置为0.85(无标度R2 = 0.920)后,作者获得了用于共表达网络构建的合适功效值(n = 4)(图3 A)。最后,总共生成了五个模块以供进一步分析,每个模块之间的相关性如图3 B所示。这五个不同颜色模块的聚类树如图3C所示。考虑到这五个模块之间的相关系数,选择与LUAD患者预后表现出最高正相关和负相关的绿松石模块(212个基因)和灰色模块(46个基因)进行进一步研究(图3D)。
图 3 使用WGCNA在TCGA LUAD数据集中识别与临床结局相关的关键模块
基于NMF聚类的LUAD中两种巨噬细胞相关亚型的识别
基于WGCNA选择的258个巨噬细胞相关标志物(绿松石模块中的212个基因和灰色模块中的46个基因)的表达模式,进行NMF聚类算法以分类LUAD患者的分子亚型。提出了最佳聚类数应该是共表系数开始急剧下降的K的第一个值。最后,在TCGA-LUAD数据集中,聚类数K为2被确定为最佳(图4A)。图4B显示了TCGA数据集中相应共识矩阵的热图。在TCGA组群中,组群1中的LUAD患者具有比组群2中的患者更好的总体存活率(图4C,P = 0.001)。在GSE 30219、GSE 31210和GSE 72094队列中获得了相似的结果。相应共识矩阵的热图如图4 D、4 F和4 H所示。进一步的存活分析显示,在GSE 30219(图4 E,p < 0.001)、GSE 31210(图4G,p <0.001)和GSE 72094(图4 I,p <0.001)组群中,在LUAD中,簇1与比簇2更好的临床结果相关。
图 4 NMF算法在LUAD中识别出两种巨噬细胞相关亚型
作者进一步探讨了LUAD中这两个簇的分子特征。与簇 1 相比,簇 2 中 M1 巨噬细胞的比例显着更高(p = 0.005),如图 5A 所示。簇1和簇2之间的M1和M2巨噬细胞表型评分没有显著差异(图5 B,p > 0.05)。这些结果可能表明,这两个集群的关系与M1和M2巨噬细胞的极化无关。为了进一步探索它们的相关性,作者进行了GSEA。如图5C所示,簇 1 主要参与免疫相关通路,包括用于产生 IgA 的肠道免疫网络、B 细胞受体信号通路和细胞粘附分子(CAM),如图 5C 所示。簇2主要与肿瘤进展相关的途径相关,包括细胞周期、DNA复制和P53信号传导途径(图5D)。此外,第1组中LUAD患者的炎症反应评分显著高于第2组中的炎症反应评分(图5 E,p = 0.021)。有趣的是,簇2中的LUAD患者具有与增殖、糖酵解和缺氧相关的较高基因集评分(图5 F-H,所有p < 0.001)。这些结果表明,在LUAD中,簇1表型可能是一个相对的“免疫炎症”表型,而簇2可能是一个相对的“致癌”表型。
图 5 两个团簇的分子特征及其相关性
共识MRI的一体化构建
通过单因素Cox分析,作者确定了62个与LUAD预后显著相关的潜在巨噬细胞相关基因。这62个潜在的与巨噬细胞相关的预后基因经历了整合的基于机器学习的过程,从中作者开发了一个一致的MRI。在TCGA-LUAD队列中,作者通过leave-one-out交叉验证框架拟合了101种预测模型。在所有队列中计算每个模型的C指数,结果如图6A所示。因此,通过Lasso和plsRCox方法的组合开发的预后模型被证明是具有最高平均C指数0.65的最佳模型(图6A)。偏差的部分概率在Lasso回归中达到最小值(图6B)。接下来,对具有非零Lasso系数的22个巨噬细胞相关标志物进行plsRCox回归。因此,用最终一组22个巨噬细胞相关基因构建共有MRI,包括SCGB 3A 1、IRX 2、HPCAL 1、HMGN 3、MS 4A 15、MBIP、LPCAT 1、TM 4SF 1、GPX 3、S100 A10、HOPX、PPIA、NECAB 3、RRAS、UBA 1、PLBD 1、BLVRB、DNAJA 1、PRDX 6、UQCRB、UBAC 2和STK 24(图6C)。这22个巨噬细胞相关基因的回归系数如图6C所示。此外,根据这22个巨噬细胞相关基因及其表达模式的回归系数计算每个LUAD患者的MRI评分。此外,使用MRI评分的平均值作为分界点,将LUAD患者分为高MRI评分组和低MRI评分组。如预期的,具有高MRI评分的LUAD患者与TCGA组群(图6 D,p < 0.001)、GSE 30219(图6 E,p = 0.005)、GSE 31210(图6 F,p = 0.003)和GSE 72094(图6 G,p < 0.001)组群中的不良总体存活率相关。
图 6 综合机器学习确定了共识巨噬细胞相关指数(MRI)
MRI性能评价
TimeROC分析评价了MRI对LUAD患者总生存率的区分,TCGA队列中1、3和5年AUC分别为0.702、0.678和0.664。此外,GSE 30219队列的1年、3年和5年AUC分别为0.798、0.697和0.680。在GSE 31210和GSE 72094队列中,1年、3年和5年AUC分别为0.653、0.610和0.670以及0.648、0.597和0.690。临床ROC曲线显示,在TCGA、GSE 30219、GSE 31210和GSE 72094队列中,MRI的AUC高于年龄、性别和临床分期的AUC。此外,在TCGA、GSE 30219、GSE 31210和GSE 72094队列中,MRI的C指数高于其他临床病理学参数,包括年龄、性别和临床分期。因此,与其他临床病理参数相比,本研究的MRI可能在预测LUAD的总生存率方面具有更好的性能。为了进一步评估MRI在预测、GSE 31210和GSE 72094队列中的性能。此外,在TCGA、GSE 30219、GSE 31210和GSE 72094队列中,MRI的C指数高于其他临床病理学参数,包括年龄、性别和临床分期。因此,与其他临床病理参数相比,本研究的MRI在预测LUAD的总生存率方面具有更好的性能。为了进一步评估MRI在预测LUAD总生存率方面的性能,将MRI的C指数与LUAD中建立的70个其他预后特征(mRNA和lncRNA相关特征)进行了比较。结果,MRI的C指数高于除Gong-XX标记之外的69个预后标记的C指数(图7A),表明本研究的MRI在预测LUAD的临床结果方面显示出比许多模型更好的性能。此外,单变量和多变量Cox回归分析表明,MRI是TCGA、GSE 30219、GSE 31210和GSE 72094队列中LUAD总生存率的独立风险因素(图7 B和C,所有p < 0.05)。在LUAD的高和低MRI评分组之间,在临床分期、pT分期和pN分期中获得了显著差异(所有p < 0.05)。具体而言,高MRI评分表明LUAD的临床分期较高(p < 0.001)、pT分期较高(p < 0.05)和pN分期较高(p < 0.01)。
图 7 评价巨噬细胞相关指数(MRI)的性能
基于MRI的肿瘤微环境解剖
先前的研究表明,肿瘤免疫景观可分为六种亚型,包括伤口愈合(C1)、IFN-γ显性(C2)、炎性(C3)、淋巴细胞耗竭(C4)、免疫静止(C5)和TGF- β显性(C6)。本研究显示,低MRI评分组中炎性亚型的比例最大,高MRI评分的LUAD患者中比例最高的是IFN-g显性亚型(图8A,p = 0.001)。进一步研究表明,MRI评分低的LAUD患者的免疫评分、基质评分和ESTIMATE评分较高(图8B,所有p < 0.05)。接下来,作者使用几种免疫细胞相关算法探索了MRI评分和免疫细胞丰度之间的相关性,这揭示了MRI评分与大多数免疫细胞的丰度显著负相关(图8C,所有p < 0.05)。此外,低MRI评分组中的B细胞、iDCs肥大细胞、T辅助细胞和TIL的评分高于高MRI评分组(图8D,所有p < 0.05)。与APC共抑制、MHC-I类、炎症前和I型IFN反应相关的基因集评分较低,而与T细胞共刺激和II型IFN反应相关的基因集评分较高,较高的基因集评分与T细胞共刺激和II型-IFN-应答相关(图8E,所有p < 0.05)。在本研究中,作者具有高MRI评分的LUAD患者具有更高水平的一些免疫检查点,如PD 1、HAVCR 2、CD 70、CD 276和TNFSF 4(图8F,所有p < 0.05)。在具有高MRI评分的LUAD患者中,一些HLA相关基因的水平显著更高,包括HLA-A、HLA-B和HLA-G(图8G,所有p < 0.05)。证据表明,低MRI评分可能是LUAD中相对“热”的肿瘤表型,而高MRI评分可能是相对“冷”的肿瘤表型。
图 8 基于巨噬细胞相关指数(MRI)的肿瘤微环境解剖
基于MRI的LUAD治疗策略
上述结果揭示了低和高MRI评分组之间肿瘤微环境的显著差异。低MRI评分可能是LUAD中的“热”肿瘤表型。因此,这两组在免疫治疗反应方面可能存在显著差异。在本究中,作者观察到具有高MRI评分的LUAD患者具有较高的免疫监视评分(图9 A,p = 0.008)、较高的免疫逃逸评分(图9 B,p = 0.013)、较高的TIDE评分(图9 C,p = 0.001)和较低的CTLA 4免疫表型评分(图9 D,p = 0.006)。TIDE和免疫表型评分被认为是预测免疫治疗反应的可靠工具。低TIDE评分和高免疫表型评分表明更好的免疫治疗益处。因此,MRI评分低的LUAD患者可能对免疫治疗更敏感。为了进一步验证这个结果,作者使用GSE 91061队列(免疫治疗队列)检查了预后,免疫治疗益处和MRI评分之间的关系。如所预期的,无应答者(PD/SD)的MRI评分显著高于应答者(PR/CR)(图9 E,p < 0.05)。与高MRI评分组相比,低MRI评分组的应答率显著更高(图9 E,p < 0.05)。此外,Kaplan-Meier生存曲线表明低MRI评分组的总生存率高于高MRI评分组(图9 E,p = 0.018)。这些结果进一步表明,低MRI评分的LUAD患者可能对免疫治疗更敏感。接下来,作者探索了常见化疗和靶向治疗药物的IC50值。因此,在MRI评分较高的LUAD患者中,克唑替尼、Savolitinib、Ulixertinib、5-氟尿嘧啶、顺铂、多西他赛、吉西他滨和紫杉醇的IC50值较低(图9 F,所有p < 0.05),表明MRI评分较高的LUAD可能对化疗和靶向治疗更敏感。一些药物的3D结构如图9 G所示。
图 9 基于巨噬细胞相关指数(MRI)的LUAD治疗策略
结论
该研究通过单细胞RNA测序数据鉴定了巨噬细胞相关标记物,并使用10种机器学习算法组合构建了MRI。主要发现包括 MRI 是 LUAD 的独立危险因素,在预测总生存期方面表现出强大的表现,并表明 MRI 评分低的患者对免疫治疗的反应更好。该研究得出的结论是,MRI 可以帮助 LUAD 患者的风险分层、预后和治疗选择。巨噬细胞在LUAD的肿瘤免疫微环境(TIME)形成和癌症进展中起着关键作用。该研究使用 10 种机器学习算法开发了巨噬细胞相关指数 (MRI) 来预测 LUAD 的预后和免疫治疗反应。最佳MRI被确定为LUAD的独立危险因素,在预测总生存期方面表现出很强的表现。MRI评分低的患者对免疫治疗有更好的反应,免疫细胞水平更高。MRI 可能有助于LUAD 的风险分层、预后和治疗选择。