Identification of the novel prognostic biomarker, MLLT11, reveals its relationship with immune checkpoint markers in glioma
鉴定新型预后生物标志物MLLT11,揭示其与胶质瘤中免疫检查点标志物的关系
发表期刊:Front Oncol
发表日期:2022 Aug 12
影响因子:5.738
DOI: 10.3389/fonc.2022.889351
一、研究背景
胶质瘤分为低级别胶质瘤(WHO 2级和3级)和高级别胶质瘤(WHO 4级),是最常见的颅内恶性肿瘤之一。其中,胶质母细胞瘤(GBM)的预后最差。新的治疗方法如分子靶向治疗和免疫治疗被纳入治疗策略,但真正能够改善临床结果的只有少数。潜在的原因是胶质瘤往往是一种多基因、多步骤的遗传异质性疾病,而肿瘤异质性可能是治疗失败的根源。
位于1q21染色体上的MLLT11基因编码一种分子量为∼9kDa的蛋白质,由270个氨基酸组成。目前,有研究表明,MLLT11的表达水平与细胞分化程度有一定的相关性。在中枢神经系统(CNS)中,MLLT11的表达随着神经干细胞(NSCs)分化为神经元而逐渐上调,其高表达可促进神经元的分化和成熟。此外,MLLT11还在肿瘤细胞和免疫细胞在TME的相互作用中发挥重要作用。
二、材料与方法
1、数据来源
1)从UCSC Xena下载了TCGA的共697个样本,包括LGG和GBM
2)从CGGA下载了1319份样本。CGGA样品包括mRNAseq_693、mRNAseq_325和CGGA_array数据集
3)从GEO数据集收集了444个批量样本,包括GSE43378、GSE16011、GSE74187和GSE83300;GSE84465的四个原发性GBM患者的单细胞RNA测序(scRNA-seq)数据共3589个细胞
4)来自GTEx数据库的105个正常大脑皮层样本
5)从中南大学湘雅医院神经外科收集了创伤后正常脑组织(n = 9)和胶质瘤样本(n = 27),其中分别包括9例2级、3级和4级胶质瘤
2、分析流程
1)分组和生存分析:根据MLLT11的表达情况将患者分为MLLT11高组和MLLT11低组,并以最大选择等级统计法计算的生存数据为分界线;生存分析;Cox回归分析
2)差异基因鉴定和富集分析:R软件包limma在每个数据集中识别差异表达的基因(DEGs);利用R软件包clusterProfiler对上表达的和下表达的DEGs进行了通路富集分析;使用GSVA R软件包中实现的单样本基因集富集分析(ssGSEA)对该通路进行评分;使用主成分分析(PCA)对路径得分矩阵进行降维。
3)免疫浸润分析:参考LM22集和归一化特征矩阵,引入CIBERSORT去卷积算法,分析浸润免疫细胞的相对丰度
4)qPCR、Western blotting、免疫组织化学
三、实验结果
01 - 胶质瘤中MLLT11的临床和分子特征
作者首先比较了TCGA和GTEX数据集中MLLT11在LGG、GBM和正常大脑皮层中的表达,发现正常大脑与WHO2级和WHO3级胶质瘤之间没有明显差异,MLLT11的表达是在GBM中最低。然后,探索MLLT11在胶质瘤组织学中的表达,发现GBM的表达量最低,其次是星形细胞瘤,而正常脑、少白细胞瘤和少突胶质瘤之间没有差异(图1A, B)。根据中位年龄,患者被分为高年龄和低年龄亚组,在TCGA数据集中,高年龄亚组和低年龄亚组的MLLT11表达有明显差异(图1C)。同时,除GBM外,在LGG中年轻组和老年组之间没有发现MLLT11表达的明显差异(图1D)。同样的结果也见于CGGA数据集(补充图1A,B)。此外,MLLT11的表达差异也可以在高年龄组和低年龄组的不同WHO病理分级中进行分析。结果显示,在高年龄组和低年龄组中,MLLT11的表达水平随着肿瘤分级的增加有明显的下降趋势(补充图1C,D)。值得注意的是,在CGGA数据集和TCGA数据集中,男性和女性的MLLT11表达在不同的WHO病理等级中没有发现明显的差异(补充图1E-G)。
近年来,随着胶质瘤分子病理学的快速发展,IDH突变、1p/19q联合性缺失、MGMT甲基化状态等一系列分子标志物被认为与胶质瘤恶性肿瘤及患者预后有关。本研究对与临床相关的分子生物标志物进行了探讨。在TCGA数据集中,1p19q联合性缺失状态和非联合性缺失状态之间的MLLT11表达存在显着差异。与1p19q非联合性缺失相比,MLLT11在1p19q联合性缺失中的表达更高(图1E),在LGG中也有同样的结果(补充图1H,I)。在非联合性缺失的患者中,MLLT11的表达随着肿瘤分级的增加而逐渐下降(图1F)。此外,MLLT11的表达水平在IDH突变和非突变之间有明显差异,这在CGGA和TCGA数据集中得到验证。在IDH突变亚型中,MLLT11的表达与正常脑相似,明显高于IDH野生型胶质瘤,在GBM中差异更为明显(图1G-J)。在CGGA_325、CGGA_693和CGGA_array数据集中也发现类似的结果(补充图1J-O)。此外,还发现与单独的IDH突变或1p/19q联合性缺失相比,IDH突变合并1p/19q联合性缺失的MLLT11表达量最高(图1K),说明MLLT11表达的预后价值与已知的IDH突变合并1p/19q联合性缺失一致。
采用qPCR、Western blotting和IHC染色来检测不同等级的胶质瘤样本(n = 27)和正常脑组织(n = 9)中MLLT11的mRNA转录水平和蛋白表达。qPCR结果显示,MLLT11在肿瘤组织中的表达水平明显低于正常脑组织,但在不同等级的胶质瘤之间没有明显差异(图1L)。此外,Western blotting和IHC结果证实,与GBM组织相比,MLLT11在正常脑组织和LGG中的表达更高(图1M,N)。在上述分析中,MLLT11表达水平较高的胶质瘤患者在胶质瘤患者中获得了良好的预后。基于以上信息,作者推断MLLT11在GBM中明显下降,并可能在胶质瘤的侵袭过程中发挥重要作用。
02 - MLLT11表达水平显示胶质母细胞瘤的亚型偏好
基于TCGA中批量表达的研究表明,GBM可分为四种亚型,即经典型(TCGA-CL)、间质型(TCGA-ME)、原神经型(TCGA-PN)和神经型(TCGA-NE),其中PN亚型的预后相对较好,但CL和ME亚型更具侵略性,预后差。在这项研究中,作者从TCGA和GTEx数据集中检测了LGG、GBM样本和正常组织中的MLLT11表达,发现在TCGA和CGGA数据集中,MLLT11表达的增加与NE和PN亚型有关(图2A-D)。
为了探索MLLT11在胶质瘤中的作用,进一步从单细胞的角度分析了MLLT11在胶质瘤中的表达。从四个胶质瘤样本中发现了七个细胞簇,主要包括星形胶质细胞、少突胶质细胞、少突胶质细胞前体细胞(OPCs)、肿瘤细胞、神经元、血管内皮细胞和免疫细胞(图2E)。MLLT11的表达主要集中在肿瘤细胞、免疫细胞和OPCs中(图2F)。此外,根据Neftel等人在2019年提出的GBM的四种类型进行scRNA-seq聚类,主要包括AC样、NPC样、OPC样和MES样四个细胞群,其中TCGA-PN亚型对应NPC样细胞状态。本研究结果显示,MLLT11主要在NPC样细胞中表达,这与其他三组细胞亚型明显不同(图2G-I)。这与批量肿瘤测序的表达一致,即MLLT11主要在TCGA-NE和TCGA-PN中上调。这表明MLLT11可以作为GBM亚型的标志物。
03 - MLLT11的表达水平与胶质瘤患者的预后有关
从上述生物信息学分析结果来看,作者认为MLLT11的表达与胶质瘤的恶性程度有明显的相关性,即在胶质瘤中,MLLT11的表达随着肿瘤恶性程度的增加呈下降趋势。为了进一步测试和验证这一结果的可靠性,在TCGA、CGGA和GEO的八个数据集中评估了MLLT11的预后价值。在这些数据集中,患者被分为低表达亚组和高表达亚组,并使用对数秩检验分析进行生存分析。结果发现,在TCGA、CGGA_array和CGGA_RNAseq_325数据集中,MLLT11表达量较高的患者(LGG和GBM)的预后明显好于低表达亚组(图3A-C)。在GSE43378数据集中,虽然在MLLT11高表达组和低表达组之间没有发现明显的统计学意义,但它们之间仍有类似的趋势(图3D)。另外,在GBM患者中,也发现MLLT11高表达的患者在CGGA_RNAseq_693数据集、GSE16011数据集、GSE74187数据集和GSE83300数据集中表现出更好的预后(图3E-H)。
为了探索对胶质瘤患者生存的影响,评估了TCGA数据集队列中MLLT11的预后价值。应用多变量Cox回归分析来研究该签名的预后能力,结果发现,在调整了年龄、性别、IDH、MGMT启动子、端粒酶逆转录酶(TERT)启动子和1p19q联合性缺失状态后,MLLT11的表达是胶质瘤患者的独立预后生物标记(图3I)。此外,TCGA数据集的ROC曲线分析被用来全面评估该模型的敏感性和特异性。在泛胶质瘤队列中,MLLT11的AUC为68%(图3J)。
04 - MLLT11高表达组和低表达组之间的差异
作者分析了TCGA中MLLT11低表达和高表达组之间的DEGs,得到301个DEGs(230个上调,71个下调)(图4A)。KEGG富集分析表明,MLLT11上调的DEGs参与了与神经活性配体-受体相互作用、突触囊泡循环、cAMP信号通路、谷氨酸突触和GABA能突触有关的通路(图4B),而MLLT11下调的DEGs则参与了与补体和凝血级联以及花生四烯酸代谢有关的通路(图4C)。同样,在CGGA_325数据集和CGGA_array数据集中,MLLT11上调的基因也主要富集在GABA能突触、逆行性内脂蛋白信号传导、突触囊泡循环和谷氨酸突触。MLLT11下调的基因主要富集在细胞外基质(ECM)-受体相互作用、蛋白质消化和吸收、补体和凝血级联的途径中。在生物过程类别中,在TCGA数据集中,发现了MLLT11上调的DEG富集的GO术语,主要涉及突触结构的发展和调节、膜电位的调节和突触后膜电位等途径(图4D)。MLLT11下调的DEGs主要富集在ECM和细胞外结构组织以及对伤口反应的调节和对伤口愈合的调节途径中(图4E),同样的结果也出现在CGGA数据集中。基于这些分析,MLLT11可能通过ECM组织影响胶质瘤微环境,并可能促进突触信息以影响胶质瘤的进展。
05 - MLLT11相关生物过程与免疫疗法的关系
为了进一步研究与MLLT11表达相关的生物学过程,作者根据MLLT11的表达,进行了PCA研究低表达亚组和高表达亚组之间的代谢状况差异。PCA结果显示,在TCGA数据集中,PCA1(Dim1)和PCA2(Dim2)对总变异的贡献分别占55.5%和15.1%(图5A)。同样,在CGGA数据集中,Dim1和Dim2分别占总方差的66.4%和7%(图5B)。此外,对DEGs进行了KEGG富集分析,以探索TCGA和CGGA中MLLT11低表达和高表达子组之间的代谢状态差异。发现在低表达亚组中,DEGs明显参与了多个肿瘤和免疫相关的途径,如白细胞跨内皮迁移、细胞因子-细胞因子受体相互作用、肠道免疫网络的IgA产生、移植物抗宿主疾病、原发性免疫缺陷、自身免疫性甲状腺疾病、糖胺聚糖降解、溶酶体、ECM-受体相互作用和谷胱甘肽代谢(图5C,D)。然而,在MLLT11低表达亚组中,泛素介导的蛋白分解、牛磺酸和次牛磺酸代谢、WNT信号通路、哺乳动物/雷帕霉素机械靶标(mTOR)信号通路。包括ERB-B1(EGFR,HER1)、ERB-B2(HER2)、ERB-B3(HER3)和ERB-B4(HER4)(ERBB)信号通路,以及磷脂酰肌醇信号系统被富集起来。这些结果在CGGA的其他数据集中也有类似的发生。这些表明,胶质瘤的侵袭性与异常的免疫状态有关。
为了研究MLLT11的高表达有助于改善预后的机制,作者通过CIBERSORT算法探讨了MLLT11表达与22种免疫细胞的免疫浸润水平之间的相关性。在CGGA和TCGA测序数据集中,皮尔逊相关分析被用来识别与MLLT11表达密切相关的免疫细胞。TCGA数据集的结果显示,MLLT11的表达与幼稚CD4 T细胞和CD8 T细胞的浸润水平呈正相关,与巨噬细胞,尤其是M2巨噬细胞的浸润水平呈负相关(图6A,B)。在CGGA阵列和CGGA 325数据集中也发现了类似的结果。此外,通过qPCR、IHC和Western blotting,在不同病理级别的胶质瘤组织中,发现随着肿瘤级别的增加,M2型巨噬细胞特异性标记物的表达水平明显增加,包括CD206、CD163、ARG1、CD115和IL-10(图7)。这可能是在肿瘤进展过程中,随着MLLT11表达水平的降低和免疫浸润水平的提高,产生的M2免疫细胞可能会促进肿瘤的侵袭过程。
最近,免疫疗法在治疗癌症方面取得了巨大的进展。考虑到免疫检查点分子对免疫反应和免疫治疗的重要性,分析了几个常见的免疫检查点成员,并评估了MLLT11和这些免疫检查点之间的相关性,如HAVCR2(TIM-3)、CD274(PD-L1)、CD276(B7-H3)、CD80、PDCD1LG2(PD-L2)、PDCD1(PD-1)和IDO1。在CGGA数据集和TCGA数据集中,对MLLT11的表达水平和七个免疫检查点之间的关系进行了Pearson相关分析。在TCGA数据集中,在WHO 3级胶质瘤中,MLLT11与PD-1、PD-L1、TIM3(HAVCR2)和PD-L2(PDCD1LG2)呈现高度负相关关系(图6)。同样,在GBM中发现MLLT11和PD-L1、TIM3(HAVCR2)和PD-L2(PDCD1LG2)之间存在强烈的负相关关系(图6)。在CGGA_325和CGGA_array数据集中也可以看到类似的趋势。这些发现表明,MLLT11可能在免疫反应中具有关键作用;特别是当MLLT11表达较低时,免疫治疗可能更有效。
四、结论
基于上述生物信息学分析和胶质瘤的实验验证,根据胶质瘤的临床病理特征、分子亚类和预后,系统地探讨了MLLT11的表达模式。同时,还分析了MLLT11与TME中免疫细胞之间的关系。这些结果初步阐明了MLLT11在胶质瘤进展中的关键作用。需要进一步研究探讨MLLT11作为胶质瘤的新型生物标志物或治疗介质,针对MLLT11的相关药物研究将有很大的潜力。