哈喽大家好呀,喵学姐又又又来读文献了,今天给大家讲解一篇做的非常全面的肿瘤方向高分生信文章
标题:
Construction and validation of a cuproptosis-related
prognostic model for glioblastoma
期刊:
研究背景
胶质母细胞瘤(Glioblastoma, GBM):根据传统的组织病理学特征,胶质瘤可被分为WHOⅠ-Ⅳ型。GBM属于胶质瘤中WHOⅣ型,其是最具侵袭性的胶质瘤。
铜死亡(Cuproptosis)是一种新型的程序性细胞死亡形式,其不同于细胞凋亡、焦亡和铁死亡。有研究表明,在铜凋亡过程中,Cu2+与线粒体呼吸链中三羧酸循环的硫辛酰化组分结合,导致硫辛酰化蛋白聚集和铁硫簇蛋白下调,随后发生蛋白毒性应激和细胞死亡。
此外,基于cuproptosis的预后模型已经发表在多种肿瘤中,包括头颈部鳞状细胞癌、三阴性乳腺癌、肺腺癌、肾透明细胞癌、黑色素瘤、肝细胞癌和低级别胶质瘤,可准确预测患者预后、肿瘤免疫微环境以及对化疗或免疫治疗的反应。然而,在GBM中尚未报道与铜死亡相关的预后模型。
思路亮点
1.该文章对同一数据集进行了两次一致性聚类分析,一次是根据铜死亡进行一致性聚类分析,另一次是根据差异基因进行一致性聚类分析。
2.该文章的免疫分析比较全面,包括了免疫细胞浸润、免疫微环境、免疫检查点、CSC指数、TMB和药物敏感性。
研究解读
Step.0
思路图
▲图1:研究设计的流程图
Step.1
数据收集
作者从TCGA数据库下载TCGA-GBM,从GEO数据库下载GSE83300和GSE74187数据集。其中GSE8330数据集中包括50例GBM患者,GSE74187数据集中包括60例GBM患者。由于样本量较少,作者首先对原始文件进行校正和分位数归一化,然后通过“Combat”算法消除批处理效应后将数据集合并。研究共收集了209例GBM患者,其中包含了详细的临床信息,包括年龄、性别、总生存时间、生存状态和IDH1突变状态。
Step.2
铜死亡亚型的鉴定
▲图2:铜死亡亚型的鉴定以及两种亚型之间临床特征和CRGs表达水平的比较。
首先,作者从已发表的文献中收集得到了12铜死亡相关基因(CRG)(图2A)。其次,作者根据5种预后CRG的表达谱,采用一致性聚类分析对GBM样本进行分类。图2B显示,k=2是最优的分类方法,最终GBM样本被分为CRGclusterA(样本数=119)和CRGclusterB(样本数=90)。此外,PCA分析表明两种亚型铜死亡转录谱不同,该结果进一步验证了聚类的结果(图2C)。然后,作者利用Kaplan-Meier生存分析探索不同铜死亡亚型预后的情况,结果表明CRGclusterA中的样本比CRGclusterB中的样本具有更长的总生存(Overall survival, OS)(图2D)。进一步,作者通过热图比较两种亚型的临床特征的情况,结果表明未观察到年龄和性别的明显差异(图2E)。最后,作用通过Pearson系数检验探究不同CRG在不同亚型的表达情况,结果表明CRGclusterA中的CRGs表达水平高于CRGclusterB(图2F)。
Step.3
不同铜死亡亚型中肿瘤微环境的特征
▲图3:肿瘤微环境与两种铜死亡亚型的相关性。
为了进一步探索了不同铜死亡亚型中免疫微环境的不同,作者首先基于ssGSEA算法获得了每个GBM样本中23种免疫细胞的相对含量。并通过Pearson系数检验验证不同铜死亡亚型与23种免疫细胞的关系,其结果表明不同铜死亡亚组的MDSCs,CD56 natural killer cells,macrophages,eosinophils,type 2 T helper cells,mast cells, monocytes,and CD56 natural killer cells的免疫细胞含量存在差异(图3A)。其次,不同铜死亡亚组与免疫检查点Pearson系数检验的结果表明,PD-L1在CRGclusterB中的表达低于CRGclusterA,而大多数CRGs在CRGclusterA中的表达水平高于CRGclusterB(图3B)。此外,使用ESTIMATE算法,作者获得了每个GBM样本的TME分数,包括ImmuneScore、StromalScore和ESTIMATEScore。ImmuneScore表示免疫成分的含量,StromalScore表示矩阵成分的含量,ESTIMATEScore是两者的总和。差异分析结果显示,CRGclusterB TME评分略高,但差异无统计学意义(图3C)。
Step.4
预后差异基因的鉴定和基于亚型的分类
作者通过R语言limma包对不同铜死亡亚型进行了差异分析,共获得360个与铜死亡亚型相关的差异表达基因。其次,通过单因素COX回归分析对360个差异基因进行筛选,最终获得了与GBM患者预后相关的79个差异基因。然后,利用79个差异基因表达谱采用一致性聚类分析对GBM样本进行分类。GBM样本被分为geneClusterA和geneClusterB两个亚型(图4A)。Kaplan-Meier曲线显示geneClusterB中的GBM样本比geneClusterA中具有更长的OS(图4B)。通过比较两种亚型的临床特征,未观察到年龄和性别的明显差异。虽然大多数预后DEGs在geneCluster A中的表达水平高于geneCluster B(图4C)。geneCluster A 和 geneCluster B 之间 12 个 CRG 的差异表达分析显示在图5D。
Step.5
建立并验证风险评分模型
▲图5:在训练集中构建风险评分模型
根据铜死亡亚型相关DEGs,建立预后风险评分模型。图5A显示不同分类方法的GBM样本分布。首先,作者将209例GBM样本分为训练集和测试集,其数量分别为105例和104例。其次,对79个差异基因进行LASSOS回归分析,获得7个风险模型候选基因(图5B-C)。此外,对7个风险模型候选基因进行多因素COX分析,最终获得5个靶基因,并构建风险评分模型(Risk=0.2988*PDIA+0.1705*PILRB+0.2448*DUSP6+0.3055*PTPRN-0.2095*CBLN1)。差异分析的结果显示geneCluster A和CRGcluster A的风险评分分别高于geneCluster B和CRGcluster B(图 5D-E)。在训练集中,作者进一步根据中位数将GBM 样本分为低风险集群 (n = 53) 和高风险集群 (n = 52)。随着风险评分的增加,GBM患者的OS逐渐降低,死亡人数稳步增加(图5F)。图5G表明PCA 分析可以清楚地区分了两个风险集群。生存曲线显示,低风险组GBM样本的OS比高风险组长(图5H)。此外,ROC曲线表明风险评分模型的预测效能良好,该模型的 0.5、1.0 和 1.5 年的 AUC 值分别为 0.643、0.709 和 0.751(图5I)。
Step.6
在测试集检验风险评分模型
▲图6:分别在测试集、GSE83300和GSE74187数据集中的验证风险评分
作者利用中位数风险评分将测试集、GSE83300和GSE74187进行分类。排名点图的结果显示,随着风险评分的增加,GBM患者的OS逐渐降低,死亡人数稳步增加(图6A、E、I)。PCA可以清楚地将两个风险集群分开(图6B、F、J)。在测试集中,Kaplan-Meier曲线显示,低风险组的GBM比高风险组具有更长的OS(图6C)。在GSE83300数据集中,虽然生存分析结果未达到统计学意义,但低风险集群中的GBM样本倾向于延长OS(图6G)。在GSE74187数据集中,Kaplan-Meier曲线显示,低危组GBM的OS比高危组长(图6G)。在测试集中,该模型的 0.5、1.0 和 1.5 年生存率的 AUC 值分别为 0.610、0.671 和 0.708(图6D)。在GSE83300数据集中,该模型的 0.5、1.0 和 1.5 年生存率的 AUC 值分别为 0.676、0.731 和 0.718(图6H)。在GSE74187数据集中,该模型的 0.5、1.0 和 1.5 年生存率的 AUC 值分别为 0.619、0.731 和 0.741(图6l)。综合来看,该模型的预测患者预后稳定且效果良好。
Step.7
用实验验证模型中基因在GBM组织和正常组织的表达情况
▲图7:通过RT-qPCR和WB验证5个模型相关基因在GBM组织和相应的正常组织中的表达水平。
Step.8
风险评分模型的临床相关性分析和分层分析
▲图8:风险评分模型的临床相关性分析和分层分析
IDH1突变株簇的风险评分低于IDH1野生型簇(图8A)。单因素和多因素COX显示,风险评分模型和IDH1突变状态均可独立的预后因素(图8B-C)。作者利用分层分析,以评估该模型是否具有广泛的适用性。Kaplan-Meier曲线显示,低危组GBM的OS总是比高危组长,年龄小于60岁亚簇p<001,年龄大于60岁的亚簇p=0.005,男性亚簇p<0.001,女性亚簇p=0.015,IDH0突变亚簇p<0.001,IDH0 野生型亚簇p=0.003(图8D-I)。
Step.9
两个风险评分组之间的TME和检查点评估
▲图9:评估TME和两个风险评分组之间的检查点
为了探究风险评分与免疫细胞浸润水平的相关性,作者通过相关性分析研究风险评分与免疫细胞含量的关系,其结果表明风险评分与调节性T细胞、滤泡辅助性T细胞、中性粒细胞、静息NK细胞和M0巨噬细胞中呈正相关,与嗜酸性粒细胞、M2巨噬细胞、单核细胞和活化的NK细胞中呈负相关(图9A)。此外,免疫细胞含量与5个模型相关基因表达水平的相关性分析显示,部分免疫细胞与特定基因存在明显相关性(图9B)。此外,低风险集群中GBM样本的StromalScore和ESTIMATEScore显著低于高风险组(图9C)。最后,对高危集群和低风险集群之间的免疫检查点进行差异表达分析。结果显示,15个免疫检查点在低风险簇中的表达水平低于高危簇,例如PD-1和PD-L1(图9D)。
Step.10
评估风险评分与CSC指数、TMB和药物敏感性的相关性
▲图10:评估风险评分与CSC指数、TMB和药物敏感性的相关性
为了探究风险评分与免疫治疗相关指标的关系,作者通过相关性分析探究风险评分模型与CSC指数、TMB和药物敏感性的相关性。CSC指数与风险评分的相关性分析结果显示,二者呈负相关(R = -0.35,P = 6.5e-06);即低风险评分的GBM患者的干细胞特征更显著(图10A)。一般认为,TMB高的肿瘤对免疫治疗反应较好,预后较好。基于TCGA GBM队列的突变数据,鉴别分析表明,高危人群的TMB低于低风险人群(图10B)。其次,TMB与风险评分的相关性分析结果显示,两者呈负相关(R = -0.048,p = 0.049;图10C).有趣的是,低风险组没有显著相关性(R = 0.044,p = 0.12;图10D)和高危组呈负相关(R = -0.012,p = 0.04;图10E)。为了确定体细胞突变的具体分布,我们构建了两个风险评分组的瀑布图,高危簇中53个最常突变的基因分别是PTEN、EGFR、TP1、TTN、NF16、MUC3、PIK2CA、LRP2、RYR1和SPTA(图10F),而低危簇中为TP53、PTEN、TTN、EGFR、MUC16、ATRX、SPTA1、FLG、IDH1和RYR2(图10G).低危簇中PTEN、EGFR和NF1的突变频率低于高危簇,而ATRX、IDH1、TP53、MUC16和PIK3R1的突变频率高于高危簇(图10F、G).此外,选择常用药物或化合物来检测药物敏感性与风险评分之间的关联。两个危险簇间IC50值的差异分析结果显示,苔藓抑素、米多司他林、米达美替尼、普纳替尼和替匹法尼在高危簇中的IC50值低于低危簇。相比之下,阿法替尼和依来洛莫在高危集群中的IC50值高于低风险集群。结果提示药物敏感性与风险评分(图10H–N)。
Step.11
构建列线图以预测生存期
▲图11:在训练集中构建列线图
为了探究风险评分模型对预后的价值,作者综合风险评分模型及临床参数构建了列线图。其结果表明,风险评分模型在GBM患者的预后中价值显著(图11A)。图11B-C表明训练集和测试集ROC曲线都表明风险评分模型对GBM患者预后预测性能良好。图11D-E校准曲线表明,两组的预测结果非常接近理想结果。最后,作者还探究了IDH1突变状态对GBM患者预后的预测效能(图11F-G)。
结论
作者通过分析从数据库下载的GBM表达谱和临床数据,构建并验证了基于CRGs的风险评分模型。进一步开发了列线图以提高适用性。作者还研究了分类与TME的关系及其在免疫治疗或化疗中的指导意义。该论文为GBM的预后预测和精准治疗指导提供了新的思路。