生信小课堂
影响因子:7.3
研究概述:
透明细胞肾细胞癌((Clear cell renal cell carcinoma, ccRCC)是一种常见的肾癌亚型,复发和预后不良的倾向性高,其肿瘤微环境复杂,显著影响肿瘤进展和免疫治疗反应。
近年来研究发现肿瘤浸润性 B淋巴细胞(TIL-Bs)可能在 ccRCC 中具有促肿瘤作用,这与已知的B细胞在多种恶性肿瘤中抗肿瘤反应有所不同,值得深究,可为ccRCC的TME提供新的见解,并促进靶向免疫治疗的发展。
本研究旨在使用多个数据集和生物信息学工具进行系统分析,探讨TIL-Bs在ccRCC中的预后和分子特征。
如果想做类似的分析,欢迎交流。
流程图:
首先证实高水平的B细胞浸润与ccRCC患者的生存率降低相关。
随后利用WGCNA确定了与TIL-B相关的重要调控网络。在此基础上还通过Consensus分析确定了ccRCC亚型,并分别在scRNA-seq数据集中确定了B细胞亚簇。
根据两个核心模块的枢纽基因进一步筛选候选分子,构建了一个10基因的特征模型,在TCGA训练队列中表现出令人满意的预后疗效,并通过TCGA和ICGC测试队列验证。
接着详细解读了10基因的丰富分子特征,如模型生物标志物的异常表达和免疫相关性,以及密切的单核苷酸变异(SNV)和基于风险评分的标记功能。
最后开发了更精确的预后列线图,并确定了几种针对高危组 ccRCC 患者的前瞻性药物。
研究结果:
一、基于B细胞浸润水平的泛癌生存分析
1. 作者使用Cox回归模型初步计算了 33 种癌细胞中 TIL-B 的 HR(hazard ratio风险比)。图2A:TIL-Bs与8种癌症的总生存期OS以及 10种癌症的无进展生存期 PFS之间存在显著关联(-log10<1)。RCC的两种亚型KIRC 和 KIRP在OS和PFS中均为HR>1。
2. 根据中位浸润水平将两个亚型队列分别分为两组。Log-Rank检验显示,在KIRC患者中较高水平的TIL-Bs确实具有较低的生存率(图2B,C),在KIRP患者中没有观察到明显差异(图8D,E)。两个独立的ccRCC队列也证实了这一发现(图2F,G)。
3. 从已报道的8个反映肿瘤环境B细胞水平的标志物中,发现其中一些,如PNOC、FCRL2、CD19,对ccRCC队列总生存期的不良预后有不同程度的影响(图S1A)。KIRC患者中这些基因的ssGSEA评分与xCell预测的B细胞浸润评分显著相关,并显示出中等生存差异(图S1B,C)。
4. 在TCGA和外部样本GSE150404中,TILBs均在ccRCC晚期较早期明显升高(图S2A,B)。重点是,对早期和晚期患者的两项独立生存分析都显示出一定意义,特别是早期患者(图S2C,D)。
二、TIL-Bs相关基因模块和ccRCC亚群
1. 作者使用 TCGA-KIRC 队列的 529 个肿瘤样本进行WGCNA鉴定共表达模块。根据树状图3A,没有检测到相当大的异常值样本,根据包含6000个高可变基因的表达矩阵的相关拓扑特征(图3B),将最佳软阈值设置为9。最终成功识别了10个模块(图3C)。
2. 根据模块特征基因(ME)值确定其各自的枢纽基因。然后计算TIL-Bs和ME之间的 spearman 相关系数,确定了三个表现出显著正相关的模块(brown, magenta, red),棕色brown模块的正相关性最强,蓝色blue模块的负相关性最强(图3D)。
3. 图 3E使用棕色和蓝色模块,共431个枢纽基因来执行重采样共识算法,识别出两个不同的 ccRCC 亚群。图3G为基于上述基因的PCA,证实了两亚群明显不同的表达谱。通过生存分析,发现cluster_2与较差的预后有显著相关性(图3F),且相比于cluster_1,TIL-Bs水平也更高(图3H)。
4. 为了解通路水平的转录组学差异,作者首先应用DESeq2工具鉴定了1815个DEGs(1380个上调,435个下调),分别用于Reactome通路富集分析。结果表明,上调基因与基质金属蛋白酶的激活、GPCR配体结合和白细胞介素信号传导有关;下调基因与氨基酸及其衍生物的代谢、SLC介导的跨膜转运、维生素及辅助因子代谢有关。
三、B细胞在ccRCC中的转录特性
1. 作者获取相关的scRNA-seq数据(GSE178481),其中10个肿瘤样本和9个正常样本。在质控和批次效应相关后以0.01的分辨率鉴定出7个簇(图4A),并使用标记基因进行细胞类型注释(图4B,C)。簇 5(蓝色)的 CD79A、CD79B 和 MS4A1 表达最高,表明其注释为B细胞类型,其在肿瘤组和正常组织组中的比例分别为5.1%和2.1%。
2. 利用CellPhoneDB分析计算并观察了TME中涉及B细胞的一些配体-受体相互作用的改变(图4D)。例如,从B细胞到上皮细胞的CD74-COPA对在肿瘤组中高表达,而在正常组中未观察到。此外还发现了几种激活的配体-受体相互作用,如C5AR1-RPS19。
3. 通过 Scissor的生存表型分析(图4E),作者发现在肿瘤条件下与较差预后相关的B细胞亚群更多,这定性地暗示 ccRCC 中的 TIL-B 可能影响生存结果。
4. 比较肿瘤组和正常组之间的 B 细胞,确定了 226 个DEGs(图 5A)。Fisher精确检验结果表明,brown, red和pink模块与这些DEGs尤其是上调的DEGs密切相关(图5B)。根据前人分析,在这3个模块中,棕色和红色模块也与TIL-Bs正相关,因此认为它们是ccRCC中与TIL-Bs相关的核心模块。
5. 另一方面,B细胞群进一步分为五个亚群(C0, C1, C2, C3, C4)。作者评估了上述两个模块在所有B细胞中的富集评分,并在测序样本水平上比较了肿瘤和正常状态下每个亚群的平均评分。如图5C所示,肿瘤组有3个亚群显示出显著更高的棕色模块评分。特别是C3,且其在ccRCC组织中的组成比例也更高(图5D)。
6. 由于XBP1、CD27等标志物的高表达,该亚簇随后被注释为浆细胞(图4E)。TCGA-KIRC队列的Log-rank检验分析表明,血浆B细胞类型的比例与不利OS显著相关(图5F)。
四、预测特征模型的建立和验证
1. 通过上述分析,棕色和红色模块可以代表 B 细胞在 ccRCC 中的重要作用,故从这两个模块的383个枢纽基因中寻找潜在的生物标志物并建立预后模型。
2. 作者将TCGA-KIRC数据集以7:3的比例随机分为训练队列和测试队列。在训练队列中,在上述枢纽基因中,经Cox回归分析HR值显著的91个基因被优先排序(图6A)。使用Lasso模型将选择范围进一步缩小到20个具有正则化效应的候选基因(图6B)。其中虽然B3GAT3、SHARPIN等几个基因表现出中等的预测性能,但在外部ICGC集上的准确性并不理想。所以通过多因素Cox回归,构建了上述候选基因的多个基因调整系数的组合模型,最终提出了10个基因特征(TNFSF13B、SHARPIN、B3GAT3、IL2RG、TBC1D10C、STAC3、MICB、LAG3、SMIM29、CTLA4)(图6C)。
3. 基于训练队列中特征的风险评分,以中位数截断法分层的两组之间的生存差异相当显著,高分组预后较差(图6D)。1年、3年和5年总生存期的AUC值分别达到0.79、0.72、0.73(图6E)。使用相同的方法评估模型在TCGA测试集(图6F,G)和整体TCGA集(图6H,I)中的性能,效果良好。该模型在ICGC外部测试数据集上也表现良好,显示出其可接受的泛化能力(图6J,K)。
五、ccRCC中特征生物标志物的异常表达
1. 作者评估了10个特征基因在TCGA癌症中相对于相应正常组织的差异表达,观察到 KIRC 队列中大多数基因显著上调,其次是 BRCA、KIRP、HNSC 和 STAD(图7A)。特别地,TBC1D10C的异常高表达仅在ccRCC中被检测到。
2. 作者进一步分析了一个亚洲队列(GSE126964),表现与TCGA-KIRC中观察到的相似,除了SMIM29,SHARPIN,B3GAT3(图7B)。此外,ccRCC 肿瘤10个上调基因中有6个在转移性ccRCC样本(GSE19949)中也表现出表达升高,如 LAG7 和 IL3RG(图7B)。B3GAT3和SHARPIN在这个比较中也被发现高表达。
3. 图8A的相关性分析显示,构成预后模型的生物标志物与B细胞浸润无关,少数在正常情况下甚至呈负相关。然而在ccRCC肿瘤中。它们与B细胞及其亚型均呈显著正相关(图8B)。在肿瘤环境中,与T细胞、内皮细胞和单核细胞等其他免疫评分的相关性也发生了显著变化。
4. 另一方面,作者还分析了与常见免疫检查点IC的关系(图8C):其中7项在两种情况下均表现出明显的相关性,还观察到一些显著的变化,如CTLA4、STAC3、TBC1D10C、TNFSF13B在肿瘤状态下与KIR(杀伤细胞免疫球蛋白样受体)家族基因的相关性较弱。
六、风险评分相关的临床表型、SNVs和通路
1. 作者评估了不同表型风险评分的分布差异,未发现性别或年龄组的显著差异。而晚期或高级别患者的风险评分往往较高。根据中位风险评分将KIRC队列分为高低风险组。结合TCGA匹配的SNV数据,分别确定了每组中突变频率最高的前10个SNV(图9A,B),其中存在一些差异,如BAP1,ATM,SYNE1。
2. 进一步采用卡方检验来比较上述基因野生组或突变组内高低风险患者的数量。如图 9C 所示,BAP1、SED2、SYNE1的突变与高危患者更为接近。BAP1,SYNE1还与较差的生存率有关(图9D)。
3. 在两个风险组之间确定了 1258 个重要的DGEs,Metascape 平台使用这些 DGE 来注释20个最相关的通路(图10A)。富集结果主要涉及细胞外基质和基质体、GPCR(G蛋白偶联受体)配体结合、体液免疫应答、细胞群增殖、细胞命运承诺。通过基于MSigDB数据库的标志性通路的GSEA分析,作者发现了12个上调的术语,包括IFN-α反应,IFN-γ反应,IL-3 / JAK / STAT10信号转导(图10B)和14个下调的术语,包括蛋白质分泌,脂肪酸代谢,雄激素反应(图10C)。
七、基于患者风险评分、分期和年龄的列线图模型
1. 基于已验证的10个基因特征的预后价值,作者进一步证实了其对生存预测的独立贡献,同时调整了其他潜在的协变量。
2. 多变量Cox回归分析结果表明,风险评分、患者年龄和AJCC分期(风险比大于1)对生存结局有显著影响(图11A)。总体一致性指数(C指数)达到0.78,表明在训练集中具有良好的预测性能。因此,汇总上述三个因素的得分,建立了一个直观的列线图(图11B)。
3. 在TCGA-KIRC序列(0.88、0.82、0.77)和测试队列(0.83、0.81、0.79)上评估基于列线图的1年、3年、5年时间点的AUC值,均显示出显著疗效(图11C)。图11D展示了组合模型的预测性能优于任何单因素的简单模型。
八、针对高危患者的潜在治疗药物
结合 TCGA-KIRC 患者274 种药物的预测 IC50 数据,作者计算了他们的 pearson 相关系数与风险评分,筛选出38个强负相关(R < -0.3)的化合物。
在前10位(表2)中,与低风险组患者相比,高危组患者更敏感,药物IC50明显低于低危组。
研究总结:
本研究阐明了B细胞高水平浸润与ccRCC患者的生存率降低之间的显著关联,检测到几个关键的基因模块以及相关的患者亚群、B细胞亚群。根据这些可能与ccRCC中的TIL-Bs有关的基因模块,提出了一个10基因特征模型,预测性能良好。此外,从多个角度研究了TIL-Bs相关10基因特征模型的分子特征,并以此开发预后列线图及前瞻性药物。
本文对TIL-Bs对ccRCC肿瘤的预后意义、分子特征及其机制进行的系统研究有助于进一步了解ccRCC中复杂的肿瘤微环境,促进新治疗策略的制定。