影响因子:8.440
本文的思路是通过单细胞数据分析识别了某种免疫细胞特有的marker基因,然后利用这些基因进行预后模型的构建。事实上,预后模型的文章已经不好发了,甚至有的审稿人看到预后模型就反感,因为实在是太多了,而且预测效能普遍不行。那么如何做的比这篇文章还要好呢?鉴于最近泛癌分析以及肿瘤分型分析比较好发,小编做的免疫细胞marker的泛癌分析以及肿瘤分型,内容是这些文章的2倍以上,均发表到8+杂志。所以我们在筛选到某种免疫细胞特有的marker基因后,可以对这些基因进行泛癌分析或者肿瘤分型分析。在分型分析中再附上简单的预后模型,但不以其为重点。这样的思路肯定是比本篇文章内容更多,更新颖。如果想做类似分析,欢迎交流。
研究概述:
膀胱癌(BLCA),是最常见的泌尿系统恶性肿瘤之一,尽管患者接受积极治疗,但5年总生存率(OS)仍然不令人满意。批量RNA-seq已成为转录组学的主要工具,越来越多的基因改变已被确定为BLCA的有效治疗目标。单细胞RNA-seq(scRNA-seq)能够发现有关细胞转录组异质性的信息和潜在的基因表达分布。在本研究中,作者使用scRNA-seq和批量RNA-seq数据进行了系统生物信息学分析,以构建BLCA患者的预后模型,并有两个外部验证队列来验证其分层风险的能力。同时概述了免疫渗透景观,并确定了它如何促进BLCA的发展。此外作者探究了风险模型和浸润免疫细胞之间的关系,以更好地了解BLCA进展过程中的潜在分子免疫过程。总的来说,本研究提供了一个新的观点,可能利于BLCA的临床治疗。
研究结果:
BLCA细胞亚型的识别
1.作者在三个样本13,490个细胞上进行PCA(图1C),得到结果。
2.作者鉴定出七个细胞簇,即B细胞、内皮细胞、T细胞、单核细胞、成纤维细胞、平滑肌细胞和上皮细胞(图1G)。通过气泡图可视化每种细胞类型重要标记基因的表达(图1H)。
核心细胞及其marker基因功能富集分析的鉴定
1.作者计算每个细胞明显不同的标记基因的ssGSEA分数,发现七个细胞在BLCA中都明显下调(图2A)。进行GO和KEGG功能分析(图2B-E)。除平滑肌细胞外,六种细胞类型的标记基因都与细胞激活的积极调节有关,包括淋巴细胞和白细胞(图2B)。此外,单核细胞和T细胞的标记基因与细胞因子-细胞因子受体相互作用有关。B细胞的标记基因与p53信号通路相关。内皮细胞、上皮细胞和平滑肌细胞的标记基因与局灶粘附和ECM-受体相互作用有关(图2E)。
2.对所有标记细胞分别进行伪时序分析,发现BLCA细胞遵循3个分化方向(图3A)。上皮细胞分化比其他细胞更早,分化为两个分支,其中一个由内皮细胞主导,另一个由平滑肌细胞、成纤维细胞为主(图3B)。
3.热图显示,成纤维细胞、T细胞、单核细胞、内皮细胞和上皮细胞细胞通信发生得更频繁(图3C)。内皮细胞和上皮细胞之间、内皮细胞和成纤维细胞之间以及内皮细胞和T细胞之间相互作用的频率和强度很高(图3D)。B细胞与其他细胞的相互作用相对罕见。
单细胞RNA-seq数据中DEGs的鉴定和功能富集分析
作者总共获得了1556个显著的DEG,包括708个上调基因和848个下调基因(图4A,B)。GO分析表明,DEGs主要富集于核分裂、细胞器裂变、有丝分裂核分裂和其他细胞周期的相关功能(图4C-E)。KEGG富集结果表明,DEG富集于PI3K-Akt信号通路、MAPK信号通路、粘附点和细胞周期(图4F)。
识别与BLCA相关的关键模块
WGCNA用于识别参与BLCA发展和进展的基因。在共表达网络的构建过程中,当无尺度拓扑的拟合指数达到0.85时,软阈值β为5(图5A-B)。MEDissThres设置为0.2,合并类似模块,合并后,总共10个模块终于可用(图5C-D)。选择MEbrown作为关键模块(包含2334个基因)(图5E)。图5F显示了具有临床相关性的棕色模块的散点图。
构建和验证3个基于特征基因的预后模型
1.使用Venn图演示了marker基因、BLCA模块基因和细胞亚型DEG的交集,总共取了123个相交基因并将其定义为候选基因(图6A)。使用TCGA-BLCA进行单变量Cox回归分析,10个基因与OS显著相关(图6B)。使用LASSO算法筛选基因进行模型构建。结果如图所示。(图6C)作者筛选出3个特征基因:PCOLCE2、MAP1B和ELN。将患者分为高风险组和低风险组(图6D)。高风险评分患者的OS和无病生存率(DFS)明显低于低风险评分的患者(图6E)。
2.为了进一步评估风险模型的有效性,计算了OS的ROC曲线,1年、2年、3年、4年和5年的AUC值大于0.59,表明风险模型的功效更好(图6F)。在内部验证集和外部验证集GSE13507和GSE32548中对模型进行了功能验证,结果表明该模型具有准确性。
风险评分和不同临床特征的分析
为了分析风险评分表达与临床特征之间的相关性,根据不同临床特征组分别比较了患者风险评分的差异。风险模型和临床特征的热图如图7A所示。图7B-I 分别为年龄、性别、M阶段、N阶段、T阶段、TMB、肿瘤阶段和生存状态与分析模型之间的关系。结果显示,风险评分在N阶段、T阶段和OS状态方面明显不同(图7B)。
独立预后因素的筛选和命名图的构建
为了筛选独立的预后因素,对临床特征和风险评分进行了单变量和多变量Cox分析,发现RiskScore和Stage是独立预后因素(图8A,-B)。两个独立的预后因素包含在nomogram模型中(图8C)。该模型具有很高的预测效果(图8D)。
高风险群体和低风险群体之间的GSEA
1.确定两组之间重要富集途径。高风险组在细胞激活和涉及免疫反应的体液免疫反应等免疫过程中显著丰富(图9A)。高风险组和低风险组的吞噬体相关途径促进趋化因子信号通路、补体和凝血等途径(图9B)。
2.高表达组在肌生成、MYC靶V2、早期雌激素反应、胰腺β细胞、DNA修复、MYC靶V1、顶端连接、KRAS信号通路、过氧化物酶体、IL6 JAK STAT3和血管生成MYC靶点的标记条目中被激活,而低表达组在缺氧、脂肪生成、血红素代谢、胆汁酸代谢、干扰素α反应途径、凝血和其他标记条目中被激活(图9C-D)。
BLCA免疫治疗可能性评估
1.ssGSEA用于估计不同风险组中28个免疫细胞的浸润分数。25个免疫细胞物种的浸润水平差异在统计学上是显著的(图10A)。预后基因和风险评分都与浸润免疫细胞显著相关(图10B)。在高风险组和低风险组中,16个GEP基因(炎症基因)和4个免疫检查点明显不同(图10C)。16个差异GEP基因的相互作用网络和排名前4的途径(T细胞激活、T细胞激活的调节、白细胞-细胞粘附的调节、白细胞-细胞-细胞粘附)如图10D所示。差异GEP基因的PPI网络显示了每个GEP基因之间的联系(图10E)。PD-1、PD-L1、CTLA-4和TIGIT在高风险组和低风险组中有所不同(图10F)。
2.评估高风险组和低风险组反应的ICB,发现CTLA-4免疫位点在Roh队列中是敏感的(图10G)。BLCA患者主要由误感突变和SNP为主(图11A)。高风险组和低风险组之间的突变结果表明,高风险组和低风险组的大多数突变类型都是异义突变。高风险组的突变比例高于低风险组,高风险组的突变负荷指数TMB指数总体高于低风险组(图11B)。结免疫疗法在BLCA中具有发展潜力。
高风险和低风险群体的药物敏感性分析
发现12种药物与风险评分呈负相关(R < -0.4和p < 0.05),图中只显示了前7种药物。(图12A)探索了12种药物的目标和途径,其中5种没有相应的数据(表1)。高风险人群和低风险群体之间有12种化疗药物的显著差异(图12B)。药物 staurosporine、CCT036477、XL765、TGX.221和苏尼替尼与风险评分的负相关性最强(图12C)。同时,五种药物的AUC值在高风险和低风险群体中都明显不同(图12D)。这些药物可能对治疗BLCA很有希望。
研究总结:在本研究中,通过整合scRNA-seq和批量RNA-seq数据,作者执行了多种机器学习方法,并建立了BLCA患者OS预测的新预后模型,该模型可用于预测BLCA患者的生存概率。此外,风险评分是一个有前途的独立预后因素,与免疫微环境和临床病理特征密切相关。总体而言,这项研究可以作为BLCA疗效的可靠预测指标,为未来靶向治疗BLCA开辟了新的途径。