影响因子:7.5
研究概述:恶性间皮瘤是一种不常见的肿瘤,与石棉暴露有很大关系,预后很差。作者试图建立一个成纤维细胞分化相关基因特征,以创建一个新的恶性间皮瘤分类和预后预测模型。NCBI-GEO、TCGA和MET-500三个数据库分别提供了单细胞RNA测序数据、MESO的bulk RNA测序和骨转移肿瘤的RNA测序。利用降维和聚类分析获得了MESO微环境中的成纤维细胞亚型,结合拟时序分析和TCGA数据库中的生存信息,筛选出与生存相关的成纤维细胞分化相关基因(FDGs),随后利用这些基因生成MESO分类和预后预测模型。然后,为每种MESO亚型构建调控网络,并预测候选抑制剂。作者收集了临床标本进一步验证。该研究为今后的研究提供了一些前瞻性的治疗靶点,对推动未来MESO的临床和基础研究具有重要意义。
本文的思路是通过单细胞数据分析识别了某种免疫细胞特有的marker基因,然后利用这些基因进行预后模型的构建。
研究流程图如下:
研究结果:
在肿瘤微环境中发现成纤维细胞
作者从GEO数据库中获取了三个MESO样本(ADU-S100_10um、ADU-S100_50um和对照组)单细胞水平的基因表达谱。经过严格过滤和控制后,共获得14,347个细胞用于后续分析。为了确定在肿瘤进展过程中可能具有调控功能的关键基质细胞,作者利用降维分析发现了肿瘤微环境中的15个seurat群,并根据细胞标志物将其分为七种细胞类型(B细胞、内皮细胞、上皮细胞、成纤维细胞、肥大细胞、髓样细胞和NK/T细胞)(图1B,C)。
图1E显示了细胞类型标记基因的表达情况,,图1D显示了三种样本中七种细胞类型的平均数量和细胞比例,其中上皮细胞数量最多,其次是NK/T细胞。在对15个seurat簇的差异表达分析中,图1F展示了各群细胞的marker基因。随后,为了弄清成纤维细胞与其他细胞之间的关系和相互作用,作者建立了七种细胞类型之间的细胞通讯网络和配体-受体相互作用。
在三个MESO样本中,作者发现了1969个成纤维细胞(图2A),并通过降维分析和聚类从中得出了六个成纤维细胞亚型(图2B)。图2C显示了每种亚型中四种细胞标记物的表达水平。除了成纤维细胞的典型标志物DCN和COL1A2外,APOE的表达也普遍较高。作者以热图的形式列出了每个亚型中表达差异最大的四或五个基因(图2D)。
六种亚型之间的细胞通讯网络和配体-受体相互作用显示,KRT19_FIB和MMP2_FIB在所有亚型中处于中心位置,EFGR与CALM2和ANXA1之间存在紧密联系(图2E,F)。为了进一步探究各亚型的功能,作者利用HALLMARK数据库根据各成纤维细胞中基因组的变异评分进行了GSVA分析。结果显示,所有亚型都普遍富集于KRAS通路,而KRT19_FIB和MMP2_FIB的免疫相关标志基因集(标IFNG和IFNA)和增殖相关标志基因集(MYC激活)的富集程度相对较高,这意味着与其他亚型相比,这两种亚型可能具有更高的增殖潜力(图2G)。因此,在所有六个亚型中,KRT19_FIB和MMP2_FIB更值得关注。
成纤维细胞亚型的分化状态和与分化相关的成纤维细胞差异基因(FDGs)
作者在此过程中使用了Monocle 2和tSNE,通过识别4个tSNE细胞簇使成纤维细胞的分化轨迹得以直观呈现。图3A显示了按时间顺序排列的分化轨迹,颜色的渐变代表了细胞分化所需的时间。共捕捉到三种分化状态,其中状态1是最早的阶段,然后分为状态2和状态3(图3B)。六种亚型在轨迹中的分布情况见图3C、D。IGF2_FIB、LARP6_FIB和MYL9_FIB主要位于状态3,意味着相对成熟的分化,而KRT19_FIB和PTPRC_FIB则主要分布在状态1,即低分化阶段。因此,KRT19_FIB中成纤维细胞的分化程度可能较低。
随后,作者为了捕捉六个亚型中与分化相关的成纤维细胞差异基因(FDGs)。先通过Monocle2单细胞分析工具集,作者提取了644个在三种分化状态下有差异表达的基因。又在TCGA数据库记录的大量RNA-seq数据和MESO患者临床信息的基础上,利用Kaplan-Meier技术和单变量Cox回归模型进行生存分析,检测与生存相关的基因。将得到的三个基因集重叠,筛选出三个基因集交叉点上的共39个基因,并将其定义为成纤维细胞分化相关基因(FDGs)。根据这39个FDGs的生存曲线,ADH1B、CFB、PRG4、PLAAT4、HP和IFIT3的高表达对生存有利,而其他33个基因被认为是危险因素。更重要的是,6个有利因素中的5个(CFB、PRG4、PLAAT4、HP和IFIT3)在状态3中有所体现,因为与状态1相关的16个FDGs都被标记为风险因素(图4A)。因此,作者推断,在MESO肿瘤微环境中,分化程度高的成纤维细胞可能有助于改善预后,而分化程度低的成纤维细胞可能产生相反的效果。根据这一推断,KRT19_FIB可能与不良预后有关。
构建基于成纤维细胞分化的MESO分类(FDBC)
通过拟时序分析来确定连续细胞发育过程中基因表达的动态变化,作者试图探索成纤维细胞的不同分化状态和各亚型的分化特征。为了探索FDGs的临床价值,作者从TCGA数据库中获取了MESO患者的bulkRNA-seq数据和临床信息,并根据FDGs的表达情况,利用共识聚类将这些患者分为不同的分类。结合共识聚类矩阵热图、CDF曲线和delta面积图,认为3是最佳k值,可产生三个聚类(图4B、C)。如图4D所示,聚类1高表达状态1和状态2的基因,而聚类2则相对高表达状态3的基因(包括CFB、PRG4、PLAAT4、HP和IFIT3),这表明聚类1可能与低分化成纤维细胞有关,而聚类2中的成纤维细胞则趋向于高分化。
所有FDGs的差异表达均有统计学意义。因此,作者将第1群组命名为"低度分化的成纤维细胞相关间皮瘤(LDFM)",第2群组命名为"高度分化的成纤维细胞相关间皮瘤(HDFM)",第3群组命名为"中度分化的成纤维细胞相关间皮瘤(MDFM)"。在这三个群组中,HDFM的生存结果明显优于LDFM和MDFM,而LDFM的生存结果最差,体现了新分类的预后价值(图4E)。作者根据39个FDGs进一步计算了每位患者的PCA得分,并将患者分为两个PCA组(低分组和高分组)。由于高分组患者的生存概率普遍高于低分组患者,因此PCA评分可能与生存率呈正相关(图4F)。同时,作者发现HDFM患者的PCA评分普遍高于LDFM和MDFM(图4G)。LDFM中的所有患者都流向了低分组,而HDFM中的高分组占了很大比例。因此,新的分类方法可能是预后预测的有效指标,从而改善患者管理。
新型预后预测模型的建立和内部验证
如图5A所示,作者从FDGs中识别出了9个MSigDB基因类别和相应的42条通路。根据基因表达与相关总生存率(OS)之间的单变量Cox回归分析,图5B展示了具有统计学意义的6个保护因素(ADH1B、CFB、PRG4、PLAAT4、HP和IFIT3)和33个危险因素。为了充分利用FDGs与生存之间的关系,作者应用Lasso回归分析法从这些FDGs中选择最佳基因构建预后预测模型,减少偏倚,最终将6个关键FDGs纳入风险评分公式。在六种关键FDGs中,ADH1B和PLAAT4(保护因子)在低风险组中的表达量普遍较高,而CDC20、CKS2、IPT1和LDLR(危险因子)在高风险组中的表达量相对较高(图5C)。
此外,如图5D所示,作者对年龄、性别、分期、骨转移和风险评分进行了单变量和多变量Cox回归分析,结果表明风险评分可被视为独立于这些临床指标的预后因素。通过比较低危组和高危组的一些临床特征,作者发现尽管两组死亡率都很高,但低危组存活的患者更多(P=0.003)(图5E、F)。在两组的GSEA分析中,与细胞周期和迁移相关的通路,如G2M检查点、E2F靶点和EMT,似乎在高危组中更为活跃,这可能是预后不良的原因(图5G)。结果表明,静息肥大细胞、浆细胞、中性粒细胞和TregT细胞在低风险组中高度浸润,与较高的存活概率有关。另一方面,M1和M2巨噬细胞的高度聚集、APC协同抑制和APC协同刺激与较低的存活概率相关。
LDFM、HDFM和MDFM的潜在调控机制
为了研究FDGs在MESO发病过程中的可能功能和分子机制,作者创建了整合的调控网络,确定了在各MESO亚型中与标志性FDGs相关的关键转录因子(TFs)、通路、免疫细胞、免疫成分和RPPA(图6A)。热图用于描述调控网络元素之间的相关性(图6B)。
MESO亚型1:低分化成纤维细胞相关间皮瘤(LDFM):SERPINE1和INHBA这两个与分化状态1相关的风险基因(图4A)出现在LDFM的调控网络中(图6A),与多个信号通路呈正相关,包括顶端连接、EMT、IL2_STAT5信号传导、TGF_beta信号传导和通过NFκB的TNFA_信号传导。ATAC-seq分析显示SEPINE1和INHBA附近的染色体可及性增加,这表明TF或其他调控元件可能与这些区域结合(图6C)。
MESO亚型2:高分化成纤维细胞相关间皮瘤(HDFM):在HDFM的调控网络中(图6A),UBC2E和CDC20与E2F靶点和G2M检查点呈正相关,这与HDFM富集于细胞周期通路的通路富集结果一致,暗示了其高度增殖能力。网络中的另一种FDGCOL4A2与EMT和TGF_beta信号传导有关。此外,这三个基因附近区域的染色体可及性也有所增加(图6C),这可能与调控网络中的三个TF(NCAPG、MYBL2和NOTCH1)有关。
MESO亚型3:中度分化的成纤维细胞相关间皮瘤(MDFM):与在LDFM和HDFM相关调控网络中发现的基因不同,MDFM调控网络中的HP和CFB都被认为是生存的有利因素,并与分化状态3相关(图4A和5B)。它们与EMT、hedgehog和TGF_beta信号转导等通路的负向联系也证实了它们的有利作用。实际上,如图4D所示,这两种FDGs在HDFM中的表达高于MDFM,这也是HDFM在三个亚型中预后最好的部分原因。
抑制剂预测
为了增加药物选择以改善预后不良的MESO患者的生存率,作者利用pRRophetic包估算了三种亚型对各种抑制剂的敏感性。最终筛选出24种抑制剂,其中LDFM比HDFM更敏感(图6D)。
临床标本验证
为进一步验证MESO患者临床亚型分为LDFM、HDFM和MDFM,临床标本被纳入湿实验验证。图7A是五种不同标记物INHBA(LDFM)、UBE2C(HDFM)、CDC20(HDFM)、HP(MDFM)和CFB(MDFM)在光镜视野下的免疫组化染色切片。
随后进行了皮尔逊卡方检验,结果显示LDFM、HDFM和MDFM亚型在分化(图7B)、免疫浸润(图7C)和转移(图7D)方面存在显著差异。由此可以推断,HDFM表明MESO分化好、免疫浸润高且无转移,而LDFM表明MESO分化差、免疫浸润低且有转移,MDFM处于中间位置,这对MESO患者的临床分类提供了很好的验证。
研究总结:
通过整合scRNA测序bulk RNA测序数据,作者共鉴定出六种成纤维细胞亚型、三种分化状态和39种FDGs。根据FDGs的表达水平,在基于成纤维细胞分化的分类(FDBC)中构建了独立于临床参数的MESO创新分类和预后预测模型,该模型具有良好的预后性能,有助于精确诊断和预后判断。在多变量预后预测模型中,依赖于几种重要FDGs表达水平的风险评分被证实是一个独立有效的预后因素。最后,作者预测了24种治疗MESO的潜在药物。此外,免疫组化染色和统计分析也提供了进一步的验证。