影响因子:6.6研究概述:肺纤维化是一组由于肺组织进行性纤维化导致的肺部疾病,随着时间推移会逐渐引发肺功能的下降。在大量病例中,肺纤维化会无明确病因地出现,被称为特发性肺纤维化(IPF),这类病例尤其难以诊断和治疗。尽管医学研究取得了进展,但IPF的预后仍然较差,确诊后的中位生存率约为3至5年。通过对肺组织中单个细胞的详细分析,可以揭示参与纤维化过程的独特细胞类型和状态,有助于发现新的生物标志物和治疗靶点。此外,将机器学习算法应用于复杂生物数据集的分析是一种诊断和理解肺纤维化的革命性方法。鉴于这些技术进步,本研究作者旨在利用单细胞测序和机器学习构建肺纤维化的诊断模型。通过识别关键的细胞标志物并理解其在疾病过程中的作用,研究试图解决肺纤维化诊断和治疗中的核心难题;为肺纤维化的精准医学时代奠定基础,使诊断更快速、准确且微创,同时开发更有效、个性化的治疗方案。具体结果如下:
研究结果:
单细胞测序分析
作者首先对肺纤维化数据集的单细胞数据进行了过滤,筛选标准为每个细胞至少包含5个细胞和300个基因;以及nFeature_RNA > 100、 nFeature_RNA < 5000、nCount_RNA > 100(图A-B)。接下来,作者对细胞进行了聚类分组,并利用自动注释对这些亚组中的细胞分类为七种类型:B细胞、树突状细胞、内皮细胞、上皮细胞、巨噬细胞、自然杀伤细胞以及平滑肌细胞(图C)。随后,作者计算了不同肺纤维化样本中各类细胞的比例,发现巨噬细胞亚组在肺纤维化样本中比例最高(图D),并确定了340个与巨噬细胞相关的基因。
巨噬细胞相关肺纤维化基因的识别与功能特性分析
为了探讨巨噬细胞相关基因与肺纤维化之间的关系,作者对整合的基因矩阵进行了差异分析。在肺纤维化样本与正常组织样本之间共识别出1104个差异基因(图A)。作者通过Venn图(图B)将这1104个差异基因与340个巨噬细胞相关基因进行交集分析,得到了20个巨噬细胞相关差异基因,包括BLVRB、PHACTR1、S100A8、S100A9、SPI1、LST1、TMEM52B、RGS2、ALOX5AP、FN1、C1QB、AREG、CD52、BCL2A1、SERPINA1、MCEMP1、RGCC、RETN、HMOX1和EREG。为了深入理解这些差异基因的生物功能,作者进行了GO分析和KEGG富集分析(图C-D)。GO分析结果显示,这些差异基因主要参与了DNA结合转录因子活性的调控、分泌颗粒腔等生物学过程(图C)。KEGG分析结果表明,这些差异基因主要富集在PI3K-Akt信号通路、补体与凝血级联反应等KEGG通路中(图D)。
肺纤维化诊断模型的构建
随后,作者利用机器学习技术构建了一个肺纤维化诊断模型。首先,lasso分析结果(图A-B)表明,与诊断密切相关的三个关键基因被识别出来,分别是TMEM52B、PHACTR1和BLVRB。SVM分析结果显示,当模型包含15个基因时,诊断模型的准确性最佳,且误差最小,准确率为0.786(图C-D)。此外,作者通过随机森林进一步分析,确定了10个与肺纤维化诊断密切相关的标志物,这些标志物的重要性评分均大于3,包括RETN、C1QB、CD52、ALOX5AP、BLVRB、LST1、MCEMP1、FN1、PHACTR1和SPI1(图E)。为了构建一个通用的关键基因诊断模型,作者通过Venn图分析识别了两个共同的交叉基因:PHACTR1和BLVRB(图F)。最终,作者对这两个关键基因进行了ROC曲线分析,结果显示它们对肺纤维化具有良好的诊断效能(图G)。
作者通过nomogram进一步推断了标志物PHACTR1和BLVRB对肺纤维化的诊断能力(图A)。校准曲线表明,肺纤维化的实际风险与预测风险之间的差异极小,表明模型具有很高的准确性(图B)。决策曲线分析(DCA)表明,对于肺纤维化患者,该模型能带来显著的净获益(图C)。散点图的ROC曲线表明模型具有良好的预测效能(图D);关键基因的诊断ROC曲线显示,PHACTR1和BLVRB的曲线下面积(AUC)均为0.986,表明出色的诊断效能(图E-F)。然而,散点图的ROC曲线下的面积约为0.564(图G)。
肺纤维化诊断模型性能验证
既然作者找到了关键基因,为了验证关键基因的诊断效能,作者使用了外部数据进行验证。差异分析结果通过小提琴图显示,PHACTR1和BLVRB在肺纤维化中显著低表达(图A-B)。ROC曲线分析结果表明,PHACTR1的AUC为0.823,BLVRB的AUC为0.790,均显示出较高的诊断准确性和特异性(图C-D)。最后,作者为关键基因构建了一个ceRNA网络,结果识别了3个miRNA,包括miR-218-2-3p、miR-127-5p和miR-361-3p,以及10个lncRNA,如LINC01043、RP3-470B24.5、RP13-507P19.2等(图E)。
肺纤维化患者的免疫细胞浸润景观
通过ssGSEA分析,作者探讨了肺纤维化患者中免疫细胞的差异(图A)。结果显示,肺纤维化患者中活化B细胞、活化CD4 T细胞、中央记忆CD8 T细胞、记忆B细胞、调节性T细胞、1型辅助T细胞、嗜酸性粒细胞以及自然杀伤T细胞的比例较高。此外,作者分析了关键基因与免疫细胞浸润之间的相关性,发现PHACTR1与多种免疫细胞呈正相关,包括17型辅助T细胞、巨噬细胞、单核细胞、MDSC以及中性粒细胞;但与活化B细胞、浆细胞样树突状细胞、活化CD4 T细胞和记忆B细胞呈负相关(图B)。类似地,BLVRB也与多种免疫细胞呈正相关,包括17型辅助T细胞、巨噬细胞、单核细胞、MDSC和中性粒细胞等等(图C)。
肺纤维化患者亚组鉴定及免疫浸润差异分析
基于与巨噬细胞相关的差异表达基因,作者进行了共识聚类分析,将肺纤维化患者分为两种亚型,分别命名为亚组1和亚组2(图A-C)。通过分析两个亚型之间的差异基因,作者发现共有20个基因表现出显著差异,这些基因包括S100A8、C1QB、S100A9、LST1、FN1、RETN、SPI1、TMEM52B等(图D)。此外,作者比较了两种亚型之间的免疫细胞浸润差异,发现多种免疫细胞在亚组1中具有更高的浸润程度,包括CD8 T细胞、CD4 T细胞、树突状细胞、自然杀伤细胞、嗜酸性粒细胞、巨噬细胞、肥大细胞、MDSC及单核细胞(图E)。
体外实验验证
作者最后用实验去检测了在PHACTR1、TMEM52B和BLVRB基因敲除后,肺成纤维细胞系中α-SMA和III型胶原蛋白的蛋白表达差异,分别在基础条件下和TGF-β刺激后进行检测。研究结果表明,与对照组相比,TGF-β刺激显著增加了成纤维细胞中α-SMA和III型胶原蛋白的表达。然而,在TGF-β刺激组中,敲除PHACTR1、TMEM52B和BLVRB基因显著降低了α-SMA和III型胶原蛋白的蛋白水平(图A)。这些结果表明,敲除PHACTR1、TMEM52B和BLVRB基因能够减弱TGF-β诱导的α-SMA和III型胶原蛋白的上调。通过Masson三色染色,作者发现PHACTR1敲除组与非模型对照组在肺组织方面没有显著差异。然而,在特发性肺纤维化模型组中,与对照组相比,PHACTR1敲除小鼠表现出显著减少的肺组织炎症和胶原沉积(图B)。
研究总结:
本研究通过结合单细胞测序和机器学习技术,全面揭示了肺纤维化的细胞和分子特征,推动了该疾病在诊断和治疗上的进展。研究首先通过单细胞测序分析识别出肺纤维化样本中显著增多的免疫细胞亚群和关键基因,尤其是巨噬细胞相关基因如PHACTR1、TMEM52B和BLVRB,它们在疾病进展中的作用得到了验证。利用机器学习构建的肺纤维化诊断模型表现出优异的准确性和特异性,关键基因PHACTR1和BLVRB的诊断能力进一步通过外部数据验证和ROC曲线分析得到支持。同时,研究揭示了肺纤维化患者中免疫细胞浸润的差异特征,发现某些免疫细胞亚群与关键基因之间存在显著相关性,为潜在治疗靶点提供了新的见解。通过湿实验验证,PHACTR1、TMEM52B和BLVRB基因的敲除显著降低了TGF-β诱导的α-SMA和III型胶原蛋白的表达,并在体内模型中有效减轻了肺组织的炎症和纤维化程度。总体而言,本研究不仅为肺纤维化的分子机制提供了新的视角,还开发了一种精准、高效的诊断方法,并确定了潜在的治疗靶点,为实现该疾病的个性化诊疗奠定了基础。