影响因子:7.3
**研究概述: **
炎症性肠病(IBD)是一种影响胃肠道的慢性、复发性炎症,主要涉及溃疡性结肠炎和克罗恩病。其最常见的症状包括便血、腹泻和胃痛。IBD主要由遗传易感性、肠道菌群失调和黏膜免疫反应异常引起,但其确切原因尚不清楚。系统性红斑狼疮(SLE)是一种多器官慢性自身免疫性疾病,常见于育龄妇女。它可导致死亡和残疾,患者死于感染、狼疮肾炎、狼疮脑病和心血管等事件。SLE的发病机制复杂,涉及遗传和环境因素、细胞因子和补体的活化以及循环免疫复合物的沉积。SLE可以单独发生或与IBD同时发生。以色列的一项多中心研究发现SLE和IBD可能有共同的发病机制。具体表现在SLE和IBD患者均有抗中性粒细胞胞浆抗体、抗淋巴细胞毒性抗体、抗核抗体和抗双链DNA抗体阳性。特发性SLE使IBD的临床诊断复杂化,因为SLE或IBD患者具有相似的临床表现和实验室结果。此外,用于治疗IBD的药物会引起药物性狼疮,狼疮血管炎的SLE患者会出现类似IBD的胃肠道反应。因此,确定新的诊断标记和治疗靶点至关重要。既往研究表明,SLE和IBD具有共同的致病通路和遗传易感性,但具体的致病机制尚不明确。本研究旨在利用生物信息学技术分析SLE与IBD之间的潜在关系。
关于非肿瘤生信,我们也解读过很多,主要有以下类型
1 单个疾病WGCNA+PPI分析筛选hub基因
2 单个疾病结合免疫浸润,热点基因集,机器学习算法等
3 两种相关疾病联合分析,包括非肿瘤结合非肿瘤,非肿瘤结合肿瘤或者非肿瘤结合泛癌分析
4 基于分型的非肿瘤生信分析
5 单细胞结合普通转录组生信分析
目前非肿瘤生信发文的门槛较低,有需要的朋友欢迎交流
研究结果:
系统性红斑狼疮(SLE)和炎性肠病(IBD)中差异表达基因的鉴定
作者首先基于IBD数据集(GSE3365)鉴定出了798个差异基因(DEGs),其中有417个基因表达上调,381个基因表达下调,热图显示这些差异基因中显著上调和下调的前20个基因,火山图显示出了已鉴定的DEGs (图1A, B)。值得注意的是,SERPINB2是IBD样本中上调最显著的基因(图1B)。此外,作者从SLE数据集(GSE72326)中鉴定出了262个差异基因,其中包括179个上调基因和83个下调基因,IFI27是SLE样本中上调最显著的基因(图1C、D)。最后,通过取交集,作者得到了51个重叠的差异基因。
SLE和IBD的加权基因共表达网络分析
接下来,作者对IBD数据集GSE3365和SLE数据集GSE72326进行了WGCNA分析,以探索临床特征与基因之间的相关性。作者发现,SLE数据集和IBD数据集中没有明显的异常样本。根据WGCNA方法作者确定IBD数据集中的最佳软阈值为6,SLE数据集中的最佳软阈值为8(图2A, B)。基于模块之间的相似性,作者最终在IBD数据集中确定了25个模块,在SLE数据集中确定了16个模块(图2C, D)。通过计算模块与性状之间的相关性,作者发现绿黄色模块与IBD的正相关性最强(r=0.6) (图2E),而绿色模块与SLE的正相关性最强(r=0.53) (图2F)。更重要的是,模块内的基因显著性(GS)和MM之间也存在很强的关联性。其中,IBD的cor=0.82,SLE的cor=0.29,该结果表明模块基因与疾病的发生密切相关。最终,作者通过WGCNA发现了21个重叠基因,这些基因可能是导致IBD和SLE发生发展的关键基因(图2G)。
SLE和IBD共同驱动基因的富集分析
在前面的分析结果中,作者鉴定出了51差异表达基因,同时发现SLE和IBD模块有21个重叠基因。考虑到从WGCNA筛选的模块包含一组具有类似表达谱的基因,这些基因可能不在DEGs中,甚至与可能对疾病进展至关重要的DEGs有很大不同。因此,作者将51个DEGs与21个模块基因整合在了一起用于后续分析。通过删除重复基因,作者获得了71个候选基因,这些基因可能在调控SLE和IBD的分子机制中发挥着关键作用·。因此,作者首先对这些基因进行了GO和KEGG富集分析。结果显示,这些基因参与了细胞因子-细胞因子受体相互作用、免疫应答调节信号通路、骨髓细胞分化和其他途径(图3A)。此外,为了进一步阐明上述外周循环标记相关基因的富集途径,作者发现这些基因在metascape数据库中的表现出了不同的功能群分布,其中对程序性细胞死亡和炎症反应的正向调节作用最为突出(图3B)。同时,基于metascape数据库的富集分析也显示了免疫和炎症在IBD和SLE病因中的共同作用(图3C)。最后,为了进一步将基因筛选到同一功能组中,作者将71个候选驱动基因输入STRING数据库,并删除独立基因。最后,使用Cytoscape软件中的MCC算法确定了GNLY、IL7R、CD40LG、KLRB1、CD247、CD160、NCR3、GZMK、KLRF1和IL2RB为候选诊断标志物,其中IL2RB在组内最为显著(图3D)。
SVM和LASSO鉴定和验证潜在的共享关键基因
为了筛选出具有最高诊断价值的关键基因,基于机器学习算法,作者对上述10个候选基因进行了进一步分析。首先,作者对这些基因进行了SVM和LASSO回归分析。LASSO方法筛选出了SLE数据集中的6个基因以及IBD数据集中的8个基因(图4A, B)。同时,使用SVM方法从SLE数据集中过滤出了8个基因,而IBD数据集保留了所有10个基因(图4C, D)。通过对上述不同方法在不同数据集中过滤得到的基因进行取交集,最终鉴定出了5个具有最高诊断价值的关键基因(KLRF1、GZMK、KLRB1、CD40LG和IL7R) (图4E)。其中,IL7R、CD40LG、KLRB1和GZMK来自DEGs,而KLRF1来自WGCNA分析。
此外,作者使用ROC曲线评估了上述5个关键基因在不同数据集中的诊断预测价值(图4F, G)。其中,SLE-GSE72326数据集中KLRF1的AUC=0.868、GZMK的AUC=0.700、KLRB1的AUC=0.902、CD40LG的AUC=0.822、KLRB1的AUC=0.902、CD40LG的AUC=0.782、IL7R的AUC=0.782,这些AUC值均大于0.7(图4F)。类似地,IBD-GSE3365数据集中KLRF1、GZMK、KLRB1、CD40LG和IL7R的AUC值分别为0.834、0.805、0.861、0.710和0.748。它们的AUC值同样都超过0.7(图4G)。该结果表明这5个基因具有良好的诊断性能,可能成为SLE和IBD的诊断标志物。
在验证集中,不同队列的AUC也具有良好的预测效果,其中KLRF1、GZMK、KLRB1、CD40LG和IL7R的AUC值分别为0.719、0.828、0.700、0.834和0.891 (图4H,I)。而在IBD验证集(GSE126124)和SLE验证集(GSE81622)中,除GZMK外,所有诊断标志物的AUC均大于0.8,其AUC小于0.700(图4H, I)。箱线图结果显示,SLE和IBD训练集中的该5个诊断标志物在疾病组中均显著下调(图5A, B)。更重要的是,SLE验证集和IBD验证集显示出一致的差异趋势(图5C, D)。
基于关键基因的候选药物鉴定
基于Enrichr中的DSigDB文库,通过计算P值和与核心关键基因的结合得分,作者筛选出了校正后P值显著的四种药物,这些药物包括胆碱、阿司匹林、砷和芥子气(表1)。而这些潜在的小分子化合物可以用作IBD和SLE的联合治疗。
免疫细胞浸润及其与共享中枢基因的相关性
基于前面的富集分析表明,免疫对这两种疾病的发生发展至关重要。因此,作者接下来探究了基于22种免疫细胞的CIBERSORT方法是否可以识别不同的免疫浸润模式。作者首先对SLE数据集和IBD数据集进行了评估。差异表达分析结果显示,与正常样品相比,SLE和IBD显示出一致的差异趋势。具体来说,与健康人血液样本相比,SLE和IBD中的单核细胞浸润更高,而静息NK细胞浸润显著降低(图6A, B),该结果表明SLE和IBD似乎都发生了免疫失调和炎症反应。
免疫细胞组成比例的共同差异只是SLE和IBD发病机制的一个方面。因此,作者想要知道这5个关键基因是否与外周血中的免疫浸润有关,它们与哪些免疫细胞特别相关以及确定它们的共性。通过相关分析发现,IL7R、KLRB1和KLRF1与SLE数据集中的神经细胞呈负相关(图6C)。同时,在IBD数据集中也观察到类似的结果,其中GZMK、CD40LG、KLRB1和KLRF1与神经细胞呈负相关,而除IL7R外,其他4个关键基因与静息NK细胞呈正相关(图6D)。由于大多数核心基因在疾病组(SLE或IBD)中低表达,这也意味着疾病中会有更多的中性粒细胞富集。该结果表明这些关键基因可能通过调节免疫细胞的表达参与调节自身免疫。
关键基因的单细胞分析
最后,作者对这5个关键基因在单细胞水平上的表达进行了分析。通过对SLE数据集中的12个样品进行质量控制后,结果显示所有循环细胞可分为18个簇(图7A)。根据发表的文献,作者选择CD3E、IL7R、CCR7、CD4、CD8A和CCL5用于T细胞注释;选择KLRB1、NKG7和GNLY用于NK细胞注释;选择LYZ、CD14、CD68、S100A9、CD16、FCGR3A和CD1C用于单核细胞注释;选择MS4A1、CD19和CD79A用于B细胞注释。最终,作者确定了六个细胞群,其中包含一个未定义的细胞群(图7B)。随后,作者对5个关键基因进行了定位分析,发现它们大多数在NK细胞中表达(图7C)。对不同样品的重新分析显示,KLRF1、KLRB1、CD40LG和IL7R在SLE中低表达(图7D-G)。然而,IL7R的表达在样品之间没有显著差异(图7H)。此外,伪体积比较允许通过平均基因表达数据在患者组之间进行更合适的比较,从而最大程度地减少单细胞数据固有的噪声和变异性。因此,作者再次基于单细胞伪体积数据进行差异分析以探究上述5个关键基因的表达。与之前结果一致,除IL7R外的所有基因在SLE样品中的表达均下调(图7I)。
研究总结:
本研究基于GEO数据库中SLE和IBD疾病的测序数据,使用WGCNA鉴定IBD和SLE中的共享关键基因,并对这些基因进行GO和KEGG分析以探索共同的生物学通路。同时,作者采用LASSO回归分析和SVM-RFE分析确定了5个最具有诊断价值的关键基因(KLRB1、KLRF1、GZMK、IL-7R和CD40LG)并评估了它们的预测价值,ROC曲线分析结果显它们具有良好的诊断效果。此外,作者还利用单细胞分析研究了5个关键基因在各种免疫细胞中的表达,发现它们在SLE与IBD具有几乎相同的免疫浸润部位。总之,本文研究发现KLRB1、KLRF1、GZMK、IL-7R和CD40LG可能是SLE与IBD的潜在生物标志物,它们对未来SLE和IBD的诊断和治疗具有重要指导意义。