最近有一些朋友问起非肿瘤纯生信文章能不能做?其实肿瘤分析的内容和方法相比非肿瘤分析,算是超前的,只要有数据,咱们就能搞起!
今天要和大家分享的是2020年10月发表在Sci Rep上的一篇文章,“Identificationof C3 as a therapeutic target for diabetic nephropathy by bioinformaticsanalysis”。作者通过差异表达分析和加权基因共表达网络(WGCNA)筛选GEO数据库糖尿病肾病管状样本的数据集,并对它们进行功能富集分析和PPI网络分析。最终确定了与DN相关的枢纽基因和富集途径,并进行了临床数据分析和药物分析。
背景:据估截止至2017年,全球共有4.51亿人患有糖尿病,预计到2045年将达到6.93亿。糖尿病肾病(DN)作为最严重的微血管并发症之一,一直是导致末期肾病的主要原因。晚期糖基化终产物的聚集、氧化应激和蛋白激酶C的激活是DN主要的发病机制。迄今为止,已有几项研究筛选了DN中涉及的基因及miRNA,证实了整合相关数据可以克服研究的异质性,并提供更准确的预后信息。
在本研究中,作者先通过差异表达分析和WGCNA从GSE30529筛选DEGs,并通过功能富集分析和PPI网络分析,最终确定了与DN相关的枢纽基因和富集途径,以及DN潜在的治疗药物。
一、分析流程及结果解读
1、GSE30529数据集基因差异表达分析,以获得可能与DN相关的差异表达基因(DEGs)。
①对GSE30529数据集进行标准化过滤(|Log2FC)|>1和P<0.05),以检测批次效应并确定对方差贡献最大的数据集的主成分(下图a)。
②两个主要成分在主成分分析(PCA)中贡献了25.7%和25.4%(下图b),表明DN组和对照组之间存在明显不同的组分。
③结果:在DN组和对照组之间共发现386个上调基因和71个下调基因,并绘制火山图(下图c)和热图(下图d)。
2、WGCNA分析
①进行样本聚类分析,发现有3个离群值(下图a)。
②构建无尺度网络,将软阈值设置为10,无标度拓扑拟合指数达到0.85,平均连通性达到100(下图b)。
③在加权基因共表达相关性的基础上进行层次聚类分析,得到不同的基因模块,这些模块用聚类树的分支和不同的颜色表示。在网络中共发现了22个模块,合并切割高点为0.25(下图c)。
④根据模块之间的关系将22个模块分为两个组(下图d)。此外,绘制热图显示所有基因的加权共同表达相关性(图e)。在TOM矩阵中选择了3538个高相关基因,阈值大于0.1。
3、目标基因的功能富集分析
①将以上两种分析结果相结合,最终获得了345个靶基因的列表,这些基因可能在DN中发挥调节作用(下图a)。
②对上述目标基因进行基因本体论(GO)注释和京都基因和基因组百科全书(KEGG)富集分析。结果显示:主要包括中性粒细胞活化、免疫效应器过程的调节、细胞因子生产的积极调节和中性粒细胞介导免疫(下图b)。KEGG通路主要包括噬菌体、补充和凝固级联、细胞粘附分子(CAMs)、ECM受体相互作用和焦粘附(下图c)。还发现了糖尿病并发症的AGE-RAGE信号通路。作者发现,免疫系统在其中扮演了重要角色。
4、潜在的表观遗传调控机制
确定目标基因后,作者研究了GSE51674(miRNA)和GSE121820(DNA甲基化数据)。
作者同样分别对其进行了标准化过滤(|log2FC|>3,p<0.01),发现了16个下调的miRNAs和67个上调的miRNAs(下图a),主成分分析表明,这两个主成分的贡献率分别为62.71%和15.68%(下图b),并绘制了火山图(下图c)和热图(下图d)。
5、构建miRNA-mRNA网络
①作者利用TargetScan、miRWalk、miRBase和miRTarBase数据库预测miRNAs的靶基因,并绘制韦恩图,获得了88对下调的miRNA-mRNA对(下图a)。结果表明,TGFBI、SH2B3和ZNF652在GSE30529数据集中集中上调(下图b)因此作者判断miR-1237-3p/SH2B3、miR-1238-5p/ZNF652和miR-766-3p/TGFBI轴可能与DN有关。
②为了了解目标基因的甲基化水平变化,GSE121820数据集验证结果显示,345个目标基因中,有227个基因在DN组和对照组之间有甲基化差异。
6、PPI网络与中心基因的识别
①将目标基因导入STRING数据库构建PPI网络(下图a)。该网络包含190个节点和680个边,每个节点代表蛋白质,边代表蛋白质之间的相互作用。
②通过拓扑分析确定了前20个节点是PPI网络的核心,这些中心基因被认为是潜在的治疗目标。分别为KNG1、C3、FN1、SYK、HLA-E、EGF、ITGB2、CXCL1、CXCL8、ITGAV、LYN、VWF、RHOA、HLA-DQA1、ITGAM、SERPING1、P2RY13、ANXA1、P2RY14和FCER1G(下图b)。
7、临床数据验证及药物预测
①作者为了验证HUB基因在DN中的潜在作用,利用Nephroseq临床数据集(Woroniecka和Schmid)对HUB基因与临床数据进行了Pearson相关分析。
②结果显示:SYK、CXCL1、LYN、VWF、ANXA1、C3、HLA-E、RHOA和SERPING1基因在DN肾小管中的表达与GFR呈负相关,提示上调基因在DN肾小管病变中起致病作用(下图a,c,e)。相反,在DN小管样本中EGF和KNG1的基因表达与GFR呈正相关,表明下调的基因具有保护作用(下图b,d,f)。
③作者将DEGs与数据库参考数据集进行比较,并获得了相关分数(−100到100)。负数表示DEGs和参考基因表达谱可能相反:即药物紊乱的表达谱与疾病紊乱的表达谱呈负相关。23个上调的DEG(logFC>2.5)和13个下调的DEG(logFC<1.5)输出到ConnectivityMap中以搜索潜在的药物。
③根据参考基因表达谱的相关分数,对平均系数小于−90的小分子化合物进行分类,结果显示,有8种小分子化合物被鉴定为潜在的治疗药物(表1)。
二、小结
本文中作者通过对GSE30529进行了差异表达分析和WGCNA分析,获得了345个目标基因,并通过功能富集分析,最终确定了与DN相关的枢纽基因和富集途径,以及DN潜在的治疗药物。结果表明,免疫应答可能参与了DN的发生。此外,作者还研究了额外的数据集,以了解目标基因差异表达的潜在机制,并绘制了miRNA-mRNA网络,提示miR-766-3p/TGFBI、miR-1238-5p/ZNF652和miR-1237-3p/SH2B3轴可能与糖尿病肾病有关,且大多数靶基因在DN组和对照组之间存在DNA甲基化水平的差异。接下来,作者建立PPI网络对20个HUB基因进行了鉴定。通过与临床资料的相关性分析,进一步证实SYK、CXCL1、LYN、VWF、ANXA1、C3、HLA-E、RHOA和SERPING1在DN肾小管组织中表达上调。相反,在DN肾小管中表达下调的EGF和KNG1被认为对DN有保护作用。最后,作者通过ConnectivityMap数据库确定了8个潜在的小分子化合物。
综上所述,本文研究对了解糖尿病肾病的发病机制具有重要意义,并有助于开发治疗糖尿病肾病的新策略。然而,还需要进一步的分子生物学实验来验证已识别的基因与DN之间存在关联。