复现一篇WGCNA文章(含代码)(五)

前面我们已经拿到了差异表达基因以及WGCNA与肿瘤最相关的两个模块里的基因,下面我们就从这些基因中找到文章标题中的那3个关键基因:AURKA, TOP2A and MELK;

文章:AURKA, TOP2A and MELK are the key genes identified by WGCNA for the pathogenesis of lung adenocarcinoma

1.png

首先看一下文章是怎么找的:

2.png
  • 分别用两个模块里的基因与差异表达基因取交集;
  • STRING网站做PPI;
  • Cytoscape里的cytohubba排名靠前的基因;
  • GEPIA网站使用TCGA和GTEx数据做表达,生存分析等;
3.png

一、基因取交集

这里其实就是一个韦恩图,这里推荐一个在线工具:https://bioinfogp.cnb.csic.es/tools/venny/index.html

4.png
  • 将我们的差异基因以及yellow模块的HUB基因分别粘贴到1和2处;

  • 点击右边图形中的相交处(3位置),在4位置就会显示相交的163个基因;

这里只展示yellow模块基因,turquoise模块用同样的方法取交集;

二、PPI分析

STRING网站做PPI分析,这里也只展示yellow模块基因与DEG的交集基因;

cytoscape找key gene;

没有做过这类分析的朋友可以参考下我前面的笔记:使用STRING数据库进行PPI分析

5.png

我们用差异表达基因和yellow模块里的相交基因,使用cytoscape软件里的cytohubba插件,排名靠前的12个基因包含文章标题中的三个基因;

三、GEPIA网站验证关键基因

在GEPIA网站中做表达及生存分析:http://gepia.cancer-pku.cn/

1 表达分析

6.png

这里只展示TOP2A的表达情况,排名前12个基因按同样的方法,在正常组织和肿瘤组织中均是显著差异表达的;

7.png

2 生存分析

8.png

TOP2A基因对LUAD预后有显著影响;

9.png

最后,文章通过RT-qPCR和WB实验最后确定AURKA, TOP2A和MELK这三个基因的基因表达水平和蛋白表达水平均显著差异表达;

10.png

小结:

本篇文章通过差异分析,WGCNA分析,功能富集分析,PPI分析以及简单的实验表达分析,找出LUAD的三个Key gene,感兴趣的朋友可以换个肿瘤,换个数据集,按前面的步骤挖掘自己需要的数据吧。

往期文章复现:

复现一篇WGCNA文章(含代码)(一)

复现一篇WGCNA文章(含代码)(二)

复现一篇WGCNA文章(含代码)(三)

复现一篇WGCNA文章(含代码)(四)

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容