Gene co-expression network analysis reveals common system-level properties of prognostic genes across cancer types
期刊:nature communication IF= 12.353
为什么做WGCNA的文章能发这么高分?让我们一起来看一下本文的亮点吧~
一 知识点积累
- 信噪比:所需信号强度和背景噪音强度的比值
二 背景介绍
预后基因对癌症的预后和治疗很重要,前期研究只集中于个体的预后基因比例,缺乏从系统层面上去宏观预测。因此本文从TCGA中下载了四种癌症表达谱。
本研究主要解决的三个问题:
- 网络成分是否能把预后基因和其他基因区分开?
- 不同种类的预后基因是否有着相同的网络成分?
- 这些成分在不同的网络之间是否是一致的?
三 结果与结论
1. 预后mRNA不是hub基因
本研究的的TCGA数据有着充足的样本量和丰富的临床数据。
将预后基因定义为: mRNA和生存数据的相关性分析,根据signal-to-noise ratio决定哪些是预后基因
共鉴定出如图数量的mRNA预后基因,纵坐标为频率,横坐标是mRNA和生存数据相关性(基于单因素cox模型)的P值。
2 基于每种癌症做一个WGCNA网络分析
根据节点连接度,基因被分为hub-gene和non-hub gene。比如说,在GBM中有一个hub gene是KLKL1,他能参与不同的丝氨酸酶和多种物理功能。预后基因有更高的节点连接度
实柱子是是预后mRNA的hub gene占总hub gene的比例,虚线柱子是不是预后mRNA的hub gene占总hub gene的比例。这张图表明,mRNA不是子网的核心。
图C表示四种癌症的hub-gene交叉情况,图D表示删除一种癌hub-gene,对另一种癌的影响(如第二行第一列,是删除GBM的hub-gene,对OV的影响)
3. 预后基因在各个moduel里的富集情况
不同癌症中的module情况
b图是预后基因和非预后基因占模块的所有基因比例,C是各模块基因的交叉情况,D是mRNA预后基因的保守性检验
4. 预后miRNA的情况
基于上述流程,作者把miRNA又重做了一遍。结果发现miRNA和mRNA有着非常相似的pattern。
5. 把几种癌症的不同模块连接到一起
- 找出富集预后mRNA基因的模块 在4种癌症中找出47个
-
用GO注释他们的生物学功能 得到结果:比较了四种癌症都有的通路和在个体癌症中独有的通路, 然后又描述了基因都在哪几个module存在的情况
这张图中不同的颜色代表不同的癌症,灰色是通路之间的conservation correspondence
这张图表示几个重要的通路的放大。
PS:conservation correspondence是用IPA做出来的