WGCNA其译为加权基因共表达网络分析。该分析方法旨在寻找协同表达的基因模块(module),并探索基因网络与关注的表型之间的关联,以及网络中的核心基因。适用于复杂的数据模式,推荐15个样品以上的数据。现在测序价格越来越便宜,得到15个样品数据的成本很低,如果再结合样品性状数据进行模块基因与表型的关联分析,一定能给你的文章增色不少!如果自己手里没有数据,利用公开的数据挖掘分析也是不错的选择。
下面我们举一些利用WGCNA进行癌症或微生物研究的例子给大家拓展一下思路,点击最下方链接可以进行WGCNA分析方法的学习。
TCGA表达数据的挖掘
先介绍两篇利用TCGA人类癌症数据库中的基因表达数据发表的文章,主要利用WGCNA的方法来筛选与癌症发生、发展相关的关键基因,从而发现区分不同癌症亚型的biomarker。看完文献可以说单单用了WGCNA的方法就发了篇paper:
文献1:眼中葡萄膜黑色素恶性瘤基因共表达网络分析
眼癌中共表达网络分析及关键biomarker查找
主要的分析思路其实就是WGCNA的分析思路:
分析套路
文献2:胃癌中miRNA共表达网络分析
这也是一篇WGCNA分析的文章,只是换了换癌种以及分析的基因变成了miRNA,分析思路几乎与上篇文章一致。这里小编就不详细介绍了,有兴趣的可以查看原文;
胃癌中共表达网络分析及关键biomarker查找
WGCNA构建微生物互作网络
下面的文章研究了531位芬兰男性肠道微生物与代谢综合征(Metabolic Syndrome)的关系,代谢综合征是指人体的蛋白质、脂肪、碳水化合物等物质发生代谢紊乱的病理状态,是一组复杂的代谢紊乱症候群,是导致糖尿病心脑血管疾病的危险因素。
为找到哪些微生物与代谢综合征相关,作者首先先利用微生物OTU table做WGCNA分析构建微生物的相互作用网络,再利用病人的的临床数据——主要包括血液中血糖含量,胰岛素含量等代谢指标,做临床数据与微生物共表达模块间的相关性分析。最后得出结论,发现蓝色模块中的Tenericutes, Methanobrevibacter,and Christensenellaceae等物种与血液中的谷氨酰胺指标正相关,另外,黄色模块中的Blautia物种与血液中的醋酸负相关等等,从而找到与疾病相关的微生物种类biomarker。
对于这种分析,我们组学大讲堂也制作了对应的分析教程,需要学习的同学,可以点击下面的链接观看视频教程:
https://study.163.com/course/introduction/1005023004.htm?share=1&shareId=1031484705
参考文献
[1] Sally Yepes,et al. Co-expressed miRNAs in gastric adenocarcinoma, Genomics, Volume 108, Issue 2,2016,Pages 93-101,ISSN 0888-7543.
[2] Qi Wan ,et al.Co-expression modules construction by WGCNA and identify potential prognostic markers of uveal melanoma, Experimental Eye Research, Volume 166,2018,Pages 13-20,ISSN 0014-4835.
[3] Org E, Blum Y, Kasela S, et al. Relationships between gut microbiota, plasma metabolites, and metabolic syndrome traits in the METSIM cohort. Genome Biology. 2017;18:70. doi:10.1186/s13059-017-1194-2.
更多生物信息课程:
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程、基因家族文献思路解读
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘、转录组文献解读
5. 微生物16S/ITS/18S分析原理及结果解读、OTU网络图绘制、cytoscape与网络图绘制课程
6. 生物信息入门到精通必修基础课,学习链接:linux系统使用、perl入门到精通、perl语言高级、R语言画图
7. 医学相关数据挖掘课程,不用做实验也能发文章,学习链接:TCGA-差异基因分析、GEO芯片数据挖掘、GSEA富集分析课程、TCGA临床数据生存分析、TCGA-转录因子分析、TCGA-ceRNA调控网络分析
8.其他课程链接:二代测序转录组数据自主分析、NCBI数据上传、二代测序数据解读。