前面给大家介绍了如何使用R语言合并TCGA表达谱数据,针对没有太多R编程基础的小伙伴,我们也提供了零代码合并TCGA表达谱数据的教程。其实,合并得到表达谱矩阵并不是我们的最终目的,而恰恰是后面所有分析的基础。
今天我们来聊聊一个基础却又很重要的分析,差异表达分析。可以说差异表达分析几乎是所有后续分析的第一步,无论你是要找biomarker,还是构建ceRNA网络,不论你是要画火山图,还是要画热图,不论你是要做功能富集分析,还是做生存分析,不论你是要做cox回归分析,还是构建风险评估模型,可以说差异表达分析都是第一步。我们还是由渐入深,先来看看不用写太多代码的方法,一个R的shiny工具,鼠标点一点就可以做差异表达分析。其实我在公众号前面的文章里面就已经介绍过这个工具了,叫做DEApp。还不太熟悉的小伙伴,可以参考下面这三篇文章,可以说从理论到实践,循序渐进
1)零代码差异表达分析, DESeq,limma,edgeR一网打尽
下面我们以TCGA合并得到的表达矩阵为例来讲解如何使用DEApp这个工具来做差异表达分析
- TCGA表达谱矩阵和样本类型文件准备,这个前面已经详细讲解过了,可以参考零代码合并TCGA表达谱数据,下面我们通过视频来了解一下DEapp这个工具
- 下面的视频会详细介绍,数据上传,表达谱归一化,PCA分析,基因过滤,差异表达分析,火山图(火山图怎么看,R一行代码搞定火山图),结果下载。统统这些都只需要动动鼠标就可以了。
- DEApp提供三种做差异表达分析的方法,limma,edgeR和DEseq2。这三种方法都是目前主流的做差异表达分析的方法,绝对是业界公认的方法。如果你有自己钟爱的方法,可以直接使用它。当然,我们也可以分别使用这三种方法对同一套数据来做差异表达分析,你甚至可以取这三种方法都鉴定到的差异表达基因作为最终结果。我们来看看具体操作,也都是用鼠标来完成。
当你了解了DEApp这个工具的原理和流程之后,其实无论是对RNAseq数据还是对miRNA seq数据做差异表达分析,整体步骤都是差不多的。大家可以动手分析一下自己的数据。
DEApp这个工具虽然有网页版(https://yanli.shinyapps.io/DEApp/),但是前面我也指出过网页版的一些弊端。
这个网站搞不好那天就不存在了
服务器搞不好哪天就负载过重down掉了
用的人多了,你的任务还要排队,什么时候排得上谁也说不准
上传文件有大小限制,最大30M。
数据安全性谁也不能保证
所以我推荐大家还是下载一个本地版本,我在DEapp(差异表达分析)本地版——自由飞翔一文中详细介绍过具体方法,大家可以自己尝试安装。对于没有太多R基础的小伙来说,安装和配置DEApp还是有些复杂的,大家可以直接☞下载视频中使用的R环境和DEApp工具☜使用。
参考资料: