单基因表达数据的提取

大家好,今天我们要讲的是,从我们昨天得到的基因表达矩阵里,提取单基因的表达数据,注意我们下载的数据都是经过校正好的的数据。具体大家可以去看一下,第一节TCGA数据库数据的下载的推文,里面讲的比较详细!生信预热第一谈:如何在TCGA数据库下载你想要的数据?

下面我们来看一下这个基因表达矩阵,注意:如果一个基因出现多行,要对它进行多行取均值的一个操作。

所以接下来,我们要做两步:第一步是先对单个基因多行取均值的操作,第二步是把我们需要的基因提取出来,就可以了。这两步的执行需要用到一个脚本文件,这个脚本文件如图所示:

这个脚本文件需要用R语言进行运行,所以我们要讲解一下,R语言的安装,如图所示,直接搜索,按照步骤,点击安装就可以了。

这时,我们还需要准备一个输入文件:symbol.txt,就是我们得到的基因表达矩阵。这个文件在上次推文中的。如图所示:

除此之外,脚本运行过程中,还需要一个包:limma包,直接搜索limma biocuductor,点击进入,复制黏贴这三行安装命令到R软件中,就可以进行安装了。如图所示:

脚本文件的解析如图所示:

最后是脚本运行,打开脚本,ctrl加a和ctrl加c,复制到R,就可以开始运行脚本了。最后运行得到一个文件。如图所示:

如果大家需要练习的脚本文件,可以在后台留言,我们发给您,如果有什么疑问也可以在后台留言,我们看到的话,会及时回复的。如果觉得本文对你们有用的话,欢迎点赞,关注和分享。谢谢大家。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容