单基因表达数据的提取

大家好，今天我们要讲的是，从我们昨天得到的基因表达矩阵里，提取单基因的表达数据，注意我们下载的数据都是经过校正好的的数据。具体大家可以去看一下，第一节TCGA数据库数据的下载的推文，里面讲的比较详细！生信预热第一谈：如何在TCGA数据库下载你想要的数据？

下面我们来看一下这个基因表达矩阵，注意：如果一个基因出现多行，要对它进行多行取均值的一个操作。

所以接下来，我们要做两步：第一步是先对单个基因多行取均值的操作，第二步是把我们需要的基因提取出来，就可以了。这两步的执行需要用到一个脚本文件，这个脚本文件如图所示：

这个脚本文件需要用R语言进行运行，所以我们要讲解一下，R语言的安装，如图所示，直接搜索，按照步骤，点击安装就可以了。

这时，我们还需要准备一个输入文件：symbol.txt,就是我们得到的基因表达矩阵。这个文件在上次推文中的。如图所示：

除此之外，脚本运行过程中，还需要一个包：limma包，直接搜索limma biocuductor，点击进入，复制黏贴这三行安装命令到R软件中，就可以进行安装了。如图所示：

脚本文件的解析如图所示：

最后是脚本运行，打开脚本，ctrl加a和ctrl加c,复制到R，就可以开始运行脚本了。最后运行得到一个文件。如图所示：

如果大家需要练习的脚本文件，可以在后台留言，我们发给您，如果有什么疑问也可以在后台留言，我们看到的话，会及时回复的。如果觉得本文对你们有用的话，欢迎点赞，关注和分享。谢谢大家。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。