GEO数据挖掘学习笔记二

学习教程来源于《手把手教你GEO数据库差异基因分析》

本次学习笔记内容为通过GEO2R在线工具进行差异基因分析

通过了解,个人觉得这个方法相比R语言的优势是更普适性,以及更加“傻瓜”,方便学不明白R语言的同学。

第一步:同R语言,找到相关的数据集

第二步:点进页面详情,进行GEO2R在线分析

第三步:选择分组信息,点击分析

第四步:下载数据,得到差异基因数据集,如果仅得到差异基因即可,可不进行后续操作。

第五步:下载基因表达矩阵,查看矩阵信息,打开文档,将多余信息删除,留下geneid和各样本表达量

第六步:通过excel可以筛选logFC>1或者<-1得基因,并可以筛选P<0.05得基因,本步可将无名字得基因数据筛出后删除,清除无效信息即重复信息

第七步:重点 用excel打开数据,将差异基因得geneid和genesymbol复制粘贴于表达矩阵得excel中,通过=vlookup(“geneid那列”2,$A$2:$$表达量得最后一列$样本量,2,FALSE)#这个命令就是通过将表达矩阵中得geneid与差异基因中得geneid匹配,进而将genesymbol与样本表达量匹配起来,得到数值后下拉全部框自动充填,同一方法重复全部样本。就此得到与genesymbol匹配得表达矩阵。#这个方法相比R语言更加好懂,更普适,但麻烦得多,适合刚开始接触得同学,有追求得同学可以去尝试R语言,更加方便。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容