总结GEO数据下载问题及GEO2R数据分析学习

一、数据下载

官网——搜索并点击GSE、GLP相应文件下载

文件格式为:    txt      txt.gz(GSE文件)


已下载数据

二、对txt.gz文件进行解压缩

使用Rstudio

正常使用应该为:

library(R.utils)

setwd("D:\\date\\GSE48060_series_matrix.txt")  当前下载文件所储存路径

gunzip(filename="GSE48060_series_matrix.txt.gz",destname="GSE48060_series_matrix")   解压缩即可

但是!!!从第二步报错


报错

解决方法如下:

创建新目录,并将相应文件移入该目录下


完成压缩

三、ID转换

将txt文件拖入excel中

使用vlookup函数提取Gene symbol

如第二列(使用函数),第三列(复制第二列内容,复制时改为仅复制数值)为提取ID对应样本名

GEO2R数据分析学习

g该工具用于比较两组或多组样本以获得差异性表达的基因,但只对系列数据进行分析,对于测序数据进行分析则不会显示


该网站获取GEO数据库,找到目的GSE,点击GEO2R

定义实验组为PA,对照组为SA,并将其进行选中

点击Analyze,可获得可视化结果,PCA主成分分析、火山图等可视化图片和差异基因列表,也可在set columns处进行选择GO功能分析等操作,将分析结果下载。

此外补充GEO在线分析网站:Network Analyst

可进行差异分析和对差异分析的结果进行功能分析和网络分析

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容