一、数据下载
官网——搜索并点击GSE、GLP相应文件下载
文件格式为: txt txt.gz(GSE文件)
已下载数据
二、对txt.gz文件进行解压缩
使用Rstudio
正常使用应该为:
library(R.utils)
setwd("D:\\date\\GSE48060_series_matrix.txt") 当前下载文件所储存路径
gunzip(filename="GSE48060_series_matrix.txt.gz",destname="GSE48060_series_matrix") 解压缩即可
但是!!!从第二步报错
报错
解决方法如下:
创建新目录,并将相应文件移入该目录下
完成压缩
三、ID转换
将txt文件拖入excel中
使用vlookup函数提取Gene symbol
如第二列(使用函数),第三列(复制第二列内容,复制时改为仅复制数值)为提取ID对应样本名
GEO2R数据分析学习
g该工具用于比较两组或多组样本以获得差异性表达的基因,但只对系列数据进行分析,对于测序数据进行分析则不会显示
该网站获取GEO数据库,找到目的GSE,点击GEO2R
定义实验组为PA,对照组为SA,并将其进行选中
点击Analyze,可获得可视化结果,PCA主成分分析、火山图等可视化图片和差异基因列表,也可在set columns处进行选择GO功能分析等操作,将分析结果下载。
此外补充GEO在线分析网站:Network Analyst
可进行差异分析和对差异分析的结果进行功能分析和网络分析