以GSE111229为例
1 下载并保存GEO数据
下载有error可以:设置镜像、翻墙、rm(list=ls())一下重试…
library(GEOquery)
GSE_name = 'GSE111229'
options( 'download.file.method.GEOquery' = 'libcurl' ) #windows系统
gset <- getGEO( GSE_name, getGPL = F )
save( gset, file = 'gset.Rdata' )
- 下载得到一个list,需学习list的处理;
2 加载GEO数据
gset包含下载的所有信息
由于gset是列表,故将其转为可操作的数据结构Gset
load("gset.Rdata")
Gset <- gset[[1]]
- 对于向量和矩阵,[]和[[]]基本上一样;
但对于列表list,如[1],相当于提取列表中的第1个子表的整体,输出结果还是个列表list;而[[1]]相当于直接提取第1个子表中的所有元素,输出结果就是数列或字符串或向量等与其中元素类型一致的东西。
实际中,对于列表,尽量采用[[]]直接提取其中的元素对象,不容易出错。
3 用GEOquery里的pdata函数获取样本信息
处理后得到数据框结构的数据
pdata<-pData(Gset)
class(pdata)
View(pdata)
-看到一篇文章,挺好的,有空多看看;R语言中知识点总结(二)
4 dim查看行列 colnames查看列名
dim(pdata)
colnames(pdata)