(二)01_start_GEO.R

Gene Expression Omnibus database (GEO)是由NCBI负责维护的一个数据库,设计初衷是为了收集整理各种表达芯片数据,但是后来也加入了甲基化芯片,甚至高通量测序数据!

1、GEO Platform (GPL) 芯片平台
2、GEO Sample (GSM) 样本ID号
3、GEO Series (GSE) study的ID号
4、GEO Dataset (GDS) 数据集的ID号

1、用GEOquery从GEO数据库下载数据

#这应该是所有启动R写代码时的操作
> rm(list = ls())#清空所有变量
> options(stringsAsFactors = F)#字符串不设置成因子

正式代码

> library(GEOquery)#加载包
#插播:[[1]]列表取子集,最里面1只能是位置
#用GEOquery包里面的函数getGEO,并用GSE42872该芯片
> eSet <- getGEO("GSE42872",      
               destdir = '.', #目标目录,下载并读取在当前路径;默认为工作目录
               getGPL = F)#不同时下载临床信息#此时的临床信息大;
#getGEO(GEO = NULL, filename = NULL, destdir = tempdir(), SElimits=NULL,GSEMatrix=TRUE,AnnotGPL=FALSE)
  • View(eSet)
View(eSet).png
  • class(eSet)#显示eSet是一个列表
> class(eSet)
[1] "list"
  • 从GEO下载GSE的数据,读取,赋值给了eSet,当本地目录下有该数据集时,不会下载了;
  • 当信息下载不完整,重新下载或自行网页下载并放在工作目录下。
  • 此时的eSet是一个大的列表,可以用View,一个是实验数据
  • 既然是列表,那么从列表中提取信息就是 eSet[[1]]

(1)提取表达矩阵exp

> exp <- exprs(eSet[[1]])#eSet的第一项就是实验数据,提取表达矩阵。

> exp[1:4,1:4]
>        GSM1052615 GSM1052616 GSM1052617 GSM1052618
7892501    7.24559    6.80686    7.73301    6.18961
7892502    6.82711    6.70157    7.02471    6.20493
7892503    4.39977    4.50781    4.88250    4.36295
7892504    9.48025    9.67952    9.63074    9.69200
#View(exp)样本名(竖行名)芯片ID(横行)
#这个时候需要肉眼检查下数据的情况,看是否取对数了
#exp = log2(exp+1)#有表达量exp为0的数据没有意义,所以才加0
exp.png

(2)提取临床信息——将样本表型信息从数据框中提取出

##将样本表型信息从数据框中提取出来【取出来的是表型、样本的数据框】
> pd <- pData(eSet[[1]])
> View(pd)#有汉字乱码
> colnames(pd)
 [1] "title"                   "geo_accession"          
 [3] "status"                  "submission_date"        
 [5] "last_update_date"        "type"                   
 [7] "channel_count"           "source_name_ch1"        
 [9] "organism_ch1"            "characteristics_ch1"    
[11] "characteristics_ch1.1"   "treatment_protocol_ch1" 
[13] "growth_protocol_ch1"     "molecule_ch1"           
[15] "extract_protocol_ch1"    "label_ch1"              
[17] "label_protocol_ch1"      "taxid_ch1"              
[19] "hyb_protocol"            "scan_protocol"          
[21] "description"             "data_processing"        
[23] "platform_id"             "contact_name"           
[25] "contact_email"           "contact_institute"      
[27] "contact_address"         "contact_city"           
[29] "contact_zip/postal_code" "contact_country"        
[31] "supplementary_file"      "data_row_count"         
[33] "cell line:ch1"           "cell type:ch1" 
pd.png

(3)提取芯片平台编号

> gpl <- eSet[[1]]@annotation#对应平台是GPL6244;
> gpl
[1] "GPL6244"
#View(gpl)#接下来就需要知道GPL6244对应的注释包
> save(pd,exp,gpl,file = "step1output.Rdata")#保存了数据
#总结,下载表达数据,临床信息
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,651评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,468评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,931评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,218评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,234评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,198评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,084评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,926评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,341评论 1 311
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,563评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,731评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,430评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,036评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,676评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,829评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,743评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,629评论 2 354

推荐阅读更多精彩内容