GEO数据库基础知识

GEO数据库基础知识

  • GEO Platform (GPL) 芯片平台
  • GEO Sample (GSM) 样本ID号
  • GEO Series (GSE) study的ID号
  • GEO Dataset (GDS) 数据集的ID号 ## 用法

三篇老大参考链接

1.https://mp.weixin.qq.com/s?__biz=MzAxMDkxODM1Ng==&mid=2247486063&idx=1&sn=156bee5397e979722b36b78284188538&chksm=9b484ad4ac3fc3c2d025b9e4bb1c3c8392839c08d84697754d7d95d041b539479a45f19cf5d5&scene=21#wechat_redirect

2.http://www.bio-info-trainee.com/bioconductor_China/software/GEOquery.html

3.http://www.bio-info-trainee.com/1085.html

GEO包下载:

source("http://www.bioconductor.org/biocLite.R")
biocLite("GEOquery")
library(GEOquery)
options(warn=-1)
suppressMessages(library(GEOquery))
gds858 <- getGEO('GDS858', destdir=".")
names(Meta(gds858))
Table(gds858)[1:5,1:5]
library(GEOquery)
if(!file.exists(f)){
  gset <- getGEO('GSE76275', destdir=".",
                 AnnotGPL = F,     ## 注释文件
                 getGPL = F)       ## 平台文件
  save(gset,file=f)                ## 保存到本地
}
load('GSE76275_eSet.Rdata')        ## 载入数据
class(gset)
length(gset)
class(gset[[1]])
a=gset[[1]] ## 降级提取a
dat=exprs(a)  ## 获取表达矩阵
dim(dat)
dat[1:4,1:4]
pd=pData(a) 使用函数?pData获取样本临床信息(如性别、年龄、肿瘤分期等等)
trait=pd[,51:53]
head(trait)
trait$T=substring(trait[,2],2,2)
trait$N=substring(trait[,2],4,4)
trait$M=substring(trait[,2],6,6)
colnames(trait)=c('age','tmn','bmi','T','M','N')
head(trait)
save(trait,file='trait.Rdata')

group_list = ifelse(pd$characteristics_ch1.1=='triple-negative status: not TN',
   'noTNBC','TNBC')
table(group_list)
save(dat,group_list,file = 'step1-output.Rdata')

dat

image-20181221092415595

dat[1:4;1:4]

trait=[ ,51:53]

head(trait)

trait=pd[,51:53]
head(trait)
trait$T=substring(trait[,2],2,2)
trait$N=substring(trait[,2],4,4)
trait$M=substring(trait[,2],6,6)
colnames(trait)=c('age','tmn','bmi','T','M','N')
head(trait)
save(trait,file='trait.Rdata')
group_list = ifelse(pd$characteristics_ch1.1=='triple-negative status: not TN','noTNBC','TNBC')
table(group_list)
save(dat,group_list,file = 'step1-output.Rdata')

以上第一步结束了,生成“step-output.Rdata文件”

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • GEO数据挖掘看老大哔哩哔哩 看了三遍了,随着理解,后续还要更新这篇记录,现在还太不全,有些还没跟上,代码随着理解...
    小梦游仙境阅读 2,186评论 1 7
  • GEO数据库基础知识 GEO Platform (GPL) 芯片平台 GEO Sample (GSM) 样本ID号...
    小梦游仙境阅读 4,728评论 0 4
  • 健明大神说过若是想学会使用R包,就去看那个包的说明书,因此去学习了GEOquery包说明书。翻译不当之处请去看原文...
    土豆学生信阅读 41,784评论 1 80
  • 使用GEOquery包 肖恩戴维斯 2014年9月21日 1GEO概述 1.1平台 1.2样品 1.3系列 1.4...
    Greatji阅读 1,003评论 0 1
  • 刘小泽写于18.9.10实战上从数据下载到差异基因的获得、初步作图实战下进行富集分析,使用数据库进行注释在此感谢j...
    刘小泽阅读 8,450评论 3 32