(三)02_group_ids分组和芯片注释

  • group_list分组

第一步:清除之前所有变量+加载之前的数据

> rm(list = ls())  #表示清除所有变量;ls当前目录赋值给列表,接着清除
#ls() 返回global environment 里面的所有object的名字。
#是一个character vector
> load(file = "step1output.Rdata")#加载工作目录下之前保存的数据
> library(stringr)#加载str包

第二步,确认分组的目标

#前文提到的pd中有临床信息,其中title中显示了control组和实验组
> pd$title
[1] "A375 cells 24h Control rep1"     "A375 cells 24h Control rep2"    
[3] "A375 cells 24h Control rep3"     "A375 cells 24h Vemurafenib rep1"
[5] "A375 cells 24h Vemurafenib rep2" "A375 cells 24h Vemurafenib rep3"
pd

第三步,分组向量生成

> group_list=c(rep("control",times=3),rep("treat",times=3))
> group_list
[1] "control" "control" "control" "treat"   "treat"   "treat"  
> #第三类,ifelse
> library(stringr)#这个包可以用函数str_detect()
> group_list=ifelse(str_detect(pd$title,"Control"),"control","treat")
> group_list
[1] "control" "control" "control" "treat"   "treat"   "treat"  
#第一个为判断条件,第二为true,第三false
#设置参考水平,对照在前,处理在后
#str_detect(string字符串, pattern匹配字符),返回逻辑值,是检测函数; 
#用于检测字符串中是否存在某种匹配模式;
#val <- c("abca4", 123, "cba2");str_detect(val, "a")检查Val是否有字符串a;TRUE FALSE TRUE
#pd$title中有6个,返回6个,TRUE返回第一个control;FALSE返回为treatment

第四步,设置因子

> group_list = factor(group_list,#生成因子的意义,后面的差异分析是处理/对照
                    levels = c("control","treat"))
#levels规定谁在前面谁是对照,注意顺序,所有加用level
#芯片注释,查找芯片平台对应的包,到此脚本中替换
  • 芯片注释

芯片注释,查找芯片平台对应的包,到此脚本中替换
gpl #取网页搜索GPL编号,ctrl+F,获取相应的注释包
http://www.bio-info-trainee.com/1399.html


芯片探针与基因的对应关系http://www.bio-info-trainee.com/1399.html

image.png

第一步,安装并加载hugene10sttranscriptcluster.db包

> gpl #取网页搜索GPL编号,ctrl+F,获取相应的注释包
[1] "GPL6244"
>if(!require(hugene10sttranscriptcluster.db))BiocManager::install("hugene10sttranscriptcluster.db")
#require()表示加载,返回的是逻辑值,TRUE时表示已加载,FALSE表示未加载;!表示否定
#先安装;ls("package:tidyr")函数用法
> library(hugene10sttranscriptcluster.db)
> ls("package:hugene10sttranscriptcluster.db")#显示包里的所有目录
 [1] "hugene10sttranscriptcluster"             
 [2] "hugene10sttranscriptcluster.db"          
 [3] "hugene10sttranscriptcluster_dbconn"      
 [4] "hugene10sttranscriptcluster_dbfile"      
 [5] "hugene10sttranscriptcluster_dbInfo"      
 [6] "hugene10sttranscriptcluster_dbschema"    
 [7] "hugene10sttranscriptclusterACCNUM"       
 [8] "hugene10sttranscriptclusterALIAS2PROBE"  
 [9] "hugene10sttranscriptclusterCHR"          
[10] "hugene10sttranscriptclusterCHRLENGTHS"   
[11] "hugene10sttranscriptclusterCHRLOC"       
[12] "hugene10sttranscriptclusterCHRLOCEND"    
[13] "hugene10sttranscriptclusterENSEMBL"      
[14] "hugene10sttranscriptclusterENSEMBL2PROBE"
[15] "hugene10sttranscriptclusterENTREZID"     
[16] "hugene10sttranscriptclusterENZYME"       
[17] "hugene10sttranscriptclusterENZYME2PROBE" 
[18] "hugene10sttranscriptclusterGENENAME"     
[19] "hugene10sttranscriptclusterGO"           
[20] "hugene10sttranscriptclusterGO2ALLPROBES" 
[21] "hugene10sttranscriptclusterGO2PROBE"     
[22] "hugene10sttranscriptclusterMAP"          
[23] "hugene10sttranscriptclusterMAPCOUNTS"    
[24] "hugene10sttranscriptclusterOMIM"         
[25] "hugene10sttranscriptclusterORGANISM"     
[26] "hugene10sttranscriptclusterORGPKG"       
[27] "hugene10sttranscriptclusterPATH"         
[28] "hugene10sttranscriptclusterPATH2PROBE"   
[29] "hugene10sttranscriptclusterPFAM"         
[30] "hugene10sttranscriptclusterPMID"         
[31] "hugene10sttranscriptclusterPMID2PROBE"   
[32] "hugene10sttranscriptclusterPROSITE"      
[33] "hugene10sttranscriptclusterREFSEQ"       
[34] "hugene10sttranscriptclusterSYMBOL" ###重要
[35] "hugene10sttranscriptclusterUNIGENE"      
[36] "hugene10sttranscriptclusterUNIPROT"      
#View(hugene10sttranscriptclusterSYMBOL)
#str(hugene10sttranscriptclusterSYMBOL)
#View(hugene10sttranscriptclusterSYMBOL)

第二步,将hugene10sttranscriptclusterSYMBOL中的数据用数据框封装

> ids <- toTable(hugene10sttranscriptclusterSYMBOL)#把包里的数据变成数据框
#toTable是一种能够以数据框的形式来操作一个Bimap对象的方法,
#也就是把Bimap对象转换为一个数据框,
#这些方法是Bimap interface方法的一部分。
#Bimap指的是一种映射关系,例如探针的编号与基因名称之间的映射
head(ids)#只有两列数据probe_id和symbol
  probe_id    symbol
1  7896759 LINC01128
2  7896761    SAMD11
3  7896779    KLHL17
4  7896798   PLEKHN1
5  7896817     ISG15
6  7896822      AGRN
#View(ids)
save(exp,group_list,ids,file = "step2output.Rdata")

继续了解probe_id和symbol在该分析中的作用

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,542评论 6 504
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,822评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,912评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,449评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,500评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,370评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,193评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,074评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,505评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,722评论 3 335
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,841评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,569评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,168评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,783评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,918评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,962评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,781评论 2 354

推荐阅读更多精彩内容

  • 官网 中文版本 好的网站 Content-type: text/htmlBASH Section: User ...
    不排版阅读 4,381评论 0 5
  • 天黑了,能说么 说 好,你带瓶酒来
    九月谣言阅读 130评论 3 4
  • 好玩的游戏如圆润的珍珠般晶莹,如星星般闪烁,快乐的游戏是闪闪发亮的宝石留在我记忆的长河中。 一次课间我们...
    d660ceb11592阅读 267评论 0 0
  • 一根白发 文/潘利伟 一直觉得自己还年轻,再一看年龄确实也不小了,只怪岁月不饶人,只怪时光太匆匆,只是我不愿承认...
    我宝超萌萌萌哒阅读 145评论 0 6
  • 今天有点失落,感觉写报告还是有种想当然的成分 ,今天她们帮看报告,她们就说要结合平面图和现场调查照片来写报告,要...
    3bf9df2860c8阅读 84评论 0 0