你还在为基因芯片表达差异分析发愁吗?这个方法带你飞!

Hello,大家好!此前,小编给大家介绍了:如何从GEO数据库下载芯片数据及相关样本处理信息等等(不知道的可以戳这里哦)。这些芯片数据下载下来干嘛呢?下载必然是为了挖数据啦!指不定什么有意思的东西我就发现了呢?指不定老天爷眼睛一闭让我发了文章了呢?

言归正传,拿到数据,分析的第一步往往是进行基因差异表达分析,所以,针对芯片数据,我们就来给大家介绍一款基因差异表达分析的常用方法——R包limma。

数据简介与设置

为了方便演示,这里选择了人的早幼粒细胞白血病细胞系NB4细胞的六个样本数据(GSE2600),分析的输入文件是下载的表达矩阵文件,而分析之前需要确保正确安装和加载limma,同时需要对工作路径进行设置。

library('limma')

workdir="F:/GEO/20180520"

setwd(workdir)

数据处理

1、表达矩阵

数据为六个样本,读取数据之后,大家可以利用head()简单查看数据的情况等。

> expreSet=read.csv2("GSE2600expressionMatrix.csv", header =T, row.names =1,check.names =F)

>head(exprSet,3)

GSM49939GSM49940GSM49941GSM49942GSM49943GSM49944

1007_s_at23.013.826.575.994.984.6

1053_at1449.91826.72242.81508.81523.02355.5

117_at109.271.5106.7128.884.179.6

针对表达矩阵,需要查看其整体分布情况,可以利用boxplot()绘制box分布图,GEO下载的表达矩阵数据基本上都是标准化的数据,可以由箱线图的分布特点看出这些样本的数据基本分布一致(中位数、上四分位数、下四分位数等等),如下图结果:

#获取样品数量,并设置图片颜色

n.sample = ncol(exprSet)

cols = rainbow(n.sample)

#利用boxplot()绘图

pdf(file=paste(workdir,"/","Probe_expressionDistribution.pdf",sep=""), width=24, height=18)

par(cex =0.7)

if(n.sample>40) par(cex =0.5)

boxplot(exprSet,col = cols, main ="expression", las =2)

dev.off()

2、分组矩阵

确认表达矩阵之后,可以由下载保存的样本处理信息进行分组,例如此处的样本处理分组:CONTROL/INFECTED,经过整理,分组信息大致如下,并基于分组信息构建分组矩阵(design):

>group

Treatment

GSM49939   CONTROL

GSM49940   CONTROL

GSM49941   CONTROL

GSM49942  INFECTED

GSM49943  INFECTED

GSM49944  INFECTED

> design = model.matrix(~ Treatment +0,group)

> colnames(design) = levels(as.factor(c("CONTROL","INFECTED")))

> design

CONTROL INFECTED

GSM4993910

GSM4994010

GSM4994110

GSM4994201

GSM4994301

GSM4994401

attr(,"assign")

[1]11

attr(,"contrasts")

attr(,"contrasts")$Treatment

[1]"contr.treatment"

3、差异比较矩阵

基于分组矩阵的信息构建差异比较矩阵(cont.matrix),由差异比较矩阵显示结果可知,是进行INFECTED 与CONTROL之间的差异分析。

>cont.matrix = makeContrasts(INFECTED-CONTROL, levels=design)

>cont.matrix

Contrasts

LevelsINFECTED-CONTROL

CONTROL-1

INFECTED1

差异表达分析

差异表达分析主要是基于lmFit()、eBayes()、topTable()完成分析过程,并提取了主要的结果(tT)。

> fit = lmFit(exprSet, design)

> fit2 = contrasts.fit(fit, cont.matrix)

>fit2 = eBayes(fit2,0.01)

>tT = topTable(fit2, adjust="fdr", sort.by="logFC", resort.by="P",n=Inf)

>

tT = subset(tT, select=c("adj.P.Val","P.Value","logFC"))

>head(tT,15)

adj.P.ValP.ValuelogFC

223020_at0.999642.196175e-05746.10000

1555758_a_at0.999646.467722e-05-540.53333

218676_s_at0.999641.352768e-04-280.86667

237249_at0.999642.669173e-04-93.53333

225100_at0.999642.836527e-04-124.96667

217825_s_at0.999642.903446e-04-143.73333

222099_s_at0.999643.425427e-04493.13333

212634_at0.999644.221452e-04-166.06667

211499_s_at0.999644.391776e-04-129.56667

221098_x_at0.999644.805746e-0495.16667

208974_x_at0.999645.060448e-04947.76667

209670_at0.999645.113338e-04374.20000

202088_at0.999645.262646e-04-594.40000

219394_at0.999645.307063e-04-117.56667

212221_x_at0.999645.393084e-04347.43333

以上,就完成了分析过程,之后可以根据结果设定合适的阈值筛选出差异表达基因,并基于结果进行图形化展示,或者进行富集分析、蛋白质互作网络分析等等,如此可以丰富分析结果,感兴趣的同学可以去探索一下哦!

更多生物信息课程:

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程基因家族文献思路解读

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘转录组文献解读

5. 微生物16S/ITS/18S分析原理及结果解读OTU网络图绘制cytoscape与网络图绘制课程

6. 生物信息入门到精通必修基础课,学习链接:linux系统使用perl入门到精通perl语言高级R语言画图

7. 医学相关数据挖掘课程,不用做实验也能发文章,学习链接:TCGA-差异基因分析GEO芯片数据挖掘GSEA富集分析课程TCGA临床数据生存分析TCGA-转录因子分析TCGA-ceRNA调控网络分析

8.其他课程链接:二代测序转录组数据自主分析NCBI数据上传二代测序数据解读

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,273评论 6 515
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,349评论 3 398
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 167,709评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,520评论 1 296
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,515评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,158评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,755评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,660评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,203评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,287评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,427评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,122评论 5 349
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,801评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,272评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,393评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,808评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,440评论 2 359