用topGO进行GO富集分析

topGO是一个半自动的GO富集包,该包的主要优势是集中了好几种统计检验的方法,目前支持的统计方法如下:


一、安装

BiocManager::install('topGO')
需要R的版本为>=2.10,但biocmanager安装需要的R版本更高,现在应该是3.6。

二、数据准备

富集工作主要包括3个步骤:
1、准备相关数据;
2、进行富集统计检验;
3、分析结果。
所以最重要的工作就是数据的准备。需要的数据包括包含全部geneID(背景基因名,一般是研究物种的全部基因)的文件,需要进行富集分析的geneID(差异表达基因或感兴趣的基因)文件,还有gene-to-GO的注释文件。

物种全部的geneID和差异基因ID比较容易获得,比较费劲的是gene-to-GO文件。
topGO提供了一些函数来帮助我们自动获取注释信息:
annFUN.db:用于Bioconductor上有注释包的物种的芯片数据;
annFUN.org:用于Bioconductor上有“org.XX.XX”注释包的数据;
annFUN.gene2GO:用户自己提供gene-to-GO文件;
annFUN.GO2gene:用户提供的GO-to-gene文件也可以;
annFUN.file:读取有gene2GO或GO2gene的txt文件。
一般Bioconductor提供的注释物种并不多,我的方法主要是用AnnotationHub的select函数或biomaRt的getBM函数来获取,具体操作见:https://github.com/xianyu426/gene_annotation

自己提供gene2GO文件时,格式应该为:
gene_ID<TAB>GO_ID1, GO_ID2, GO_ID3, ....

三、数据导入

library(topGO)
# 读取gene-to-GO mapping文件
gene2go <- readMapping(file = "gene-to-GO文件") # 这里我用的是物种全部的基因对应GO文件
# 读取差异基因文件
DEGs <- read.table("差异基因文件", header = TRUE)

# 定义背景基因和感兴趣基因
genenames <- names(gene2go)
genelist <- factor(as.integer(genenames %in% DEGs$geneid)) 
# 这里会生成一个factor,有两个levels:0和1,其中1表示感兴趣的基因。
names(genelist) <- genenames
GOdata <- new("topGOdata", ontology="MF", allGenes = genelist, 
              annot = annFUN.gene2GO, gene2GO = gene2go)

这样就定义了一个topGOdata对象。

四、统计检验

test.stat <- new("classicCount", testStatistic = GOFisherTest, name = "Fisher test")
resultFisher <- getSigGroups(GOdat, test.stat)
test.stat <- new("elimScore", testStatistic = GOKSTest, name = "Fisher test", cutOff = 0.01)
resultElim <- getSigGroups(GOdata, test.stat)
test.stat <- new("weightCount", testStatistic = GOFisherTest, name="Fisher test", sigRatio = "ratio")
resultWeight <- getSigGroups(GOdata, test.stat)
test.stat <- new("classicScore", testStatistic = GOKSTest, name = "KS tests")
resultKS <- getSigGroups(GOdata, test.stat)
elim.ks <- runTest(GOdata, algorithm = "elim", statistic = "ks")
allRes <- GenTable(GOdat, classic=elim.ks, KS=resultKS, weight = resultWeight,
                   orderBy = "weight", ranksOf = "classic", topNodes =10)
write.table(allRes, file = "sig_GO_result.txt",
            row.name = FALSE, col.names=TRUE)

结果可以作气泡富集图。

五、显示结果

showSigOfNodes(GOdata, score(resultWeight), firstSigNodes = 10, useInfo = "all")

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,640评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,254评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,011评论 0 355
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,755评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,774评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,610评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,352评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,257评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,717评论 1 315
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,894评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,021评论 1 350
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,735评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,354评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,936评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,054评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,224评论 3 371
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,974评论 2 355

推荐阅读更多精彩内容