GO富集分析之弦图

本文使用 GOplot 包绘制弦图

首先要准备两个文件，一个是GO富集分析的结果，一个是基因差异表达分析的结果。一般我们都是用差异表达的基因进行GO富集分析，所以这两个文件还是很好准备的。（基因差异表达分析的结果是可选项，如果想要画的图更漂亮，更准确，就需要准确知道GO富集分析条目下每个基因的logFC）

准备第一个文件（GO富集分析的结果）：

首先来看看GO富集分析的结果：

S gene number表示该条目下显著基因的个数，B gene number表示背景基因，enrichFactor表示S gene number比上B gene number。这里我按照S gene number降序排列，并选择Pvalue小于0.05的前5个条目（条目的数量最好不要太多，条目下的基因最好也不要太多，不然最终成图后很难看）

GOplot对导入的GO富集分析的结果有一定的格式要求，要有五列，而且需要将列名命名为：

'category', 'ID', 'term', 'adjusted p-value' ('adj_pval') and 'genes'

并且，gene那一列中，每一行的gene需要用逗号隔开（不能是其他符号），可以直接用excel调整好这些格式要求，当然也可以用R语言：

>goenrichment <- read.csv(file = "clipboard",header = T,sep = "\t") #读入GO富集分析的结果

>goenrichment <- goenrichment[ , c(3,1,2,7,4)] #按照要求的顺序选择列

>colnames(goenrichment) <- c("category", "ID", "term", "adj_pval", "genes")

>goenrichment$genes <- gsub(";", ",", goenrichment$genes) # 用逗号替换分号

准备第二个文件（差异表达分析的结果）：

值得注意的是，在gene_name那一列，可能会出现多个基因在一行的情况，比如：

上面这种情况，在取交集时，有多个基因的那行就识别不到，因此需要把它分开，变成一行只有一个基因的形式：

可以通过以下代码实现：

>logFC<- read.csv(file = "clipboard",header = T,sep = "\t") #读入差异表达分析的结果

>genedata <- data.frame()

>for(i in c(1:dim(logFC)[1])){

+ row_genelist <- strsplit(logFC[i,1],";",)[[1]]

+ num <- length(row_genelist)

+ if(num > 1){

+ genelogFC <- c(rep(logFC[i,2],num))

+ genedata <- rbind(genedata,cbind(gene = row_genelist,logFC = genelogFC))

+ }

>colnames(logFC) <- colnames(genedata)

>logFC <- rbind(genedata,logFC)

除此以外，差异倍数的那一列还可能出现正无穷或者负无穷的情况，需要排除

GOplot对导入的差异表达分析的结果也有一定的格式要求，要有两列，而且需要将列名命名为："ID", "logFC"

>colnames(logFC) <- c("ID","logFC")

准备好上面两个文件，就可以开始画图了：

要知道5个term下富集的基因的logFC，就要先知道这些条目下有哪些基因：

>genename <- NULL

>for (i in c(1:5)){

genelist <- c(goenrichment[i,4])

temp <- strsplit(list,",",)[[1]]

genename <- append(genename,temp,after = length(genename))

}

>genename <- genename[-which(duplicated(genename))] #删除重复的基因

>genename

>diffgene <- logFC[which(logFC$gene_name %in% gene),] # 取交集，获得每个基因的差异表达倍数，有些基因的差异表达倍数可能为无穷值，在开始阶段就被排除了，因此diffgene这个数据框里的基因数可能比genename里的基因少。

>head(diffgene) #行名称还是遵循logFC中的行名称

>diffgene$logFC <- as.numeric(diffgene$logFC) #保证第二列是数值类型

>circ <- circle_dat(goenrichment,diffgene) #创建画图所需要的矩阵

>head(circ)

# >chord <- chord_dat(circ,diffgene,goenrichment$term) #这一个函数会通过匹配circ和diffgene中的基因名，将diffgene中的差异表达倍数整合到circ矩阵中。但是这个函数如果直接用的话，只会传递匹配到的基因的logFC：

>chord #可以看出，整个chord矩阵就只有这些基因，即只有这些基因匹配到了。

这里有个小细节，矩阵circ中，genes那一列的基因全是大写，而我们准备的差异表达基因的数据框diffgene中，基因是有大写，有小写，因此不能匹配，不能把基因的差异表达倍数传递给circ这个矩阵，需要把diffgene中的基因名全部转为大写：

>diffgene$ID <- toupper(diffgene$ID)

>chord <- chord_dat(circ,diffgene,goenrichment$term) #此时就可以全部匹配，chord的行数就会和diffgene的行数一样

>GOChord(chord,space = 0.02,gene.order = "logFC",gene.space = 0.3,gene.size = 4,process.label = 3)

# 绘图；参数space表示图中圆形每部分的间隔，gene.order表示按照“logFC”排序，gene.space表示基因与圆形之间的间隔，process.label表示图例的大小。

最终效果如下图，可以看到基因数还是很多，所以效果不是很好。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 219,490评论 6赞 508
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,581评论 3赞 395
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 165,830评论 0赞 356
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,957评论 1赞 295
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,974评论 6赞 393
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,754评论 1赞 307
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,464评论 3赞 420
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,357评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,847评论 1赞 317
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,995评论 3赞 338
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,137评论 1赞 351
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,819评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,482评论 3赞 331
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,023评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,149评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,409评论 3赞 373
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,086评论 2赞 355

GO富集分析之弦图

本文使用 GOplot 包绘制弦图

准备第一个文件（GO富集分析的结果）：

准备第二个文件（差异表达分析的结果）：

准备好上面两个文件，就可以开始画图了：

推荐阅读更多精彩内容