将GO、Pathway富集结果整合在一张高颜值圆圈图上

富集分析是生物医学论文中非常常见的一类分析,例如GO富集分析,Pathway富集分析等。其结果一般包括以下几个要素:1,名字(GO term或者KEGG description);2,该名字所包含的基因数目;3,该名字所包含的基因与进行富集分析的输入基因的重叠数目;4,富集的P值、FDR值等。富集结果的常见绘图方式包括:气泡图,条形图,弦图等。今天我们利用circlize R包整合富集结果,绘制一个高大上的圈图。

图1.GO、Pathway富集圈图

如图1所示,从外到内共4个track,中间的为图例(从上到下依次为:分类,p值,上调或者下调)

1)分类track

相同颜色的为同一分类,例如黄色表示BP,蓝色表示MF,最外圈刻度表示总的基因数,10的次方表示。总的基因数即图2中所有黄色圈所包含的基因去重后的基因数,或者推荐使用比所有条目中基因数最大值更大的一个值(一般设置为整百或者整千)。

2)term里边的基因数

矩形长度表示该term中包含的基因数(例如GO:0031625这个term中包含306个基因),与最外圈的刻度成比例。矩形的颜色表示该term的富集p值(或者FDR值,q值等,经过-log10转化),颜色越深表示P越小。

3)重叠基因数

矩形长度表示该term中包含的基因与进行基因富集分析时所输入的基因的重叠基因数。例如进行富集分析的基因有500个,其中与GO:0031625中306个基因重叠的基因为38个。由于这个数字一般较小,因此矩形的长度与该track中最的基因数成比例。一般我们要么使用up的基因,要么使用down的基因进行富集分析,因此这里仅一种颜色。

4)富集分数bar

Bar的高度即第三个track里的基因数占第二个track里对应基因数的比例(如图2所示)。数值范围为0到1,这里每个小圈表示0.2。

图2. 基因数及比例来源示意图

1,打开绘图页面

首先,使用浏览器(推荐chrome或者edge)打开富集圈图绘制页面。左侧为常见作图与分析导航,中间为数据输入框和可选参数,右侧为描述和结果示例。也可以在主页搜索框中搜索GO,找到绘图页面。

http://www.bioinformatics.com.cn/plot_basic_go_pathway_circlize_plot_140

图3.富集圈图绘图页面

2,示例数据

点击右侧“示例数据”链接下载excel格式的示例数据。

图4. 输入数据示例

示例数据(仅供参考)包括7列:

第1列:GO或者KEGG条目ID。推荐使用ID,因为名字长短不一,很难统一。

第2列:分类名。可以包含1类,2类,3类,或者4类,例如单独绘制KEGG通路富集结果;同时绘制GO-BP,KEGG;同时绘制BP、CC、MF;甚至同时绘制BP、CC、MF、KEGG。同一分类放在一起,不要相互穿插。

第3列:总基因数。总基因数即图2中所有黄色圈所包含的基因去重后的基因数,或者推荐使用比所有条目中基因数最大值更大的一个值。例如第4列中最大的数值是470,这里可以使用1200,用来从整体上控制第二个track的矩形长度,是一个比较松散的值(一般设置为整百或者整千)。

第4列:数据库中某term包含的基因数。在使用同一个数据库版本的情况下,这个数值是固定不变的,例如GO:0010498里边就包含470个基因。

第5列:某term富集的p值(或者q值,FDR值等)。

第6列:做富集分析时输入的基因与该term中包含基因的重叠基因数(见图2)。

第7列:第6列与第4列的比值(见图2)。

3,粘贴示例数据

直接复制示例数据中的A-G列数据,然后粘贴到输入框。

图5. 必需输入

注意:不是拷贝excel文件,是拷贝excel文件里边的数据。另外粘贴到输入框后,格式乱了没关系,只要在excel中是整齐的就行。并且数据矩阵中不能有空的单元格,中文字符等。

4,修改参数,并提交

我们设置了图片尺寸,字体大小,颜色,字体类型等参数,基本能满足日常绘图使用。如需更高级的定制,请联系我们。

图6.字体、颜色等可调参数

5,提交出图

粘贴好输入数据,调整好参数(或者全部默认)后,点击提交按钮,约8秒后,会在页面右侧出现预览图。我们提供了4种图片格式供下载使用,两种矢量图(pdf,svg)和两种标量图(600 dpi tiff和300 dpi png)。

图7.预览与下载

Tips:

1,该图最大限度地利用有限的空间展示更多的数据内容。因此条目不能过多,推荐总共30个以内的GO和KEGG条目,否则太拥挤。

2,第4个track最大值默认为1.0,可以修改成其他值,以整体上降低或者降低柱子的高度。

3,一般我们使用up或者down的基因做富集分析,对于使用up+down富集结果不适合这个图。

4,对于DAVID等富集分析结果,各列的名字可能不一样,需要根据数值代表的意思调整成示例数据即可。

没有预览就是没有出图,这时请参考示例数据,检查自己输入数据的格式。

遇到文字截断,需要修改字体、调整字体大小等,使用科研作图实操:用inkscape编辑svg矢量图

微生信助力高分文章,用户67000,引用880

 

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,732评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,496评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,264评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,807评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,806评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,675评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,029评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,683评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,704评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,666评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,773评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,413评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,016评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,204评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,083评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,503评论 2 343

推荐阅读更多精彩内容