也谈火山图

逐渐感觉到,一些人正在将生信分析带偏,他们着重强调图片的观赏性,而忽视了生信分心的本质不是为了文章凑图片,而是能利用大数据分析观测到wet lab实验不能观测的新视角,提供新发现以供实验验证。火山图作为一款常见的结果展示图片似乎正在被玩坏。网上各种络绎不绝的帖子教你如何调整颜色,调整点的大小变化。我不否认漂亮的图片可以为你的文章增色,然而前提必须是建立在科学和准确的基础上的。

火山图是一个很好的用来显示差异分析结果的方式,通常情况下Y轴代表的是显著性的p值,为了方便观察显著性的,通常用-log10(p.val)或者-log10(p.adj),X轴数值一般是差异倍数FC(fold change)或log2FC。 举个例子,下图是我根据自己的蛋白质组数据用ggplot做的图。

你想要的是不是都在?

该图展示了以下几种作图的操作:

1.FC变化与点的大小成正相关.FC越大,点越大

2.颜色变化与p值的大小而变化,p值越小,颜色越深(渐变色),且左右两侧使用不同颜色。

3.使用SAM test将T-test 结果进行显著性区分,而非人为划定(FC=1,-log10(p.val)<0.05,虚线所示)。

4.在图中对感兴趣基因进行标注

为什么做这个图呢?最近注意到有些人开始传授如何在火山图画这个双曲线。这个双曲线在R里其实是个相对复杂的操作,并且牵扯到SAM test SAM (Significance Analysis of Microarray)。这个分析最初的参考文献见这里:Proc Natl Acad Sci USA. 2001 Apr 24;98(9):5116-21. SAM test 其实是一个 一种改进的T-tets,其引了Fudge factor 用以校正在t-test里一些差异较小的基因的假阳性问题。据我所知的其在火山图中的应用最常见的地方其实是来源于Perseus 软件里的火山图,其使用的统计学原理也是来自我上面提到的这篇文献。

由于这个双曲线和反比例函数曲线近似,于是就出现了我觉得比较荒唐的地方,有人开始用反比例函数来画这个图。这个倒也不是原创,研究了一下发现确实有人这么在文章里干过,例如: Mol Cell Proteomics. 2015 Jan;14(1):120-35. 文章里使用了一个自创的函数y=c/(x-x0),(c= curvature,x0 = minimum fold change) ,参数的取值似乎也是猜出来的。在我看来这个逆向工程有点不讲武德,为了区分显著性的蛋白就自己琢磨了一个分界线,还搞得有点玄幻。其本质上来讲,似乎还不如传统的-Log10(p.val)加FC分解来的有道理,虽然都是猜。所以问题来了,既然都是猜,是不是就可以乱来?是不是搞个指数函数也可以呢?因为如果你用 geom_function(fun = ~ 0.5*exp(-abs(.x))) 也能画出类似的曲线,如下图

geom_function(fun = ~ 0.5*exp(-abs(.x)))

我觉得答案显然是你不能想怎样就怎样,就如我一开始所言,数据分析是要有科学依据的,你做的是科学不是艺术,准确度的优先级一定是大于美学的。如果实在不确定怎么划界,那么就老实的用别人的工具,或者传统的-Log10(p.val)加FC。当然如果你有充分的理由不这么做的除外。

最后附上作图部分的代码,水平有限,仅供参考。

ggplot() +

    geom_point(dat_red, mapping = aes(x = FC, y = -log10(p.val), color = -log10(p.val)), size = dat_red$FC) +

    scale_size(limits = c(0, 6)) +

    scale_colour_gradient(low = "#e1bb4e", high = "#c12131") +

    guides(color = "none") +

    ggnewscale::new_scale_color() +

    geom_point(dat_blue, mapping = aes(x = FC, y = -log10(p.val), color = -log10(p.val)), size = abs(dat_blue$FC)) +

    scale_size(limits = c(0, 5)) +

    scale_colour_gradient(low = "#a7d3d5", high = "#1c0d51") +

    ggrepel::geom_text_repel(data = lab_gene, max.overlaps = 100, min.segment.length = 0.1, force = 0.5, size = 2, colour = "black", aes(x = FC, y = -log10(p.val), label = rownames(lab_gene))) +

    geom_point(dat_gray, mapping = aes(x = FC, y = -log10(p.val)), size = abs(dat_gray$FC), color = "gray") +

    geom_vline(xintercept = c(-1, 1), lty = 2, col = "gray", lwd = 0.5) +

    geom_hline(yintercept = -log10(0.05), lty = 2, col = "gray", lwd = 0.5) +

    geom_line(aes(x = x, y = y), color = "#dd008f", scurve, inherit.aes = FALSE, linetype = "dotted", size = 0.8) +

    ylim(c(0, 6)) +

    ggtitle("SAM Test Soft Threshold") +

    xlab("log2(FC)") +

    ylab("-log10(p.val)") +

    theme_classic() +

    guides(color = "none")

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,367评论 6 512
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,959评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,750评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,226评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,252评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,975评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,592评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,497评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,027评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,147评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,274评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,953评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,623评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,143评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,260评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,607评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,271评论 2 358

推荐阅读更多精彩内容