R使用笔记: ggplot2的一顿骚操作...

本次笔记内容:

  • 使用ggplot2及ggrepel绘制主图和副图
  • 多种方法整合主图与副图:
    ggpubr: ggarange() , 副图注释在主图外
    ggplot2: ggplotGrob + annotation_custom, 副图注释在主图内
    ggExtra: ggMarginal(), 副图重叠注释在主图外
    cowplot: 副图注释在主图外
  • 总结:形式为功能服务,不要lost在细节的漩涡,但细节如何处理得心里有数。

使用iris这个示例数据,用ggplot2画一个基本图。
鸢尾花(iris)是数据挖掘常用到的一个数据集,有150个鸢尾花样本信息,包括3个物种(setosa,versicolour和virginica)。每个样本具有5个特征(Sepal.Length,Sepal.Width, Petal.Length, Petal.Width, Species)。

data("iris")
iris <- data.frame(iris)
col <- brewer.pal(3, "Set1")
ggplot(data = iris, aes(Sepal.Length, Sepal.Width, colour = Species)) + 
    geom_point(size = 5, alpha = .6) + 
    scale_color_manual(values = col)
base
使用ggplot2及ggrepel绘制主图和副图

使用iris这个示例数据绘制主图和副图。在以下代码中我切了一个子数据集出来,并加上了一个‘group’列,作为演示ggrepel用。

主图:
# required packages
library(RColorBrewer)
library(ggrepel)
library(ggpubr)
library(cowplot)
library(ggExtra)

data("iris")
iris <- data.frame(iris)
iris_sub <- iris[iris$Sepal.Length > 2 & iris$Sepal.Width > 3.5, ]
iris_sub$group <- c(rep('group1',10), rep('group2',9))

col <- brewer.pal(3, "Set1")
col1 <- brewer.pal(3,"Set3")[1:2]     

# main scatter plot
gg <- ggplot(data = iris, aes(Sepal.Length, Sepal.Width, colour = Species)) + 
  geom_point(size = 5, alpha = .6) + 
  scale_color_manual(values = col) +
  geom_label_repel(data = iris_sub, 
                   aes(
                     Sepal.Length, Sepal.Width, 
                     label=rownames(iris_sub), 
                     fill = group,
                     color = group
                     ),
                   color = 'black', alpha=1,
                   point.padding = unit(0.1,"lines"), 
                   box.padding = 0.5,
                   segment.color = 'grey55') +
                   # 连接label和点的线:颜色设置为gery55
  scale_fill_manual(values = setNames(col1, levels(iris_sub$group))) +
  # 将col1的两个颜色,设置为iris_sub的两个group的颜色,ggrepel按照这个颜色来fill
  theme(legend.position = "bottom")     
  # 把legend设置在底部,因为副图可能会遮盖住右边的Legend
main scatter plot
副图:
# annotated plot
xplot <- ggplot(data = iris, aes(x = Species, y = Sepal.Length, fill = Species)) + 
  geom_boxplot(position = position_dodge(0.8)) +
  geom_point(position = position_jitterdodge())+
  scale_fill_brewer(palette = "Set1") +
  coord_flip() +
  # 把竖着的boxplot横过来
  clean_theme() +
  # 去掉所有theme, 比如x和y轴,只留下box。在调整阶段可以先留着,以观察把主副图合并时有没有把坐标轴对齐
  theme(legend.position = "none")
  # 去掉lengend

yplot <- ggplot(data = iris, aes(x = Species, y = Sepal.Width, fill = Species)) + 
  geom_boxplot(position = position_dodge(0.8)) +
  geom_point(position = position_jitterdodge())+
  scale_fill_brewer(palette = "Set1") +
  clean_theme() +
  theme(legend.position = "none")
多种方法整合主图与副图:
ggpubr: ggarange() , 副图注释在主图外
ggarrange(xplot, NULL,gg,yplot, 
          widths = c(5,1),heights = c(1,4), align = "hv")

ggarange()将副图整合在主图外部。如果把clean_theme()去掉,发现因为主图legend的缘故,副图的坐标轴没法和主图对齐。这里可能得根据实际情况调整主图的legend。ggarange()的好处在于可以调整整合图的比例,参数设置简单。

ggplotGrob + annotaion_custom
# ggplotGrob + annotaion_custom
x_grob <- ggplotGrob(xplot)
y_grob <- ggplotGrob(yplot)
xmin <- min(iris$Sepal.Length)
xmax <- max(iris$Sepal.Length)
ymin <- min(iris$Sepal.Width)
ymax <- max(iris$Sepal.Width)
yoffset <- (1/20) * ymax
xoffset <- (1/30) * xmax

gg + annotation_custom(grob = x_grob, 
                       xmin = xmin, xmax = xmax, 
                       ymin = ymin-yoffset, ymax = ymin+yoffset) +
  annotation_custom(grob = y_grob,
                    xmin = xmin-xoffset, xmax = xmin+xoffset, 
                    ymin = ymin, ymax = ymax)

ggGrob + annotation_custom()设置起来比较麻烦,其副图注释在主图内部。但存在一系列问题。坐标轴很难对齐,主图与副图重叠很多。所以实际操作起来,为避免图之间的overlap, 可能还是副图注释在主图外比较合适。

ggExtra: ggMarginal()
ggMarginal(gg, type = "boxplot",groupColour = TRUE, groupFill = TRUE)

ggMarginal()可以用简洁的代码画出上述的图。注释在主图外,且坐标轴可以对齐。但副图之间有overlap...可能绘制可以重叠的分布曲线比较合适。我始终没有找到如何避免boxplot之间overlap的办法=_=
ggMarginal()有个好处在于不需要画出副图,只需要主图。这个包会帮你直接绘制副图。但也意味着你没办法自定义副图的一些属性。

cowplot
p1 <- insert_xaxis_grob(gg, xplot, grid::unit(.2, "null"), position = "top")
p2 <- insert_yaxis_grob(p1, yplot, grid::unit(.2, "null"), position = "right")
ggdraw(p2)

cowplot画出的图是我觉得比较满意的一种。副图注释在主图外,坐标轴对齐,代码简单,不用调试太多参数。

p.s. 还有一个ggscatterhist() 可以试试
http://www.sthda.com/english/articles/32-r-graphics-essentials/131-plot-two-continuous-variables-scatter-graph-and-alternatives/

总结

....有时候很难找到一个合适的包,能满足所有的需求:副图和主图之间的空白不要那么大,坐标轴要互相对齐,box之间最好不要有overlap,lengend的位置不要影响到副图的位置...等等。图是为表达科学问题的一种形式,更好的反应出科学假设与结果才是作图的目的。一些代码难以处理的细枝末节可以在图的形式大致确定下来之后,使用其他图片编辑软件进行微调。

参考链接:
color filling in ggrepel:
https://github.com/slowkow/ggrepel/issues/82
https://stackoverflow.com/questions/37664025/ggrepel-label-fill-color-questions
http://rstudio-pubs-static.s3.amazonaws.com/155546_17c0cb7ee350417e902dfb9031b81f48.html
annotated to the main plot:
http://www.sthda.com/english/wiki/wiki.php?id_contents=7930
http://www.sthda.com/english/articles/24-ggpubr-publication-ready-plots/78-perfect-scatter-plots-with-correlation-and-marginal-histograms/
http://www.r-graph-gallery.com/277-marginal-histogram-for-ggplot2/

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,657评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,662评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,143评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,732评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,837评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,036评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,126评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,868评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,315评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,641评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,773评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,859评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,584评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,676评论 2 351

推荐阅读更多精彩内容

  • 简介 文章较长,点击直达我的博客,浏览效果更好。本文内容基本是来源于STHDA,这是一份十分详细的ggplot2使...
    taoyan阅读 51,035评论 7 159
  • 今天中午孩子进家门就喊:“妈,你猜猜外面怎么样?”我说:“怎样?”“多亏你和弟弟没出去啊,外面冻死了,风刮的...
    女人越简单越快乐阅读 125评论 0 0
  • 今天听同事小Y说起她的发小摆了个小摊,专卖炒面炒饼的,作为吃货的我,为了掩盖我真实的关注点,就假装好奇多问了几句,...
    丁丁求职阅读 642评论 10 6
  • 忽然就想到你们。 现在我坐在教室,靠着窗的座位。许多人在外面打篮球,半场四打四。显的有些拥挤。仿佛看得到小晗别扭的...
    简画阅读 322评论 0 1
  • 《修》:邓松云 又回村一趟 石板路上 落了一滩乱红 后山梨树还在下雪 叶子却还没长出来 没看见乌鸦 这乌七八黑的鸟...
    邓松云的手工作坊阅读 457评论 0 2