Part 1 :棒棒糖图
棒棒糖图因其形状和棒棒糖相似而得名,具体来看实际上是一个散点和一条线段的组合。棒棒糖图是散点图的一种变体,又与柱状图非常相似,但其在清晰展示数据的同时,减少了图形量,使得读者能够更加关注于数据本身而非图形。棒棒糖图能够帮助将数值与类别对齐,非常适合比较多个类别的值之间的差异。 本期介绍棒棒糖图的基本作图方法和优化
示例1:相同数据源下柱状图和棒棒糖图展示数值差异效果对比
示例2:使用棒棒糖图画出的好图
Part 2 :图像与代码
1、快速构建基础图形:
只需在散点图基础上,增加geom_segment( )图层即可画出棒棒糖图
示例3:基础图形
library(ggplot2)
# 随机构建数据
data <- data.frame(xv = LETTERS[1:26], #x轴:以26个字母作为类别
yv = abs(rnorm(26))) #y轴:取26个符合正态分布的随机数
## fig 1 :基础图形
fig3 = ggplot(data, aes(x = xv, y = yv)) +
geom_segment( aes(x = xv, xend = xv, y = 1, yend = yv),color = "grey40")+ #控制线段的参数,见下
geom_point(size = 4, pch = 21, bg = 5, col = 1) + #控制散点的参数
theme_bw()
fig3
#geom_segment中的参数用于控制线条相关参数
#x=xv,xend=xv 表示x轴的线条起始位置x和终止位置xend都是xv(没有线条)
#类似的,y = 1, yend = yv表示y轴线段起始点为y=1,种植点为每个类别的值即yv
2、基础优化:
(1)对线段的控制体现在对geom_segment()函数参数的调整,该函数的详细用法可参考 https://ggplot2.tidyverse.org/reference/geom_segment.html
在此我们介绍常用的参数:
x - (必须) 起点的x坐标
y - (必须) 起点的y坐标 — 此参数用作设定基线
xend - (必须)终点的x坐标
yend - (必须)终点的y坐标
size - (默认:0.5)线段的宽度
linetype - (默认:1=solid)线段的类型,可参见下图中 lty 变量类型
color - (默认: "black") 线段的颜色
alpha - (默认:1=opaque)线段的透明度
(2)对顶点(散点)的控制则由geom_point()控制,此处不再赘述,可参考:
https://ggplot2.tidyverse.org/reference/geom_point.html?q=geom_point#null
值得一提的是,R语言本身提供了一些自定义图形外观的参数,这些参数几乎可以适用在所有基于R语言的绘图包中:
cex - 形状大小
lwd - 线条宽度
col - 控制颜色类型
lty - 线条类型
pch - 标记(散点)形状
type - 点之间的连接形状
这些参数对应的可选变量见下图:
(3)其他:
- x、y轴坐标交换 :直接使用** coord_flip() **函数即可
- 对变量进行排序,使图形更加美观;此处提供3种方法供参考:forcats::fct_reorder()、dplyr::arrange()、reorder(),具体示例参见:https://www.r-graph-gallery.com/267-reorder-a-variable-in-ggplot2.html
- 要在散点上显示对应数值:使用geom_text()
示例4:简单优化后的棒棒糖图
library(ggplot2)
library(dplyr)
# 随机构建数据
data <- data.frame(xv=LETTERS[1:26],
yv=abs(rnorm(26)))
data <- data %>%
mutate(mycolor = ifelse(yv>1, "Y>1", "Y<=1")) #设置分组
## fig 2 :简单优化后的图形
fig4 <- ggplot(data, aes(x=reorder(xv,-yv), y=yv,fill = mycolor)) +
geom_segment( aes(x=reorder(xv,-yv), xend=reorder(xv,-yv), y=1, yend=yv,color=mycolor),
size=0.5,linetype=1)+#使用reorder()排序变量
geom_point(size = 5, pch = 21, color="black") +
#在散点上显示数值并保留两位小数
geom_text(aes(label =sprintf("%.2f",yv)), color = "black", size = 1.6)+
xlab("26Letters") +
scale_y_continuous("Y_Values",breaks =c(0,0.25,0.5,0.75,1,1.25,1.5,1.75,2)) +
coord_flip() +
theme_minimal()
fig4
示例5:带分组的棒棒糖图
library(ggplot2)
library(hrbrthemes)
yv1 <- abs(rnorm(6))*2
data6 <- data.frame(
x=LETTERS[1:24],
val=c( yv1, yv1+1+rnorm(6, 14,1) ,yv1+1+rnorm(6, sd=1) ,yv1+1+rnorm(6, 12, 1) ),
grp=rep(c("grp1", "grp2", "grp3", "grp4"), each=6)
) %>%
arrange(val) %>%
mutate(x=factor(x, x))
fig5 = ggplot(data6) +
geom_segment( aes(x=x, xend=x, y=0, yend=val), color="grey") +
geom_point( aes(x=x, y=val, color=grp), size=3 ) +
coord_flip()+
theme_ipsum() +
theme(
legend.position = "none",
panel.border = element_blank(),
panel.spacing = unit(0.1, "lines"),
strip.text.x = element_text(size = 8)
) +
xlab("") +
ylab("Value of Y") +
facet_wrap(~grp, ncol=1, scale="free_y")
fig5
3、变体:一个类型两个值
在棒棒糖图中,如果一个类别有两个数值,可以很方便地使用一条线段来表示二者间的差异。即在棒棒糖图中geom_segment(aes(x = xv, xend = xv, y = 1, yend = yv)中,y的起始点不再是固定的度量y=1,而是该类别的另一变量示例6:
library(ggplot2)
library(dplyr)
yv1 = abs(rnorm(26))*2
data2 <- data.frame(
xv1 = LETTERS[1:26],
yv1 = yv1,
yv2 = yv1+1+rnorm(26, sd=1)
)
fig6 = ggplot(data2) +
geom_segment( aes(x=xv1, xend=xv1, y=yv1, yend=yv2),
size=0.7,linetype=1,color="grey")+ # 此处y起始点为yv1,终止点为yv2
geom_point(aes(x=xv1,y=yv1),size = 4, pch = 20, color="#66CCEE") +
geom_point(aes(x=xv1,y=yv2),size = 4, pch = 20, color="#EE6677") +
xlab("26Letters") +
scale_y_continuous("Y_Values",breaks =c(0,1,2,3,4,5,6,7)) +
theme_minimal()
fig6
示例6这样的图形也被称之为“哑铃图”,并且已有成熟的函数可以绘制:ggalt::geom_dumbbell(),该函数的相关参数含义及用法和示例参见官方文档:https://yonicd.github.io/ggalt/reference/geom_dumbbell.html
下面给出使用该函数绘制“哑铃图”的示例:
示例7:geom_dumbbell()官方文档示例
library(ggplot2)
library(ggalt)
df <- data.frame(trt=LETTERS[1:5], l=c(20, 40, 10, 30, 50), r=c(70, 50, 30, 60, 80))
bbfig3 = ggplot(df, aes(y=trt, x=l, xend=r)) +
geom_dumbbell(size=3, color="#e3e2e1",
colour_x = "#5b8124", colour_xend = "#bad744",
dot_guide=TRUE, dot_guide_size=0.25) +
labs(x=NULL, y=NULL, title="ggplot2 geom_dumbbell with dot guide") +
theme_minimal() +
theme(panel.grid.major.x=element_line(size=0.05))
bbfig3
示例8:geom_dumbbell()绘制哑铃图
llibrary(ggalt)
health <- read.csv("https://raw.githubusercontent.com/selva86/datasets/master/health.csv")
health$Area <- factor(health$Area, levels=as.character(health$Area))
bbfig2 = ggplot(health, aes(x=pct_2013, xend=pct_2014, y=Area)) +
geom_dumbbell()+
theme_minimal()
bbfig2
library(ggalt)
library(ggplot2)
bbfig3 = ggplot(health, aes(x=pct_2013, xend=pct_2014, y=Area)) +
geom_segment(aes(x=pct_2013,
xend=pct_2014,
y=Area,
yend=Area),
color="#b2b2b2", size=1.5)+
geom_dumbbell(color="light blue",
size_x=3.5,
size_xend = 3.5,
colour_x="#edae52",
colour_xend = "#9fb059")+
labs(x=NULL, y=NULL,
title="Dumbbell Chart",
subtitle="Pct Change: 2013 vs 2014")+
geom_text(color="black", size=2, hjust=-0.5,
aes(x=pct_2013, label=pct_2013))+
geom_text(aes(x=pct_2014, label=pct_2014),
color="black", size=2, hjust=1.5)+
theme_minimal()
bbfig3
参考: