写在前面。
这篇文章对应原书的第6章,主要介绍一些描述数据分布的可视化图形。主要包括如下这些:
- 直方图
- 密度图
- 频数多边形
- 箱线图
- 小提琴图
- Wilkinson点图
密度图
核密度图
也是很常用的一种反映数据分布的图形。
分组密度图
如何绘制分组密度图呢?将分组变量映射给fill
或者color
参数。
- 映射给
fill
ggplot(data = birthwt, aes(x = bwt, fill = smoke)) +
geom_density(alpha = .2)
[图片上传失败...(image-d931e6-1696585145197)]
- 映射给
colour
ggplot(data = birthwt, aes(x = bwt, colour = smoke)) +
geom_density(alpha = .2)
[图片上传失败...(image-60401e-1696585145197)]
- 分面
另一种方式是根据分组变量进行图形分面。
ggplot(data = birthwt, aes(x = bwt)) +
geom_density() +
facet_grid(smoke~.)
[图片上传失败...(image-b3dcb2-1696585145197)]
注意,前文中已经对smoke
变量进行了因子化处理
和标签指定
。