2021.4.23
持续更新中。。。
参考:《R语言数据可视化之美》、《ggplot2:数据分析与图形艺术》、《R数据可视化手册》、学术数据分析及可视化
1. ggplot2简介
ggplot2是一个用来绘制统计图形(可视化数据)的R软件包。采用图层的设计方式,从原始的图层开始,首先绘制原始数据,然后不断地添加图形注释和统计汇总结果。
2. ggplot2的特点
- 采用图层设计方式,有明确的起始图层。图层之间的叠加用
+
实现,越往后,图层越在上方。 - 将表征数据和图形细节分开,能快速将图形表现出来。
- 扩展包丰富,有专门调整颜色、字体和主题等的辅助包。
3. ggplot2基本语法
整套语法的核心是如何将数据(变量)映射到几何对象(geom,包括点、线、面等)的图形属性(aes,包括颜色、形状、大小等)。此外还包括数据的统计变换(stats)、绘制特定坐标系(coord)、形成分面(facet)等过程。
- ggplot():底层绘制函数。参数主要是需要可视化的数据集(通常是数据框),以及一些常规的控制颜色、形状、大小等图形属性映射。
- geom_xxx:需要转换成的几何图形。常用的有:geom_point()、geom_line()、geom_area()等
- stat_xxx:统计变换。对数据进行的某种汇总,例如对数据分组计数以创建直方图。
4. ggplot2语法进阶
4.1 图层的五个组成部分
- 数据(data)
- 一组图形属性映射(mapping)
- 一种几何对象
- 一种统计变换
- 一种位置调整方式,
4.1 绘图基本过程
第一步:利用ggplot()
函数创建底层图形
两个主要参数:数据和图形属性映射
- 数据,数据框
- 图形属性映射
ase()
主要参数
2.1 需要映射到图形x轴和y轴的第一和第二变量
2.2 需要映射到图形颜色/形状/大小等的第三变量
2.3 是否需进行分组的变量
注:
- ggplot()函数创建的图形对象在加上其他图层之前是无法显示的
aes()
的参数尽量简单化,可以后续进行自定义的修改- 当需要使用多个数据的时候,底层可直接用不接任何参数的
ggplot()
,但是在后续绘图添加数据的时候,数据的添加需要使用data =
的形式。
第二步:利用几何对象geom_xxx
函数生成图形
每个几何对象都有一组它能识别的图形属性和一组绘图所需的值
每个几何几何对象都对应着一个默认的统计变换和位置参数,可以直接进行修改