第五章 工具箱
5.1 简介
本章列举了ggplot2中大量几乎对象和统计变换的一部分,并把它们按照用途进行细分。
5.2 图层叠加的总体策略
- 用以展示数据本身
- 用以展示数据的统计摘要
- 用以添加额外的元数据、上下文信息和注解
5.3 基本图形类型
每种几何对象自身即可独立构建图形,同时也可以组合起来构建更复杂的几何对象。
这些和对象均是二维的,因此x和y两种图形属性都是不可或缺的。同时,它们都可以接受colour和size图形属性,另外,填充型几何对象(条形、瓦片和多边形)还可以接受fill图形属性。点使用shape图形属性,线和路径接受linetype图形属性。
geom_area()
:面积图`geom_bar(stat = "identity")``:条形图,我们需要制定stat= "identity",因为默认的统计变换将自动对值进行技术。而统计统计变换identity将保持数据不变。
geom_line
:线条图,group属性决定了哪些观测是连接在一起的。geom_path与geom_line类似,但前者将数据点按出现的顺序进行连接,而非从左至右进行连接。geom_point
:散点图geom_polygon
:多边形,既填充后的路径。数据中的每一行代表了多边形的一个顶点geom_text
:在指定点处添加标签。它是,这些几何对象中唯一一个需要额外图形属性的:它需要制定label参数。我们可以通过设置可选的图形属性hjust和vjust来控制文本的横纵位置;此外,可以设置图形属性angle来控制文本的旋转。geom_tile
:深图(image plot)或水平图(level plot)。
5.4 展示数据分布
5.5 处理遮盖绘制问题
散点图是研究两个连续型变量间关系的重要工具。但是当数据量很大时,这些点经常会出现重叠现象,从而掩盖真实的关系。处理办法:
- 小规模的遮盖问题可以通过绘制更小的点(
shape = "."
,一像素大小的点)加以缓解,或者使用中空的符号(shape = 1
) - 对于更大的数据集产生的更为严重的遮盖问题,可以使用
alpha
(透明度)让点呈现透明效果。假如以比值的形式制定alpha值,则分母表示一个位置的颜色变为完全不透明时所需重叠的数量。在R中最小值为1/256
5.10 添加图形注解
geom_text
:可添加文字叙述或为点添加标签,往往用于对离群点或其他重要的点记性标注geom_vline
,geom_hline
:像图形添加垂直或水平线geom_abline
:添加任意斜率和截距的直线geom_rect
:向感兴趣的区域添加矩形,拥有xmin、xmax、ymin和ymax四个图形属性。geom_line
,geom_path
和``geom_segment`都可以添加直线。所有这些几何对象都有一个arrow参数,可以用于在线上放置一个箭头。我们也可以使用arrow()函数绘制箭头,它拥有angle, length, ends以及type几个参数。