数据
数据来源
使用的数据集mtcars是R自带的数据
数据格式说明
该数据集的数据类型为data.frame,一共有11列,每一列对应于汽车的某一特征。每一行记录一种汽车的详细信息,本次绘图一共截取了mtcars的前30行数据。
绘图
上一期已经讲了
- 如何画最基础的散点图描述两个变量之间的关系
- 如何让散点图按照某一特征分类别表示
这一期将利用mtcars数据集绘制散点图,并且用label标注图中的点
-
为点带上文本label(image1)
# library library(ggplot2) library(hrbrthemes) #可以去除灰色的背景色,让坐标轴的轴名在坐标轴的尽头 data=head(mtcars, 30) #摘取数据集中的前30行 ggplot(data, aes(x=wt, y=mpg)) + #输入绘图的数据 geom_point(shape=23,color="yellow",fill="pink",size=3.0,stroke=1.5,alpha=1.0) + #画点 geom_text( #为点注上label label=data$mpg, nudge_x = 0.25, nudge_y = 0.25, check_overlap = T, size=3, )+ theme_ipsum() #去除灰色的背景色,让坐标轴的轴名在坐标轴的尽头
ggplot函数设定data为绘图的数据,且wt列为横坐标,mpg列为纵坐标。
geom_point函数用来画点,里面设置了若干参数用来定义点的外形,比如这里设置点的形状是菱形,轮廓颜色是黄色,填充颜色是粉色,点的大小设置为3,轮廓宽度设置为1.5,透明度是1。
geom_text函数用来定义标签的外形,"label=data$mpg"表示以mpg作为y坐标,所以定义点的label是用mpg描述的,如果要用行名(汽车名字)作为label,可以设置“label=rownames(data)”,“ nudge_x = 0.25, nudge_y = 0.25,”表示label和点之间的相对距离,“check_overlap = T”表示不让label重合,“size”定义label的大小。
-
为点带上有框框的label(image2)
只要把geom_text改成geom_label即可
-
在图中任意某一处带上label
# library library(ggplot2) library(hrbrthemes) #可以去除灰色的背景色,让坐标轴的轴名在坐标轴的尽头 # Keep 30 first rows in the mtcars natively available dataset data=head(mtcars, 30) # Add one annotation ggplot(data, aes(x=wt, y=mpg)) + #输入绘图的数据 geom_point(shape=23,color="yellow",fill="pink",size=3.0,stroke=1.5,alpha=1.0) + # 画点 geom_label( #定义标签 label="Look at this!", x=4.1, y=20, label.padding = unit(0.55, "lines"), label.size = 0.35, color = "black", fill="#69b3a2" )+ theme_ipsum() #去除灰色的背景色,让坐标轴的轴名在坐标轴的尽头
由于是带有框框的标签,因此还要定义框框和字体的大小,label.padding就是定义了框框的大小,label.size是框框的轮廓大小,color是框框的轮廓颜色,fill是框框的填充颜色。此外还需要提供label的位置(就是x坐标和y坐标)
-
筛选符合条件的点标注出来
library(ggplot2) library(dplyr) library(tibble) library(hrbrthemes) #可以去除灰色的背景色,让坐标轴的轴名在坐标轴的尽头 # Keep 30 first rows in the mtcars natively available dataset data=head(mtcars, 30) # Change data rownames as a real column called 'carName' data <- rownames_to_column(data,var="carName") #调整数据结构 # Plot ggplot(data, aes(x=wt, y=mpg)) + #绘图数据 geom_point(shape=23,color="yellow",fill="pink",size=3.0,stroke=1.5,alpha=1.0) + #画点 geom_label( #画标签 data= filter(data,mpg>20 & wt>3), # 筛选符合条件的点 aes(label=carName), #定义以carName列命名 nudge_x = 0.3, nudge_y = 0.1, #调整点与label的相对位置 label.padding = unit(0.2, "lines"), # 定义框框的大小 label.size = 1, #定义框框的边缘宽度 size=3, #定义label的大小 fill="red", #定义框框的填充色 color="yellow", #定义框框的边缘颜色是黄色 )+ theme_ipsum() #去除灰色的背景色,让坐标轴的轴名在坐标轴的尽头
为什么要把行名转化成具体的一列并以“carName”作为列名,因为下面的代码要以汽车名字作为label,而在画这种图时,如果要命名则需要用某一列命名,行名不是具体的某一列,因此要先转化一下。转换后的数据如下所示,可以看到,carName成为一列独立的数据。如果不是以汽车名字作为label,则不需要转换数据结构,直接aes(label=data$mpg)或者其它列名