【R】散点图(二)

数据

数据来源

使用的数据集mtcars是R自带的数据

数据格式说明
data

该数据集的数据类型为data.frame,一共有11列,每一列对应于汽车的某一特征。每一行记录一种汽车的详细信息,本次绘图一共截取了mtcars的前30行数据。

绘图

上一期已经讲了

  • 如何画最基础的散点图描述两个变量之间的关系
  • 如何让散点图按照某一特征分类别表示

这一期将利用mtcars数据集绘制散点图,并且用label标注图中的点

  • 为点带上文本label(image1)

    # library
    library(ggplot2)  
    library(hrbrthemes)      #可以去除灰色的背景色,让坐标轴的轴名在坐标轴的尽头
    data=head(mtcars, 30)    #摘取数据集中的前30行
    
    ggplot(data, aes(x=wt, y=mpg)) +      #输入绘图的数据
    geom_point(shape=23,color="yellow",fill="pink",size=3.0,stroke=1.5,alpha=1.0) + #画点
    geom_text(                          #为点注上label
        label=data$mpg, 
        nudge_x = 0.25, nudge_y = 0.25, 
        check_overlap = T,
        size=3,
      )+
      theme_ipsum()        #去除灰色的背景色,让坐标轴的轴名在坐标轴的尽头   
    

ggplot函数设定data为绘图的数据,且wt列为横坐标,mpg列为纵坐标。
geom_point函数用来画点,里面设置了若干参数用来定义点的外形,比如这里设置点的形状是菱形,轮廓颜色是黄色,填充颜色是粉色,点的大小设置为3,轮廓宽度设置为1.5,透明度是1。
geom_text函数用来定义标签的外形,"label=data$mpg"表示以mpg作为y坐标,所以定义点的label是用mpg描述的,如果要用行名(汽车名字)作为label,可以设置“label=rownames(data)”,“ nudge_x = 0.25, nudge_y = 0.25,”表示label和点之间的相对距离,“check_overlap = T”表示不让label重合,“size”定义label的大小。

image1

  • 为点带上有框框的label(image2)
    只要把geom_text改成geom_label即可

    image2

  • 在图中任意某一处带上label

    # library
    library(ggplot2)
    library(hrbrthemes)      #可以去除灰色的背景色,让坐标轴的轴名在坐标轴的尽头
    # Keep 30 first rows in the mtcars natively available dataset
    data=head(mtcars, 30)
    
    # Add one annotation
    ggplot(data, aes(x=wt, y=mpg)) +    #输入绘图的数据
    geom_point(shape=23,color="yellow",fill="pink",size=3.0,stroke=1.5,alpha=1.0) + # 画点
    geom_label(                                  #定义标签
        label="Look at this!", 
        x=4.1,
        y=20,
        label.padding = unit(0.55, "lines"), 
        label.size = 0.35,
        color = "black",
        fill="#69b3a2"
      )+
      theme_ipsum()        #去除灰色的背景色,让坐标轴的轴名在坐标轴的尽头   
    

由于是带有框框的标签,因此还要定义框框和字体的大小,label.padding就是定义了框框的大小,label.size是框框的轮廓大小,color是框框的轮廓颜色,fill是框框的填充颜色。此外还需要提供label的位置(就是x坐标和y坐标)

image3
  • 筛选符合条件的点标注出来

    library(ggplot2)
    library(dplyr)
    library(tibble)
    library(hrbrthemes)      #可以去除灰色的背景色,让坐标轴的轴名在坐标轴的尽头
    # Keep 30 first rows in the mtcars natively available dataset
    data=head(mtcars, 30)
    
    # Change data rownames as a real column called 'carName'
    data <- rownames_to_column(data,var="carName") #调整数据结构
    
    # Plot
    ggplot(data, aes(x=wt, y=mpg)) +    #绘图数据
    geom_point(shape=23,color="yellow",fill="pink",size=3.0,stroke=1.5,alpha=1.0) + #画点
    geom_label(                            #画标签
      data= filter(data,mpg>20 & wt>3), # 筛选符合条件的点
      aes(label=carName),                     #定义以carName列命名
      nudge_x = 0.3, nudge_y = 0.1,     #调整点与label的相对位置
      label.padding = unit(0.2, "lines"),  # 定义框框的大小
      label.size = 1,                               #定义框框的边缘宽度
      size=3,                                         #定义label的大小
      fill="red",                                      #定义框框的填充色
      color="yellow",                           #定义框框的边缘颜色是黄色             
    )+
    theme_ipsum()        #去除灰色的背景色,让坐标轴的轴名在坐标轴的尽头   
    

为什么要把行名转化成具体的一列并以“carName”作为列名,因为下面的代码要以汽车名字作为label,而在画这种图时,如果要命名则需要用某一列命名,行名不是具体的某一列,因此要先转化一下。转换后的数据如下所示,可以看到,carName成为一列独立的数据。如果不是以汽车名字作为label,则不需要转换数据结构,直接aes(label=data$mpg)或者其它列名


image4
image5
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容