散点图主要用于描述两个连续变量之间的关系,通过散点图发现变量之间的相关性强度、是否存在线性关系等。
简单散点图
上篇文章R语言与散点图介绍了如何用ggplot2包中的geom_point()函数绘制简单的散点图。
散点图参数调整
数据产生
利用rnorm()函数产生符合正态分布的随机数,data.frame()函数形成数据框。
a <-< span=""> rnorm(150,mean =2, sd = 10)#ab <-< span=""> 2*a + rnorm(100, mean = 10, sd = 10)
## Warning in 2 * a + rnorm(100, mean = 10, sd = 10): 长的对象长度不是短的对象长度## 的整倍数
#bdf <-< span=""> data.frame(x = a, y = b)#df
简单绘图
library(ggplot2)
ggplot(data = df, mapping = aes(x = a, y = b)) + geom_point()
调整点的类型和颜色
各类符号常用于画图时设置点的不同形状,pch,即plotting character。默认参数是点状。pch范围用0-25来表示26个标识。为了使大家更清晰的了解R语言的绘图符号设置参数,我给大家画了一张“pch标识图”。
plot(0:25,pch=0:25,cex=1.5, main="pch标识图",xlab="pch编号")
只需要添加参数pch和col即可实现颜色和形状设置
ggplot(data = df, mapping = aes(x = a, y = b)) + geom_point(pch = 10, col = "red")
按照分组绘制不同颜色的散点图
设置分组以后可将分组变量(因子或字符变量)赋予某种颜色或形状属性,实现分组颜色散点图的绘制。首先用sample()产生新的一列,为x,y设置新的属性:0或1。
c <-< span=""> sample(c(0,1), size = 150, replace = TRUE)#cdf_abc<-< span="">data.frame(x = a, y = b, z = c)str(df_abc)#查看变量属性
## 'data.frame': 150 obs. of 3 variables:## $ x: num 14.353 -0.171 6.116 -12.312 -3.416 ...## $ y: num 29.6936 -0.8661 10.1574 -0.0841 -2.2291 ...## $ z: num 1 1 0 1 0 0 0 0 1 1 ...
可以看到现在新的属性列z中的0或1属于数值型变量,需要转化为因子型变量才能作为属性赋予颜色或形状等等,这点一定要做笔记,后面的学习中还会经常遇到这种情况。很多小伙伴很容易忽略。因子转换可以用factor()函数实现。
df_abc$z <-< span=""> factor(df_abc$z)str(df_abc$z)#再次查看转变后的变量属性
## Factor w/ 2 levels "0","1": 2 2 1 2 1 1 1 1 2 2 ...
根据分组设置颜色
ggplot(data = df_abc, mapping = aes(x = x, y = y, col = z)) + geom_point(size = 2.5)
根据分组设置形状
ggplot(data = df_abc, mapping = aes(x = x, y = y, shape = z)) + geom_point(size = 2.5)
今天的分享先到这里,下次有空将继续分享。可能小伙伴不喜欢系统自动分配的颜色,下篇将给大家分享如何用多种方法实现个性化设置点的颜色和形状。欢迎大家关注评论转发。