散点图(scatter plot)是数据处理中最最常见的基本图表,两个变量,一个作 “x ” ,一个作 “y” ,通常还会配一个拟合曲线,预测未知值。
在R小姐中,我们有很多种方法去绘制基本图表,比如说:R小姐中的基本绘图函数,它们制图非常迅速,适用于简单图表的绘制。
但对于一些复杂的图表,我们会选用更加有用的函数。比如说:ggplot2 。利用 ggplot2 绘制出来的图表非常好看。
首先安装 **ggplot2 **和 数据包 **gcookbook **:
install.packages('ggplot2')
install.packages('gcookbook')
1
本期所要使用的数据
引入包。
library(ggplot2)
library(gcookbook)
首先看一下本期文章所用的数据,来自于 gcookbook 包中的 **heightweight **。
gcookbook::heightweight
heightweight的数据集。
2
利用基本plot()函数绘制散点图
比如说我们想看看 ageYear 与 heightIn 两个变量之间的关系,我们首先可以通过绘制散点图看看两变量之间是否存在一种常见的关系。比如说线性相关之类的,随后再做进一步的处理。
传入变量 “x” , “y”
plot(x=heightweight$ageYear,y=heightweight$heightIn)
3
利用ggplot2中的qplot()绘制散点图
利用 qplot() 函数也能够绘制出与基本函数一样的图表。
qplot(x=heightweight$ageYear,y=heightweight$heightIn)
如果两个变量在同一个数据框里,我们也可以这样引用。
qplot(x=ageYear,y=heightIn,data = heightweight)
两者的绘图效果是一样的,只是X轴和Y轴的名称有一些区别。
4
利用ggplot2中的ggplot()绘制散点图
ggplot()函数与上面的两个函数使用方式,明显不同。
ggplot(data = heightweight,mapping = aes(x=ageYear,y=heightIn)) + geom_point()
首先传入数据集 data ,然后利用 aes()(aesthetic attributes)绘制图形属性,利用geom()(geometric object)绘制几何对象,散点图。
5
优化图表
对得到的图表我们可以更改形状(shape)、颜色(colour)和大小(size)。
ggplot(data = heightweight,mapping = aes(x=ageYear,y=heightIn)) +
geom_point(shape=3,colour='red',size=4)
当然也可以通过第三个变量 sex 性别进行分组。
1、利用颜色(colour)对性别(sex)进行分组。
ggplot(data = heightweight,mapping = aes(x=ageYear,y=heightIn,colour=sex)) +
geom_point()
2、利用形状(shape)对性别(sex)进行分组。
ggplot(data = heightweight,mapping = aes(x=ageYear,y=heightIn,shape=sex)) +
geom_point()
3、当然也可以两者结合使用。
ggplot(data = heightweight,mapping = aes(x=ageYear,y=heightIn,shape=sex,colour=sex)) +
geom_point() +
scale_shape_manual(values = c(0,3)) +
scale_color_brewer(palette = 'Set2')
本期文章就到这里。
借中科院物理所曹则贤先生的一句话共勉:希望大家抽空把自己的面拓宽一点,有时候多往深里去理解一点、去试试水到底有多深,这样可能会让你能静下心来安心地去做一点事情。
下期再见。喜欢的话就多多转发支持一下。
你可能还想看
等你很久啦,长按加入古同社区