数据可视化中,分面(Faceting)是一种将数据分割成多个子图以便更好理解和比较的技术。分面允许在不同的子图中显示数据的不同子集,从而更全面地展示整体趋势和关系。在R语言中,有多种方式可以实现分面,其中最常用的是使用ggplot2包的facet_wrap()和facet_grid()函数。
facet_grid双变量分面
mtcars_tbl <- rownames_to_column(mtcars, var = 'car') %>%
mutate(cyl = factor(cyl),
am = if_else(am == 1, 'A', 'M'),
vs = if_else(vs == 1, 'V', 'L'))
ggplot(mtcars_tbl, aes(x = wt, y = mpg)) +
geom_point(shape = 21,
alpha = 0.3,
aes(size = disp, fill = factor(cyl))) +
scale_fill_npg() +
scale_size(range = c(1, 20)) +
facet_grid(factor(vs)~factor(am),
scales = 'free') +
theme_bw()
这段代码使用了R语言中的ggplot2
包,用于创建一个散点图,对数据进行可视化呈现。以下是对代码的详细介绍:
-
数据预处理:
-
rownames_to_column(mtcars, var = 'car')
:将原始数据集中的行名(行索引)转为一列名为'car'的变量。 -
mutate()
:通过mutate
函数进行变量的修改和添加。 -
cyl = factor(cyl)
:将cyl
列的数据转换为因子变量。 -
am = if_else(am == 1, 'A', 'M')
:将am
列的数据进行条件判断,如果为1,则赋值为'A',否则为'M'。 -
vs = if_else(vs == 1, 'V', 'L')
:将vs
列的数据进行条件判断,如果为1,则赋值为'V',否则为'L'。
-
-
绘制散点图:
-
ggplot(mtcars_tbl, aes(x = wt, y = mpg))
:创建一个ggplot
对象,设置数据为mtcars_tbl
,横轴变量为wt
,纵轴变量为mpg
。 -
geom_point()
:添加散点图层。 -
shape = 21
:设置散点的形状为圆点,同时具有边框。 -
alpha = 0.3
:设置点的透明度为0.3,使得图中的点有一定的透明效果。 -
aes(size = disp, fill = factor(cyl))
:根据disp
列设置点的大小,根据cyl
列设置点的填充颜色。
-
-
设置颜色和大小的比例尺:
-
scale_fill_npg()
:应用颜色比例尺,用于对fill
(填充颜色)进行设置。 -
scale_size(range = c(1, 20))
:应用大小比例尺,将disp
列的数值映射到点的大小,范围在1到20之间。
-
-
设置分面:
-
facet_grid(factor(vs)~factor(am), scales = 'free')
:根据vs
和am
两个因子变量进行分面,其中scales = 'free'
表示每个分面的坐标轴可以自由变化。
-
-
设置主题:
-
theme_bw()
:设置图形的主题为白底黑边。
-
facet_wrap单变量分面
small_diamonds <- sample_n(diamonds, size = 500)
ggplot(data = small_diamonds, aes(x = carat, y = price)) +
geom_point(shape = 21, size = 2,
color = 'black', aes(fill = cut)) +
scale_fill_npg() +
facet_wrap(~color, ncol = 3) +
theme_bw() +
theme(legend.position = c(0.65, 0.15),
legend.direction = 'horizontal')
这段代码使用了R语言中的ggplot2
包,用于创建一个散点图,对小样本的钻石数据进行可视化呈现。以下是对代码的详细解释:
-
创建小样本数据:
-
sample_n(diamonds, size = 500)
:从diamonds
数据集中随机抽取500个样本,形成一个小样本数据集small_diamonds
。
-
-
绘制散点图:
-
ggplot(data = small_diamonds, aes(x = carat, y = price))
:创建一个ggplot
对象,设置数据为small_diamonds
,横轴变量为carat
,纵轴变量为price
。 -
geom_point()
:添加散点图层。 -
shape = 21
:设置散点的形状为圆点,并具有边框。 -
size = 2
:设置点的大小为2。 -
color = 'black'
:设置点的边框颜色为黑色。 -
aes(fill = cut)
:根据cut
列的不同水平,给点设置不同的填充颜色。
-
-
设置颜色比例尺:
-
scale_fill_npg()
:应用颜色比例尺,用于对cut
列的不同水平进行颜色映射。
-
-
设置分面:
-
facet_wrap(~color, ncol = 3)
:根据color
列进行分面,每行显示3个分面。
-
-
设置主题:
-
theme_bw()
:设置图形的主题为白底黑边。 -
theme(legend.position = c(0.65, 0.15), legend.direction = 'horizontal')
:设置图例(legend)的位置为相对于整个图形的0.65(横坐标)和0.15(纵坐标),并设置图例的方向为水平方向。
-
facet_matrix不同变量分面
library(ggforce)
ggplot(mtcars_tbl, aes(x = .panel_x, y = .panel_y)) +
geom_point(shape = 21,
aes(fill = factor(cyl))) +
scale_fill_npg() +
facet_matrix(vars(mpg, disp, wt, qsec)) +
theme_bw()
这段代码使用了R语言中的ggplot2
包以及ggforce
扩展包,用于创建一个矩阵散点图,对mtcars_tbl
数据集进行可视化呈现。以下是对代码的详细介绍:
-
绘制矩阵散点图:
-
ggplot(mtcars_tbl, aes(x = .panel_x, y = .panel_y))
:创建一个ggplot
对象,设置数据为mtcars_tbl
,横轴变量为.panel_x
,纵轴变量为.panel_y
。这里使用了.panel_x
和.panel_y
,这是facet_matrix
函数生成的特殊坐标。 -
geom_point()
:添加散点图层。 -
shape = 21
:设置散点的形状为圆点,并具有边框。 -
aes(fill = factor(cyl))
:根据cyl
列的不同水平,给点设置不同的填充颜色。
-
-
设置颜色比例尺:
-
scale_fill_npg()
:应用颜色比例尺,用于对cyl
列的不同水平进行颜色映射。
-
-
设置分面矩阵:
-
facet_matrix(vars(mpg, disp, wt, qsec))
:使用facet_matrix
函数,指定在矩阵中展示的变量,这里是mpg
、disp
、wt
、qsec
。这样就会生成一个矩阵,横轴和纵轴上分别是这四个变量,每个小格子中都有一个散点图。
-
-
设置主题:
-
theme_bw()
:设置图形的主题为白底黑边。
-