坐标轴排序
ggplot2 作图时,x轴有一个很好用的默认排序过程,但实际应用过程中往往需要自己决定排序方式。
默认情况
如果x轴是字符(chr)格式,在使用ggplot2 作图的时候,x 轴往往是自动按照字母顺序进行排序。
options(stringsAsFactors = FALSE)
name <- rep(c("C","B","D","A"),3)
value <- runif(12)
data <- data.frame(name, value)
p <- ggplot(data = data) + geom_col(aes(x = name, y = value)) +
labs(title = "Sorted by Alphabetically")+
theme(plot.title = element_text(hjust = 0.5))
解决办法
一般是将chr转换为factor然后作图
name <- rep(c("C","B","D","A"),3)
name <- factor(name, levels = c("C","B","D","A"))
value <- runif(12)
data <- data.frame(name, value)
p <- ggplot(data = data) + geom_col(aes(x = name, y = value))
这样做的好处是因子水平手动控制,数据转换过程清晰,但如果levels 太多的时候处理起来不免麻烦。
forcats 分类变量的处理工具
面对大量数据的时候,forcats是R中比较好的因子处理工具。基本功能:
- fct_reorder(): 通过另外的值进行因子排序
- fct_infreq(): 通过频率进行排序
- fct_relevel(): 手动档
- fct_anon:忽略因子水平
查看:help(forcats)
- 例1
data <- data.frame(name, value)
### 保持在数据从上到下的顺序
data$name <- fct_inorder(data$name)
ggplot(data = data) + geom_col(aes(x = name, y = value)) +
labs(title = "Order by first appearance") +
theme(plot.title = element_text(hjust = 0.5, color = "darkgreen"))
- 例2
data <- data.frame(name, value)
data_reorder <- data %>%
mutate(names = fct_reorder(name, value))
ggplot(data = data_reorder) + geom_col(aes(x = names, y = value)) +
labs(title = "Order by value") +
theme(plot.title = element_text(hjust = 0.5, color = "red"))
参数设置:.desc = TRUE从大到小排列
set.seed(13)
data <- data.frame(
test = paste0("test", sample(seq(1:20), size = 20, replace = FALSE)),
city = rep(c("Chengdu", "Beijing", "Shanghai", "Xiamen"), times = 5),
value = runif(20),
order = sample(seq(1:20), size = 20, replace = FALSE)
)
标签过长
当坐标轴标签名字过长时会压缩主绘图区域,导致图片失衡。
scale_y_discrete(labels = function(x) str_wrap(x, width = 99))