Learning 'dplyr' package
处理数据神器'dplyr'包
mutate()
mutate(data, new_var = expression… )
根据公式计算产生新列
select()
select(data, …)
根据列号或者列名选出对应列
-
为剔除该列
select(df,-a)
剔除a列
filter()
filter(data, logical expression)
根据逻辑表达式选出对应观测(行)
arrange()
arrange(.data, x, .by_group = FALSE
按x进行排序, 可以按多个变量进行排序, 默认为升序排列
desc(x)
按x降序排列
group_by()
group_by(df, x)
对x进行分组
ungroup
取消分组
summarise()
summarize(data, var = func())
汇总分析, 可以联合group_by()
一起用进行分组汇总
管道操作 %>%
将左边的对象作为第一个参数传递到右边的函数中
x %>% f(y)
等价于f(x,y)