1. dplyr简介
dplyr是R语言的数据分析包,能对dataframe类型的数据做很方便的数据处理和分析操作。d代表dataframe - plyr是英文钳子plier的谐音.
dplyr如同R的大多数包,都是函数式编程。有点类似于流水线,每个函数就是一个车间,多个车间共同完成一个生产(数据分析)任务。
而在dplyr中,就有一个管道符 %>% ,符号左侧表示数据的输入,右侧表示下游数据处理环节。
dplyr是R中专门用于数据处理的包。更具体功能包括:
•select() 从数据中选择列
•filter() 数据行的子集
•group_by()汇总数据
•summarise()汇总数据(计算汇总统计信息)
•arrange() 排序数据
mutate() 创建新变量
2. dplyr常用函数
2.1 arrange
2.2 Select
2.3 Filter
2.4 Mutate(重点)
注:转自知乎(HiDadeng)