R包的学习:dplyr包
dplyr包主要用于数据清洗和整理,主要功能有:行选择、列选择、统计汇总、窗口函数、数据框交集等是非常高效、友好的数据处理包。
一、安装dplyr包
二、使用dplyr包:五个基础函数
1、mutate(),新增列
2、select(),筛选列
(1)按列号筛选
(2)按列名筛选
3、filter(),筛选行
4、arrange(),按某1列或某几列对整个表格进行排序
5、summarise(),汇总
三、dplyr的两个实用功能
1、管道操作
2、统计某列的unique值
四、dplyr处理关系数据:将两个表格进行连接
1、inner_join:内连,取交集
2、left_join:左连
3、full_join:全连
4、semi_join:半连接,返回能与y表匹配的x表所有记录
5、anti_join:反连接
6、简单合并:bind_rows();bind_cols()