安装和加载R包
微信图片_20220413221154.png
dplyr五个基础函数
1、.mutate(),新增列
微信图片_20220413223650.png
2、select(),按列筛选
微信图片_20220413223907.png
3、.filter()筛选行
微信图片_20220413224030.png
4、.arrange(),按某1列或某几列对整个表格进行排序
微信图片_20220413224138.png
5、summarise():汇总
![微信图片_20220413224322.png
微信图片_20220413224322.png
dplyr两个实用技能
1、管道操作 %>% (cmd/ctr + shift + M)
微信图片_20220413224500.png
2、count统计某列的unique值
微信图片_20220413224629.png
dplyr处理关系数据
1.內连inner_join,取交集
微信图片_20220413224829.png
2、左连left_join
微信图片_20220413224932.png
3、全连full_join
微信图片_20220413225029.png
4、半连接:返回能够与y表匹配的x表所有记录semi_join
微信图片_20220413225132.png
5、反连接:返回无法与y表匹配的x表的所记录anti_join
微信图片_20220413225132.png
6、简单合并
bind_rows()
函数需要两个表格列数相同,而bind_cols()
函数则需要两个数据框有相同的行数
微信图片_20220413225333.png