学习小组Day6笔记-朱殊璇

R包的学习:dplyr包

dplyr包主要用于数据清洗和整理,主要功能有:行选择、列选择、统计汇总、窗口函数、数据框交集等是非常高效、友好的数据处理包。

一、安装dplyr包

1.jpg

二、使用dplyr包:五个基础函数

1、mutate(),新增列

2.jpg

2、select(),筛选列

(1)按列号筛选

3.jpg

(2)按列名筛选

4.jpg

3、filter(),筛选行

5.jpg

4、arrange(),按某1列或某几列对整个表格进行排序

6.jpg

5、summarise(),汇总

7.jpg

三、dplyr的两个实用功能

1、管道操作

8.jpg

2、统计某列的unique值

9.jpg

四、dplyr处理关系数据:将两个表格进行连接

10.jpg

1、inner_join:内连,取交集

11.jpg

2、left_join:左连

12.jpg

3、full_join:全连

13.jpg

4、semi_join:半连接,返回能与y表匹配的x表所有记录

14.jpg

5、anti_join:反连接

15.jpg

6、简单合并:bind_rows();bind_cols()

16.jpg
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。