dplyr包

1. dplyr简介

dplyr是R语言的数据分析包,能对dataframe类型的数据做很方便的数据处理和分析操作。d代表dataframe - plyr是英文钳子plier的谐音.

dplyr如同R的大多数包,都是函数式编程。有点类似于流水线,每个函数就是一个车间,多个车间共同完成一个生产(数据分析)任务。

而在dplyr中,就有一个管道符 %>% ,符号左侧表示数据的输入,右侧表示下游数据处理环节。

dplyr是R中专门用于数据处理的包。更具体功能包括:

•select() 从数据中选择列

•filter() 数据行的子集

•group_by()汇总数据

•summarise()汇总数据(计算汇总统计信息)

•arrange() 排序数据

mutate() 创建新变量

2. dplyr常用函数

2.1 arrange


也可以写成下面的形式: aapl %>% arrange(-Volume)

2.2 Select

排除3列 aapl %>% select(-c("Open", "High", "Low"))

2.3 Filter

aapl %>% filter((Close>=150) & (Close>Open))

2.4 Mutate(重点)

aapl %>% mutate(n=row_number())


注:转自知乎(HiDadeng)

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容