学习小组Day-6笔记 会飞的蚂蚁

逝者远去,存者自勉
image.png

学习使用dplyr包

-安装加载包

install.packages("dplyr") 
library(dplyr)
  • 五个基本函数的使用
    1.mutate()
    新增数据框的变量
    mutate(x,newvar=)
    2.select()挑选变量
    select(x,1,2...) 3.filter()行筛选filter(x,var=某观测值)`
    4..arrange(),按某1列或某几列对整个表格进行排序
    5.summarise():汇总感觉跟summary()函数有相似之处
  • dplyr包的使用技巧
    1.管道操作 %>% (cmd/ctr + shift + M)这个在linux上面的原理一样
    2.count统计某列的unique值
  • dplyr处理关系数据
    1.內连inner_join,取交集
    inner_join(test1, test2, by = "x")
    2.左连left_join
    left_join(dataframe1, dataframe2, by = 'x')
    3.全连full_join
    full_join( test1, test2, by = 'x')
    4.半连接:返回能够与y表匹配的x表所有记录semi_join
    5.反连接:返回无法与y表匹配的x表的所记录anti_join
    6.简单合并:rbind cbind.
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容