学习小组Day6笔记--winningxu

R包的学习

1.mutate(),新增列


微信截图_20220508090157.png

2.select(),按列筛选
(1)按列号筛选


微信截图_20220508090234.png

(2)按列名筛选


微信截图_20220508090354.png

3.filter()筛选行


微信截图_20220508090612.png

4.arrange(),按某1列或某几列对整个表格进行排序


微信截图_20220508090646.png

5.summarise():汇总
对数据进行汇总操作,结合group_by使用实用性强


微信截图_20220508090735.png

dplyr两个实用技能

1:管道操作 %>% (cmd/ctr + shift + M)
(加载任意一个tidyverse包即可用管道符号)


微信截图_20220508090912.png

2:count统计某列的unique值


微信截图_20220508090944.png

dplyr处理关系数据
即将2个表进行连接,注意:不要引入factor


微信截图_20220508091028.png

1.內连inner_join,取交集


微信截图_20220508091100.png

2.左连left_join


微信截图_20220508091134.png

3.全连full_join


微信截图_20220508091208.png

4.半连接:返回能够与y表匹配的x表所有记录semi_join


微信截图_20220508091240.png

5.反连接:返回无法与y表匹配的x表的所记录anti_join


微信截图_20220508091321.png

6.简单合并
在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数


![微信截图_20220508091420.png](https://upload-images.jianshu.io/upload_images/27960635-c6d8d69096d4a3b7.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

文章所有图片均引用自生信星球。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容