R包的学习
1.mutate(),新增列

微信截图_20220508090157.png
2.select(),按列筛选
(1)按列号筛选

微信截图_20220508090234.png
(2)按列名筛选

微信截图_20220508090354.png
3.filter()筛选行

微信截图_20220508090612.png
4.arrange(),按某1列或某几列对整个表格进行排序

微信截图_20220508090646.png
5.summarise():汇总
对数据进行汇总操作,结合group_by使用实用性强

微信截图_20220508090735.png
dplyr两个实用技能
1:管道操作 %>% (cmd/ctr + shift + M)
(加载任意一个tidyverse包即可用管道符号)

微信截图_20220508090912.png
2:count统计某列的unique值

微信截图_20220508090944.png
dplyr处理关系数据
即将2个表进行连接,注意:不要引入factor

微信截图_20220508091028.png
1.內连inner_join,取交集

微信截图_20220508091100.png
2.左连left_join

微信截图_20220508091134.png
3.全连full_join

微信截图_20220508091208.png
4.半连接:返回能够与y表匹配的x表所有记录semi_join

微信截图_20220508091240.png
5.反连接:返回无法与y表匹配的x表的所记录anti_join

微信截图_20220508091321.png
6.简单合并
在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数


文章所有图片均引用自生信星球。