学习小组DAY6笔记——Jason

学习R包

思维导图

学习R包

安装和加载

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 
install.packages("dplyr")
library(dplyr)

dplyr的基础函数

  1. mutate(),新增列
  2. select(),按列筛选
    按列号筛选

    按列名筛选
  3. filter(),筛选行
    筛选行
  4. arrange(),按某1列或某几列对
    整个表格进行排序

    从小到大

    从大到小
  5. summarise(),汇总

dplyr的实用技能

  1. 管道操作 %>% (cmd/ctr + shift + M)
  2. count统计某列的unique值

dplyr处理关系数据

新建两个数据框
  1. 內连inner_join,取交集
inner_join(test1,test2,by = "x")
#以test1和test2的相同的x为标准,选取该行。
  1. 左连left_join
left_join(test1, test2, by = 'x') 
#以test1的x为标准,取test2中的x对应的行。
left_join(test2, test1, by = 'x')`
#以test2的x为标准,取test1中的x对应的行。
  1. 全连full_join
full_join(test1,test2,by = "x")
#以test1和test2的x的并集为标准,补全各列
  1. 半连接:返回能够与y表匹配的x表所有记录semi_join
  2. 反连接:返回无法与y表匹配的x表的所记录anti_join
  3. 简单合并
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容