DAY6——清芷

学习R包

R包就是多个函数的集合,利用RStudio可以实现其各种功能,按需选择。

R包的安装和加载

#镜像设置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 
#安装需要的R包(下面指令两个二选一,根据要安装的R包来自于CRAN网站还是Biocductor)
install.package("")
BiocManger::install("")
#加载(以下两个命令均可)
library()
require()

dplyr的基本函数

示例数据:test <- iris[c(1:2,51:52,101:102),]

  1. mutate(),新增列
    增加一个new新列,数据为两列相乘
  2. select()按列筛选
    image.png
  3. filter()筛选行
    image.png
  4. arrange()按照某一列或者某几列对整个表格进行排序
    排序
  5. summarise()汇总
    image.png

dplyr的两个技能

【r<-基础|分析】初学者学习tidyverse

  1. 管道操作%>%(ctrl+shift+M)


    image.png
  2. count()统计某列的unique值
    image.png

dplyr处理关系数据

  1. 内连inner_join()取交集
inner_join(test1, test2, by = "x")
##   x z y
## 1 b A 2
## 2 e B 5
## 3 f C 6
  1. 全连full_join()
full_join( test1, test2, by = 'x')
##   x    z  y
## 1 b    A  2
## 2 e    B  5
## 3 f    C  6
## 4 x    D NA
## 5 a 
## 6 c 
## 7 d 
  1. 左连left_join()
left_join(test1, test2, by = 'x')#以test1作为参照物
##   x z  y
## 1 b A  2
## 2 e B  5
## 3 f C  6
## 4 x D NA
left_join(test2, test1, by = 'x')#以test2为参照物
##   x y    z
## 1 a 1 
## 2 b 2    A
## 3 c 3 
## 4 d 4 
## 5 e 5    B
## 6 f 6    C
  1. 半连接semi_join返回能够与y表匹配的x表所有记录
semi_join(x = test1, y = test2, by = 'x')
##   x z
## 1 b A
## 2 e B
## 3 f C
  1. 反连接:返回无法与y表匹配的x表的所记录anti_join
anti_join(x = test2, y = test1, by = 'x')
##   x y
## 1 a 1
## 2 c 3
## 3 d 4
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。