"R包的安装"
- 性价比高的配置Rstudio的下载镜像
按照如下代码> options()repos
options()$BioC_mirror
image.png
安装失败时,可在每次需要下载R包时运行这两句代码即可
安装
大部分包存于CRAN网站或Biocductor
install.packages(“包”)或者BiocManager::install(“包”)加载
library(包)
require(包)安装加载三部曲
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
测验数据
image.png
""dplyr五个基础函数""
1.mutate(),新增列
image.png
2.select(),按列筛选
-
按列号筛选
image.png
image.png
image.png -
按列名筛选
image.png
image.png
3.filter()筛选行
image.png
image.png
4.arrange(),按某1列或某几列对整个表格进行排序
image.png
5.summarise():汇总
image.png
对数据进行汇总操作,结合group_by使用实用性强
6.管道操作 %>% (cmd/ctr + shift + M)
image.png
(加载任意一个tidyverse包即可用管道符号)
7.count统计某列的unique值
image.png
8.dplyr处理关系数据
将2个表进行连接,注意:不要引入factor
-
内连inner_join,取交集
image.png -
左连left_join
image.png -
全连full_join
image.png -
半连接:返回能够与y表匹配的x表所有记录semi_join
image.png -
反连接:返回无法与y表匹配的x表的所记录anti_join
反连接 - 简单合并
bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数
基本情况
image.png