文/叶子
以下内容均来自生信星球,本节课思维导图如下:
一、安装和加载R包
安装加载三部曲:
options("repos"=c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)
二、dplyr五个基础函数
1.mutate(),新增列
2.select(),按列筛选
3.filter(),筛选行
4.arrange(),按某1列或某几列对整个表格进行排序
5.summerise(),汇总
三、dplyr两个实用技能
1.管道操作 %>% (cmd/ctr + shift + M)
2.count统计某列的unique值
四、dplyr处理数据关系
1.內连
inner_join,取交集
2.左连
left_join
3.全连
full_join
4.半连接
返回能够与y表匹配的x表所有记录semi_join
5.反连接
返回无法与y表匹配的x表的所记录anti_join
6.简单合并
在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数
五、反思
1.我没有安装成功dplyr包
我安装的是R4.0.2和R Studio,安装dplyr包的时候出现了下面的warning:WARNING: Rtools is required to build R packages but is not currently installed. Please download and install the appropriate version of Rtools before proceeding,昨天没有学习,今早才学习,还没有解决。