学习使用R包
安装
1.使用“install.packges”(使用CRAN网站下线) or "BiocManager::install"(使用biocductor下载)
加载命令
library(包)
require(包)
安装加载
dplyr基础函数
mutate(),新增列
select(),按列筛选
filter()筛选行
arrange(),按照某列或某几列对整个表格进行排序
summaries(),汇总
dplyr使用技能
1.管道操作%>%(cmd/ctr+shift+M)
group_by函数按照某个变量分组,对于数据集本身并不会发生什么变化,只有在与mutate(), arrange() 和 summarise() 函数结合应用的时候会体现出它的优越性,将会对这些 tbl 类数据执行分组操作 (R语言泛型函数的优越性).
2.count:统计列的unique值
dplyr处理关系数据
1.内连inner_join,去交集
2.左连left_join
左连要求以表格1最左边表格为主,看2表格中左边是否符合1的左边
3.full_join
4.半连接:返回能够与y表匹配的x表所有记录semi_join
5.反连接:返回无法与y表匹配的x表的所记录anti_join
我们有两个表:A和B,那么就分别将其当做一个集合
那么我们的左右外连接和内连接就相当于变成了这样↓ ↓ ↓
A Left join B -> A (根据返回需求 需连接上B中与A等条件的部分)
A Right join B -> B (根据返回需求 需连接上A中与B等条件的部分)
A Inner join B -> A∩B (根据返回需求 需连接上A与B等条件的部分)
图解就是这样↓ ↓ ↓
(摘自博客园shenhaha
)
6.在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数