一、安装和加载R包
- 镜像设置
 

镜像设置.png
- 安装R包
 
- R包存在与CRAN:install.packages(“R包名称”)
 - R包存在于Biocductor:BiocManager::install(“R包名称”)
 

安装R包.png
- 加载R包
 

加载R包.png
二、dplyr(数据操作R包)五个基础函数
- 新增列:mutate()
 

新增列.png
- 按列筛选:select()
 

筛选列.png
- 筛选行:filter()
 

筛选行.png
- 按某1列或某几列对整个表格进行排序:arrange()
 

表格排序.png
- 汇总分析:summarise(),再加上分组group_by()即可实现各组内分析
 

汇总分析.png
三、dplyr两个扩展技巧
- 管道操作
 
- 能够通过管道将数据从一个函数传给另外一个函数,从而用若干函数构成的管道依次变换你的数据
 - 管道运算符号为%>%(Windows快捷键为Shift+CTRL+M),其意思是将左边的运算结果,以输入的方式传递给右边的函数
 

管道操作.png
- count() :统计某列的unique值
 

统计某一列各元素出现次数.png
四、dplyr处理关系数据-类似于Excel的VLOOKUP
- 取两个数据在某一变量上的的交集:inner_join(X,Y,by = '某一变量')
 

找出两个数据集在某一变量上的交集.png
- 将两个数据集以左侧数据集为标准取交集:left_join(X,Y, by = '某一变量')
 

左连.png
- 将两个数据集整体合并:full_join(X,Y, by = '某一变量')
 

全连.png
- 返回能够与Y表匹配的X表所有记录:semi_join(X, Y, by = '某一变量')
 

半合并.png
- 返回无法与Y表匹配的X表的所有记录:anti_join(X, Y, by = '某一变量')
 

反连接.png
- 简单合并
 
- bind_rows()函数需要两个表格列数相同
 - bind_cols()函数则需要两个数据框有相同的行数
 

简单合并.png