R包学习(dplyr为例)
R包是一系列函数的合集,安装加载R包后可以通过调用别人写好的函数完成自己的数据处理需求
R包安装
R包的来源有R的官网(设置CRAN)和bioconductor这两个网站,下载R包也是从这两个网站上下载的,所以需要先设置镜像,镜像设置不好的话R包下载就会报错
镜像设置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源
options:设置R的选项设置
查询镜像来源的代码:
options()$repos
options()$BioC_mirror
安装
install.packages(“包”)#CRAN的包
BiocManager::install(“包”)#Bioconductor的包
加载
library()
require()
dplyr包
安装并加载dplyr
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)
五个基础函数
mutate()#增加列
select()#筛选列
filter()#筛选行
arrange()#按列排序整个表格
summarise()
实用技能
1、管道
%>% #快捷键(cmd/ctr + shift + M)
2、count 统计某列的unique值
count(test,Species)
dplyr的双表操作
1、内连接
inner_join(A,B,by = 'C')
2、左连接
left_join(A,B,by ='C')
3、全连接
full_join(A,B,by ='C')
4、半连接
semi_join(x = A, y = B, by = 'C')
5、反连接
anti_join(x = A, y = B, by = 'x')
6、简单合并
bind_rows(A,B)
bind_cols(A,B)