学习小组Day6--刘水水

R包学习(dplyr为例)

R包是一系列函数的合集,安装加载R包后可以通过调用别人写好的函数完成自己的数据处理需求

R包安装

R包的来源有R的官网(设置CRAN)和bioconductor这两个网站,下载R包也是从这两个网站上下载的,所以需要先设置镜像,镜像设置不好的话R包下载就会报错

镜像设置

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源

options:设置R的选项设置
查询镜像来源的代码:
options()$repos
options()$BioC_mirror

安装

install.packages(“包”)#CRAN的包
BiocManager::install(“包”)#Bioconductor的包

加载

library()
require()

dplyr包

安装并加载dplyr

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 
install.packages("dplyr")
library(dplyr)

五个基础函数

mutate()#增加列
select()#筛选列
filter()#筛选行
arrange()#按列排序整个表格
summarise()

实用技能

1、管道

%>% #快捷键(cmd/ctr + shift + M)

2、count 统计某列的unique值

count(test,Species)

dplyr的双表操作

1、内连接

inner_join(A,B,by = 'C')

2、左连接

left_join(A,B,by ='C')

3、全连接

full_join(A,B,by ='C')

4、半连接

semi_join(x = A, y = B, by = 'C')

5、反连接

anti_join(x = A, y = B, by = 'x')

6、简单合并

bind_rows(A,B)
bind_cols(A,B)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容