Day6的学习任务:
R包的学习
·什么是R包?
R 包是由社区开发(developed by the community)的功能(functions)和数据集(data sets)的集合。 它们通过改进现有的基本 R 功能或通过添加新功能来提升 R 的效率。
·安装及加载R包(以dplyr为例)
a.镜像配置(目的是为了每次安装R包时不需要重新配置Rstudio的下载镜像)
镜像配置.PNG
b.安装命令:install.packages("包")
/BioCManager:install("包")
c.加载R包:library(包)
/require(包)
安装三步走:两个options
→install.packages("dplyr")
→library(dplyr)
·dplyr的五个基础函数
1.
mutate()
,新增列
2.select()
,按列筛选
3.filter()
,筛选行
4.arrange()
,按某1列或某几列对整个表格进行排序
5.summarise()
,汇总
·dplyr两个使用技能
1.管道操作
%>%(cmd/ctr+shift+M)
2.count统计某列的unique,例count(test,Species)
·dplyr处理关系数据
1.内连
inner_join
,取交集
2.左连left_join
3.全连full_join
4.半连接:返回能够与y表匹配的x表所有记录semi_join
5.反连接:返回无法与y表匹配的x表的所有记录anti_join
--上摘自”生信星球“公众号