初步学习R语言之后,需要使用更多的package来进行功能的扩展。今天的主要内容是如何使用R包。今天的主要内容是如何使用R包。
学生信,R语言必学的原因是丰富的图表和Biocductor上面的各种生信分析R包。R包是多个函数的集合,具有详细的说明和示例。
安装和加载R包
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #配置下载镜像
install.packages("dplyr")#安装dplyr包
library(dplyr)#加载dplyr包
dplyr的基础函数
- 新增列
mutate()
- 按列筛选
select()
按列号
按列名
- 筛选行
filter()
- 表格排序
arrange()
- 汇总
summarise()
dplyr的实用技能
- 管道操作符号 %>% (快捷键ctrl+shift+M)(加载tidyverse包即可用管道符号)
- count统计某列的unique值
dplyr处理关系数据
inner_join()
left_join()
full_join()
-
semi_join()
返回能够与y表匹配的x表所有记录
-
anti_join()
返回无法与y表匹配的x表的所记录
- 简单合并
在相当于base包里的函数
cbind()
和rbind()
bind_rows()
函数需要两个表格列数相同的列数
bind_cols()
函数需要两个数据框有相同的行数
注:引用来自“生信星球”