R包dplyr
1.安装R包
install.packages(“dplyr”)
或者
BiocManager::install(“dylyr”)
取决于你要安装的包存在于CRAN网站还是Biocductor,存在于哪里?可以谷歌搜到。
- 加载R包
library(dplyr)
require(dplyr)
- 使用dplyr
新增列 mutate()
mutate(test, new = Sepal.Length * Sepal.Width)
按列筛选 select()
按列号筛选
select(test,1)
按列名筛选
select(test, Petal.Length, Petal.Width)
筛选行 filter()
filter(test, Species == "setosa"&Sepal.Length > 5 )
按某1列或某几列对整个表格进行排序
arrange(test, Sepal.Length)#默认从小到大排序
汇总 summarise()
summarise(test, mean(Sepal.Length), sd(Sepal.Length))# 计算Sepal.Length的平均值和标准差
summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))# 先按照Species分组,计算每组Sepal.Length的平均值和标准差