学习小组Day6-sansan-R包初步

镜像设置

安装

install.packages(“包”) #包在CRAN网站
BiocManager::install(“包”)  #包在Biocductor

加载

libaray(包)
or
require(包)

dplyer的5个基本函数

?mutate 查找mutate用法

1. mutate 新增列

mutate(test, new = Sepal.Length * Sepal.Width) 新增了名为 new的一列,计算方式在后面

2. select 按列筛选

vars <- c("Petal.Length", "Petal.Width")
select(test, one_of(vars))

3. filter 按行筛选

filter(test, Species == "setosa"&Sepal.Length > 5 )

4. arrange 按某1列或某几行对整个表格排序

arrange(test, Sepal.Length)#按照test数据级的Sepal.Length 默认从小到大排序

5. summary 汇总

计算 mean、sd等

dplyr 两个实用技能

1. 管道操作

test %>% 
  group_by(Species) %>% 
  summarise(mean(Sepal.Length), sd(Sepal.Length))

2.count 统计某列unique值

dplyr 处理关系数据

inner_join 内连接
left_join 左连接
full_join 全连接
semi_join 半连接
anti_join 反连接
bind_rows bind_cols 简单合并

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容