学习小组Day6笔记-陈冰雪

安装加载R包

options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
options("repos" = c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/"))

用options函数设置R运行过程中的镜像
安装dplyr
install.packages("dplyr")
加载dplyr
library(dplyr)
查看dplyr中的指令
ls("package:dplyr")

使用示例数据学习dplyr基础函数

1.png

1.mutate(),用于新增列
test<-(mutate(test,new=Sepal.Length*Sepal.Width)) #新增列名为new。
2.select(),用于按列筛选
select(test,one_of("Sepal.Length","Petal.Length"))
2.png

3.filter()用于筛选行
3.png

4.arrange(),排序。默认从小到大,desc从大到小。
4.png

5.summarise() 用于汇总。
mean():计算平均值
sd():计算方差
group_by( ):分组
5.png

dplyr两个实用技能

1.管道操作 符号 %>% ,快捷键Ctrl+Shift+M
%>%:将左侧准备的数据或表达式,传递给右侧的函数调用或表达式进行运行


6.png

2.coount()统计某列的unique值


7.png

dplyr处理关系数据

1.内连inner_join,取交集,通过相同的元素连接
2.左连left_join,左边的表格连在左边
3.全连full_join
4.半连接semi_join,显示连接表2能与表1匹配的部分
5.反连接anti_join,显示无法匹配的部分
6.简单合并 bind_rows(),合并行,需要两个表格相同列数
bind_cols(),合并列,需要两个表格相同行数。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容