学习小组Day 6笔记——向向

学习R包

一、安装并加载R包

下载R包，不同的电脑可能不不一样镜像设置-安装-加载（其中镜像设置我好像没有用上，直接就输入下载的就下载成功了）
我首先是傻傻的什么内容都不告诉人家下载什么

后来知道肯定要把包的名字写进去，然后就开始下载了

加载的话是下面这样子，后面还跟了一段话

二、dplyr函数的操作

首先test <- iris[c(1:2,51:52,101:102),]
给test赋值iris包的1、2、51、52、101、102行的数据

1. mutate（）添加新变量并保留现有变量； transmute（）添加新变量，并删除现有变量。

mutate(.data, 列名=数据)

test<-iris[c(1:2,51:52,101:102),]
mutate(test,new = Sepal.Length * Sepal.Width)

i

2. select(),按列筛选

select(data，筛选内容），可以按列名，按列数
select(test,c(1:5))

3. filter()筛选行，可以按行名，按行数，还可以筛选特殊字符

select(test,1). select(test,c(1,5))

在test中选择存在“setosa”的行，并且Sepal.Length>5的行
filter(test,Species=="setosa"&Sepal.Length>5)

4.arrange(),按某1列或某几列对整个表格进行排序

arrange(test, Petal.Length)#默认从小到大排序

arrange(test, desc(Petal.Length))#用desc从大到小

5.summarise()：汇总

对数据进行汇总操作，summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))
计算每组Sepal.Length的平均值和标准差

6.管道操作%>%(cmd/ctr+shift+M)

计算机中的管道，就是一种解决进程间信息交互问题的手段。

7.count统计某列的各个元素的个数

三、dplyr处理关系数据

内联，取交集这里的交集是"bef"
inner_join()

左连
left_join()
结果会根据括号里前后文件的不一样有区别

全连
full_join()
最后的by="x",的引号部分单双额

半链接
semi_join()

简单合并
相当于base包里的cbind()函数和rbind()函数
bind_rows()需要两个表格列数相同
bind_cols()需要两个数据框有相同的行数

今天不仅学会了关于dplyr函数的运用，还把之前一直不会在markdown里展示的代码弄上了，也调整了图片的大小，这样看起来我的笔记应该就会好看了很多。

该笔记借鉴了“黑森林深处的小星星”的部分，小星星同学的学习笔记写的很好，值得我学习借鉴！

最后编辑于：2021.06.17 13:31:18

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

学习小组Day 6笔记——向向