学习小组Day 6笔记——向向

学习R包

一、安装并加载R包

下载R包,不同的电脑可能不不一样镜像设置-安装-加载(其中镜像设置我好像没有用上,直接就输入下载的就下载成功了)
我首先是傻傻的什么内容都不告诉人家下载什么


后来知道肯定要把包的名字写进去,然后就开始下载了

加载的话是下面这样子,后面还跟了一段话

二 、dplyr函数的操作

首先test <- iris[c(1:2,51:52,101:102),]
给test赋值iris包的1、2、51、52、101、102行的数据

1. mutate()添加新变量并保留现有变量; transmute()添加新变量,并删除现有变量。

mutate(.data, 列名=数据)

test<-iris[c(1:2,51:52,101:102),]
mutate(test,new = Sepal.Length * Sepal.Width)


i
2. select(),按列筛选

select(data,筛选内容),可以按列名,按列数
select(test,c(1:5))

3. filter()筛选行,可以按行名,按行数,还可以筛选特殊字符

select(test,1). select(test,c(1,5))

在test中选择存在“setosa”的行,并且Sepal.Length>5的行
filter(test,Species=="setosa"&Sepal.Length>5)

4.arrange(),按某1列或某几列对整个表格进行排序

arrange(test, Petal.Length)#默认从小到大排序


arrange(test, desc(Petal.Length))#用desc从大到小

5.summarise():汇总

对数据进行汇总操作,summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))
计算每组Sepal.Length的平均值和标准差


6.管道操作%>%(cmd/ctr+shift+M)

计算机中的管道,就是一种解决进程间信息交互问题的手段。


7.count统计某列的各个元素的个数

三 、dplyr处理关系数据

内联,取交集 这里的交集是"bef"
inner_join()


左连
left_join()
结果会根据括号里前后文件的不一样有区别

全连
full_join()
最后的by="x",的引号部分单双额

半链接
semi_join()

简单合并
相当于base包里的cbind()函数和rbind()函数
bind_rows()需要两个表格列数相同
bind_cols()需要两个数据框有相同的行数


今天不仅学会了关于dplyr函数的运用,还把之前一直不会在markdown里展示的代码弄上了,也调整了图片的大小,这样看起来我的笔记应该就会好看了很多。

该笔记借鉴了“黑森林深处的小星星”的部分,小星星同学的学习笔记写的很好,值得我学习借鉴!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容