第145期学习小组Day6笔记-杨沐籽

一、安装和加载R包

  1. 镜像设置
镜像设置.png
  1. 安装R包
  • R包存在与CRAN:install.packages(“R包名称”)
  • R包存在于Biocductor:BiocManager::install(“R包名称”)
安装R包.png
  1. 加载R包
加载R包.png

二、dplyr(数据操作R包)五个基础函数

  1. 新增列:mutate()
新增列.png
  1. 按列筛选:select()
筛选列.png
  1. 筛选行:filter()
筛选行.png
  1. 按某1列或某几列对整个表格进行排序:arrange()
表格排序.png
  1. 汇总分析:summarise(),再加上分组group_by()即可实现各组内分析
汇总分析.png

三、dplyr两个扩展技巧

  1. 管道操作
  • 能够通过管道将数据从一个函数传给另外一个函数,从而用若干函数构成的管道依次变换你的数据
  • 管道运算符号为%>%(Windows快捷键为Shift+CTRL+M),其意思是将左边的运算结果,以输入的方式传递给右边的函数
管道操作.png
  1. count() :统计某列的unique值
统计某一列各元素出现次数.png

四、dplyr处理关系数据-类似于Excel的VLOOKUP

  1. 取两个数据在某一变量上的的交集:inner_join(X,Y,by = '某一变量')
找出两个数据集在某一变量上的交集.png
  1. 将两个数据集以左侧数据集为标准取交集:left_join(X,Y, by = '某一变量')
左连.png
  1. 将两个数据集整体合并:full_join(X,Y, by = '某一变量')
全连.png
  1. 返回能够与Y表匹配的X表所有记录:semi_join(X, Y, by = '某一变量')
半合并.png
  1. 返回无法与Y表匹配的X表的所有记录:anti_join(X, Y, by = '某一变量')
反连接.png
  1. 简单合并
  • bind_rows()函数需要两个表格列数相同
  • bind_cols()函数则需要两个数据框有相同的行数
简单合并.png
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容