学习小组day6笔记--秋禾

学习使用R包

安装

1.使用“install.packges”(使用CRAN网站下线) or "BiocManager::install"(使用biocductor下载)

加载命令

library(包)
require(包)

安装加载

摘自生信星球

dplyr基础函数

mutate(),新增列

image.png

image.png

select(),按列筛选

image.png

image.png

filter()筛选行

image.png

image.png

arrange(),按照某列或某几列对整个表格进行排序

image.png

summaries(),汇总

image.png

image.png

dplyr使用技能

1.管道操作%>%(cmd/ctr+shift+M)
group_by函数按照某个变量分组,对于数据集本身并不会发生什么变化,只有在与mutate(), arrange() 和 summarise() 函数结合应用的时候会体现出它的优越性,将会对这些 tbl 类数据执行分组操作 (R语言泛型函数的优越性).
2.count:统计列的unique值


image.png

dplyr处理关系数据

1.内连inner_join,去交集

image.png

2.左连left_join
左连要求以表格1最左边表格为主,看2表格中左边是否符合1的左边
image.png

3.full_join
image.png

4.半连接:返回能够与y表匹配的x表所有记录semi_join
image.png

5.反连接:返回无法与y表匹配的x表的所记录anti_join
image.png

我们有两个表:A和B,那么就分别将其当做一个集合
那么我们的左右外连接和内连接就相当于变成了这样↓ ↓ ↓

A Left join B -> A (根据返回需求 需连接上B中与A等条件的部分)

A Right join B -> B (根据返回需求 需连接上A中与B等条件的部分)

A Inner join B -> A∩B (根据返回需求 需连接上A与B等条件的部分)

图解就是这样↓ ↓ ↓

image.png

(摘自博客园shenhaha

6.在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数
image.png

image.png

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容