高效数据整理工具——dplyr(二)多数据框处理

高效数据整理工具——dplyr(一)中,简要介绍使用dplyr对但数据表的处理,在本节中将会学习如何使用dplyr对多数据表进行处理。主要函数有如下图所示。

image.png

1、数据框合并

两个数据框合并可分别使用bind_rows(y, z)bind_cols(y, z)进行行或者列合并。

> df1 <- data.frame(a=1:2,b=3:4);df1
  a b
1 1 3
2 2 4
> df2 <-data.frame(a=5:6,b=7:8);df2
  a b
1 5 7
2 6 8
> bind_rows(df1,df2)
  a b
1 1 3
2 2 4
3 5 7
4 6 8
> bind_cols(df1,df2)
  a b a1 b1
1 1 3  5  7
2 2 4  6  8

此外,也可以使用R自带的rbind()cbind()进行数据框的合并。

2、数据框连接

dplyr提供了left_join(), right_join(), inner_join(), full_join()来提供不同的连接方式。
left_join() 以左边数据框为基准,将右边数据框连接进去,可存在一对多的映射关系,保留左边数据框的所有行。

> df1 <- data.frame(x = c(1, 2), y = 2:1)
> df2 <- data.frame(x = c(1, 3), a = 10, b = "a")
> df1;df2
  x y
1 1 2
2 2 1
  x  a b
1 1 10 a
2 3 10 a
> left_join(df1,df2)
Joining, by = "x"
  x y  a    b
1 1 2 10    a
2 2 1 NA <NA>

right_join()用法与left_join()相似,只是以右边为基准,连接左侧数据框。

> right_join(df1,df2)
Joining, by = "x"
  x  y  a b
1 1  2 10 a
2 3 NA 10 a

inner_join()则是选取连接后两个数据框都有的记录保留。

> inner_join(df1,df2)
Joining, by = "x"
  x y  a b
1 1 2 10 a

full_join()则是保留两个数据框的所有记录。

> inner_join(df1,df2)
Joining, by = "x"
  x y  a b
1 1 2 10 a

除了上面四种常见的连接方式外,dplyr还提供了另外两个函数通过共有记录来筛选数据:semi_join(x,y)只保留x中能与y匹配的记录;而anti_join(x,y)则是丢掉x中与y匹配的记录。

3、数据框间的交集、差集与并集

dplyr提供了intersect(x,y)union(x,y)setdiff(x,y)三个函数来分别进行求交集、并集和差集。

> df1 <- data_frame(x = 1:2, y = c(1L, 1L))
> df2 <- data_frame(x = 1:2, y = 1:2)
> df1;df2
# A tibble: 2 x 2
      x     y
  <int> <int>
1     1     1
2     2     1
# A tibble: 2 x 2
      x     y
  <int> <int>
1     1     1
2     2     2
> df1;df2
# A tibble: 2 x 2
      x     y
  <int> <int>
1     1     1
2     2     1
# A tibble: 2 x 2
      x     y
  <int> <int>
1     1     1
2     2     2
# 交集
> intersect(df1,df2)
# A tibble: 1 x 2
      x     y
  <int> <int>
1     1     1
# 并集
> union(df1,df2)
# A tibble: 3 x 2
      x     y
  <int> <int>
1     1     1
2     2     1
3     2     2
# 差集
> setdiff(df1,df2)
# A tibble: 1 x 2
      x     y
  <int> <int>
1     2     1
4、多个数据框的连接

对于多个数据框的连接可以使用purrr包中的reduce函数:

library(dplyr)
x <- data_frame(i = c("a","b","c"), j = 1:3)
y <- data_frame(i = c("b","c","d"), k = 4:6)
z <- data_frame(i = c("c","d","a"), l = 7:9)

list(x, y, z) %>% reduce(full_join, by = "i")
# A tibble: 4 x 4
# i         j     k     l
# <chr> <int> <int> <int>
#   1 a         1    NA     9
# 2 b         2     4    NA
# 3 c         3     5     7
# 4 d        NA     6     8

list(x, y, z) %>% reduce(inner_join, by = "i")
# A tibble: 1 x 4
# i         j     k     l
# <chr> <int> <int> <int>
#   1 c         3     5     7

参考:
R语言入门7:数据处理之双表操作-Dplyr
官方文档

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,053评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,527评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,779评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,685评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,699评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,609评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,989评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,654评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,890评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,634评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,716评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,394评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,976评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,950评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,191评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,849评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,458评论 2 342

推荐阅读更多精彩内容