R管道操作

转自https://blog.csdn.net/zhaozhn5/article/details/79001384

  1. magrittr介绍
    magrittr包是一个高效的管道操作工具,让数据传递更高效。使用操作符%>%,直接把数据传递给下一个函数或表达式。

  2. magrittr的使用
    4个管道操作符:
    %>%, %T>%, %$% 和 %<>%

2.1 向右操作符%>%, 向左操作符%T>%, 解释操作符%$% 和 复合赋值操作符%<>%

比如:

取10000个随机数符合,符合正态分布。
求这个10000个数的绝对值,同时乘以50。
把结果组成一个100*100列的方阵。
计算方阵中每行的均值,并四舍五入保留到整数。
把结果除以7求余数,并话出余数的直方图。

正常代码:


# 设置随机种子
> set.seed(1)
 
# 开始 
> n1<-rnorm(10000)            # 第1步
> n2<-abs(n1)*50              # 第2步
> n3<-matrix(n2,ncol = 100)   # 第3步
> n4<-round(rowMeans(n3))     # 第4步
> hist(n4%%7)                 # 第5步

另外一种写法是括号包含


# 设置随机种子

> set.seed(1)
>hist(round(rowMeans(matrix(abs(rnorm(10000))*50,ncol=100)))%%7)

使用管道函数


# 设置随机种子
> set.seed(1)
# 开始
> rnorm(10000) %>%
+ abs %>% `*` (50) %>%
+ matrix(ncol=100) %>%
+ rowMeans %>% round %>%
+ `%%`(7) %>% hist

2.2
%T>%向左操作符
把数值向左边传递,接着又可以向右边传递。

比如,在数据处理中间过程们需要打印输出或图片输出,这时整个过程就会被中断,用左侧操作符,就可以解决这个问题。

  1. 取10000个随机数,符合正态分布。
  2. 求这个10000个数的绝对值,同时乘以50。
  3. 把结果组成一个100*100的方阵
  4. 计算方阵中每行的均值,并四舍五入保留至整数
  5. 把结果除以7求余数,并画出直方图
  6. 对余数求和

由于输出直方图后,返回值为空,那么再继续管道,就会把空值向右进行传递,所以会报错。所以先向左,然后可以再进行向右传递。

 
> rnorm(10000) %>%
+   abs %>% `*` (50)  %>%
+   matrix(ncol=100)  %>%
+   rowMeans %>% round %>% 
+   `%%`(7) %T>% hist %>% sum
[1] 328

2.3 %$% 解释操作符(exposition pipe-operator)

%$% 的作用是把左侧数据的属性名传递给右侧,让右侧的调用函数直接通过名字就可以获得左侧数据。

下面定义一个3列10行的data.frame,列名分别为x,y,z,或缺x列大于5的数据集。使用 %$% 把列名x直接传到右侧进行判断。这里.代表左侧的完整数据对象。一行代码就实现了需求,而且这里不需要显示的定义中间变量。

 > set.seed(1)
> data.frame(x=1:10,y=rnorm(10),z=letters[1:10]) %$% .[which(x>5),]
    x          y z
6   6 -0.8204684 f
7   7  0.4874291 g
8   8  0.7383247 h
9   9  0.5757814 i
10 10 -0.3053884 j

如果不使用%$%,通常代码的写法为定义变量df,df出现3次。

 
> set.seed(1)
> df<-data.frame(x=1:10,y=rnorm(10),z=letters[1:10])
> df[which(df$x>5),]
    x          y z
6   6 -0.8204684 f
7   7  0.4874291 g
8   8  0.7383247 h
9   9  0.5757814 i
10 10 -0.3053884 j

2.4 %<>%复合复制操作符(compound assignment pipe-operator)
%<>%复合赋值操作符,功能与%>%基本是一样的,多了一项额外的操作,就是把结果写到左侧对象。比如,我们需要对一个数据集进行排序,那么需要获得排序的结果,用%<>%就是非常方便的。

现实原理如下图所示,使用%<>%把左侧的程序的数据集A传递右侧程序的B函数,B函数的结果数据集再向右侧传递给C函数,C函数结果的数据集再重新赋值给A,完成整个过程。


 
> set.seed(1)
> x<-rnorm(100) %<>% abs %>% sort %>% head(10)
> x
 [1] 0.001105352 0.016190263 0.028002159 0.039240003 0.044933609 0.053805041 0.056128740
 [8] 0.059313397 0.074341324 0.074564983

但是这里同时有一个陷阱,需要** 注意一下 %<>% 必须要用在第一个管道的对象处,才能完成赋值的操作 ** ,如果不是左侧第一个位置,那么赋值将不起作用。

 
> set.seed(1)
> x<-rnorm(100)
 
# 左侧第一个位置,赋值成功
> x %<>% abs %>% sort %>% head(10)
> x
 [1] 0.001105352 0.016190263 0.028002159 0.039240003 0.044933609 0.053805041 0.056128740
 [8] 0.059313397 0.074341324 0.074564983
 
# 左侧第二个位置,结果被直接打印出来,但是x的值没有变
> x %>% abs %<>% sort %>% head(10)
 [1] 0.001105352 0.016190263 0.028002159 0.039240003 0.044933609 0.053805041 0.056128740
 [8] 0.059313397 0.074341324 0.074564983
> length(x)
[1] 10
 
# 左侧第三个位置,结果被直接打印出来,但是x的值没有变
> x %>% abs %>% sort %<>% head(10)
 [1] 0.001105352 0.016190263 0.028002159 0.039240003 0.044933609 0.053805041 0.056128740
 [8] 0.059313397 0.074341324 0.074564983
> length(x)
[1] 10
  1. magrittr包的扩展功能
    %>%对代码块的传递
    %>%对函数的传递

magrittr对常见计算符号操作符进行的重新定义,让每个操作对应一个函数。

 
extract                   `[`
extract2              `[[`
inset                     `[<-`
inset2                    `[[<-`
use_series            `$`
add                   `+`
subtract              `-`
multiply_by           `*`
raise_to_power            `^`
multiply_by_matrix    `%*%`
divide_by             `/`
divide_by_int             `%/%`
mod                   `%%`
is_in                     `%in%`
and                   `&`
or                    `|`
equals                    `==`
is_greater_than           `>`
is_weakly_greater_than    `>=`
is_less_than              `<`
is_weakly_less_than   `<=`
not (`n'est pas`)     `!`
set_colnames              `colnames<-`
set_rownames              `rownames<-`
set_names             `names<-`

符号与函数写法的对比

 
# 使用符号的写法
> set.seed(1)
> rnorm(10) %>% `*`(5) %>% `+`(5)
 [1]  1.8677309  5.9182166  0.8218569 12.9764040  6.6475389  0.8976581  7.4371453  8.6916235
 [9]  7.8789068  3.4730581
 
# 使用函数的写法
> set.seed(1)
> rnorm(10) %>% multiply_by(5) %>% add(5)
 [1]  1.8677309  5.9182166  0.8218569 12.9764040  6.6475389  0.8976581  7.4371453  8.6916235
 [9]  7.8789068  3.4730581

3.2 %>%传递到代码块

对同一个数据块要进行多次处理,可以使用一个代码块一次性解决。把数据集传递到{}代码块中, 传入的数据集用.来表示。

以下对一个包括10个随机数的向量的先*5再+5,求出向量的均值和标准差,并从小到大排序后返回前5条。

set.seed(1)
 rnorm(10)    %>%
      multiply_by(5) %>%
      add(5)         %>%
      { 
          cat("Mean:", mean(.), 
                        "Var:", var(.), "\n")
          sort(.) %>% head(5)
        }
 Mean: 5.661014 Var: 15.23286 
 [1] 0.8218569 0.8976581 1.8677309 3.4730581 5.9182166 
 

3.3 %>%传递到函数
传递到函数和传递到代码块设计是类似的,是把一个数据集传给一个匿名函数,进行复杂的数据数据的操作。在这里,我们会显示的定义数据集的名字作为匿名函数的参数。

比如,对鸢尾花数据集进行处理,只保留第一行和最后一行作为结果。

 iris %>%
        ( function(x)rbind(head(x, 2), tail(x, 2)) )

这里的代码有点不太懂,好像很容易就能取到上下两行。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,271评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,275评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,151评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,550评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,553评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,559评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,924评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,580评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,826评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,578评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,661评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,363评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,940评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,926评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,872评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,391评论 2 342

推荐阅读更多精彩内容