Tidyverse自学笔记-列操作之列排序和更名

数据准备
本示例数据是自编数据,仅为练习所用,数据结构假设为,两个年份year(2020,2021),两个氮水平nitrogen(N1,N2),两个玉米品种variety(a,b)测定了5个试验指标(变量v1,v2,v3,v4,v5),每个处理3次重复block(1,2,3)。

library(tidyverse) # 调用tidyverse。
df <- read_csv(file = "df.csv") # 导入数据。文档在工作目录下,所以直接给文件名导入。
df # 查看数据。
## # A tibble: 24 × 9
##     year nitrogen variety block    v1    v2    v3    v4    v5
##    <dbl> <chr>    <chr>   <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1  2020 N1       a           1  1.26  2.14   0.4   5    3.25
##  2  2020 N1       a           2  1.2   2.9    0.1   5.3  1.27
##  3  2020 N1       a           3  1.3   3      0.3   5.6  2.24
##  4  2020 N1       b           1  1.08  1.72   1.8   2.8  1   
##  5  2020 N1       b           2  1.05  1.65   1.7   2.5  3.12
##  6  2020 N1       b           3  1.15  1.35   1.5   3.1  4.57
##  7  2020 N2       a           1  1.32  3.78   1.6   6    5.85
##  8  2020 N2       a           2  1.28  4.32   1.4   6.1  6.48
##  9  2020 N2       a           3  1.35  3.95   1.3   6.2  7.21
## 10  2020 N2       b           1  1.33  3.47   2.8   4.1  6.56
## # … with 14 more rows

6.1.3 列排序

Base R
搜索学习了一下,在Base R中通过索引去实现列序的改变。

df[,c(2,4,1,3,5:9)] # 改变df数据集列序,新的列顺序是原来的df第2和第4列提前。
## # A tibble: 24 × 9
##    nitrogen block  year variety    v1    v2    v3    v4    v5
##    <chr>    <dbl> <dbl> <chr>   <dbl> <dbl> <dbl> <dbl> <dbl>
##  1 N1           1  2020 a        1.26  2.14   0.4   5    3.25
##  2 N1           2  2020 a        1.2   2.9    0.1   5.3  1.27
##  3 N1           3  2020 a        1.3   3      0.3   5.6  2.24
##  4 N1           1  2020 b        1.08  1.72   1.8   2.8  1   
##  5 N1           2  2020 b        1.05  1.65   1.7   2.5  3.12
##  6 N1           3  2020 b        1.15  1.35   1.5   3.1  4.57
##  7 N2           1  2020 a        1.32  3.78   1.6   6    5.85
##  8 N2           2  2020 a        1.28  4.32   1.4   6.1  6.48
##  9 N2           3  2020 a        1.35  3.95   1.3   6.2  7.21
## 10 N2           1  2020 b        1.33  3.47   2.8   4.1  6.56
## # … with 14 more rows
subset(df, select = c(2,4,1,3,5:9)) # 利用subset函数选择排序。
## # A tibble: 24 × 9
##    nitrogen block  year variety    v1    v2    v3    v4    v5
##    <chr>    <dbl> <dbl> <chr>   <dbl> <dbl> <dbl> <dbl> <dbl>
##  1 N1           1  2020 a        1.26  2.14   0.4   5    3.25
##  2 N1           2  2020 a        1.2   2.9    0.1   5.3  1.27
##  3 N1           3  2020 a        1.3   3      0.3   5.6  2.24
##  4 N1           1  2020 b        1.08  1.72   1.8   2.8  1   
##  5 N1           2  2020 b        1.05  1.65   1.7   2.5  3.12
##  6 N1           3  2020 b        1.15  1.35   1.5   3.1  4.57
##  7 N2           1  2020 a        1.32  3.78   1.6   6    5.85
##  8 N2           2  2020 a        1.28  4.32   1.4   6.1  6.48
##  9 N2           3  2020 a        1.35  3.95   1.3   6.2  7.21
## 10 N2           1  2020 b        1.33  3.47   2.8   4.1  6.56
## # … with 14 more rows

tidyverse
在tidyverse中可以通过以下方法去实现。
1、select函数
利用select将要排序的列选择出来后排序。

df %>% select(nitrogen, variety, v3) # 通过select函数将要排序的列按排序要求选择出来。
## # A tibble: 24 × 3
##    nitrogen variety    v3
##    <chr>    <chr>   <dbl>
##  1 N1       a         0.4
##  2 N1       a         0.1
##  3 N1       a         0.3
##  4 N1       b         1.8
##  5 N1       b         1.7
##  6 N1       b         1.5
##  7 N2       a         1.6
##  8 N2       a         1.4
##  9 N2       a         1.3
## 10 N2       b         2.8
## # … with 14 more rows
df %>% select(nitrogen, block, everything()) # 把nitrogen和block调整到第1和第2列。
## # A tibble: 24 × 9
##    nitrogen block  year variety    v1    v2    v3    v4    v5
##    <chr>    <dbl> <dbl> <chr>   <dbl> <dbl> <dbl> <dbl> <dbl>
##  1 N1           1  2020 a        1.26  2.14   0.4   5    3.25
##  2 N1           2  2020 a        1.2   2.9    0.1   5.3  1.27
##  3 N1           3  2020 a        1.3   3      0.3   5.6  2.24
##  4 N1           1  2020 b        1.08  1.72   1.8   2.8  1   
##  5 N1           2  2020 b        1.05  1.65   1.7   2.5  3.12
##  6 N1           3  2020 b        1.15  1.35   1.5   3.1  4.57
##  7 N2           1  2020 a        1.32  3.78   1.6   6    5.85
##  8 N2           2  2020 a        1.28  4.32   1.4   6.1  6.48
##  9 N2           3  2020 a        1.35  3.95   1.3   6.2  7.21
## 10 N2           1  2020 b        1.33  3.47   2.8   4.1  6.56
## # … with 14 more rows

2、relocate函数

relocate可以将选择的列放置在指定列的前后。
relocate(.data, ..., .before, .after)
.data:要处理的数据框;
...:选择的要移动的列。
.before和.after:指定放置在之前或之后的列。

df %>% relocate(nitrogen, block) # 只排序指定的列,其他列在指定列后,顺序不变。
## # A tibble: 24 × 9
##    nitrogen block  year variety    v1    v2    v3    v4    v5
##    <chr>    <dbl> <dbl> <chr>   <dbl> <dbl> <dbl> <dbl> <dbl>
##  1 N1           1  2020 a        1.26  2.14   0.4   5    3.25
##  2 N1           2  2020 a        1.2   2.9    0.1   5.3  1.27
##  3 N1           3  2020 a        1.3   3      0.3   5.6  2.24
##  4 N1           1  2020 b        1.08  1.72   1.8   2.8  1   
##  5 N1           2  2020 b        1.05  1.65   1.7   2.5  3.12
##  6 N1           3  2020 b        1.15  1.35   1.5   3.1  4.57
##  7 N2           1  2020 a        1.32  3.78   1.6   6    5.85
##  8 N2           2  2020 a        1.28  4.32   1.4   6.1  6.48
##  9 N2           3  2020 a        1.35  3.95   1.3   6.2  7.21
## 10 N2           1  2020 b        1.33  3.47   2.8   4.1  6.56
## # … with 14 more rows
df %>% relocate(nitrogen, .after = v2) # 将选择的列放置在指定位置。
## # A tibble: 24 × 9
##     year variety block    v1    v2 nitrogen    v3    v4    v5
##    <dbl> <chr>   <dbl> <dbl> <dbl> <chr>    <dbl> <dbl> <dbl>
##  1  2020 a           1  1.26  2.14 N1         0.4   5    3.25
##  2  2020 a           2  1.2   2.9  N1         0.1   5.3  1.27
##  3  2020 a           3  1.3   3    N1         0.3   5.6  2.24
##  4  2020 b           1  1.08  1.72 N1         1.8   2.8  1   
##  5  2020 b           2  1.05  1.65 N1         1.7   2.5  3.12
##  6  2020 b           3  1.15  1.35 N1         1.5   3.1  4.57
##  7  2020 a           1  1.32  3.78 N2         1.6   6    5.85
##  8  2020 a           2  1.28  4.32 N2         1.4   6.1  6.48
##  9  2020 a           3  1.35  3.95 N2         1.3   6.2  7.21
## 10  2020 b           1  1.33  3.47 N2         2.8   4.1  6.56
## # … with 14 more rows
df %>% relocate(nitrogen, .after = v1) %>% relocate(block, .before = v3) # 重复使用relocate进行多列的移动。
## # A tibble: 24 × 9
##     year variety    v1 nitrogen    v2 block    v3    v4    v5
##    <dbl> <chr>   <dbl> <chr>    <dbl> <dbl> <dbl> <dbl> <dbl>
##  1  2020 a        1.26 N1        2.14     1   0.4   5    3.25
##  2  2020 a        1.2  N1        2.9      2   0.1   5.3  1.27
##  3  2020 a        1.3  N1        3        3   0.3   5.6  2.24
##  4  2020 b        1.08 N1        1.72     1   1.8   2.8  1   
##  5  2020 b        1.05 N1        1.65     2   1.7   2.5  3.12
##  6  2020 b        1.15 N1        1.35     3   1.5   3.1  4.57
##  7  2020 a        1.32 N2        3.78     1   1.6   6    5.85
##  8  2020 a        1.28 N2        4.32     2   1.4   6.1  6.48
##  9  2020 a        1.35 N2        3.95     3   1.3   6.2  7.21
## 10  2020 b        1.33 N2        3.47     1   2.8   4.1  6.56
## # … with 14 more rows

6.1.4 列更名

Base R
可通过索引找到需改名的列,通过赋值改变列名。如colnames(df)[1] = "Y"表示将df数据集第1列列名year改为Y。

colnames(df) # 获取列名称。
names(df) # 同上,获取列名。
## [1] "year"     "nitrogen" "variety"  "block"    "v1"       "v2"       "v3"      
## [8] "v4"       "v5"

tidyverse

set_names() :修改列名。 rename():部分修改列名,函数内部写新名=旧名。
select():在进行列选择的时候可以给选择的列指定新的名称。
relocate():实际上是将选定的列移动到第1列,移动的同时给列名重新进行了命名。

set_names(df, LETTERS[1:9]) # 对df所有列进行了重命名,命名为大写字母A到I。
## # A tibble: 24 × 9
##        A B     C         D     E     F     G     H     I
##    <dbl> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1  2020 N1    a         1  1.26  2.14   0.4   5    3.25
##  2  2020 N1    a         2  1.2   2.9    0.1   5.3  1.27
##  3  2020 N1    a         3  1.3   3      0.3   5.6  2.24
##  4  2020 N1    b         1  1.08  1.72   1.8   2.8  1   
##  5  2020 N1    b         2  1.05  1.65   1.7   2.5  3.12
##  6  2020 N1    b         3  1.15  1.35   1.5   3.1  4.57
##  7  2020 N2    a         1  1.32  3.78   1.6   6    5.85
##  8  2020 N2    a         2  1.28  4.32   1.4   6.1  6.48
##  9  2020 N2    a         3  1.35  3.95   1.3   6.2  7.21
## 10  2020 N2    b         1  1.33  3.47   2.8   4.1  6.56
## # … with 14 more rows
df %>% rename(B = block, N = nitrogen, 变量1 = v1) # rename函数可对部分列名进行修改,新名=旧名。
## # A tibble: 24 × 9
##     year N     variety     B 变量1    v2    v3    v4    v5
##    <dbl> <chr> <chr>   <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1  2020 N1    a           1  1.26  2.14   0.4   5    3.25
##  2  2020 N1    a           2  1.2   2.9    0.1   5.3  1.27
##  3  2020 N1    a           3  1.3   3      0.3   5.6  2.24
##  4  2020 N1    b           1  1.08  1.72   1.8   2.8  1   
##  5  2020 N1    b           2  1.05  1.65   1.7   2.5  3.12
##  6  2020 N1    b           3  1.15  1.35   1.5   3.1  4.57
##  7  2020 N2    a           1  1.32  3.78   1.6   6    5.85
##  8  2020 N2    a           2  1.28  4.32   1.4   6.1  6.48
##  9  2020 N2    a           3  1.35  3.95   1.3   6.2  7.21
## 10  2020 N2    b           1  1.33  3.47   2.8   4.1  6.56
## # … with 14 more rows
df %>% select_all(toupper) # 将列名全部变为大写字母。小写可以录入参数tolower。
## # A tibble: 24 × 9
##     YEAR NITROGEN VARIETY BLOCK    V1    V2    V3    V4    V5
##    <dbl> <chr>    <chr>   <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1  2020 N1       a           1  1.26  2.14   0.4   5    3.25
##  2  2020 N1       a           2  1.2   2.9    0.1   5.3  1.27
##  3  2020 N1       a           3  1.3   3      0.3   5.6  2.24
##  4  2020 N1       b           1  1.08  1.72   1.8   2.8  1   
##  5  2020 N1       b           2  1.05  1.65   1.7   2.5  3.12
##  6  2020 N1       b           3  1.15  1.35   1.5   3.1  4.57
##  7  2020 N2       a           1  1.32  3.78   1.6   6    5.85
##  8  2020 N2       a           2  1.28  4.32   1.4   6.1  6.48
##  9  2020 N2       a           3  1.35  3.95   1.3   6.2  7.21
## 10  2020 N2       b           1  1.33  3.47   2.8   4.1  6.56
## # … with 14 more rows
df %>% select(A = nitrogen, B = v1) # select选择列的同时对列名进行重命名。
## # A tibble: 24 × 2
##    A         B
##    <chr> <dbl>
##  1 N1     1.26
##  2 N1     1.2 
##  3 N1     1.3 
##  4 N1     1.08
##  5 N1     1.05
##  6 N1     1.15
##  7 N2     1.32
##  8 N2     1.28
##  9 N2     1.35
## 10 N2     1.33
## # … with 14 more rows
df %>% select(B = block, N = nitrogen, everything()) # 可以通过select函数将要更名的列指定新名,再配合everything选择所有列实现更名。
## # A tibble: 24 × 9
##        B N      year variety    v1    v2    v3    v4    v5
##    <dbl> <chr> <dbl> <chr>   <dbl> <dbl> <dbl> <dbl> <dbl>
##  1     1 N1     2020 a        1.26  2.14   0.4   5    3.25
##  2     2 N1     2020 a        1.2   2.9    0.1   5.3  1.27
##  3     3 N1     2020 a        1.3   3      0.3   5.6  2.24
##  4     1 N1     2020 b        1.08  1.72   1.8   2.8  1   
##  5     2 N1     2020 b        1.05  1.65   1.7   2.5  3.12
##  6     3 N1     2020 b        1.15  1.35   1.5   3.1  4.57
##  7     1 N2     2020 a        1.32  3.78   1.6   6    5.85
##  8     2 N2     2020 a        1.28  4.32   1.4   6.1  6.48
##  9     3 N2     2020 a        1.35  3.95   1.3   6.2  7.21
## 10     1 N2     2020 b        1.33  3.47   2.8   4.1  6.56
## # … with 14 more rows
df %>% relocate(N = nitrogen) # relocate函数也可以进行列更名。
## # A tibble: 24 × 9
##    N      year variety block    v1    v2    v3    v4    v5
##    <chr> <dbl> <chr>   <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1 N1     2020 a           1  1.26  2.14   0.4   5    3.25
##  2 N1     2020 a           2  1.2   2.9    0.1   5.3  1.27
##  3 N1     2020 a           3  1.3   3      0.3   5.6  2.24
##  4 N1     2020 b           1  1.08  1.72   1.8   2.8  1   
##  5 N1     2020 b           2  1.05  1.65   1.7   2.5  3.12
##  6 N1     2020 b           3  1.15  1.35   1.5   3.1  4.57
##  7 N2     2020 a           1  1.32  3.78   1.6   6    5.85
##  8 N2     2020 a           2  1.28  4.32   1.4   6.1  6.48
##  9 N2     2020 a           3  1.35  3.95   1.3   6.2  7.21
## 10 N2     2020 b           1  1.33  3.47   2.8   4.1  6.56
## # … with 14 more rows

参考资料

  1. R语言编程—基于 tidyverse,人民邮电出版社(待出版),2022.
  2. R语言教程,李东风,https://www.math.pku.edu.cn/teachers/lidf/docs/Rbook/html/_Rbook/index.html
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,254评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,875评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,682评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,896评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,015评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,152评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,208评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,962评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,388评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,700评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,867评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,551评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,186评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,901评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,142评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,689评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,757评论 2 351

推荐阅读更多精彩内容