R语言match函数的应用举例

数据筛选是在分析中最常用的步骤,如数据挖掘分析中,从TCGA或GEO得到的表达矩阵要不断筛选,来进行数据整理。
match函数是生信技能树生信爆款入门课程R语言部分的讲到的一个重要知识点。
为加深理解,现在找一个数据集做下练习巩固。

官方说明文档:

match
match:匹配两个向量,返回第二个向量在第一个向量匹配位置的下标值。
match函数使用格式有如下两种:
第一种方便设置参数,返回x中元素在table中的位置
match(x, table, nomatch = NA_integer_, incomparables = NULL)
第二种简洁,返回x中每个元素在table中是否存在
x %in% table

参数详解

x: 向量, 要匹配的值;
table: 向量, 被匹配的值;
nomatch: 没匹配上的返回值, 必须是整数;
incomparables: 指定不能用来匹配的值.

match函数是一个完全匹配函数, 当两个元素类型不一样时, 如果进行类型转换后匹配得上的话, 则仍可匹配, 可看下例.

match(c(1, "TRUE"), c(T, 0, "1"))
返回3 1,
即1位于表中的3号位,TRUE位于1号位,且T和TRUE可匹配成功

c(1, "TRUE", F) %in% c(T, 0, "1")
返回TRUE TRUE FALSE,
表示每个元素在table中是否存在

举例练习如下:

生成测试数据:
library(tidyverse)
diamonds
> x <- colnames(diamonds)[1:5]
> x
[1] "carat"   "cut"     "color"   "clarity" "depth"  
> y <- colnames(diamonds)[1:10]
> y
 [1] "carat"   "cut"     "color"   "clarity" "depth"   "table"   "price"   "x"       "y"      
[10] "z"      
> z <- colnames(diamonds)[seq(1,10,2)]
> z
[1] "carat" "color" "depth" "price" "y"    

1.使用match函数找出x中每个元素在y中的位置

> match(x,y)
[1] 1 2 3 4 5

2.使用match函数找出y中每个元素在x中的位置

> match(y,x)
 [1]  1  2  3  4  5 NA NA NA NA NA

3.判断z中的元素是否都在x中

> z %in% x
[1]  TRUE  TRUE  TRUE FALSE FALSE

4.z中元素都在y的什么位置?

> match(z,y)
[1] 1 3 5 7 9

5.z中有多少个元素在y中?

 sum(z %in% y)
[1] 5

6.挑出y里面有z中没有的数值。

 y[-match(z,y)]
[1] "cut"     "clarity" "table"   "x"       "z"      

7.x和z中有几个相同元素?,都是哪些元素?

> sum(x %in% z)
[1] 3
> z[x %in% z]
[1] "carat" "depth" "y"   

8.z中和y相同的元素都有哪些?

> y[match(z,y)]
[1] "carat" "color" "depth" "price" "y"    

9.x和z中相同的元素都有哪些?

> x[x %in% z]
[1] "carat" "color" "depth"

10.使用match删除y中与z重复的值

> y[-match(z,y)]
[1] "cut"     "clarity" "table"   "x"       "z"      

参考
R语言:数据筛选match

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1.变量转换 is.datatype():判断变量种类 as.datatype():转换变量类型其中,dataty...
    caoqiansheng阅读 3,304评论 0 3
  • 函数的编写 参考文章 格式如下所示: 函数案例A 输入直角三角形的两个边长,求斜边长 运行结果如下所示: 函数案例...
    天涯清水阅读 11,172评论 3 7
  • R语言与数据挖掘:公式;数据;方法 R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还...
    __一蓑烟雨__阅读 5,608评论 0 5
  • —————————第一部分[三维数据结构]——————— 一、三维数据结构 数组概况: 二维数据结构——矩阵↓叠加...
    ShanSly阅读 4,123评论 0 4
  • 推荐指数: 6.0 书籍主旨关键词:特权、焦点、注意力、语言联想、情景联想 观点: 1.统计学现在叫数据分析,社会...
    Jenaral阅读 11,017评论 0 5