创建数据集

1. 数据类型

数值型、字符串、逻辑型

逻辑型数据

①比较运算的结果 >,<,<=,>=,==(判断是否相等),!=(判断是否不相等)。

②逻辑运算

&:多个条件同时满足则为TRUE, 反之则为FALSE;
|:只要满足一个条件则为TRUE,都不满足则为TRUE;
!:TRUE变FALSE,FALSE变TRUE。

③is族函数,判断数据类型;as族函数,转变数据类型

is.numeric(), is.logical(), is.character()
as.numeric(), as.logical(), as.character()

2. 数据结构

向量、数据框、矩阵、列表

2.1向量

2.1.1向量的生成

①用c()逐一放在一起

优先级遵循(字符型>数值型>逻辑型T1F0)

②连续的数字用

>1:5
1,2,3,4,5

③函数

rep()#重复
seq()#有规律的序列
rnrom()#随机数

④组合

>Paste0(rep("x",times=3),1:3)    
X1,X2,X3

2.1.2对单个向量进行操作

①赋值

②简单的数学计算

③根据条件判断,生成逻辑值向量

④初级统计

**Length()** #统计长度,计算元素个数
**Unique()** #去重复,最后的结果是所有的元素只出现一次
**duplicated()**#判断是否重复,生成逻辑值,第一次出现就是FALSE,第二次及以后出现就是TRUE
**table()**#重复值统计
**sort()**#排序,默认从小到大,decreasing改变排序的顺序

2.1.3对两个向量进行操作

①逻辑比较,生成等长的逻辑向量

== 对应位置的元素,如果长度不一致时会再循环一次
循环补齐:谁长谁说了算,短的一方就开始重复,前后顺序颠倒不影响结果
%in% 判断是否存在,前者是否在后者中存在

②数学计算

③连接

paste #有分割,默认是空格
paste0 #无缝连接

image.png

paste0(x,y)=paste(x,y,sep="")

④交集、并集、差集(都会去重复)

intersect()#交集
union()#只保留唯一数值的去重复并集
setdiff(x,y)#在x中存在,在y中不存在
setdiff(y,x)#在y中存在,在x中不存在

2.1.4向量筛选,取子集

①按照逻辑值

[]将TRUE值挑出来,FALSE丢弃
x[x==10]
x[x%in%c(9,13)]

②按照位置

x[c(1,5)]#取第1和第5个向量
x[2:4]#取第2-4个向量
x[-4]#舍弃第4个向量

2.1.5修改向量中的某个元素,R语言的修改都要赋值,没有赋值就没有发生过。

补充(http://www.bio-info-trainee.com/1071.html)

①排序

sort(x)是对向量x进行排序,返回值排序后的数值向量。
rank()#依次对向量的最小值,次小值,第三小值,最大值进行索引(位置索引)
order()#对应sort()“排名”的元素所在向量中的位置。
sort(x)等同于x[order(x)]

②集合运算

交集、并集、差集、%in%、match()
%in%:%in%这个操作符只返回逻辑向量TRUE 或者FALSE,而且返回值应该与%in%这个操作符前面的向量程度相等。也就是说它相当于遍历了C里面的一个个元素,判断它们是否在B中出现过,然后返回是或者否即可。
match():返回结果同样与前面的向量等长,但是它并非返回逻辑向量,而是遍历了C里面的一个个元素,判断它们是否在B中出现过,如果出现就返回在B中的索引号,如果没有出现,就返回NA。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 第二章 创建数据集 本章内容:探索R中的数据结构、输入数据、导入数据、标注数据 2.1 数据集的概念 数据集通常是...
    催催莎阅读 4,709评论 0 0
  • 第二天,继续学习R语言。 2.创建数据集 2.1数据集 数据构成的一个矩形数组,行表示观测,列表示变量。 2.2数...
    生信要进步阅读 5,049评论 0 1
  • 《R语言实战》笔记系列 本章学习大纲 1.R的数据结构 2.输入数据 3.标注数据 第一部分 R的数据结构 1.向...
    一日如十年阅读 4,918评论 0 8
  • 1. 数据集的概念 数据集通常是由数据构成的一个矩形数组,行表示观测,列表示变量。 R可以处理的数据类型(模式)包...
    小伍_r阅读 4,014评论 0 0
  • 2.1 数据集的概念 数据集通常是用数据构成的一个矩形数组,行表示观测(observation),列表示变量(va...
    壹亮3278阅读 5,310评论 0 50