R语言数据结构
一、向量
1、标量和向量的区分
(1)元素:指的是数字或者字符串(用chr表示)等。
(2)标量:一个元素组成的变量
(3)向量:多个元素组成的变量。
使用时,一般给向量“赋值“,赋值的内容可以是数值,也可以是字符串和数据框(在R语言中,表格被称为数据框)。
我们可以给变量赋于不同的值
在这4次操作中,x被赋予了4次值,每一次赋值都会将前一次的覆盖。
2、从向量中提取元素
(1)根据元素的位置
(2)根据元素的值
二、数据框
1、读取本地数据
2、设置行名和列名
3、数据框的导出
4、变量的保存与重新加载
前4步的操作都在这张图里了。
5、提取元素
- X[x,y]#第x行第y列
- X[x,]#第x行
- X[,y]#第y列
- X[y] #也是第y列
- X[a:b]#第a列到第b列
- X[c(a,b)]#第a列和第b列
- X$列名#也可以提取列(不用括号,并且支持自动补全,缺点是只能提取1列)
6、直接使用数据框中的变量
如果要提取数据框中的两列坐散点图,建立新的数据框a后,为了防止数据框名a的反复出现,有两种方法:
(1)attach
将数据框名添加到搜索环境中,可以直接提取列。做完以后detach(a)
删除搜索环境,缺点是两个以上数据框名有重复时会报错。
(2)with
7、保存新建R脚本:将需要保存到代码复制到新的R脚本中,
课后问题:save(X,file="test.RData")这句代码如果报错object X not found,是为什么,应该怎么解决?
答:在R语言中需要区分大小写,我们没有给X变量赋值,因此保存时报错,应该将X改为x即可解决。