R数据结构
向量
向量定义
- 标量: 一个元素组成的变量
- 向量: 多个元素组成的变量
x<- c(1,2,3) #常用的向量写法,意为将x定义为由元素1,2,3组成的向量。
x<- 1:10 #从1-10之间所有的整数
x<- seq(1,10,by = 0.5) #1-10之间每隔0.5取一个数
x<- rep(1:3,times=2) #1-3 重复2次
注意,多次对同一个变量进行赋值时,变量代表最后赋值向量
提取向量
用到的是[]
- 根据元素位置
x[4] #x第4个元素
x[-4]#排除法,除了第4个元素之外剩余的元素
x[2:4]#第2到4个元素
x[-(2:4)]#除了第2-4个元素
x[c(1,5)] #第1个和第5个元素
- 根据值
x[x==10]#等于10的元素
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素
数据框
- 读取
read.table(file = "huahua.txt", sep ="\t", header = T)
a <-read.table(file = "huahua.txt", sep ="\t", header = T)
csv 文件是用逗号分隔的,故而 sep = ","
tsv 文件是用制表符分隔的,故而 sep = "\t"
常用的分隔符还有空格 sep = " "
header所代入的表格数据,第一行是否用作列名称。
true是第一行用于列名称,具体数据从第二行开始
false则第一行即为具体数据
- 行名和列名的设置
colnames(X) #查看列名
rownames(X) #查看行名
row.names=1 #修改第一列为行名
- 数据框导出
write.table(X,file = "yu.txt",sep = ",",quote=F) #分隔符改为逗号,字符串不加双引号(默认格式带由双引号)
- 变量的保存与重新加载
save.image(file="bioinfoplanet.RData")#保存当前所有变量
save(X,file="test.RData")#保存其中一个变量
load("test.RData")#再次使用RData时的加载命令
如果执行save(X,file="test.RData")报错:object X not found
说明R中找不到变量X
可以看右边窗口环境中有没有变量X
之后需要另外重新赋值