今天的主要任务是认识R语言的5种数据类型,以及数据处理的实际操作。
数据结构.png
1 向量的操作
1.变量的赋值
常见的赋值方式
依次罗列 x <- c(1,2,3,4,5)
取范围内整数 x<-1:10
(包括1、10)
固定间隔取数 x<-seq(1:10, by=0.5)
(取1至10内连续数,间隔为0.5)
多元素重复 x<-rep(1,2,times=2)
x<-rep(1:3,times=2)
2.从向量中提取元素([ ])
根据位置
x[4] 第4个元素
x[-4] 除第4个元素外其他元素
x[2:4] 第2至4个元素
x[c(1,2)] 第1、2个元素
根据值
x[x==10] 等于10的元素
x[x<0] 小于0的元素
x[x %in% c(1,2,5)] 在子向量集(1,2,5)中的元素
2 数据框的操作
1.读取本地数据
x<-read.table(file="C:/Users/Administrator/Documents/chip.csv",sep="",header=T)
文件不在默认工作路径时的写法
可直接读取txt、csv文件
空白分隔符:"","\t"
2.设置行列名
colnames(x)[1]<-
rownames(x)[3]<-
x<-read.table(file="C:/Users/Administrator/Documents/chip.csv",sep="",header=T, row.names=1) 修改第一行为列名
3.数据框的导出
write.table(x, file="a.csv")
4.变量的保存与重新加载
save(x, file="test.RData") 保存一赋值变量于RData形式数据文件“test.RData”
若出现object x not found,说明找不到变量x,变量x未进行赋值
save.image(file="bioinfoplanet.RData") 保存当前镜像(所有变量)至“bioinfoplanet.RData”
5.元素提取
x[1,2] 第1行第二列的元素
x[,2] 第二列的所有元素
x[1,] 第一行的所有元素
x[1] (默认)第一列的元素
x[1:2] 第一列至第二列中的元素
x$ID 列名为ID的所有元素,常见的高级写法