数据结构
概念
向量:可以从左到右计数的一组数
标量:一个数字或者一个字符串
数据框:表格在R语言重点别称
应用
-
赋值
<-
x<- c(1,2,3) #向量
x<- 1:10 #取整
x<- seq(1,10,by = 0.5)#间隔取数
x<- rep(1:3,times=2)#重复一组数
-
提取元素
x[4]#x第4个元素
x[-4]#排除法,除了第4个元素之外剩余的元素
x[2:4]#第2到4个元素
x[-(2:4)]#除了第2-4个元素
x[c(1,5)]#第1个和第5个元素
-
读取本地数据框
- read.csv()是读取以英文逗号分隔的数据
- read.table()是读取以制表符分隔的数据
- 本地数据格式可以是txt excel
- 数据框同样可以赋值给某个名称,比如X<- read.csv("dayi.txt")
- 当本地数据里面有空格时用 fill=F 就可以不报错,示例
B<-read.table("dayi.txt",fill=T)
反过来,制作本地数据txt格式时,如果要制作的表格本身包含空值的表格的话,用英文逗号分隔可以不用留空格,可以对比huahua.tx和doudou.txt
- read.table()可以嵌套“把要读取的数据框改成你想要的形式”的函数,示例
read.table(file='huahua.txt',sep="\t",header=T)
file= 是你想要读取的文件,sep是分隔数据的形式,header是确定是否用第一行作为列称(是就用T,不写的话默认是电脑自己取名字,叫v1,v2,v3...)
- 当有变量被赋值成数据框时,environment框就会出现data栏,点击data栏中的变量,就可以在脚本框中看到数据框的样子,同时在控制台出现view(变量)
-
设置行名和列名
colnames(X) 看x列
rownames(X)看x行
colnames(X)[1]<-"bioplanet"把第一列第一个空改成自己想要的样子,原来表格是空的话电脑默认这个空叫x
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)
最后row.names的意思是修改第一列为行名
-
数据框导出
write.table(A,file="lei.txt",sep=",",quote=F)
quote,是指加不加引号,不加就是quote=F,加就不写,因为默认是加的,长这样
-
变量保存与重新加载
save.image(file="day5.RData")#保存所有数据框
save(B,file="保存一个变量.RData")#保存一个数据框
-
提取元素
A是赋值了数据框的变量
取第x行和第y列
A[x,y]
取第x行
A[x,]
取第y列,有三种
A[,y]、A[y]、A$列名
取第a列到第b列
A[a:b]
取第a列和第b列
A[c(a,b)]
-
直接使用数据框中的变量
方法一(缺陷,有两个变量名)
>options(stringsAsFactors = T)
> a <-data.frame(case=paste0("S",1:9),values=runif(9))
> plot(a$case,a$values)
options是环境设置函数
用options()命令可以设置一些环境变量。 比如说:
options(digits=10)
这个命令,可以把R的整数表示能力设为10位。
options(warn=-1)
这个命令,可以忽视任何警告。(warn=1时,为不放过任何警告)
使用help(options)可以查看详细的参数信息。
方法二(缺陷,两个以上数据框的列名有冲突时,同时attach会报错。)
attach(a)
plot(case,values)
方法三
> with(a,{
+ plot(case,values)
+ x<<-summary(values) })
思维导图
问题回答
X没被赋值为数据框