R语言的数据结构
相较昨天难了一丢丢,还是需要多理解和消化,学会动手百度一下也很重要,以及代码一定要理解不能纯复制
第一步
区分标量(一个元素组成的变量)和向量(多个元素组成的有序变量)
那么怎么给向量赋值呢,大概有以下几种方法👇
x<- c(1,2,3)
这是常用的向量写法,意为将x定义为由元素1,2,3组成的向量
x<- 1:10
x为从1-10之间所有的整数
x<- seq(1,10,by = 0.5)
x为1-10之间每隔0.5取一个数(注意是逗号不是分号)
x<- rep(1:3,times=2)
x为1-3 ,重复2次
如果一直在给同一个变量赋值。。。那结果以最后一次为哈
第二步
从向量中提取元素
可以分为两种方法
1.根据元素位置(这里的x是刚刚赋值的那个变量)
x[4]
提取x第4个元素
x[-4]
提取除了第4个元素之外剩余的元素
x[2:4]
提取第2到4个元素
x[-(2:4)]
提取除了第2-4个元素
x[c(1,5)]
提取第1个和第5个元素
2.根据值
x[x==10]
等于10的元素
x[x<0]
小于0的元素
x[x %in% c(1,2,5)]
存在于向量c(1,2,5)中的元素
疯狂划重点!!!
x[c(1,2)]
和x[x %in% c(1,2)]
的意思真的不一样!!
举个栗子👇
x[c(1,2)]
指的是x中的第1、2个元素;而x[x %in% c(1,2)]
指的是x中所有值为1、2的元素!!!!
第三步
数据框(有点头大)
1.读取本地数据
还是举个栗子
read.table(file="xx.txt",sep="\t",header=T)
就是提取了那个叫xx的txt,sep="\t"
的话数据会是一列一列的 sep=","
的话数据会用逗号隔开,嗷sep=" "
也可以,道理同上
header=T
的话第一行用于列名称,具体数据从第二行开始 header=F
的话第一行即为具体数据
可以看出来header=F会比header=T多出一行
2.创建数据框
举个栗子
xxnb <- data.frame(xx=c("clever","beautiful",6),zz=c("fat","white",7),mm=c("cute","handsome",8))
然后~当当当当
3.设置行名和列名
colnames(xxnb)
查看列名
rownames(xxnb)
查看行名
colnames(xxnb)[1]<-"xinxin"
把第一列名改为xx
rownames(xxnb)[1]<-"zz zhende taoyan"
把第一行名改为zz zhende taoyan
下面这个注意一下!!
X<-read.csv(file = "xx.txt",sep = " ",header =T,row.names=1)
row.names=1
的意思是修改第一列为行名
4.数据框的导出
栗子👉write.table(X,file = "yu.txt",sep = ",",quote=F)
quote=F意思字符串不加双引号
5.变量的保存与重新加载
save.image(file="xx.RData")
保存当前所有变量
save(xxnb,file="zz.RData")
保存其中一个变量
load("zz.RData")
再次使用RData时的加载命令
(后两行进行实验的时候记得要删掉现在环境中的所有变量,否则就算只保存了一个,load完还是所有变量都在哦
那么怎么删掉所有变量呢,昨天有学的,但是我忘了
rm(list=ls())
rm(list=ls())
rm(list=ls())
重要的事情说三遍!!!)
6.提取元素
xxnb[x,y]
第x行第y列
xxnb[x,]
第x行
xxnb[,y]
第y列
xxnb[y]
也是第y列
xxnb[a:b]
第a列到第b列
xxnb[c(a:b),]
第a行到第b行
xxnb[c(a,b)]
第a列和第b列
xxnb$列名
也可以提取列
7.直接使用数据框中的变量
不知道怎么解释。。。直接上栗子
a <-data.frame(case=paste("S",1:50),values=runif(50))
plot(a$case,a$values)
这样就是提取case和values两列做散点图
但是怎么样避免要一直重复输变量a呢
有两种办法
第一种:attach
attach(a)
plot(case,values)
将数据框名添加到搜索环境中:attach(a),作图时就只需输入列名(连$都不用了)
做完后将a删除出搜索环境 detach(a)
局限性:两个以上数据框的列名有冲突时,同时attach会报错
第二种:with
先解释一下with(xxnb,xx)
就是调取xxnb里边的xx
with(a,{
plot(case,values)
x<<-summary(values) #求和并赋值给x,<<的意思是作为全局变量,也就是出了大括号仍有效。
})
x #运行完后打印x
其实这个方法没有很看懂。。
第四步
保存脚本
随便复制黏贴一个代码
然后保存,下次可以直接打开
最后放上思维导图梳理一下
最后的最后回答一下问题
save(X,file="test.RData")这句代码如果报错X not found,是为什么,应该怎么解决?
因为没有这个变量,检查一下要保存的变量到底叫啥,注意大小写什么的