R语言的数据结构

相较昨天难了一丢丢，还是需要多理解和消化，学会动手百度一下也很重要，以及代码一定要理解不能纯复制

第一步

区分标量（一个元素组成的变量）和向量（多个元素组成的有序变量）
那么怎么给向量赋值呢，大概有以下几种方法👇
x<- c(1,2,3) 这是常用的向量写法，意为将x定义为由元素1，2，3组成的向量
x<- 1:10 x为从1-10之间所有的整数
x<- seq(1,10,by = 0.5) x为1-10之间每隔0.5取一个数（注意是逗号不是分号）
x<- rep(1:3,times=2)x为1-3 ，重复2次
如果一直在给同一个变量赋值。。。那结果以最后一次为哈

第二步

从向量中提取元素
可以分为两种方法
1.根据元素位置（这里的x是刚刚赋值的那个变量）
x[4] 提取x第4个元素
x[-4]提取除了第4个元素之外剩余的元素
x[2:4]提取第2到4个元素
x[-(2:4)]提取除了第2-4个元素
x[c(1,5)] 提取第1个和第5个元素

2.根据值
x[x==10]等于10的元素
x[x<0]小于0的元素
x[x %in% c(1,2,5)]存在于向量c（1，2，5）中的元素

疯狂划重点！！！
x[c(1,2)] 和x[x %in% c(1,2)]的意思真的不一样！！
举个栗子👇

我是栗子

x[c(1,2)]指的是x中的第1、2个元素；而x[x %in% c(1,2)]指的是x中所有值为1、2的元素！！！！

第三步

数据框(有点头大)
1.读取本地数据
还是举个栗子
read.table(file="xx.txt",sep="\t",header=T)
就是提取了那个叫xx的txt，sep="\t"的话数据会是一列一列的 sep=","的话数据会用逗号隔开，嗷sep=" "也可以，道理同上
header=T的话第一行用于列名称，具体数据从第二行开始 header=F的话第一行即为具体数据

sep=","

sep="\t"

header=T

header=F

可以看出来header=F会比header=T多出一行
2.创建数据框
举个栗子

xxnb <- data.frame(xx=c("clever","beautiful",6),zz=c("fat","white",7),mm=c("cute","handsome",8))

然后~当当当当

我是新建的数据框

3.设置行名和列名
colnames(xxnb) 查看列名
rownames(xxnb) 查看行名
colnames(xxnb)[1]<-"xinxin"把第一列名改为xx
rownames(xxnb)[1]<-"zz zhende taoyan"把第一行名改为zz zhende taoyan
下面这个注意一下！！
X<-read.csv(file = "xx.txt",sep = " ",header =T,row.names=1)
row.names=1的意思是修改第一列为行名

4.数据框的导出
栗子👉write.table(X,file = "yu.txt",sep = ",",quote=F)
quote=F意思字符串不加双引号

5.变量的保存与重新加载
save.image(file="xx.RData")保存当前所有变量
save(xxnb,file="zz.RData")保存其中一个变量
load("zz.RData")再次使用RData时的加载命令
(后两行进行实验的时候记得要删掉现在环境中的所有变量，否则就算只保存了一个，load完还是所有变量都在哦
那么怎么删掉所有变量呢，昨天有学的，但是我忘了
rm(list=ls()) rm(list=ls()) rm(list=ls()) 重要的事情说三遍！！！)
6.提取元素
xxnb[x,y]第x行第y列
xxnb[x,]第x行
xxnb[,y]第y列
xxnb[y]也是第y列
xxnb[a:b]第a列到第b列
xxnb[c(a:b),]第a行到第b行
xxnb[c(a,b)]第a列和第b列
xxnb$列名也可以提取列

7.直接使用数据框中的变量
不知道怎么解释。。。直接上栗子

a <-data.frame(case=paste("S",1:50),values=runif(50))
 plot(a$case,a$values)

这样就是提取case和values两列做散点图
但是怎么样避免要一直重复输变量a呢
有两种办法
第一种：attach

attach(a)
plot(case,values)

将数据框名添加到搜索环境中：attach（a）,作图时就只需输入列名(连$都不用了)
做完后将a删除出搜索环境 detach（a）
局限性：两个以上数据框的列名有冲突时，同时attach会报错
第二种：with
先解释一下with(xxnb,xx)就是调取xxnb里边的xx

with(a,{
 plot(case,values)
x<<-summary(values)   #求和并赋值给x,<<的意思是作为全局变量，也就是出了大括号仍有效。
})
x #运行完后打印x

其实这个方法没有很看懂。。

第四步

保存脚本

点我

随便复制黏贴一个代码

我是随便复制黏贴的代码

然后保存，下次可以直接打开

长这样

最后放上思维导图梳理一下

Day5（R语言的数据结构）

最后的最后回答一下问题
save(X,file="test.RData")这句代码如果报错X not found，是为什么，应该怎么解决？
因为没有这个变量，检查一下要保存的变量到底叫啥，注意大小写什么的

学习小组Day5笔记-Li

学习小组Day5笔记-Li

R语言的数据结构

第一步

第二步

第三步

第四步

推荐阅读更多精彩内容