学习小组Day5笔记-Li

R语言的数据结构

相较昨天难了一丢丢,还是需要多理解和消化,学会动手百度一下也很重要,以及代码一定要理解不能纯复制

第一步

区分标量(一个元素组成的变量)和向量(多个元素组成的有序变量)
那么怎么给向量赋值呢,大概有以下几种方法👇
x<- c(1,2,3) 这是常用的向量写法,意为将x定义为由元素1,2,3组成的向量
x<- 1:10 x为从1-10之间所有的整数
x<- seq(1,10,by = 0.5) x为1-10之间每隔0.5取一个数(注意是逗号不是分号)
x<- rep(1:3,times=2)x为1-3 ,重复2次
如果一直在给同一个变量赋值。。。那结果以最后一次为哈

第二步

从向量中提取元素
可以分为两种方法
1.根据元素位置(这里的x是刚刚赋值的那个变量
x[4] 提取x第4个元素
x[-4]提取除了第4个元素之外剩余的元素
x[2:4]提取第2到4个元素
x[-(2:4)]提取除了第2-4个元素
x[c(1,5)] 提取第1个和第5个元素

2.根据值
x[x==10]等于10的元素
x[x<0]小于0的元素
x[x %in% c(1,2,5)]存在于向量c(1,2,5)中的元素

疯狂划重点!!!
x[c(1,2)]x[x %in% c(1,2)]的意思真的不一样!!
举个栗子👇

我是栗子

x[c(1,2)]指的是x中的第1、2个元素;而x[x %in% c(1,2)]指的是x中所有值为1、2的元素!!!!

第三步

数据框(有点头大)
1.读取本地数据
还是举个栗子
read.table(file="xx.txt",sep="\t",header=T)
就是提取了那个叫xx的txt,sep="\t"的话数据会是一列一列的 sep=","的话数据会用逗号隔开,嗷sep=" "也可以,道理同上
header=T的话第一行用于列名称,具体数据从第二行开始 header=F的话第一行即为具体数据

sep=","

sep="\t"

header=T

header=F

可以看出来header=F会比header=T多出一行
2.创建数据框
举个栗子

xxnb <- data.frame(xx=c("clever","beautiful",6),zz=c("fat","white",7),mm=c("cute","handsome",8))

然后~当当当当


我是新建的数据框

3.设置行名和列名
colnames(xxnb) 查看列名
rownames(xxnb) 查看行名
colnames(xxnb)[1]<-"xinxin"把第一列名改为xx
rownames(xxnb)[1]<-"zz zhende taoyan"把第一行名改为zz zhende taoyan
下面这个注意一下!!
X<-read.csv(file = "xx.txt",sep = " ",header =T,row.names=1)
row.names=1的意思是修改第一列为行名

4.数据框的导出
栗子👉write.table(X,file = "yu.txt",sep = ",",quote=F)
quote=F意思字符串不加双引号

5.变量的保存与重新加载
save.image(file="xx.RData")保存当前所有变量
save(xxnb,file="zz.RData")保存其中一个变量
load("zz.RData")再次使用RData时的加载命令
(后两行进行实验的时候记得要删掉现在环境中的所有变量,否则就算只保存了一个,load完还是所有变量都在哦
那么怎么删掉所有变量呢,昨天有学的,但是我忘了
rm(list=ls()) rm(list=ls()) rm(list=ls()) 重要的事情说三遍!!!)
6.提取元素
xxnb[x,y]第x行第y列
xxnb[x,]第x行
xxnb[,y]第y列
xxnb[y]也是第y列
xxnb[a:b]第a列到第b列
xxnb[c(a:b),]第a行到第b行
xxnb[c(a,b)]第a列和第b列
xxnb$列名也可以提取列

7.直接使用数据框中的变量
不知道怎么解释。。。直接上栗子

a <-data.frame(case=paste("S",1:50),values=runif(50))
 plot(a$case,a$values)

这样就是提取case和values两列做散点图
但是怎么样避免要一直重复输变量a呢
有两种办法
第一种:attach

attach(a)
plot(case,values)

将数据框名添加到搜索环境中:attach(a),作图时就只需输入列名(连$都不用了)
做完后将a删除出搜索环境 detach(a)
局限性:两个以上数据框的列名有冲突时,同时attach会报错
第二种:with
先解释一下with(xxnb,xx)就是调取xxnb里边的xx

with(a,{
 plot(case,values)
x<<-summary(values)   #求和并赋值给x,<<的意思是作为全局变量,也就是出了大括号仍有效。
})
x #运行完后打印x

其实这个方法没有很看懂。。

第四步

保存脚本


点我

随便复制黏贴一个代码


我是随便复制黏贴的代码

然后保存,下次可以直接打开
长这样

最后放上思维导图梳理一下

Day5(R语言的数据结构)

最后的最后回答一下问题
save(X,file="test.RData")这句代码如果报错X not found,是为什么,应该怎么解决?
因为没有这个变量,检查一下要保存的变量到底叫啥,注意大小写什么的

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容