echo " Hello 数据结构 "
Hello 数据结构
·先来点豆豆花花有用的小笔记
(6)表格在R语言中改名叫数据框
(7)查看帮助:?read.table,调出对应的帮助文档,翻到example部分研究一下。
(8)数据类型(重点只有两个,剩下的不看)
·向量(vector)👈重要
·矩阵(Matrix)
·数组(Array)
·数据框(Data frame)👈重要
·List
上思维导图——
数据类型
一、向量
元素指的是数字或者字符串;
标量:一个元素,如'huahua'。
向量:一排有序排列的元素,如c(1,2,3)。
1.赋值
> x <- c(1,2,3) #元素123
> x
[1] 1 2 3
> x <- 1:10 #范围
> x
[1] 1 2 3 4 5 6 7 8 9 10
> x <- seq(1,10,by = 0.5) #间隔
> x
[1] 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0
[10] 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5
[19] 10.0
> x <- rep(1:3,times=2) #重复
> x
[1] 1 2 3 1 2 3
2.元素提取
(1)根据位置
以x <- rep(1:3,times=2)
的结果为例
> x
[1] 1 2 3 1 2 3
> x[4] #第4个
[1] 1
> x[-4] #除去第4个
[1] 1 2 3 2 3
> x[2:4] #范围
[1] 2 3 1
> x[-(2:4)] #除了第2-4个元素
[1] 1 2 3
> x[c(1,5)] #第1和第5个
[1] 1 2
(2)根据值
以x <- -1:10
的结果为例
> x
[1] -1 0 1 2 3 4 5 6 7 8 9 10
> x[x==10]
[1] 10
> x[x<0]
[1] -1
> x[x %in% c(1,2,5)] #存在于向量c(1,2,5)中的元素
[1] 1 2 5
二、数据框
(1)读取本地数据
read.table() :读取矩形表格数据。
seq:指定字符的分隔符号。如sep = "\t"
,表示用制表符分隔。
header:第一行是否用作列名称。
(2)设置行名和列名
colnames(X) :查看列名
rownames(X) :查看行名
row.names = 1:修改第一列为行名
(3)数据框的导出
write.table(X,file = "yu.txt",sep = ",",quote=F)
write.table():数据导出
quote=F:字符串不加双引号
(4)变量的保存与重新加载
save.image(file=" "):保存当前所有变量
save(X,file=" "):保存其中一个变量X
load(" "):加载变量文件
(5)提取元素
X[x,y]:第x行第y列
X[x,]:第x行
X[,y]:第y列
X[y] :第y列
X$列名:提取某列
X为取值来源变量。
其他[ ]内取值逻辑和上文类似。
(6)【选修部分】直接使用数据框中的变量
plot(iris$Sepal.Length,iris$Sepal.Width)
iris:R语言的内置数据。
- 课后问题
问题:save(X,file="test.RData")这句代码如果报错object X not found,是为什么,应该怎么解决?
答:因为目标对象X没有赋值,不存在。R语言中区分英文大小写,出现这种情况可能是将变量赋值到了小写x。
解决方法为重新赋值X,或将上述代码的X换成x。