数据结构
向量
- 元素:数字或字符串(chr,使用时必须加引号)等
- 标量:一个元素组成的变量
- 向量:多个元素组成的变量(一个向量是一排有序排列的元素)
- 从向量中提取元素
- 根据元素位置
- x[a]:x第a个元素
- x[-a]:除第a个元素之外剩余的
- x[a:b]:从a到b个元素
- x[c(a,b)]:第a和b个元素
- 根据值
- x[赋值式子]
- x[x %in% c(a,b,c)]:存在于向量c中的元素
数据框
- 读取本地数据:read.table(file="XXX.txt",sep="\t",header=T)
在输入的时候,原内容是用什么符号分隔的,sep就要保持一致,否则可能无法正确读取;header=T,所代入excel数据,第一行是否用作列名称。true则excel第一行用于列名称,具体数据从第二行开始 false则第一行即为具体数据 - 设置行名和列名
- colnames(X):查看列
- rownames(X) :查看行
- 数据框的导出:write.table(X,file = "XXX.txt",sep = ",",quote=F)
- 变量的保存与重新加载
- save.image(file="XXX.RData"):保存当前所有变量
- save(X,file="XXX.RData"):保存其中一个变量
- load("XXX.RData"):再次使用时加载
- 提取元素
- x[行,列]
- x[行,]
- x[,列],x[列]
- x[a:b],x[c(a,b)]:a列到b列
- x$列名:提取列
- 提取某两列作散点图:plot(iris
Sepal.Width)
51.png
52.png
作业
报错可能有两种原因:
- 变量x不存在
- 变量x未被赋值
重新定义变量或给变量x赋值即可