Day5 数据结构.png

1. 数据类型

向量（vector）、矩阵（Matrix）、数组（Array）、数据框（Data frame）、List

2.向量

2.1元素、标量、向量

元素、标量、向量.png

在实际使用时，一般会给变量定义，即“赋值”（<-）,举例如下：

x<- 1 # x=1
x<- c(1,2,3) # x为由1,2,3组成的向量
x<- 1:10 # 从1-10之间所有的整数
x<- seq(1,10,by = 2)  # 从1到10，每隔2取一个数
x<- rep(1:3,times=2) # 从1到3之间的所有整数，重复2遍

2.2 从向量中提取元素

方法1：根据元素位置

x<-  seq(1,10,by = 2)
x[4] #x中的第4个元素
x[-4] #排除法，除了第4个元素之外剩余的元素
x[2:4] #第2到4个元素
x[-(2:4)] #除了第2-4个元素
x[c(1,5)] #第1个和第5个元素

方法2：根据值

x[x=1] #x中等于1的元素
x[x<3] #x中小于的元素
x[x %in% c(1,2,5)] #存在于向量c（1，2，5）中的元素

image.png

3.数据框

3.1 准备工作

将相关文件放入工作目录（read的时候默认从工作目录里面读取）

3.2 读取本地数据

read.table(file = "huahua.txt",sep="\t",header =T)
a<-read.table(file = "huahua.txt",sep="\t",header =T)

3.3 设置行名和列名

X<-read.csv('doudou.txt') #X实质上是一个数据框
colnames(X) #查看列名
rownames(X) #查看行名,默认值的行名就是行号，1.2.3.4...
colnames(X)[1]<-"bioplanet"#实际情况：左上角第一格常常为空，R会自动补为x,用该命令可修改第一列的名字
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)#最后row.names的意思是修改第一列为行名

3.4 数据框的导出

write.table(X,file = "yu.txt",sep = ",",quote=F)#分隔符改为逗号，字符串不加双引号（默认格式带由双引号）

3.5 变量的保存与重新加载

#应用场景：本次处理的数据，后续想继续使用
#保存格式：RData
save.image(file="bioinfoplanet.RData")#保存当前所有变量，在这里指的是保存整个“bioinfoplanet.RData”文件
save(X,file="test.RData")#保存其中一个变量，这里的X指的是test.RData文件中的的一个变量
load("test.RData")#再次使用RData时的加载命令

3.6 提取元素

- X[x,y]#第x行第y列
- X[x,]#第x行
- X[,y]#第y列
- X[y] #也是第y列
- X[a:b]#第a列到第b列
- X[c(a,b)]#第a列和第b列

image.png

3.7 直接使用数据框中的变量

plot(iris$Sepal.Length,iris$Sepal.Width) #iris是R语言的内置数据，可以直接使用。提取某两列作散点图：

On the way.

Day5——Doc.Shu

Day5——Doc.Shu

1. 数据类型

2.向量

2.1元素、标量、向量

2.2 从向量中提取元素

3.数据框

3.1 准备工作

3.2 读取本地数据

3.3 设置行名和列名

3.4 数据框的导出

3.5 变量的保存与重新加载

3.6 提取元素

3.7 直接使用数据框中的变量

推荐阅读更多精彩内容