熟悉数据结构
1.标量和向量的区分
y<- c(1,2,3) #常用的向量写法,意为将x定义为由元素1,2,3组成的向量。
y
y<- 1:10 #从1-10之间所有的整数
y
y<- seq(1,10,by = 0.5) #1-10之间每隔0.5取一个数(注意是逗号不是分号)
y
y<- rep(1:3,times=2) #1-3 重复2次
y
image.png
2.从向量中提取元素
2.1根据元素位置
#这里的x是你刚才赋值的变量名,根据自己的情况来修改
y[5] #x第5个元素
y[-5]#排除法,除了第5个元素之外剩余的元素
y[2:4]#第2到4个元素
y[-(2:4)]#除了第2-4个元素
y[c(1,5)] #第1个和第5个元素
image.png
2.2根据值
y[y==10]#等于10的元素
y[y<0]
y[y %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素
image.png
得好好理解%in%这个符号
3.数据框
(1)读取本地数据
(2)设置行名和列名
(3)数据框的导出
(4)变量的保存与重新加载
x <- read.table(file ="nodes.txt",sep = '\t',header = T)
head(x)
colnames(x)[1]<-"bioplanet" #有的公司返回数据,左上角第一格为空,R会自动补为x,用这个命令来修改
head(x)
y<-read.table(file = "nodes2.txt",sep = " ",header =T,row.names=1)#最后
head(y)
write.table(y,file = "yu.txt",sep = ",",quote=F)#分隔符改为逗号,字符串不加双引号(默认格式带由双引号)
#这次没有处理完的数据下次想接着用怎么办?--学会保存和重新加载。保存的格式是RData。
save.image(file="bioinfoplanet.RData")#保存当前所有变量
save(X,file="test.RData")#保存其中一个变量
load("test.RData")#再次使用RData时的加载命令
(5)提取元素
y[1,2]#第1行第2列
y[1,]#第1行
y[,3]#第3列
y[3] #也是第y列
y[1:2]#第1列到第2列
y[c(1,2)]#第a列和第b列
y$gene 列名#也可以提取列
```散点图因为没下载数据 算了 下次吧
记下代码
a <-data.frame(case=paste("S",1:50),values=runif(50))
plot(avalues)
方法1:attach
将数据框名添加到搜索环境中:attach(a),作图时就只需输入列名(连$都不用了)。
attach(a)
plot(case,values)
方法2:with
with(a,{
plot(case,values)
x<<-summary(values) #求和并赋值给x,<<的意思是作为全局变量,也就是出了大括号仍有效。
})
x #运行完后打印x
save没找到X,那重复赋值一下X,就可以了吧