学习小组的第五天
数据类型
元素 向量 标量 变量
图片来源:生物星球
赋值:
向量中提取元素
①根据元素位置
例如:x[4] 第4个元素
x[-4] 排除法,除第4个元素之外的元素
x[2:4] 第2到4个元素
x[c(1,5)] 第1个和第5个元素
②根据值
如:x[x= =10] 等于10的元素
x[x<0]
x[x %in% c(1,2,5)] 存在于向量c(1,2,5) 中的元素
数据框
①读取本地数据
示例数据一定要放在工作目录里,否则报错。
read.table(file = "huahua.txt",sep = "\t",header =T)
a<- read.table(file = "huahua.txt",sep = "\t",header =T)
sep,header是比较常用的参数
②设置行名和列名 严格区分大小写
x<- read.csv('doudou.txt') 变量x是一个数据框
colnames(x)
rownames(x)
colnames(x)[1]<- "bioplanet"#有的公司返回数据,左上角第一格为空,R会自动补为x,用这个命令来修改
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)#最后row.names的意思是修改第一列为行名
③数据框的导出
write.table(x,file ="yu.txt", sep=",",quote=F)
④变量的保存与重新加载
save.image(file="bioinfoplanet.RData")保存当前所有变量
save(x,file="test.RData")保存其中一个变量
load("test.RData")再次使用RData时的加载命令
⑤提取元素
⑥直接使用数据框中的变量
提取某两列作散点图:
这里的case和values是两个单纯的列名,没别的意思
options(stringsAsFactors = T)
a <-data.frame(case=paste0("S",1:9),values=runif(9))
plot(avalues)
这种方法有个缺点:数据框名a在代码中重复出现(不符合懒惰(哦不,高效)的要求)
save(X,file="test.RData")这句代码如果报错object X not found,是因为没有区分大小写,重新改一下大小写,再跑一下代码