R数据结构
1、R中的赋值符号是 <- ,不是=
2、Console控制台输入命令,相当于Linux的command line
3、括号注意使用都是英文半角括号
4、显示工作路径 get()
5、向量是由元素组成的,可以使数字或字符串
6、表格在R中为数据框
7、数据类型主要看:向量(vector)和数据框(Data frame)
向量
标量和向量
标量:一个元素组成的变量
向量:多个元素组成的变量,一排有序排列的元素。
赋值:给变量定义。
从向量中提取元素
根据元素位置
x[4] #x第4个元素
x[-4]#排除法,除了第4个元素之外剩余的元素
x[2:4]#第2到4个元素
x[-(2:4)]#除了第2-4个元素
x[c(1,5)] #第1个和第5个元素
根据值
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素
数据框
读取本地文件
> getwd()
[1] "/Users/yuxiyang/Desktop"
> read.csv(file="huahua.txt", sep = "\t", header = TRUE)
X1 X2
1 A 1
2 B NA
3 C NA
4 D 3
5 E NA
设置行名、列名
> a <- read.csv(file="huahua.txt", sep = "\t", header = TRUE)
> colnames(a)
[1] "X1" "X2"
> rownames(a)
[1] "1" "2" "3" "4" "5"
> colnames(a)[1] <- "bioplanet"
> x <- read.csv(file="huahua.txt", sep = "\t", header = TRUE, row.names = 1)
> colnames(x)
[1] "X2"
数据框的导出
> write.table(x,file = "yu.txt",sep = ",",quote=F)
变量保存与加载
> save(x,file="test.RData")#保存其中一个变量
> load("test.RData")#再次使用RData时的加载命令
提取元素
X[x,y]#第x行第y列
X[x,]#第x行
X[,y]#第y列
X[y] #也是第y列
X[a:b]#第a列到第b列
X[c(a,b)]#第a列和第b列
X$列名#也可以提取列(优秀写法,而且这个命令还优秀到不用写括号的地步,并且支持Tab自动补全哦,不过只能提取一列)
直接使用数据框变量
options(stringsAsFactors = T)
a <-data.frame(case=paste0("S",1:9),values=runif(9))
plot(a$case,a$values)
attach()
attach(a)
plot(case,values)
deattach(a)
with()
with(a,{
plot(case,values)
x<<-summary(values) #求和并赋值给x,<<的意思是作为全局变量,也就是出了大括号仍有效。
})
x #运行完后打印x
课后作业
save(X,file="test.RData"),这句代码如果报错object X not found,是为什么,应该怎么解决?
查找变量X,第一确定有变量X,其次注意区分变量大小写。