1.新手牢记
R赋值为<-
代码为全英模式,括号要对称
向量由若干元素组成,只有1个数字或字符串时为标量,多个为向量
?read.table是学习的重要手段
2.重点一 向量
复现
x<- c(1,2,3)
x
[1] 1 2 3
x <- 1:10
x
[1] 1 2 3 4 5 6 7 8 9 10
x <- seq(1,18,by=0.5)
x
[1] 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5
[19] 10.0 10.5 11.0 11.5 12.0 12.5 13.0 13.5 14.0 14.5 15.0 15.5 16.0 16.5 17.0 17.5 18.0
x <- rep(1:4,times=2)
x
[1] 1 2 3 4 1 2 3 4
方括号:提取的意思
x[5]
[1] 1#提取第5个
x[-5]
[1] 1 2 3 4 2 3 4#去除第5个之后
x[2:5]
[1] 2 3 4 1#第2到第5 共4个
x[-(2:5)]
[1] 1 2 3 4#去除第2到第5 有点奇特,1是第一轮的,2 3 4 是第二轮的
x[c(1,5)] #第1、第5个
[1] 1 1
x[x==10]
integer(0) #没有10
x[x<0]
integer(0)#没有小于0的
x[x %in% c(1,2,5)]
[1] 1 2 1 2#有
3.重点二 数据框
read.table(file = "huahua.txt",sep = "\t",header = T)
X1 X2
1 A 1
2 B NA
3 C NA
4 D 3
5 E NA
?read.table
sep为分隔符,默认空格,即什么都不写时为空格
header为表头,即变量名
a <- read.table(file = "huahua.txt",sep = "\t",header = T)
View(a)
设置行列名
X<-read.csv('doudou.txt') #读取
colnames(X)
[1] "X1" "X2"
rownames(X)
[1] "1" "2" "3" "4" "5"
colnames(X)[1]<-"bioplanet"
colnames(X)[1]
[1] "bioplanet"
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)
X
X2
A 1
B NA
C NA
D 3
E NA
列的提取较多切复杂,能感觉到对变量的看重而非一个观测值
- X[,y]#第y列
- X[y] #也是第y列
- X[a:b]#第a列到第b列
- X[c(a,b)]#第a列和第b列
- X$列名#也可以提取特定列
save(X,file="test.RData")
object X not found问题回答:
很可能是大小写的问题,R是严格区分大小写的。别的也想不到了。