划重点
- 显示工作路径
getwd()
- 表格在R语言中改名叫数据框
- 函数或命令不会用时,
?read.table
,调出对应的帮助文档,翻到example部分研究一下
向量
首先明确“元素”的意思,元素指的是数字或者字符串(用chr表示)等,根据它可以区分两个词:
标量:一个元素组成的变量
向量:多个元素组成的变量(就是多个数字、文本等元素组成的)
1.给变量赋值(<-
)
注:在哪儿看变量(右上environment)
2. 从向量中提取元素
(1)根据元素位置
x[4]
第4个元素
x[-4]
排除法,除了第4个元素之外剩余的元素
x[2:4]
第2到4个元素
x[-(2:4)]
除了第2-4个元素
x[c(1,5)]
第1个和第5个元素
(2)根据值
x[x==10]
等于10的元素
x[x<0]
小于0的元素
x[x %in% c(1,2,5)]
存在于向量c(1,2,5)中的元素
数据框
1.读取本地数据
将示例数据放在工作目录下!!!!
read.table(file = "huahua.txt")
- sep
- header
2.设置行名和列名
X<-read.csv('doudou.txt') #在示例数据里有doudou.txt 注意这里的变量X是一个数据框
colnames(X) #查看列名
rownames(X) #查看行名,默认值的行名就是行号,1.2.3.4...
colnames(X)[1]<-"bioplanet"#有的公司返回数据,左上角第一格为空,R会自动补为x,用这个命令来修改
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)#最后row.names的意思是修改第一列为行名
- 先将一个数据框赋给变量,colnames(变量名)是查看列名,rownames(变量名)是查看行名。
3.数据框的导出
4.变量的保存与重新加载(保存的格式是Rdata)
save.image(file="bioinfoplanet.RData")
#保存当前所有变量
save(X,file="test.RData")
#保存其中一个变量
load("test.RData")
#再次使用RData时的加载命令
5.提取元素
- X[x,y]#第x行第y列
- X[x,]#第x行
- X[,y]#第y列
- X[y] #也是第y列
- X[a:b]#第a列到第b列
- X[c(a,b)]#第a列和第b列