Day 5 - 雯雯~

数据结构

今天学习的数据类型主要有向量（vector）和数据框（Data frame）。

向量

1.标量与向量区分：

元素：数字或者字符串（用chr表示）等
标量：1个元素组成的变量
向量：多个元素组成的变量

2.赋值：
eg：x<- 4 #x=4
3.从向量中提取元素
可以根据元素位置或值来提取。eg：

x[4] #提取x中第四个元素
x[-4]#除了第4个元素之外剩余的元素
x[2:4]#第2到4个元素
x[-(2:4)]#除了第2-4个元素
x[c(1,5)] #第1个和第5个元素

x[x==10]#等于10的元素
x[x<0]#小于0的元素
x[x %in% c(1,2,5)]#存在于向量c（1，2，5）中的元素

例子中的%in%：判断前面一个向量内的元素是否在后面一个向量中，返回布尔值。布尔值代表“真”和“假”两个状态。“真”用关键字true表示，“假”用关键字false表示

a <- c(1,3,13,1443,43,43,4,34,3,4,3) 
b <- c(1,13,11,1313,434,1) 
a %in% b
结果为：
[1]  TRUE FALSE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

a[a %in% b] #提取元素
结果为：
[1]  1 13

数据框

一定要将要用到的数据文件发到工作目录下！！！
X<-read.csv("文件名.txt")可获得数据框。
若不明白某个函数的用法，可以使用命令? 函数名称来获得右下角方框中help的帮助。
1.读取本地数据：

a<-read.table() #读取文件并赋值给a
sep #字段间隔符
header #当且仅当第一行包含比列数少一个字段时，header=true

2.设置行名和列名
先查看：colnames(X)，rownames(X)
再设置：

colnames(X)[1]<-"bioplanet" #将左上角第一格改为bioplanet
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1) #最后row.names的意思是修改第一列为行名

3.数据框的导出

write.table(X,file = "yu.txt",sep = ",",quote=F)#分隔符改为逗号
quote #字符串不加双引号（默认格式带由双引号）

4.变量的保存与重新加载

save.image(file="bioinfoplanet.RData") #保存当前所有变量
save(X,file="test.RData") #保存其中一个变量
load("test.RData") #再次使用RData时的加载命令

5.提取元素

- X[x,y] #提取第x行第y列的元素
- X[x,] #第x行
- X[,y] 和 - X[y] #第y列
- X[a:b] #第a列到第b列
- X[c(a,b)] #第a列和第b列
- X$列名 #也可以提取列，不过只能提取一列

脚本文件的后缀是.R。若要保存为脚本，则直接保存（save）即可；若要打开，则在R studio中打开即可。
如果save(X,file="test.RData")这句代码如果报错X not found，那么原因可能是其中的大小写不统一，改成统一就可以啦。

数据类型

最后编辑于：2020.11.11 10:53:47

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

Day 5 - 雯雯~

Day 5 - 雯雯~

数据结构

向量

数据框

相关阅读更多精彩内容

友情链接更多精彩内容