学习小组Day5笔记-云云

向量

向量是由元素组成的,元素可以是数字或者字符串(chr)。
标量:一个元素组成的变量
向量:多个元素组成的变量

微信图片_20220730163430.png

给变量定义,即“赋值”,赋予这个变量一个数值/字符串/数据框等。
赋值符号:<-
例:
x<- c(1,2,3) 将x定义为由元素1,2,3组成的向量
x<- 1:10 从1-10之间所有的整数
x<- seq(1,10,by = 0.5) 1-10之间每隔0.5取一个数
x<- rep(1:3,times=2) 1-3 重复2次

对同一个变量进行多次赋值,则新赋值覆盖旧赋值。

从向量中提取元素

①根据元素位置
x:变量名
x[4] x第4个元素
x[-4]排除法,除了第4个元素之外剩余的元素
x[2:4]第2到4个元素
x[-(2:4)]除了第2-4个元素
x[c(1,5)] 第1个和第5个元素

个人理解:
单个
[]内填数字几指代第几个元素
-代表排除
代表某个元素至某个元素
c(,)填上几个数字,逗号隔开,表示选择对应位置的元素

②根据值
x[x==10]等于10的元素
x[x<0]小于0的元素
x[x %in% c(1,2,5)]x被赋的值中存在于向量c(1,2,5)中的值

设置数据框

查看目前工作目录: getwd()
将文件放到该工作目录下,否则无法读取。
X<-read.csv('doudou.txt')以读取文件,文档会出现在右下角框内,右上角数据框会出现读取的数据,点击表格图标可获取数据框,显示在上方。

屏幕截图 2022-07-30 171252.jpg
读取本地数据

read.table(file="huahua.txt",sep ="\t",header=T),输出如下:

屏幕截图 2022-07-30 172944.jpg

NA代表空值
header=T代表导入的数据第一行用作列名称
header=F则不列名称,具体数据从第一行开始
sep:确定以什么分割,一般情况下
csv 文件 sep = “,” 以逗号分割
txt 文件 sep = “\t” 以制表符分割
其他文件 sep = " " 以空格分割

设置行名和列名

X<-read.csv('doudou.txt') 将X定义为读取该txt输出的数据框
colnames(X) 查看列名
rownames(X) 查看行名,默认值的行名是行号,1.2.3.4...
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)最后row.names的意思是修改第一列为行名,对比如下:

命令前

命令后

colnames(X)[1]<-"bioplanet"#有的返回数据,左上角第一格为空,R会自动补为x,用这个命令来修改

导出当前数据框:
write.table(X,file = "yu.txt",sep = ",",quote=F)
则输出当前数据框为新文件“yu.txt",出现在右下角列表中
quote:引用,即字符串会被引号引起来

使用和不使用quote=F的对比

变量的保存与重新加载

保存这次未处理结束的数据下次使用:保存的格式为RData。
save.image(file="bioinfoplanet.RData")保存当前所有变量
save(X,file="test.RData")保存其中一个变量,该命令表示保存变量X
load("test.RData")再次使用RData时的加载命令

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容