学习小组Day5笔记-云云

向量

向量是由元素组成的，元素可以是数字或者字符串(chr)。
标量：一个元素组成的变量
向量：多个元素组成的变量

微信图片_20220730163430.png

给变量定义，即“赋值”，赋予这个变量一个数值/字符串/数据框等。
赋值符号：<-
例：
x<- c(1,2,3) 将x定义为由元素1，2，3组成的向量
x<- 1:10 从1-10之间所有的整数
x<- seq(1,10,by = 0.5) 1-10之间每隔0.5取一个数
x<- rep(1:3,times=2) 1-3 重复2次

对同一个变量进行多次赋值，则新赋值覆盖旧赋值。

从向量中提取元素

①根据元素位置
x：变量名
x[4] x第4个元素
x[-4]排除法，除了第4个元素之外剩余的元素
x[2:4]第2到4个元素
x[-(2:4)]除了第2-4个元素
x[c(1,5)] 第1个和第5个元素

个人理解：
单个[]内填数字几指代第几个元素
-代表排除
：代表某个元素至某个元素
c(,)填上几个数字，逗号隔开，表示选择对应位置的元素

②根据值
x[x==10]等于10的元素
x[x<0]小于0的元素
x[x %in% c(1,2,5)]x被赋的值中存在于向量c（1，2，5）中的值

设置数据框

查看目前工作目录： getwd()
将文件放到该工作目录下，否则无法读取。
X<-read.csv('doudou.txt')以读取文件，文档会出现在右下角框内，右上角数据框会出现读取的数据，点击表格图标可获取数据框，显示在上方。

屏幕截图 2022-07-30 171252.jpg

读取本地数据

read.table(file="huahua.txt",sep ="\t",header=T)，输出如下：

屏幕截图 2022-07-30 172944.jpg

NA代表空值
header=T代表导入的数据第一行用作列名称
header=F则不列名称，具体数据从第一行开始
sep：确定以什么分割，一般情况下
csv 文件 sep = “,” 以逗号分割
txt 文件 sep = “\t” 以制表符分割
其他文件 sep = " " 以空格分割

设置行名和列名

X<-read.csv('doudou.txt') 将X定义为读取该txt输出的数据框
colnames(X) 查看列名
rownames(X) 查看行名,默认值的行名是行号，1.2.3.4...
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)最后row.names的意思是修改第一列为行名,对比如下：

命令前

命令后

colnames(X)[1]<-"bioplanet"#有的返回数据，左上角第一格为空，R会自动补为x,用这个命令来修改

导出当前数据框：
write.table(X,file = "yu.txt",sep = ",",quote=F)
则输出当前数据框为新文件“yu.txt"，出现在右下角列表中
quote:引用，即字符串会被引号引起来

使用和不使用quote=F的对比

变量的保存与重新加载

保存这次未处理结束的数据下次使用：保存的格式为RData。
save.image(file="bioinfoplanet.RData")保存当前所有变量
save(X,file="test.RData")保存其中一个变量，该命令表示保存变量X
load("test.RData")再次使用RData时的加载命令

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

学习小组Day5笔记-云云