学习小组Day5--R语言数据结构--shujun

先上思维导图
学习小组Day5-数据结构.png

1. 豆花给新手Tips

-R的赋值符号不是等号,而是<-
-在Console 控制台输入命令,相当于Linux的命令行
-R的代码都是带括号的,括号必须是英文的。
-显示工作路径 getwd()
-向量是由元素组成的,元素可以是数字或者字符串
-表格在R语言中改名叫数据框
-函数或者命令不会用时,百度/谷歌搜索+?read.tabl命令查看帮助,调出帮助文档
-数据类型:向量、矩阵、数组、数据框、列表

2.向量

(1)元素:数字(numeric)/字符串(charecter)等

-标量:一个元素组成的变量
-向量:多个元素组成的变量 (一个向量是一排有序排列的元素,可作为数据框中的一列)

(2)赋值:给变量定义,赋予这个变量一个数值、字符串、数据框
x<- c(1,2,3)   # 常用的向量写法,意为将x定义为由元素1,2,3组成的向量
x<- 1:10    #从1-10之间所有的整数
x<- seq(1,10,by = 0.5)   #1-10之间每隔0.5取一个数(注意是逗号不是分号)
x<- rep(1:3,times=2)    #1-3 重复2次

查看变量
-右侧environment处,可以发现Values和Datas
-点击Datas中的变量,1)脚本编辑器中会出现一个数据框 2)控制台下会出现View()这个函数

(3)从向量中提取元素

-根据元素位置

x[4]   #x第4个元素
x[-4]    #排除法,除了第4个元素之外剩余的元素
x[2:4]    #第2到4个元素
x[-(2:4)]   #除了第2-4个元素
x[c(1,5)]    #第1个和第5个元素

根据值

x[x==10]     # 等于10的元素
x[x>0]    # 取大于0的元素
x[x %in% c(1,2,5)]    # 存在于向量c(1,2,5)中的元素

3. 数据框

(1)读取本地数据

read.table(file = "doudou.txt",header =T)   #默认分隔符为制表符 \t 
a <- read.table(file = "doudou.txt",header =T)
read.table("doudou.txt")
b <- read.table("doudou.txt")
read.csv("doudou.txt")     # 默认分隔符是","
c <- read.csv("doudou.txt")

参数设置:
-sep = " " "," "\t" #分别以空格、逗号、制表符为分隔符
-header = "T/F" # 是否将第一行作为列命
-row.names = "" #设置行名
-col.names = "" #设置列命

将数据框赋值给a/b/c 3个变量后分别如图所示(差异明显!)

(2)设置行名和列名

colnames(X) # 查看列名
rownames(X) # 查看行名

(3)数据框的导出

write.table(X,file = "yu.txt")
参数设置:https://blog.csdn.net/qq_42937176/article/details/105537432

(4)变量的保存与重新加载

save.image(file="bioinfoplanet.RData")#保存当前所有变量
load("bioinfoplanet.RData")
save(X,file="test.RData") #保存其中一个变量
load("test.RData")

清空environment里面的所有变量后,分别load这两个文件看环境处呈现的变量,能更好的体会什么叫做保存一个变量和所有变量

(5)元素提取

- X[x,y]    #第x行第y列
- X[x,]     #第x行
- X[,y]     #第y列
- X[y]      #也是第y列
- X[a:b]      #第a列到第b列
- X[c(a,b)]   #第a列和第b列
- X$列名     #也可以提取列,可以Tab键自动补全
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。