生信星球Day5-杨羽茜

R数据结构

1、R中的赋值符号是 <- ,不是=
2、Console控制台输入命令,相当于Linux的command line
3、括号注意使用都是英文半角括号
4、显示工作路径 get()
5、向量是由元素组成的,可以使数字或字符串
6、表格在R中为数据框
7、数据类型主要看:向量(vector)和数据框(Data frame)

向量

标量和向量

标量:一个元素组成的变量
向量:多个元素组成的变量,一排有序排列的元素。
赋值:给变量定义。

从向量中提取元素

根据元素位置

x[4] #x第4个元素
x[-4]#排除法,除了第4个元素之外剩余的元素
x[2:4]#第2到4个元素
x[-(2:4)]#除了第2-4个元素
x[c(1,5)] #第1个和第5个元素

根据值

x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素

数据框

读取本地文件

> getwd()
[1] "/Users/yuxiyang/Desktop"
> read.csv(file="huahua.txt", sep = "\t", header = TRUE)
  X1 X2
1  A  1
2  B NA
3  C NA
4  D  3
5  E NA

设置行名、列名

> a <- read.csv(file="huahua.txt", sep = "\t", header = TRUE)
> colnames(a)
[1] "X1" "X2"
> rownames(a)
[1] "1" "2" "3" "4" "5"
> colnames(a)[1] <- "bioplanet"
> x <- read.csv(file="huahua.txt", sep = "\t", header = TRUE, row.names = 1)
> colnames(x)
[1] "X2"

数据框的导出

> write.table(x,file = "yu.txt",sep = ",",quote=F)

变量保存与加载

> save(x,file="test.RData")#保存其中一个变量
> load("test.RData")#再次使用RData时的加载命令

提取元素

X[x,y]#第x行第y列
X[x,]#第x行
X[,y]#第y列
X[y] #也是第y列
X[a:b]#第a列到第b列
X[c(a,b)]#第a列和第b列
X$列名#也可以提取列(优秀写法,而且这个命令还优秀到不用写括号的地步,并且支持Tab自动补全哦,不过只能提取一列)

直接使用数据框变量

options(stringsAsFactors = T)
a <-data.frame(case=paste0("S",1:9),values=runif(9))
plot(a$case,a$values)

attach()

attach(a)
plot(case,values)
deattach(a)

with()

with(a,{
 plot(case,values)
x<<-summary(values)   #求和并赋值给x,<<的意思是作为全局变量,也就是出了大括号仍有效。
})
x #运行完后打印x

课后作业

save(X,file="test.RData"),这句代码如果报错object X not found,是为什么,应该怎么解决?

查找变量X,第一确定有变量X,其次注意区分变量大小写。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。