学习小组Day5笔记-梦幻天堂

首先复习一下一个重要命令
help()或者?，可以查询不会的函数。
rm(list = ls())，清除所有环境中的变量。
下面开始今天的学习，

向量

标量和向量的区别

摘自生信星球

元素指的是数字或者字符串（用chr表示）等，根据它可以区分两个词：
标量：一个元素组成的变量
向量：多个元素组成的变量

总结一下就是标量是一个字符或数字，向量是一堆。
做以下练习

x<-c(1,2,3) #常用的向量定义写法，意为将x定义为由元素1，2，3组成的向量。
x<-(1:10) #从1-10之间所有的整数
x<-seq(1,10,by = 0.5) #1-10之间每隔0.5取一个数（注意这里是逗号不是分号）
x<-rep(1:3,times=2) #1-3 重复2次

体会：x<-c(1,2,3)与x<-(1:10)含义相同，都是赋值。都可以用x(2)函数查看。
x<-seq(1,10,by=0.5)这个命令只能是,不能写成:。
x<-rep(1:3,times=2)这个命令只能是:，不能是,。

Snipaste_2018-10-26_19-16-56.png

从向量中提取元素

根据元素的位置，代码引用生信星球。

x[4] #x第4个元素
x[-4]#排除法，除了第4个元素之外剩余的元素
x[2:4]#第2到4个元素
x[-(2:4)]#除了2到4之外的元素
x[c(1,5)] #第1个和第5个元素

注意这个地方是[]不是()，查看X值，View()中V必须大写。查看向量中的某个元素，需要加c。

Snipaste_2018-10-26_19-29-58.png

2.根据值得大小。

x[x==10]#等于10的元素
x[x<0] #小于0的元素
x[x %in% c(1,2,5)]#存在于向量c（1，2，5）中的元素

Snipaste_2018-10-26_19-37-43.png

x[x==10]与x[x=10]一样的效果。

数据框

读取本地数据

read.table(file = "huahua.txt",sep = "\t",header =T) #读取文件，分隔符为Tab，有表头
a<-read.table(file = "huahua.txt",sep = "\t",header =T)#把这个数据框赋给一个变量a

\t 的意思是横向跳到下一制表符位置
read_csv 默认分割是逗号
read_table 默认分割是\t

设置行名和列名

X<-read.csv('doudou.txt') #在示例数据里有doudou.txt 注意这里的变量X是一个数据框
colnames(X) #查看列名
rownames(X) #查看行名,默认值的行名就是行号，1.2.3.4...
colnames(X)[1]<-"bioplanet"#有的公司返回数据，左上角第一格为空，R会自动补为x,用这个命令来修改
X<-read.csv(file = "huahua.txt",sep = "\t",header =T,row.names=1)#最后row.names的意思是修改第一列为行名

colnames(X)[1]<-"doudou"的意思是修改第一格为doudou
colnames(X)[2]<-"huahua"的意思是修改第二格为huahua

这里一直想让第二列为行名，结果一直没有实现，花花指导后明白或者默认第一列为行名或者没有行名。。。

数据框的导出

write.table(X,file = "yu.txt",sep = ",",quote=F)#分隔符改为逗号，字符串不加双引号（默认格式带由双引号）

Snipaste_2018-10-26_21-56-28.png

如果去掉quote=F，除了数值外都加了双引号。

变量的保存和重新加载

这次没有处理完的数据下次想接着用怎么办?--学会保存和重新加载。保存的格式是RData。
save.image(file="bioinfoplanet.RData")#保存当前所有变量
save(x,file="x1.RData")#保存其中一个变量
load("x1.RData")#再次使用RData时的加载命令

这个地方卡了很久，因为花花的frame1把我搞蒙了，我以为是什么函数。。。。

Snipaste_2018-10-26_22-37-58.png

提取元素

X[x,y]#第x行第y列
X[x,]#第x行
X[,y]#第y列（横着写，这是不够懒也不够优秀却能存在的写法）
X[y] #第y列（竖着写，这是懒惰又优秀的写法）
X[a:b]#第a列到第b列
X[c(a,b)]#第a列和第b列
X$列名#也可以提取列（优秀写法，而且这个命令还优秀到不用写括号的地步，并且支持Tab自动补全哦，不过只能提取一列）

这里花了更长时间，今天有点不在状态呢。把[]写成（），折腾了一个小时。
**x[1:3]指1到3列，如果要提取1到3行，x[1:3,]。

Snipaste_2018-10-26_23-40-38.png

提取某两列做散点图

c <-data.frame(case=paste("S",c(1:50)),values=runif(50))
plot(c$case,c$values)

case和values单纯为变量，科普了下paste函数

它可以将任意数量的参数组合在一起。
语法
粘贴（paste）函数的基本语法是：
paste(..., sep = " ", collapse = NULL)
以下是所使用的参数的说明：
... 表示要组合的任何数量的参数。sep- 表示参数之间的分隔符。它是任选的。
collapse - 用于消除两个字符串之间的空间。但不是在一个字符串的两个词的空间。

一直没明白s是什么意思，忽然看图发现是横坐标。R语言好难。。。很多百度搜不到啊！各种猜谜。
想使用刚才自己的x变量中提取第一和第二列作图。

c<-data.frame(x1=paste("s",x[,1],x2=x[,2]))
plot(c$x1,c$x2)

画出图形为

Snipaste_2018-10-27_00-07-11.png

虽然很丑，但很高兴。

attach和with用法

在R语言中，对于串列，数据框中的数据的进行操作时，为了避免重复地键入对象名称，可使用attach或with。
1、attach（）
假设data.frame包含列name，age
attach(onedata.frame)后就可以引用直接引用onedata.frame中的元素了，例如：
（1）创建测试数据框
name<-c("Zhangshan","Lisi","Wangwu","Zhaoliu")
age<-c(20,30,40,50)
onedata.frame<-data.frame(name,age)
onedata.frame
name age
1 Zhangshan 20
2 Lisi 30
3 Wangwu 40
4 Zhaoliu 50
（2）attach测试
attach(onedata.frame)
The following objects are masked by .GlobalEnv:
age, name
age
[1] 20 30 40 50
name
[1] "Zhangshan" "Lisi" "Wangwu" "Zhaoliu"
detach(onedata.frame)
name
错误: 找不到对象'name'
可见，访问数据框中的元素只在命令attach()和detach()之间可以搜索到。
2、with()
使用with，类似Javascript中的with，在括号中有效。例如：
with(onedata.frame,{
name
})
[1] Zhangshan Lisi Wangwu Zhaoliu
Levels: Lisi Wangwu Zhangshan Zhaoliu
用with有个问题就是里面设置的变量在外部无法访问：
with(onedata.frame,{name1<-name})
name1
错误: 找不到对象'name1'
解决办法就是使用<<-赋值符号，例如：
with(onedata.frame,{name1<<-name})
name1
[1] Zhangshan Lisi Wangwu Zhaoliu
Levels: Lisi Wangwu Zhangshan Zhaoliu
--------------------- 作者：hongweigg
来源：CSDN
原文：https://blog.csdn.net/hongweigg/article/details/48093577

今天学习结束，感觉有点难。
思维导图

初学数据集.png

学习小组Day5笔记-梦幻天堂

学习小组Day5笔记-梦幻天堂

向量

标量和向量的区别

从向量中提取元素

数据框

读取本地数据

设置行名和列名

数据框的导出

变量的保存和重新加载

attach和with用法

相关阅读更多精彩内容

友情链接更多精彩内容