getwd() 绝对路径
基础
- 新建项目:R Studio-New project-new direction-new project
- 新建脚本:New File-R Script
- Run快捷键:crl/cmd+enter
- 数据类型:数字型numeric、字符型character(加‘’or“”)、逻辑型logical(T/F/NA)
- 命令响应:Error-报错,Warning-忽略,红点-命令正在运行,+-补全命令orESC退出,进一步选择-输入后回车
- 修改命令:光标放在>后面,摁向上键,即可修改上一条命令重新运行
向量
- 逻辑连接:与&、或|、非!
- 比较运算:结果是逻辑值,>,<,<=,>=,==,!=
- is族函数:判断,返回值为TRUE or FALSE:is.numeric/logical/character()
- as族函数:实现数据类型转换:as.numeric()
- 数据结构:向量、数据框、矩阵、列表
- 脚本打开是乱码:File-reopen with encoding-UTF-8-OK
- 数据类型转换优先顺序:字符型-数值型-逻辑型
1.向量生成
(1)用 c() 结合到一起
c(2,5,6,2,9)
c("a","f","md","b")
(2)连续的数字用冒号“:”
1:5 #不需要c()
(3)有重复的用rep(),有规律的序列用seq(),随机数用rnorm
rep("gene",times=3)
seq(from=3,to=21,by=3) #可以省略三个单词
rnorm(n=3)
(4)通过组合,产生更为复杂的向量
连接函数,paste为中间加分隔符
paste0(rep("gene",times=3),1:3)
#循环补齐原则可简写为:
paste0("gene",1:3)
paste("gene",1:3,sep = "+")
[1] gene+1,gene+2,gene+3
#sep为分隔符,若无sep部分则自动为空格,若sep=“”则等于paste0
2.对单个向量进行的操作
(1)赋值给一个变量名
x = c(1,3,5,1) #随意的写法
x
x <- c(1,3,5,1) #规范的赋值符号Alt+减号
x
赋值+输出一起执行
x <- c(1,3,5,1);x
(x <- c(1,3,5,1))
(2)简单数学计算
x+1 #循环补齐
log(x)
sqrt(x)
(3)根据某条件进行判断,生成逻辑型向量
x>3
x==3
(4)初级统计
max(x) #最大值
min(x) #最小值
mean(x) #均值
median(x) #中位数
var(x) #方差
sd(x) #标准差
sum(x) #总和
length(x) #长度
unique(x) #去重复
duplicated(x) #对应元素是否重复
table(x) #重复值统计
sort(x) #默认从小到大排
sort(x,decreasing = T) #从大到小排列
3.对两个向量进行的操作
x = c(1,3,5,1)
y = c(3,2,5,6)
(1)逻辑比较,生成等长的逻辑向量
x == y
[1] F F T F
x %in% y #x中的元素是否在y中!【重点理解】
[1] F T T F
(2)数学计算
x + y
(3)“连接”
paste(x,y,sep=":") #paste与paste0
(4)交集、并集、差集
intersect(x,y) #交集
[1] 3 5
union(x,y) #并集
[1] 1 3 5 2 6
setdiff(x,y) #x里存在,y里不存在
[1] 1
setdiff(y,x) #y里存在,x里不存在
[1] 2 6
当两个向量长度不一致
x = c(1,3,5,6,2)
y = c(3,2,5)
x == y #啊!warning!不用管
循环补齐——短循环补齐长,前后顺序无关
利用循环补齐简化代码
paste0(rep("gene",3),1:3)
paste0("gene",1:3)
4.向量筛选(取子集)
(1)根据逻辑值取子集,取TRUE值,FALSE丢弃
x <- 8:12
x[x==10]
x[x<12]
x[x %in% c(9,13)]
(2)根据位置取子集
x[4] #第4位
x[2:4] #第2-4位
x[c(1,5)] #第1、5位
x[-4] #去掉第4个
x[-(2:4)] #-2相对:优先级高,故加括号,<优先级高于-2
按照逻辑值:中括号里是与x等长的逻辑值向量
按照位置:中括号里是由x的下标组成的向量
5.修改向量中的某个/某些元素:取子集+赋值
R语言里的修改,都要赋值,没有赋值就没有发生过
(1)改一个元素
x[4] <- 40;x #第4位=40
(2)改多个元素
x[c(1,5)] <- c(80,20);x #第1、5位=80、20
6. 简单向量作图
k1 = rnorm(12);k1
k2 = rep(c("a","b","c","d"),each = 3);k2
k3 = rnorm(12);k3
plot(k1) #默认横坐标1、2、3……
plot(k1,k3) #前面横坐标,后面纵坐标
boxplot(k1~k2) #试着搜索boxplot表达什么意思
思考
(1)如何调整向量里元素的顺序?
根据下面的x生成BDEAC
x <- c("A","B","C","D","E");x
x[c(2,4,5,1,3)]
(2)向量匹配排序:match 【重要!】
x <- c("A","B","C","D","E")
y <- c("B","D","E","A","C")
match(x,y) #x在y中的顺序
#[1] 4 1 5 2 3
y[match(x,y)] #谁在外面,谁就在后面,需要被调整,根据x,调整y的顺序
#[1] "A" "B" "C" "D" "E"
x[match(y,x)] #根据y,调整x的顺序
#[1] "B" "D" "E" "A" "C"
(3)如何将两个向量合到一起,组成一个长向量?
x=c(1,3,5)
y=c(2,3,4)
a=c(x,y);a
# [1] 1 3 5 2 3 4
(4)如何在向量首/尾增加一个元素?
x=c(3,x)
x=c(x,4)
(5)如何在向量中间某位置增加一个元素?
n=3
x=c(1,3,5,8,6);x
# [1] 1 3 5 8 6
y=c(x[1:n-1],7,x[n:length(x)]);y
# [1] 1 3 7 5 8 6
写成函数
join <- function(x,n,y){c(x[1:n-1],y,x[n:length(x)])}
x=c(1,3,5,8,6)
join(x,3,7)
# [1] 1 3 7 5 8 6