虽然R中的向量化计算函数可以省掉写很多循环的功夫,但是常见的语法还是要掌握的。
控制语句
if(a %% 2 == 0) cat(a, "is odd")
#若if后的语句只有一行,可以不用大括号
if(a %% 2 == 0){
cat(a, "is odd")
} else {
cat(a, "is even")
}
#若if后有多个分支,则需要用if- else if - else控制
ifelse(vec %% 2 == 0, 'even', 'odd')
#ifelse函数可以对向量进行计算
ifelse(vec %%2 == 0, 'even', ifelse(vec %%3 == 0, 'yes', 'no'))
#ifelse函数还可以嵌套使用
switch(expr, value1, value2, ....)
#switch函数可以用于多重分支的条件判断,第一个参数是表达式,
#根据表达式的值返回后面对应位置的值
switch('apple', apple = 10, banana = 15)
#若switch第一个参数是字符串,会和后面的参数匹配,返回对应数值
循环
#for循环
for(i in 1:1000){
...
}
#while循环
while(expr){
...
}
#while循环的不同在于要在循环体中增加对循环条件的更新操作
# repeat循环
repeat{
... next
... break
}
# repeat循环没有循环条件,要在循环体内进行判断
#next结束本次循环,break退出循环
在R中尽量使用向量化,使用循环会降低效率。
函数
一般情况下函数可接收的参数只能是一个数值,但返回值可以是各种形式
函数中定义的变量是局部变量,即使变量名与全局变量相同,也无法对全局变量造成影响。
但是还是可以在函数中修改全局变量的,只需要用<<-
赋值符号就行了
函数参数中还可以加入省略号,表示可能需要传递给其他函数的参数
myfunc <- function(x, type = 'sample' ...){
n <- length(x)
m <- mean(x, ...)
if(type == 'sample'){
sd <- sqrt(sum((x-m)^2))/(n-1)
} else{
sd <- sqrt(sum(x-m)^2))/n
}
return(sd)
}
#在函数参数中增加省略符
#在mean函数中也有省略符,表示函数可以在函数中设置mean函数的参数
#如本函数可以设置mean函数中的na.rm = T参数
匿名函数:只使用一次的函数,常常会在向量化计算中看到
set.seed(1)
m <- matrix(rnorm(100), 10,10)
apply(m, 1, function(x) max(x) - min(x)
函数式编程:R中另一个特点就是万物皆对象,函数自然也可以作为对象,地位和数据框、向量是完全相同的,自然也可以放到列表中存储,还能用循环语句调用,甚至还能在别的函数中当做参数使用
Funclist <- list(base = function(x) mean(x),
med = function(x) median(x),
manual = function(x) {
n <- length(x)
x <- sort(x)[c(-1,-n)]
mean(x)
})
set.seed(1)
x <- sample(1:100,10)
for( f in Funclist){
print(f(x))
}
# 这种将函数当做对象循环调用的真的很有特点
# 当然甚至还可以和向量化计算结合
sapply(Funclist, function(f) f(x))
工厂函数:函数的返回值是函数
SdFunc <- function(func, type){
function(x) {
x <- x[!is.na(x)]
n <- length(x)
m <- func(x)
if(type == 'sample') n <- n -1
sd <- sqrt(sum(x-m)^2/(n))
return(sd)
}
}
#没有return语句时,函数默认返回最后一个位置上的值