1. apply函数
对矩阵、数据框、数组(二维、多维)等矩阵型数据,按行或列应用函数FUN进行循环计算,并以返回计算结果
apply(X, MARGIN, FUN, ...)
X:数组、矩阵、数据框等矩阵型数据
MARGIN: 按行计算或按按列计算,1表示按行,2表示按列
FUN: 自定义的调用函数
应用iris数据集进行举例,以下计算前四个变量的均值:
a <- apply(iris[,1:4], 2, mean) #前四列数据,按列,求均值
a
# 输出
Sepal.Length Sepal.Width Petal.Length Petal.Width
5.843333 3.057333 3.758000 1.199333
2. tapply函数
将数据按照不同方式分组,生成类似列联表形式的数据结果
tapply(X, INDEX, FUN = NULL, ..., default = NA, simplify = TRUE)
X:数组、矩阵、数据框等分割型数据向量
INDEX:一个或多个因子的列表,每个因子的长度都与x相同
FUN: 自定义的调用函数
manager <- c(1, 2, 3, 4, 5)
country <- c("US", "US", "UK", "UK", "UK")
gender <- c("M", "F", "F", "M", "F")
age <- c(32, 45, 25, 39, 99)
leadership <- data.frame(manager, country, gender, age)
tapply(leadership$age, leadership$country, mean) # 求在不同country水平下的age的均值
# 输出
UK US
54.33333 38.50000
# 求在不同country和gender交叉水平下的age的均值, 输出得到矩阵数据
tapply(leadership$age, list(leadership$country, leadership$gender), mean)
# 输出
F M
UK 62 39
US 45 32
3. lapply函数
对列表、数据框数据集进行循环,输入为列表,返回值为列表
lapply(X, FUN, ...)
X:列表、数据框
FUN:自定义的调用函数
b <- list(x = 1:10, y = matrix(1:12, 3, 4))
b
# 输出
$x
[1] 1 2 3 4 5 6 7 8 9 10
$y
[,1] [,2] [,3] [,4]
[1,] 1 4 7 10
[2,] 2 5 8 11
[3,] 3 6 9 12
lapply(b, sum) # 求列表中各元素的和
# 输出
$x
[1] 55
$y
[1] 78
4. sapply函数
类似于lapply函数,但输入为列表,返回值为向量
sapply(X, FUN, ..., )
X:列表、矩阵、数据框
FUN:自定义的调用函数
sapply(b, sum) # 求列表中各元素的和
# 输出
x y
55 78
5. vapply函数
类似于sapply函数,但是可以预先指定返回值类型。
lapply(X, FUN, ...)
sapply(X, FUN, ..., simplify = TRUE, USE.NAMES = TRUE)
vapply(X, FUN, FUN.VALUE, ..., USE.NAMES = TRUE)
vapply(b,sum,numeric(1))
这里的FUN.VALUE还可以用character(1),factor(1),etc
6. mapply函数
多参数版本的sapply。第一次计算传入各组向量的第一个元素到FUN,进行结算得到结果;第二次传入各组向量的第二个元素,得到结果;第三次传入各组向量的第三个元素…以此类推。
l1<- list(a = c(1:10), b = c(11:20))
l2<- list(c = c(21:30), d = c(31:40))
mapply(sum, l1$a, l1$b, l2$c, l2$d)
文章来源:
https://blog.csdn.net/qq_43407763/article/details/91652918。
https://www.cnblogs.com/xihehe/p/7473981.html
在此基础上补充修改。