在编写条件判断时
1.可以使用 || (或)和 && (与)操作符来组合多个逻辑表达式。这些操作符具有“短路效应”:只要 || 遇到第一个 TRUE ,那么就会返回 TRUE ,不再计算其他表达式;只要 && 遇到第一个 FALSE ,就会返回 FALSE ,不再计算其他表达式。** 不能在 if 语句中使用 | 或 **,它们是向量化的操作符,只可以用于多个值
如果一定要使用逻辑向量,那么你可以使用 any() 或 all() 函数将其转换为单个逻辑值。
2.在测试相等关系时,一定要小心, == 是向量化的,很容易输出多个值。要么先检查结果的长度是否为 1,然后使用 all() 或 any() 函数进行转换;要么使用非向量化的identical() 函数。 identical() 非常严格,总是返回一个 TRUE 或者一个 FALSE ,并且不限制参数类型。这意味着,在比较整数和双精度数时,一定要注意:
identical(0L, 0)
> [1] FALSE
可以看到":"函数产生的是整数,而c函数产生的是浮点数
解决方式是使用 dplyr::near() 函数进行比较
x == NA 没有任何作用。
stopifnot() 函数,
它会检查每个参数是否为真,如果某个参数不为真,则生成一条通用的错误消息:
wt_mean <- function(x, w, na.rm = FALSE) {
stopifnot(is.logical(na.rm), length(na.rm) == 1)
stopifnot(length(x) == length(w))
if (na.rm) {
miss <- is.na(x) | is.na(w)
x <- x[!miss]
w <- w[!miss]
函数 | 197
}
sum(w * x) / sum(x)
}
wt_mean(1:6, 6:1, na.rm = "foo")
#> Error: is.logical(na.rm) is not TRUE
Note:注意,如果使用了 stopifnot() 函数,那么你实际上是断言了哪些参数必须为真,而不是
检查哪些参数可能是错的。
4.在创建函数时
在创建函数时经常会用到循环,在循环中经常会扩展向量或者矩阵,如果用下面的方式的话会不断消耗内存,所以最好是事先就定义好一个大空向量或者大空矩阵,在循环过程中逐行或列进行赋值,这种做法避免了循环过程中每次进行耗时的内存分配
test <- NULL
for(i in 1:5){
test<- c(test,i)
}
-------------------------------------------------------
test <- matrix(nrow=2,ncol=2)
one <- c(1,2)
for(i in 1:3){
test <- rbind(one,test)
}
5.避免意外降维
这里的降维并不是机器学习中的降维,是指以下情况
image.png
看图中r已经不是矩阵而是向量了,这种情况在有些情况下不利于程序的运行,所以必须避免这种情况
image.png
6.基本运算符
image.png