字符串操作
grep()函数
#第一个参数是pattern,在第二个参数代表的字符串向量中进行匹配
#返回匹配到的索引值
grep("pole",c("x","pole","poler"))
#但是如果没有匹配到的话返回是integer(0)
#这个值并不能用于if条件判断中,如果要用在if中,这样使用:
if(length(grep("pole",c("x","pole")))!=0){
print("yes")
}```
#nchar()函数
返回字符串x的长度
x <- "south Africa"
nchar(x)
而length()计算的是这个x向量包含多少个元素
length(x)```
paste()函数
#默认的连接符是空格,使用sep参数进行指定
paste("north","pole")
paste("north","pole",sep=".")```
#sprintf()函数
打印到字符串里面
i <- 8
s <- sprintf("the square of %d is %d",i,i^2)
s```
substr()函数
substr("i love you",3,6)```
#strsplit()函数
返回拆分后的子字符串组成的R列表
如果输入的是多个元素的向量,那么返回的就是有多个组件的列表
strsplit("2016-03-24",split="-")```
regexpr()
#第一个参数是pattern,第二个参数是字符串,返回匹配的第一个子字符串的起始位置
regexpr("ubt","xsubtls")```
#gregexpr()
与regexpr()函数不同的是,这个函数将寻找所有匹配的子字符串的起始位置
gregexpr("u","xusfusjfu")```
正则表达式的一些例子
grep("[au]",c("equator","north pole","south pole"))
grep("o.e",c("equator","north pole","south pole"))
grep("o..e",c("equator","north polee","sout.h pole"))
grep("\\.",c("equator","north polee","sout.h pole"))```
#检测文件名的后缀
testsuffix <- function(fn,suff){
if T match strsplit exactly,otherwise use regular expressions
parts <- strsplit(fn,".",fixed = T)
返回的parts是一个组件的列表,因为fn只有一个元素,如果有多个元素,
则返回的parts将有多个组件
nparts <- length(parts[[1]])
计算这个列表唯一组件的长度,包含元素个数
判断最后一个被分割开的元素是不是需要的后缀名
return(parts[[1]][nparts]==suff)
}
另外一个检测文件名后缀的方法
testsuffix1 <- function(fn,suff){
ncf <- nchar(fn)
小数点后的后缀名开始位置
dotpos <- ncf - nchar(suff)+1
return(substr(fn,dotpos,ncf)==suff)
}```
生成文件名
for(i in 1:5){
#先生成文件名
fname <- paste("q",i,".pdf",sep="")
pdf(fname)
#生成服从正态分布的随机变量直方图
hist(rnorm(100,sd=i))
#默认mean=0
dev.off()
}
#使用sprintf()函数
for(i in 1:5){
fname <- sprintf("q%d.pdf",i)
pdf(fname)
hist(rnorm(100,sd=i))
dev.off()
}```