网上🏄看到的教程,本来打算粗粗看了,但发现真挺好,就好好学习、好好记笔记了,小菜鸡还是要乖乖学习
网址链接
http://qiubio.com/new/book/chapter-02/#%E5%B8%B8%E8%A7%84%E6%93%8D%E4%BD%9Cbasics
R-Bioconductor
使用chooseBioCmirror函数选择合适的镜像
就近原则 近了📶就好使
chooseBioCmirror()
数据结构
同质——存放相同类型数据
异质——存放不同类型数据
维度 | 同质的 | 异质的 |
---|---|---|
1维 | Atomic vector | List |
2维 | Matrix | Data frame |
多维 | Array |
二维数据结构: Matrices及DataFrame
取值与赋值
降维 | 保持 | |
---|---|---|
Vector | x[[1]] | x[1] |
List | x[[1]] | x[1] |
Factor | x[1:4,drop=T] | x[1:4] |
Array | x[1,] or x[,1] | x[1,,drop=F] or x[,1,drop=F] |
Data frame | x[1,] or x[[1]] | x[,1,drop=F] or x[1] |
字符串处理
mychar <- c("ACTACCACTAACCACT","TCATCCATTCGTGGG","GTTGTTCCATAG")
#获取字串长度
length(mychar)#返回的是3,指3个字符串,而非字符串内字符的长度
nchar(mychar)#返回字符的长度
mcr <- substr(mychar,1,3) #对mychar进行部分选取,从第一个字符开始,第三个字符结束
#[1] "ACT" "TCA" "GTT"
substr(mychar,1,3) <- 'ATGC' # substr这样操作,也可以实现替换操作
paste("Hey",mychar,"End",sep="-") # 增加了前缀、后缀,以"-"连接
paste(mychar,collapse=‘--’) # 三个字符串之间以'--'连接
strsplit(mychar,'T') # 碰见'T'就切割,注意,得到的结果里就没有T了
sort(mychar) # 根据字符串的首字母进行排序
exT<-c("Intron", "Exon", "promoter","enhancer")
match('Exon', exT) # 返回输入字符串在给定向量内匹配的位置号
'promoter' %in% exT #百分百in - ‘%in%’
exT<-c("Intron", "Exon", "promoter","enhancer")
pmatch('I',exT) # 返回匹配到I的位置
pmatch('o',exT) # 因没有以'o'开头的单词,所以返回NA
charmatch("I", exT) # 同上
charmatch("o", exT) #同pmatch('o',exT)