R读取蛋白fasta文件，提取基因名

#BiocManager::install("Biostrings",force = TRUE)

library(Biostrings)

library(plyr)

fastaFile <- readBStringSet("D:/DATA/Homo_sapiens/Homo_sapiens.fasta",

format="fasta")

#nrec=-1L,

#skip=0L,

#seek.first.rec=FALSE,

#use.names=FALSE)

test<-name[1,1]

#获取名字id

name <- names(fastaFile) %>% as.data.frame()

#######################按"|"分割----

#############自定义函数

filler <- function(x){

a <- strsplit(x,split = "|",fixed = T) %>% as.data.frame()##按"|"分割

y <- a[5,]

return(y)

}

#####应用函数

results.list <- lapply(name$.,filler)

results.list <- unlist(results.list) %>% as.data.frame()

#######################按";"分割----

#############自定义函数

#results.list$.[1]

filler <- function(x){

#x <- results.list$.[3]

a <- strsplit(x,split = ";",fixed = T) %>% as.data.frame()##按";"分割

y <- a[1,]

return(y)

}

#####应用函数

results <- lapply(results.list$.,filler)

results <- unlist(results) %>% as.data.frame()

results <- unique(results$.)

write.csv(results,"iuuCD.human.list.RDS")

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。