从GFF注释文件获得Gene ID与Gene Name的对应关系列表

zless Homo_sapiens.GRCh38.95.gtf.gz | sed -n '6,10005p' >test.gtf
R
gtf <- read.table("test.gtf",header=F,sep="\t",stringsAsFactors=F)
gtf_gene <- gtf[gtf[,3]=="gene",]
id <- NULL
name <- NULL
for (i in 1:nrow(gtf_gene)){
 temp <- unlist(strsplit(gtf_gene[i,9],";"))
 id[i] <- substr(temp[1],9,nchar(temp[1]))
 name[i] <- substr(temp[3],11,nchar(temp[3]))
 print(i)
 }
id2name <- cbind(id,name)
截屏2020-12-11 14.48.08.png
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容