R语言读取gtf文件

library("rtracklayer")
gtf_data = import('gencode.v35.annotation.gtf') #gtf的路径
#这里使用import导入gtf文件, 生成一个GRangs对象
gtf_data = as.data.frame(gtf_data)
image.png

这样读取gtf文件回比直接使用read.table()好,因为生成的dataframe能够比较清楚地分开,并且有title。

image.png

除了import函数,rtracklayer包中还有一个导出数据的函数export()。
网页链接:
export: Import and export in rtracklayer: R interface to genome annotation files and the UCSC genome browser (rdrr.io)
这个函数将Grange对象导出为gtf或者bed文件等。

export(object, con, format, ....)
import(con, format, text, ...)
image.png

其实这几个参数没咋完全看明白。
直接看例子吧

track = import(system.file("tests", "v1.gff", package = "rtracklayer"))
## Not run: export(track, "my.gff", version = "3")
##equivalently,
##Not run:
con = file("my.gff3")
export(track, con, "gff3")

##End(not run)
## or as a string
export(track, format = "gff3")

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容