利用R包GenomicFeatures构建小麦的TxDb
#R
#安装GenomicFeatures包
if (!require("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("GenomicFeatures")
library(GenomicFeatures)
metadata=data.frame(name="Resource URL",value=paste0("https://ftp.ensemblgenomes.ebi.ac.uk/pub/plants/release-56/gff3/triticum_aestivum/Triticum_aestivum.IWGSC.56.gff3.gz"))
#从gtf文件中获取TxDb
CS=makeTxDbFromGFF(file="~/genome/ChineseSpring/Triticum_aestivum.IWGSC.only.gtf",metadata=metadata,organism="Triticum")
#制作TxDb包
makeTxDbPackage(CS,version="1.0",maintainer="username<userName@qq.com>",author="username",destDir="~/genome/ChineseSpring/",license="Artistic-2.0",pkgname="Triticum.aestivum.IWGSC.TxDb")
结果会在~/genome/ChineseSpring路径下生成Triticum.aestivum.IWGSC.TxDb目录,目录结构如下
#shell
Triticum.aestivum.IWGSC.TxDb
├── DESCRIPTION
├── inst
│ └── extdata
│ └── Triticum.aestivum.IWGSC.TxDb.sqlite
├── man
│ └── package.Rd
├── NAMESPACE
└── R
└── zzz.R
5 directories, 5 files
将该目录打包成R包
#shell
R CMD build Triticum.aestivum.IWGSC.TxDb
R CMD INSTALL Triticum.aestivum.IWGSC.TxDb_1.0.tar.gz
测试TxDb
#R
library(Triticum.aestivum.IWGSC.TxDb)
#获取该TxDb的基本信息
seqinfo(Triticum.aestivum.IWGSC.TxDb)
#列名
columns(Triticum.aestivum.IWGSC.TxDb)
#查看染色体号
seqlevels(Triticum.aestivum.IWGSC.TxDb)
#获取转录本位置信息
transcripts(Triticum.aestivum.IWGSC.TxDb)
#获取启动子位置信息
promoters(Triticum.aestivum.IWGSC.TxDb,upstream=1000,downstream=1000)
#获取外显子位置信息
exons(Triticum.aestivum.IWGSC.TxDb)