Txdb创建和读取

做chip-seq时候,使用chipseeker对找到的peak进行注释
需要加载相应的txdb文件


参考网站:
http://www.360doc.com/content/18/0402/01/33459258_742149876.shtml
https://mp.weixin.qq.com/s/_OPzvaEAbiMolCA2mqJXLw


方法1

使用gtf构建

library(GenomicFeatrues)
spombe <- makeTxDbFromGFF("test.gff3")
#从ucsc中下载,但是我没跑通
hg19.refseq.db <- makeTxDbFromUCSC(genome="hg19", table="refGene")
image.png

方法2

从Bioconductor中直接下载,Bioconductor提供了30个TxDb包

if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")

BiocManager::install("TxDb.Hsapiens.UCSC.hg38.knownGene")
library("TxDb.Hsapiens.UCSC.hg38.knownGene")
> hg38.refseq.db = TxDb.Hsapiens.UCSC.hg38.knownGene
> hg38.refseq.db 
TxDb object:
# Db type: TxDb
# Supporting package: GenomicFeatures
# Data source: UCSC
# Genome: hg38
# Organism: Homo sapiens
# Taxonomy ID: 9606
# UCSC Table: knownGene
# UCSC Track: GENCODE V36
# Resource URL: http://genome.ucsc.edu/
# Type of Gene ID: Entrez Gene ID
# Full dataset: yes
# miRBase build ID: NA
# Nb of transcripts: 232184
# Db created by: GenomicFeatures package from Bioconductor
# Creation time: 2021-04-28 16:32:07 +0000 (Wed, 28 Apr 2021)
# GenomicFeatures version at creation time: 1.41.3
# RSQLite version at creation time: 2.2.6
# DBSCHEMAVERSION: 1.2

补充一些txbd文件的操作

参考网站:http://www.360doc.com/content/19/1202/12/50736008_876886520.shtml

> library(TxDb.Hsapiens.UCSC.hg19.knownGene)
> Txdb = TxDb.Hsapiens.UCSC.hg19.knownGene
> seqinfo(Txdb)
Seqinfo object with 93 sequences (1 circular) from hg19 genome:
  seqnames       seqlengths isCircular genome
  chr1            249250621       <NA>   hg19
  chr2            243199373       <NA>   hg19
  chr3            198022430       <NA>   hg19
  chr4            191154276       <NA>   hg19
  chr5            180915260       <NA>   hg19
  ...                   ...        ...    ...
  chrUn_gl000245      36651       <NA>   hg19
  chrUn_gl000246      38154       <NA>   hg19
  chrUn_gl000247      36422       <NA>   hg19
  chrUn_gl000248      39786       <NA>   hg19
  chrUn_gl000249      38502       <NA>   hg19
> columns(Txdb)
 [1] "CDSCHROM"   "CDSEND"     "CDSID"     
 [4] "CDSNAME"    "CDSSTART"   "CDSSTRAND" 
 [7] "EXONCHROM"  "EXONEND"    "EXONID"    
[10] "EXONNAME"   "EXONRANK"   "EXONSTART" 
[13] "EXONSTRAND" "GENEID"     "TXCHROM"   
[16] "TXEND"      "TXID"       "TXNAME"    
[19] "TXSTART"    "TXSTRAND"   "TXTYPE" 
> seqlevels(Txdb) %>% head(10)
 [1] "chr1"  "chr2"  "chr3"  "chr4"  "chr5" 
 [6] "chr6"  "chr7"  "chr8"  "chr9"  "chr10"

> transcripts(Txdb) #转录本信息
GRanges object with 82960 ranges and 2 metadata columns:
                seqnames        ranges strand |
                   <Rle>     <IRanges>  <Rle> |
      [1]           chr1   11874-14409      + |
      [2]           chr1   11874-14409      + |
      [3]           chr1   11874-14409      + |
      [4]           chr1   69091-70008      + |
      [5]           chr1 321084-321115      + |
      ...            ...           ...    ... .
  [82956] chrUn_gl000237        1-2686      - |
  [82957] chrUn_gl000241   20433-36875      - |
  [82958] chrUn_gl000243   11501-11530      + |
  [82959] chrUn_gl000243   13608-13637      + |
  [82960] chrUn_gl000247     5787-5816      - |
              tx_id     tx_name
          <integer> <character>
      [1]         1  uc001aaa.3
      [2]         2  uc010nxq.1
      [3]         3  uc010nxr.1
      [4]         4  uc001aal.1
      [5]         5  uc001aaq.2
      ...       ...         ...
  [82956]     82956  uc011mgu.1
  [82957]     82957  uc011mgv.2
  [82958]     82958  uc011mgw.1
  [82959]     82959  uc022brq.1
  [82960]     82960  uc022brr.1
  -------
  seqinfo: 93 sequences (1 circular) from hg19 genome

> promoter =  promoters(Txdb, upstream = 1000, downstream = 1000); promoter
Warning message:
In valid.GenomicRanges.seqinfo(x, suggest.trim = TRUE) :
  GRanges object contains 1 out-of-bound range
  located on sequence chrUn_gl000223. Note
  that ranges located on a sequence whose
  length is unknown (NA) or on a circular
  sequence are not considered out-of-bound
  (use seqlengths() and isCircular() to get
  the lengths and circularity flags of the
  underlying sequences). You can use trim() to
  trim these ranges. See
  ?`trim,GenomicRanges-method` for more
  information.
GRanges object with 82960 ranges and 2 metadata columns:
                   seqnames        ranges strand
                      <Rle>     <IRanges>  <Rle>
  uc001aaa.3           chr1   10874-12873      +
  uc010nxq.1           chr1   10874-12873      +
  uc010nxr.1           chr1   10874-12873      +
  uc001aal.1           chr1   68091-70090      +
  uc001aaq.2           chr1 320084-322083      +
         ...            ...           ...    ...
  uc011mgu.1 chrUn_gl000237     1687-3686      -
  uc011mgv.2 chrUn_gl000241   35876-37875      -
  uc011mgw.1 chrUn_gl000243   10501-12500      +
  uc022brq.1 chrUn_gl000243   12608-14607      +
  uc022brr.1 chrUn_gl000247     4817-6816      -
             |     tx_id     tx_name
             | <integer> <character>
  uc001aaa.3 |         1  uc001aaa.3
  uc010nxq.1 |         2  uc010nxq.1
  uc010nxr.1 |         3  uc010nxr.1
  uc001aal.1 |         4  uc001aal.1
  uc001aaq.2 |         5  uc001aaq.2
         ... .       ...         ...
  uc011mgu.1 |     82956  uc011mgu.1
  uc011mgv.2 |     82957  uc011mgv.2
  uc011mgw.1 |     82958  uc011mgw.1
  uc022brq.1 |     82959  uc022brq.1
  uc022brr.1 |     82960  uc022brr.1
  -------
  seqinfo: 93 sequences (1 circular) from hg19 genome

> exons(Txdb)
GRanges object with 289969 ranges and 1 metadata column:
                 seqnames      ranges strand |
                    <Rle>   <IRanges>  <Rle> |
       [1]           chr1 11874-12227      + |
       [2]           chr1 12595-12721      + |
       [3]           chr1 12613-12721      + |
       [4]           chr1 12646-12697      + |
       [5]           chr1 13221-14409      + |
       ...            ...         ...    ... .
  [289965] chrUn_gl000241 35706-35859      - |
  [289966] chrUn_gl000241 36711-36875      - |
  [289967] chrUn_gl000243 11501-11530      + |
  [289968] chrUn_gl000243 13608-13637      + |
  [289969] chrUn_gl000247   5787-5816      - |
             exon_id
           <integer>
       [1]         1
       [2]         2
       [3]         3
       [4]         4
       [5]         5
       ...       ...
  [289965]    289965
  [289966]    289966
  [289967]    289967
  [289968]    289968
  [289969]    289969
  -------
  seqinfo: 93 sequences (1 circular) from hg19 genome

同理:

cds(Txdb) #获得cds 区域
transcriptBy(Txdb) #基于基因的转录本分Granges list
exonsBy(Txdb) #基于基因的exons分Granges list

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,324评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,356评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,328评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,147评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,160评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,115评论 1 296
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,025评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,867评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,307评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,528评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,688评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,409评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,001评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,657评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,811评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,685评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,573评论 2 353

推荐阅读更多精彩内容