DDBJ数据库简介
DDBJ(DNA Data Bank of Japan)是与NCBI的GenBank,EMBL的EBI数据库齐名的世界三大DNA 数据库之一。DDBJ由日本研究机构于1983年建立。DDBJ数据库不仅已经收录了20多万个研究的600多万样本的测序数据,而且现在还保持每日更新。
DDBJ数据库地址: https://www.ddbj.nig.ac.jp/index-e.html
DDBJ数据库收录数据:
人、动物、植物、土壤、水体等样本的基因组、转录组、表观组、外显子组、宏基因组、宏转录组等多组学数据。
如何从DDBJ中获取宏转录组测序数据?
方法一:进入DDBJ寻找任意感兴趣的组学数据(不做介绍)。
方法二:根据文章中提供的DDBJ DRA编号进行数据检索和下载,过程如下:
第一步
在宏转录组相关研究的文章中的Data availability处找到metatranscriptome data的DDBJ DRA编号,例如:
第二步
打开DDBJ数据库,点击进入Sequence Read Archive (DRA)。
第三步
点击进入Search。
第四步
在Accession中输入DRA编号(例如:DRA006303),点击Search。
第五步
选择一个Run (如:DRR110568),点击进入该Run的FASTQ目录,右键鼠标复制DRR110568_1.fastq.bz2和DRR110568_2.fastq.bz2的下载链接。
第六步
在Linux环境中下载,解压fastq文件。
下载
wget -c ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA006/DRA006303/DRX103657/DRR110568_1.fastq.bz2 &
wget -c ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA006/DRA006303/DRX103657/DRR110568_2.fastq.bz2 &
解压
bzip2 -d DRR110568_1.fastq.bz2 &
bzip2 -d DRR110568_2.fastq.bz2 &
这样我们就获得了一个样本的宏转录组测序的fastq文件。
首次发布于微生太