导读
1. DDBJ数据库简介
- DDBJ(DNA Data Bank of Japan)是与NCBI的GenBank,EMBL的EBI数据库齐名的世界三大DNA 数据库之一。DDBJ由日本研究机构于1983年建立。DDBJ数据库不仅已经收录了20多万个研究的600多万样本的测序数据,而且现在还保持每日更新。
DDBJ数据库地址:https://www.ddbj.nig.ac.jp/index-e.html
2. DDBJ数据库收录的数据有:
-
人、动物、植物、土壤、水体等样本的基因组、转录组、表观组、外显子组、宏基因组、宏转录组等多组学数据。
如何从DDBJ中获取宏转录组测序数据?
- 方法一:进入DDBJ寻找任意感兴趣的组学数据(不做介绍)。
- 方法二:根据文章中提供的DDBJ DRA编号进行数据检索和下载,过程如下:
1. 第一步:
-
在宏转录组相关研究的文章中的Data availability处找到metatranscriptome data的DDBJ DRA编号,例如:
2. 第二步:
-
打开DDBJ数据库,点击进入Sequence Read Archive (DRA)。
3. 第三步:
-
点击进入Search。
4. 第四步:
-
在Accession中输入DRA编号(例如:DRA006303),点击Search。
5. 第五步:
-
选择一个Run (如:DRR110568),点击进入该Run的FASTQ目录,右键鼠标复制DRR110568_1.fastq.bz2和DRR110568_2.fastq.bz2的下载链接。
6. 第六步:
- 在Linux环境中下载,解压fastq文件。
6.1 下载
nohup wget ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA006/DRA006303/DRX103657/DRR110568_1.fastq.bz2 &
nohup wget ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA006/DRA006303/DRX103657/DRR110568_2.fastq.bz2 &
6.2 解压
nohup bzip2 -d DRR110568_1.fastq.bz2 &
nohup bzip2 -d DRR110568_2.fastq.bz2 &
结束语
这样我们通过DDBJ数据库获得了一个样本的宏转录组测序的fastq文件。