笔记内容:
- SRA是什么,点解要向它上传序列数据
- 上传之前的准备
- 如何上传
SRA是什么,点解要向它提交序列数据
SRA官方document.
Sequence Read Archive (SRA) 存储了NCBI上各研究所用到的序列数据。许多文献都可以看到一个SRAID,根据这个ID可以找到并且下载文章数据的原始序列。这里是讲如何上传数据。
上传到SRA,使研究的原始数据得以共享,有利于研究的重复及新发现的挖掘。一般文章中只要用到了高通量测序得到的数据,要需要将数据提交到SRA,并获得一个SRA编号。
上传之前的准备
包括注册BioProject和Biosamples, 上传SRA metadata等
注册一个NCBI账号,登录:SRA Submission Portal Wizard,
新建一个submission, 参考这个连接逐步上传。
在 Submission Portal总览提交各个步骤的信息,如下所示:
如何上传
- Submitter (contact information of submitter)
- General info (general information of submission)
- Project info (project title, public description, registered or not)
- BioSample type (best description of sample type; 16S rDNA as follow)
- Biosample attributes (attributes table according to sample type selected in step 4)
-
SRA metadata (metadata of your data, see instructions in templates)
files (upload sequence files)
Also there are options to preload data could be found here.
注意:
- 选择 preload 如果需要提交超过10GB的数据或超过300个文件。所有要提交的东西必须在一个文件夹里。
- 如果有超过1000个samples需要提交,则建多个submissions来提交,只要在同一个Bioproject下就可以。
- Review & submit
上传完成后,注意查收SRA官方的反馈邮件。而且可以在提交的protal page: manage section中管理自己的提交。
附:
SRA Submission Portal Wizard
: https://submit.ncbi.nlm.nih.gov/subs/sra/
SRA official document
: https://www.ncbi.nlm.nih.gov/sra/docs/submitportal/
Submitting data to the NCBI Sequence Read Archive
: https://rachaellappan.github.io/SRA/
Submitting Read Data to NCBI SRA
: https://github.com/faircloth-lab/protocols/wiki/Submitting-Read-Data-to-NCBI-SRA