上传序列数据到SRA

笔记内容:

  • SRA是什么,点解要向它上传序列数据
  • 上传之前的准备
  • 如何上传

SRA是什么,点解要向它提交序列数据

SRA官方document.
Sequence Read Archive (SRA) 存储了NCBI上各研究所用到的序列数据。许多文献都可以看到一个SRAID,根据这个ID可以找到并且下载文章数据的原始序列。这里是讲如何上传数据。

上传到SRA,使研究的原始数据得以共享,有利于研究的重复及新发现的挖掘。一般文章中只要用到了高通量测序得到的数据,要需要将数据提交到SRA,并获得一个SRA编号。

上传之前的准备

包括注册BioProject和Biosamples, 上传SRA metadata等

注册一个NCBI账号,登录:SRA Submission Portal Wizard,
新建一个submission, 参考这个连接逐步上传。

Submission Portal总览提交各个步骤的信息,如下所示:

上传模板参考这个连接:

templates

如何上传

  1. Submitter (contact information of submitter)
  2. General info (general information of submission)
  3. Project info (project title, public description, registered or not)
    project-info
  4. BioSample type (best description of sample type; 16S rDNA as follow)
biosample-type
  1. Biosample attributes (attributes table according to sample type selected in step 4)
biosample-attr
  1. SRA metadata (metadata of your data, see instructions in templates)

    sra-metadata

  2. files (upload sequence files)

file-upload

Also there are options to preload data could be found here.

注意:

  • 选择 preload 如果需要提交超过10GB的数据或超过300个文件。所有要提交的东西必须在一个文件夹里。
  • 如果有超过1000个samples需要提交,则建多个submissions来提交,只要在同一个Bioproject下就可以。
  1. Review & submit

上传完成后,注意查收SRA官方的反馈邮件。而且可以在提交的protal page: manage section中管理自己的提交。

manage-data

附:
SRA Submission Portal Wizard
: https://submit.ncbi.nlm.nih.gov/subs/sra/

SRA official document
: https://www.ncbi.nlm.nih.gov/sra/docs/submitportal/

Submitting data to the NCBI Sequence Read Archive
: https://rachaellappan.github.io/SRA/

Submitting Read Data to NCBI SRA
: https://github.com/faircloth-lab/protocols/wiki/Submitting-Read-Data-to-NCBI-SRA

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容