如何上传测序数据至NCBI?

文章发表一般要求将测序数据上传至NCBI的SRA(Sequence Read Archive)数据库。上传到NCBI 的数据可归纳为两大类:测序原始数据和分析数据。原始数据(Raw data)指测序下机的最初文件,未经任何处理和分析。

1. 注册NCBI帐号

https://www.ncbi.nlm.nih.gov/account/,点击“ Register for a NCBI account”,进入到注册页面,如实填写信息。(尽量使用项目提交人的信息进行注册)

2. 创建BioProject

https://submit.ncbi.nlm.nih.gov/subs/bioproject/,在界面上选择 new submission ,依次填写SUBMITTER、PROJECT TYPE、TARGET、GENERAL INFO等信息,后面的BIOSAMPLE和PUBLICATIONS两个界面可以不写相关信息,都直接点Continue,进入OVERVIEW界面。如果有问题可返回修改,没问题的话即可点击submit提交。
创建成功后,再次进入该网址,会出现BioProject编号,以PRJNA开头,可放在文章中。(注册人的邮箱会收到相关邮件)

BioProject.png
注意:

  • SUBMITTER:email选项中,两个邮箱中要留一个该测序项目负责人的常用邮箱(qq/163邮箱除外的大学/科研机构邮箱 ),因为后期如果想要修改数据信息或者释放时间,都需要该邮箱发送邮件到NCBI才会被受理。
  • Project Type:一般高通量测序数据可选择“Raw sequence reads”。
  • Sample scope:是对实验物种的简洁描述或者说是一个题目,根据不同选择会影响后面TARGET的填写。
  • GENERAL INFO:Release data是数据公开日期,可以点击立即释放,也可以选择具体时间,一般选择在文章发表之后释放。

3、创建BioSample

https://submit.ncbi.nlm.nih.gov/subs/biosample/,在界面选择 new submission。大致提交过程如下截图所示,最终提交完成后,每个样本会有一个样本编号,以SAMN开头,用于后面提交原始数据。

BioSample.png
注意:

  • SAMPLE TYPE:该研究中样本类型为BALF,因此选择metagenome or environmental sample。
  • ATTRIBUTES:填写样本信息表,必填内容包括sample_name、sample_title、bioproject_accession、organism、host、isolation_source、collection_date、geo_loc_name,其中sample_name必须与测序数据文件前缀一致,可以是纯数字格式。填写格式可参考下图。
    image.png
ATTRIBUTES.png

4. 提交原始数据至SRA

https://www.ncbi.nlm.nih.gov/Traces/sra_sub/sub.cgi,选择 NCBI PDA入口,填写个人信息后,点击 create new submission >> New submission。

SRA.png
注意:

  • SRA METADATA:填写文库相关信息,内容及格式可参考下图,其中双端测序数据的文件名(包括后缀)应写两个。


    SRA METADATA.png
  • FILES:单个样本数据量超过10Gb以上或者数据太多,需要用其他方式上传,比如aspera,勾选aspera上传选项后,会在下方出现“Select preload folder”。下载aspera.openssh文件至本地,然后上传至服务器。根据页面提示方法,运行下方命令,即可完成上传。
~/.aspera/connect/bin/ascp -i aspera.openssh -QT -l100m -k1 -d reads.path subasp@upload.ncbi.nlm.nih.gov:uploads/husy_163.com_1f3LOev0

数据上传比较慢,等数据都上传完成后,再点击“Select preload folder”,即可出现上传好的原始数据,点击“Use selected folder”,继续即可。
注意:数据上传完成之后,NCBI还需要一段时间对数据进行processing,若页面提示"error"(比如提示数据文件格式有问题),只能发邮件联系sra@ncbi.nlm.nih.gov,数据上传成功会出现"processed"标志,每个样本会对应获得一个SRR编号。SRA处理邮件的效率还是很高的。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,816评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,729评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,300评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,780评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,890评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,084评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,151评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,912评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,355评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,666评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,809评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,504评论 4 334
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,150评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,882评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,121评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,628评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,724评论 2 351