GEO (Gene Expression Omnibus)是一个公共功能基因组学数据存储库,支持符合 MIAME 标准的数据提交。 接受基于阵列和序列的数据。 提供工具来帮助用户查询和下载实验和策划的基因表达谱。基本上文章中原始测序数据和过程文件都会提交在这个数据库中,只上传原始测序文件则传到SRA数据库中。
上传流程
1.选择注册账号,可以根据当前账号(163实测没问题)直接注册,也可以通过谷歌邮箱注册(后面填写信息要用(https://www.google.com/intl/zh-CN_cn/gmail/about/)
2.填写信息,然后save,然后选择右上角的GEO submissions,在选择new submissions
3.点击Sunbmit high-throughput sequencing,详细阅读此界面,上传时一共需要三个(原始数据,过程文件,填写信息的表格)
4.滑到下面,选择Transfer Files,进去后step1是你的绝对路径,step2有address,用户名和密码
5.上传方式选择(lftp和FileZilla Client)
在服务区网速快且稳定时直接conda安装lftp
lftp user:密码f@ftp-private.ncbi.nlm.nih.gov
cd到你的文件夹下
mirror -R 文件夹路径 ./
放着不动等自动传完就行了
如果服务器网络不稳定,则推荐使用FileZilla Client
在文件这一栏打开站点管理器,如图所示填写,连接成功后如果传输速度依然很慢,可以在编辑这一栏打开设置,点击传输,如下设置
数据传完了,只剩下填表,表格包含两张就可,一张是你实验的信息,需按照指定格式完整填写,另一张是raw data和processed data的MD5值。
6.待所有数据上传完成后,就可以进入最后一步,Notify GEO
然后填入你上传的文件夹名。如果文章在投或者暂不想公开数据,GEO数据可以将你的测序文件设为私密(最多3年),这个可以自行设置Release date。最后点击Submit,即完成上传的所有流程。释放时间无需担心,文章投刊时会释放出来。ps:NCBI工作效率还是挺快的,一两天就有人回复,他们觉得没问题后就会把数据存放至另一个位置,原路径文件可能会删除,数据存放两个星期也后会自动删除。
看到这啦,不妨点个赞再走吧