SRA数据库数据下载-Linux

虽然我目前还不到数据下载的时候,GEO开头的和PRJNA开头的到底有什么区别,但是GEO的下载界面很好找到,下载链接也很好找,但是SRA或者以PRJNA开头的数据下载链接我找了好几天。。。记录如下(以PRJNA257197为例):

在搜索框输入PRJNA number 或者在SRA官网搜索PRJNA257197 会得到以下的几个界面,但是怎么都翻不到download linkage


image.png
image.png

于是翻遍了教程,终于让我找到了,去另一个官网 The European Nucleotide Archive (ENA)(https://www.ebi.ac.uk/ena/browser/home) 在搜索框直接输入PRJNA257197

image.png

点击“TSV” 就可以得到包含全部items 下载链接的一个txt file, 红色框起来的就是下载链接,
image.png

image.png

得到下载链接后,就可以直接下载啦,我用的是wget,免安装,但是会有些慢,每个fastq文件需要1-2天时间下载,所以推荐后台下载

wget -c -t 0 -O SRR1553421_1.fastq.gz ftp.sra.ebi.ac.uk/vol1/fastq/SRR155/001/SRR1553421/SRR1553421_1.fastq.gz
# 或者-b 采用后台下载
wget -c -t 0 -O SRR1553421_1.fastq.gz -b ftp.sra.ebi.ac.uk/vol1/fastq/SRR155/001/SRR1553421/SRR1553421_1.fastq.gz
#或者  -t 0 用来表示无限次重刷和重新连接   -O 给下载的文件重新命名  -o 下载日志保存在该文件下
wget  -t 0 -o xx.log -O SRR1553421_1.fastq.gz -b ftp.sra.ebi.ac.uk/vol1/fastq/SRR155/001/SRR1553421/SRR1553421_1.fastq.gz
#我发现上午无论哪种方式,我关闭了Xshell的窗口都再重新打开,下载好像都不受影响。。。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容