虽然我目前还不到数据下载的时候,GEO开头的和PRJNA开头的到底有什么区别,但是GEO的下载界面很好找到,下载链接也很好找,但是SRA或者以PRJNA开头的数据下载链接我找了好几天。。。记录如下(以PRJNA257197为例):
在搜索框输入PRJNA number 或者在SRA官网搜索PRJNA257197 会得到以下的几个界面,但是怎么都翻不到download linkage
image.png
image.png
于是翻遍了教程,终于让我找到了,去另一个官网 The European Nucleotide Archive (ENA)(https://www.ebi.ac.uk/ena/browser/home) 在搜索框直接输入PRJNA257197
image.png
点击“TSV” 就可以得到包含全部items 下载链接的一个txt file, 红色框起来的就是下载链接,
image.png
image.png
得到下载链接后,就可以直接下载啦,我用的是wget,免安装,但是会有些慢,每个fastq文件需要1-2天时间下载,所以推荐后台下载
wget -c -t 0 -O SRR1553421_1.fastq.gz ftp.sra.ebi.ac.uk/vol1/fastq/SRR155/001/SRR1553421/SRR1553421_1.fastq.gz
# 或者-b 采用后台下载
wget -c -t 0 -O SRR1553421_1.fastq.gz -b ftp.sra.ebi.ac.uk/vol1/fastq/SRR155/001/SRR1553421/SRR1553421_1.fastq.gz
#或者 -t 0 用来表示无限次重刷和重新连接 -O 给下载的文件重新命名 -o 下载日志保存在该文件下
wget -t 0 -o xx.log -O SRR1553421_1.fastq.gz -b ftp.sra.ebi.ac.uk/vol1/fastq/SRR155/001/SRR1553421/SRR1553421_1.fastq.gz
#我发现上午无论哪种方式,我关闭了Xshell的窗口都再重新打开,下载好像都不受影响。。。