本文主要介绍下载sra的常用的方式,并且经历多重磨炼才得到自认为较为可靠的方式
1. wget下载:
wget ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/ERP/ERP002/ERP002469/ERR260132/ERR260132.sra 单个文件下载,不是批量下载
wget -i sra_list3.txt ##sra_list3.txt是SRR所有列表,需注意,改TXT文件中包含的应是每个数据的下载网址。如:ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR548/SRR5483090/类似这种。
备注:sra_list3.txt可通过NCBI下载,CSV格式文件获得。
缺点:当数据量很多的时候不建议用wget下载,真的是非常的慢!!!
优点:下载过程中如若出现错误,系统会重新下载该数据。
2.利用sratoolkit中的prefetch下载:
/home/liuyuxia/sratoolkit/sratoolkit.2.9.6-centos_linux64/bin/prefetch --option-file sra_list2.txt
优点:可批量下载。
缺点:该法下载是按顺序下载,其过程中有些数据的网址解析有误,导致无法正常下载,会跳过无法下载的数据,继续进行下一个数据的下载)若下载的数据很多,有些下载成功,有些不成功。目前只能用到一种笨办法(你也可以找找别的方法),将很多的数据集拆分成多个小的txt文件,每次下载完成后,比对,看哪些数据未下载成功,将哪些没成功的数据重新单个用该命令下载。
3.利用迅雷软件可批量下载
首先,得到每个数据下载网址,如:http/ftp//:如下图
优点:可批量下载,下载过程中不中断,下载文件完整,速度一般,和prefetch差不多。
如下是下载方式。
4.群辉synology下载sra数据
downloadstation→点击网址下载,用获得数据网址进行批量下载如图所示。