Linux安装sratoolkit
NCBI查看安装帮助NCBI SRA Toolkit
下载、解压安装
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.2/sratoolkit.2.9.2-centos_linux64.tar.gz
tar zxf sratoolkit.2.9.2-centos_linux64.tar.gz
数据下载
最近在看微生物文献,想找文献的数据练手,链接进原文。
进入SRA数据查询库,如作图,输入SRP编号后下载,Accession List
使用prefetch进行下载
下载完成后,会在你的工作主目录下生成一个ncbi的文件夹。
输入命令:
prefetch --option-file SRR_Acc_List.txt #批量下载
cd ncbi/public/sra #查看下载结果
PS.安装aspera后再用prefetch命令会自动调用ascp下载,速度很快,有兴趣可以自行百度查找教程。
SRA格式转化
sra转化为fastq文件可以使用sratoolkit中的fastq-dump命令。
fastq-dump --split-3 filename其中--split-3参数代表着如果是单端测序就生成一个 、.fastq文件,如果是双端测序就生成_1.fastq 和*_2.fastq 文件。
进入到sra文件中我们可以用下述代码进行批量的格式转化:
for i in *sra
do
echo $i
fastq-dump --split-3 $i
done
结果查看:
ps.批量解压sra文件,用下面命令替换上面对应部分:
fastq-dump --gzip --split-files $i
参考来源: