从NCBI上下载SRA原始数据,使用SRA TOOLKIT 进行下载和转化。
1. 下载SRA Toolkit (注意找准自己的版本)
https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software
2. 解压,放在文件夹下,并记住路径
我这里放在“/Users/baiyunfan/bio”下面
3. 打开终端或者Linux虚拟机
4. 配置环境变量
echo "export PATH=$PATH:/Users/baiyunfan/bio/sratoolkit.2.9.6-1-mac64/bin" >> ~/.bashrc
source ~/.bashrc
将路径塞进bashrc里,source是运行一下
5. 下载单个数据
prefetch SRR2061753
6. 下载多个数据
echo SRR2061753 > id
echo SRR2061752 >>id
prefetch --option-file id
如果文件下着下着就掉线了怎么办?
nohup prefetch --option-file id &
7. 文件下到~/ncbi/public/sra中
8. 查看是双端还是单端
NCBI里会描述是双端测序还是单端,具体要详细看一下,如果是双端要拆分。
网址参照:https://www.ncbi.nlm.nih.gov/Traces/study/?acc=PRJNA281942&go=go 在左上角输入你的SRA序号即可
9.sra转化成fastq格式
单端测序(single-end)
fastq-dump SRR2061752.sra
双端测序(pair-end)
fastq-dump --split-3 SRR2061752.sra
对您有帮助的话,还请留个赞。