linux批量下载SRA数据并完成数据转换

最近在收集NCBI中的相关数据,进行meta分析,探讨石油污染对土壤微生物群落在系统发育层面的影响。


目录结构

每个文件中都有对应的SRR_Acc_List.txt文件记录了相对应的序列文件SRR***,格式统一,执行的操作一致,所以可以进行批量操作

在当前目录所有文件夹下,统一新建SRA和fastq子文件夹,下载序列文件至各目录下的SRA子文件夹,然后将序列文件转换成fastq文件

for file in $(ls)  #获取当前目录下的多个文件夹
do
mkdir ${file}/{SRA,fastq} -p #在各个文件夹下新建SRA和fastq两个子文件夹

for line in $(cat ${file}/SRR_Acc_List.txt) #获取每个文件夹中SRR**
do
prefetch ${line} -O ${file}/SRA #下载到对应文件夹的SRA子文件夹中
fastq-dump ${file}/SRA/* --split-3 -O ${file}/fastq #完成数据格式转换,并输出到对应的fastq子文件夹中
done

done
执行中...
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。