我们进行获取数据并进行分析时,一个个的操作未免太过麻烦,因此可以利用shell脚本进行批量处理。在此利用之前老师上课讲过的生物软件来利用脚本做一个流程化处理。
首先我们明确一下操作流程
1、利用Aspera批量下载文件
2、利用FastQC语需要.fastq.gz文件,所以我们需要利用SRA-toolkits做格式转换
3、利用FastQC做质控
我的需要批量下载的序列放在sra_list.txt文件中
下面是一些结果和脚本代码
第一步结果
第二步结果
第三步结果
脚本运行结果
因为是在sra_list.txt中放了三个文件位置,却只下载了两条,有一条错误,我在下面也试了很多次,代码应该没有什么问题,估计可能是服务器不稳定,如果有其他什么发现,欢迎同学们告知
关于后面的序列组装SPAdes和velvet以及序列拼接评价QUAST的脚本,大家有兴趣的可以在后面添加,与此如出一辙。
今天看了俊辉的脚本发现可以对PE还是SE进行区别,大家也可以看看