质控相关软件
fastp
序列操作软件
seqkit
NCBI 的 SRA toolkits
https://www.ncbi.nlm.nih.gov/sra/docs/toolkitsoft/
https://github.com/ncbi/sra-tools/wiki/HowTo:-fasterq-dump
查看文档后,似乎需要注意两点:
- 将中间目录设置到SSD或者是RAM-disk将会极大地提升速度(其实这个本身就是一个IO密集的工作,必然如此)
- 多线程可以加速,但是过多的线程会导致错误的输出。在多线程或者多进程编程中,总是会有这种结果,可以理解。
总的来说,我觉得加速的关键,在于1 而不在于2