SRAtoolkits: fastq-dump

将下载的SRA文件转换成fastq或者fasta文件

1. 普通双端拆分

fastq-dump --split-files filename.sra

将SRA文件转换成R1和R2两个fastq文件,R1是Barcode+UMI,R2是RNA序列

2. 普通单端拆分

fastq-dump --split-3 filename.sra

3. 以.gz格式保存fastq文件

fastq-dump --gzip --split-files

4. 报错及解决

4.1 报错一

Rejected 20042 READS because READLEN < 1
.sra文件中其中有些read的长度为0,而在拆分.sra文件时会有一个-M的参数设置,这个参数规定了read的最少length,默认参数为1;在-M为默认参数下,length0read会被去除,单端测序在这种情况下只会减少一些数据量,其他没有影响;双端测序在这种情况下由于两端测序数据中length0read不一样,从而导致双端测序read不能对齐,导致下游数据分析失败

    1. 解决方案:添加 -M 0参数
    1. 解决效果:长度为0的行被保存,@开头和+开头行与其他read相同,序列行测序质量行依然存在,不过没有任何值
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容