将下载的SRA文件转换成fastq或者fasta文件
1. 普通双端拆分
fastq-dump --split-files filename.sra
将SRA文件转换成R1和R2两个fastq文件,R1是Barcode+UMI,R2是RNA序列
2. 普通单端拆分
fastq-dump --split-3 filename.sra
3. 以.gz
格式保存fastq文件
fastq-dump --gzip --split-files
4. 报错及解决
4.1 报错一
Rejected 20042 READS because READLEN < 1
.sra
文件中其中有些read
的长度为0
,而在拆分.sra
文件时会有一个-M
的参数设置,这个参数规定了read
的最少length
,默认参数为1
;在-M
为默认参数下,length
为0
的read
会被去除,单端测序在这种情况下只会减少一些数据量,其他没有影响;双端测序在这种情况下由于两端测序数据中length
为0
的read
不一样,从而导致双端测序read
不能对齐,导致下游数据分析失败
- 解决方案:添加
-M 0
参数
- 解决效果:长度为
0
的行被保存,@
开头和+
开头行与其他read
相同,序列行
和测序质量行
依然存在,不过没有任何值