fastp去umi测试
在二代测序中,由于文库的质量偏低,通常需要增加umi以标记reads序列
常规有使用一下两个方法进行去umi:
方法一:使用-U的命令
fastp -i 1.fq.gz -I 2.fq.gz --adapter_sequence AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC --adapter_sequence_r2 AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTA -j sample.json -h sample.html -o sample_Clean_R1.fq.gz -O sample_Clean_R2.fq.gz --umi_loc per_read --umi_len 8 --umi_prefix UMI --umi_skip 20 -w 8
方法二:直接切掉所有reads5'端的8bp
fastp -i 1.fq.gz -I 2.fq.gz -f 8 -F 8 --adapter_sequence AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC --adapter_sequence_r2 AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTA -j sample.json -h sample.html -o sample_Clean_R1.fq.gz -O sample_Clean_R2.fq.gz
方法三:或者由于打断片段太短,read被测穿了,可同时切掉3‘端的8bp
fastp -i 1.fq.gz -I 2.fq.gz -f 8 -F 8 -t 8 -T 8 --adapter_sequence AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC --adapter_sequence_r2 AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTA -j sample.json -h sample.html -o sample_Clean_R1.fq.gz -O sample_Clean_R2.fq.gz
总的来说去umi的干净程度为:
方法三 >方法二 >方法一
但是打断片段若正常的情况下,建议使用方法二,能够更好的保留reads的完整性同时具备一定量去掉umi的比例。