Fastp官方教程学习笔记
资源
输入和输出参数
- 单端:
-i -o - 双端:
-i -I -o -O - 如果不指定-o,则对QC前后的序列文件进行质检报告,但是没有输出文件
-
-o如果以gz结尾,则对输出文件进行压缩等级为4的zip压缩 -
--unpaired1和--unpaired2指定的是未配对的文件,如果两个文件的名称相同,则将未配对的read输出到一个文件 -
--failed_out可以指定未通过QC的read -
--read_to_process仅仅处理部分read --dont_overwrite
Filtering
- 质量
-
-n指定N的数目最多为多少个 -
-q指定好read的phred值 -
-u指定不合格的read的最大的百分比 -
-e指定average的phread值
-
- 长度:
-
-lread的长度不短于该值的时候保留 -
--length_limitread不长于
-
- complexity:
-
-Y默认为30%,即相邻的碱基必须至少30%是不同的
-
Adapter
-
-a指定adapter的序列 - 对于双端测序数据来说,一般不用指定adapter序列,软件可以自动识别
- 利用
--detecet_adapter_for_pe打开自动识别adapter的功能 - 软件有给出常用的adapter序列,在帮助文件里面有提到
--adapter_fasta- ==先trimauto_detect_adapter或--adapter_seq,在trim--adapter_fasta==
cut模式
- -5
- -3
- -r
miscellaneous
-
--split_prefix_digits指定把数据分块的prefix -
-s分块的块数