trimmomatic 转 fastp

之前一直用fastqc + trimmomatic 数据质控,基于fastp快速方便等特点,研究转为fastp做质控。

trimmomatic:我们使用的参数(以MALBAC_1_step_lib为例)

trimmomatic的具体参数用法:
https://www.jianshu.com/p/a8935adebaae
高通量测序常见的接头序列
https://github.com/csf-ngs/fastqc/blob/master/Contaminants/contaminant_list.txt

ILLUMINACLIP="ILLUMINACLIP:" + ADAPTERS + ":2:20:6"
SLIDINGWINDOW= SLIDINGWINDOW:4:15
LEADING= "LEADING:3",
TRAILING= "TRAILING:3",
MINLEN= "MINLEN:25",
CROP= 60
HEAD_CROP=12

fastp 具体的参数用法:
https://www.jianshu.com/p/6f492058da5b
https://github.com/OpenGene/fastp#base-correction-for-pe-data
http://www.biotrainee.com/thread-2540-1-1.html

fastp 对应trimmomatic 的参数如下:

1.先做接头切除:用默认值

2.做滑窗处理:窗口大小:4;每个窗口平均碱基质量值:15

--cut_window_size 4
--cut_mean_quality 15

3.根据碱基质量切

---cut_front/-5 3
--cut_front/-3 3

4.长度过滤:丢掉长度不够的reads

--length_required 25

5.做全局剪切

reads开头切掉的碱基数

read1: -f 12
read2: -F 12

从reads尾部开始切,使其达到指定长度

read1: -b/--max_len1 60
read2: -B, --max_len2 60

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 转录组学习一(软件安装) 转录组学习二(数据下载) 转录组学习三(数据质控) 转录组学习四(参考基因组及gt...
    Dawn_WangTP阅读 20,784评论 3 34
  • SRA—>FASTQ—>BAM—>COUNTS 这几个步骤而已,中间穿插一些质控的手段,每个步骤选择好合适的软件即...
    六六_ryx阅读 11,016评论 7 20
  • 一、测序数据的格式转换 sra文件下载好后,使用fastq-dump转换数据格式: fastq-dump --sp...
    BioLearner阅读 4,432评论 0 1
  • 今天带着大宝二宝去了佳乐家逛了逛,在佳乐家上碰到两个机器人,俩孩子是啥也不要了,就要去看那两个机器人,一开始俩孩子...
    硕新飞阅读 412评论 2 3
  • 平日里一个人在上海,总感觉山西老乡很少,很难遇到。可是每次一坐上回家的火车,感觉老乡们就像雨后春笋一样纷纷冒出。不...
    八表哥殿下阅读 790评论 0 2