Trimmomatic是一个广受欢迎的Tllumina平台数据过滤工具,支持多线程软件有两种模式 SE 和 PE
用法
单末端测序模式
在SE模式下,只有一个输入文件和一个过滤后的输出文件
java -jar [Trimmomatic所在的绝对路径] SE -phred33 [输入文件] [输出文件] [动作1] [动作2]...................
双末端测序模式
在PE模式下,有两个输入文件,正向测序序列和反向测序序列,过滤之后
输出文件有四个 两端序列都保留的为paried 一端序列过滤后被遗弃另一端保留为unparied
java -jar [Trimmomatic的绝对路径] PE -phred33
第一个输入文件(forward端)正向端
第二个输入文件(reverse端)反向端
输出文件[forward_paried forward_unpaired reverse_paired reverse_unpaired ] [动作1] [动作2].............
动作说明
ILLUMINACLIP:
过滤reads中的Illumina测序街头和引物序列并决定是否去除反向互补的R1/R2中的R2
参数说明(PE测序要注意最后一个参数,SE最后两个参数不用设置,参数之间用冒号连接)
<接头和引物序列所在位置(Trimmomatic自带在adapters里面,其中TruSeq2为2代测序,TruSeq3为三代测序)> :
<seed搜索允许多少个个碱基错配)>:
<alindrome比对分值阈值为多少>:
<simple clip 比对分值阈值为多少>:
<palindrome模式允许切除的最短接头序列为多少 默认为8bp>:
<palindrome模式去除与R1完全反向的R2>
SLIDINGWINDOW:
从reads的5'端开始,进行滑窗质量过滤,切掉碱基质量平均值低于阈值的滑窗
参数说明:<窗口大小>:<碱基平均质量值阈值>
MAXINFO:
一个自动调整的过滤选项,在保证reads长度的情况下尽量降低测序错误率,最大化reads的使用价值
LEADING:
从reads的开头切除质量低于阈值的碱基
TRAILING:
从reads的末尾切除质量低于阈值的碱基
CROP:
从reads的末尾切掉部分碱基是reads达到指定长度
HEADCROP:
从reads的开头切掉指定数量的碱基
MINLEN:
如果经过剪切后reads的长度低于阈值则丢弃这条reads
AVGQUAL:
如果reads的平均碱基质量值低于阈值则丢弃这条reads
TOPHRED33:
将reads的碱基质量值体系转为phred-33
TOPHRED64:
将reads的碱基质量值体系转化为phred-64