生信笔记3-Trim Galore的安装和使用

介绍

Trim Galore是自动检测转录组数据adapter的质控软件。cutadapt软件可以对NGS数据进行质量过滤,FastQC软件可以查看NGS数据的质量分布,trim_galore将这两个软件封装到一起,使用起来更加的方便。


安装

conda install trim-galore


使用

trim_galore -q 20 --phred33 --stringency 3 --length 20 -e 0.1 \

            --paired $dir/cmp/01raw_data/$fq1 $dir/cmp/01raw_data/$fq2  \

            --gzip -o $input_data

参数说明:

--quality(-q):设定Phred quality score阈值,默认为20。

--phred33::选择-phred33或者-phred64,表示测序平台使用的Phred quality score。

--adapter:输入adapter序列。也可以不输入,Trim Galore!会自动寻找可能性最高的平台对应的adapter。自动搜选的平台三个,也直接显式输入这三种平台,即--illumina、--nextera和--small_rna。

--stringency:设定可以忍受的前后adapter重叠的碱基数,默认为1(非常苛刻)。可以适度放宽,因为后一个adapter几乎不可能被测序仪读到。

--length:设定输出reads长度阈值,小于设定值会被抛弃。

--paired:对于双端测序结果,一对reads中,如果有一个被剔除,那么另一个会被同样抛弃,而不管是否达到标准。

--retain_unpaired:对于双端测序结果,一对reads中,如果一个read达到标准,但是对应的另一个要被抛弃,达到标准的read会被单独保存为一个文件。

--gzip和--dont_gzip:清洗后的数据zip打包或者不打包。

--output_dir (-o):输入目录。需要提前建立目录,否则运行会报错。

-- trim-n : 移除read一端的reads


参考

https://www.jianshu.com/p/7a3de6b8e503

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容