fastqc 质控2023-07-13

fastqc seqfile1 seqfile2 .. seqfileN

    fastqc [-o output dir] [--(no)extract] [-f fastq|bam|sam] [-c contaminant file] seqfile1 .. seqfileN

-o --outdir FastQC生成的报告文件的储存路径,生成的报告的文件名是根据输入来定的

-f --format      指定输入文件的格式

--extract        生成的报告默认会打包成1个压缩文件,使用这个参数是让程序不打包

-t --threads      选择程序运行的线程数,每个线程会占用250MB内存,越多越快咯

--min_length      设置序列的最小长度,≥最长read的长度

-c --contaminants 污染物选项,输入的是一个文件,格式是Name [Tab] Sequence,里面是可能的污染序列,如果有这个选项,FastQC会在计算时候评估污染的情况,并在统计的时候进行分析,一般用不到

-a --adapters    也是输入一个文件,文件的格式Name [Tab] Sequence,储存的是测序的adpater序列信息,如果不输入,目前版本的FastQC就按照通用引物来评估序列时候有adapter的残留

-q --quiet        安静运行模式,一般不选这个选项的时候,程序会实时报告运行的状况


The discordant sequence content at the begining of the reads are common phenomenon for CUT&Tag reads. Failing to pass the Per base seuqnence content does not mean your data failed.It can be due to the Tn5 preference.What you might be detecting is the 10-bp periodicity that shows up as a sawtooth pattern in the length distribution. If so, this is normal and will not affect alignment or peak calling. In any case we do not recommend trimming as the bowtie2 parameters that we list will give accurate mapping information without trimming. 这可能是由于10个碱基的周期性导致的。作者指出,如果是这种情况,这种现象是正常的,不会影响比对或峰值调用。因此,他们建议不进行修剪操作,并表示列出的bowtie2参数将在不进行修剪的情况下提供准确的比对信息。这段话的理解可以归纳为以下几点:锯齿状图案:在长度分布中观察到的锯齿状图案可能是由某种10个碱基的周期性引起的。这种现象可能是由于某种基因组结构或特定的测序技术导致的。正常现象:作者认为这种10-bp的周期性是正常的,不会对比对和峰值调用产生负面影响。这意味着即使存在锯齿状图案,仍然可以继续使用该数据进行后续分析,并获得准确的比对和峰值信息。不建议修剪:作者明确表示不建议进行修剪操作,即对序列进行截断或修剪。他们认为,在给定的bowtie2参数设置下,无需进行修剪操作即可获得准确的比对结果。这是基于作者的经验和测试结果,他们相信修剪操作是不必要的。
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容