FASTQ格式说明

illumina下fastq文件命名

FASTQ文件在Illumina下通常会被命名为
SampleName_S1_L001_R1_001.fastq.gz
比如 NTC_S11_L001_R1_001.fastq.gz
其被下划线_分为了五个部分:
第一部分:SampleName,样本名,与上机时在Sample Sheet中填写的一致
第二部分:S1,S***,S后跟的数字与样本在Sample Sheet中的顺序一致,从1开始。不能分配到确定样本的read会归到S0(Undetermined_S0)
第三部分:L00*,泳道lane的编号
第四部分:R*,R1表示read1,R2表示read2。R1和R2为paired end reads。同一个样本的配对的FASTQ,只有这个地方不同
第五部分:001,通常为001

fastq格式

Each entry in a FASTQ file consists of four lines:
• Sequence identifier
• Sequence
• Quality score identifier line (consisting of a +)
• Quality score

Fastq

Sequence identifier
@<instrument>:<run number>:<flowcell ID>:<lane>:<tile>:<x-pos>:<y-pos><read>:<is filtered>:<control number>:<index sequence>
eg:

Quality score
The character '!' represents the lowest quality while '~' is the highest. Here are the quality value characters in left-to-right increasing order of quality (ASCII):

Quality score
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容