一、测序技术的历史沿革
- 1954年,Whitfeld等提出了测定多聚核糖核苷酸链的降解法
- 70年代的Sanger发明了“双脱氧终止反应法”,即一代测序
- 1983年Kary Mullis 发明PCR测序仪,推动产生了二代测序
- 1989年以纳米孔单分子测序技术为基础产生了三代测序
二、二代测序原理介绍
- 必备名词
- flowcell: 测序反应的载体/容器,1个flowcell有8个lane
- lane: 测序反应的平行泳道,试剂添加、洗脱等过程的发生位置
- tile: 每次荧光扫描的位置,肉眼是看不到的
- 双端测序: 可能序列比较长有四五百bp,两边各测120-150bp
- junction: 双端测序中间一些没有测到的区域
- flowcell构造:一个lane包含两列(swath),每一列有60个tile,每个tile会种下不同的cluster,每个tile在一次循环中会拍照4次(每个碱基一次)
- 测序流程-边合成边测序(sequence by synthesis, SBS)
- 构建DNA文库
- 上样
- 桥式PCR
- 测序
- 数据产生
- 图象校正(即空间校正)
- cluster识别
- 荧光校正(即光学校正)
- phasing/prephasing(即化学校正)
- 碱基识别
- PF(Illumina默认的数据过滤算法Pass Filtering)
- 质量评估
- 数据格式及分析
- Fastq格式:一种基于文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式,一般都包含有4行
- Fasta格式:一种基于文本用于表示核酸序列或多肽序列的格式
- GenBank格式
- EMBL格式
- 使用fastqc软件进行分析
三、三代测序技术介绍
- PacBio实时单分子测序
- Complete Genomics公司的复合探针-锚定连接技术
- Oxford Nanopore纳米孔单分子通道技术
- Ion Torrent电子流检测技术
生信星球Day7-测序知识.png