关于测序原理稍微了解过一点点
所以就复习了一下自己以前的笔记
图片来源不详,都是网上找的,仅供本人自己学习使用
讲解测序原理:https://www.jianshu.com/p/101c14c3a1d2(后面数据处理那块没看懂,以后再看)
Sanger测序的原理:在体系中混入一定量带有荧光标记的ddNTP,它们结合上去后会终止后续dNTP继续连接上去,从而形成不同长度的片段,先经过电泳将不同长度的条带分离,再根据不同的荧光信号区分那个位置的碱基是哪一个。
第一代测序技术的主要特点就是测序读长可达1000bp,准确性高达****99.999%,二三代所不能及),而是因为它的通量低,成本高。
Illumina测序原理
主要有4个步骤:sample preparation,cluster generation,sequencing,data analysis
每一轮只延长一个碱基,测完以后再延长下一个碱基,一个一个测。
通过加接头的方式,可以一次测出多个不同序列(高通量)
加入特殊的dNTP【它的3‘ 羟基被叠氮基团替代,因此每次只能添加一个dNTP;还含有荧光基团,能激发不同颜色】;
在dNTP被添加到合成链上后,所有未使用的游离dNTP和DNA聚合酶会被洗脱掉;
再加入激发荧光缓冲液,用激光激发荧光信号,光学设备记录荧光信号的记录,计算机将光学信号转化为测序碱基
再加入化学试剂淬灭荧光信号并使dNTP 3’ 叠氮基团变成羟基,这样能继续向下进行再加一个,并且保证这个不再发出荧光。如此重复直至所有链的碱基序列被检测出。
两端加接头实现高通量:P5和P7是用来使片段固定在lane上的,这样经过约35轮PCR,附近的区域都是相同的序列,形成一个cluster,使信号放大。
为什么能测序的长度有限?
因为错误会不断积累。等到了后面错误多的时候系统无法判断谁是真实的信号谁是干扰信号,就会在结果中给出N
PhiX Control v3 Library 是来自于噬菌体的一个库,ATCG比例较为均衡,常用于平衡illumina各通道荧光信号。
有些文库的信号比较平衡,这时没啥问题。
但是有些库的信号不太平衡,特别是在前几个循环,如果信号都集中于某一个碱基,机器可能难以把各个cluster区分开。所以要加入一定比例的PhiX作为control
三代测序-单分子测序-有很多不同的技术,利用荧光或电流检测不同的碱基。主要思想是不经过PCR直接对单个DNA分子测序,有SMRT技术和纳米孔技术等。
读长可以很长,错误率可以达到15%,要通过重复测来纠错。