生命密码→ATCG
高通量测序的发展使得基因序列的获得变得简单,未来或许所有生物的基因序列都可以转化为数据库里的ATCG,通过比较不同生物基因序列,我们或许可以绘制物种的进化树,或将其作为人类预防和治疗疾病的线索。那么生命密码是如何变成ATCG数据的呢?
ATCG
DNA由脱氧核苷酸组成的大分子聚合物。脱氧核苷酸由碱基、脱氧核糖和磷酸构成。其中碱基有4种:腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)和胞嘧啶(C)。
如何将四种不同的碱基分子顺序转化为ATCG序列?
光信号和电信号
光信号方案:给每个碱基加上不同的荧光基团,利用激发光让荧光基团发射,通过捕获基团荧光,确定ATCG
电信号方案:四种碱基依次通过电极,由于化学结构不同,引起的电信号也有不同,最终解码为ATCG。要求需要很高的灵敏度检测技术。
illumina平台特点
illumina的测序采用光信号方案,其有三个特点:
边合成边测序
sanger末端终止技术(一代测序)由于效率低不再被采用,需要边合成边测序技术来提高效率,每合成一次就能读取一个碱基,然而会产生新的问题,已合成的碱基加入的荧光基团相互之间会产生干扰,因此需采取可逆阻断技术。
可逆阻断技术
通过在3'端加入一个阻断基团,当荧光基团加入后,后面的合成被终止,从而捕获荧光信号,完成后,切除荧光基团和阻断基团,进入下一个合成。
双末端测序
边合成边测序需要进行大量的PCR反应,因此存在限制,从而限制了测序的读长,双末端测序即为解决方案,也就是测一条序列的两端,从而提高了测序的读长。
这三点优势使得illumina成为目前很成熟的高通量测序平台。
知识整合于网络和同源基因视频课程。