一、illumina测序原理
illumina的底层原理就是基于可逆终止的、荧光标记dNTP来做边合成变测序的工作。
工作流程主要有四个步骤:
- 样本准备(文库构建):
将DNA片段化,就是将基因组DNA用超声波打断,然后用酶将两端补平,接着在3‘端加上一个A碱基;
在3’端将带有dA尾的DNA片段与adapter进行连接,连接好的DNA混合物就是文库(library),接头包含了index和测序结合片段。 - 簇生成(就是一个扩增的过程)
lane表面会通过共价键接上一些寡聚核苷酸引物,用来与测序结合片段结合。
将文库接到flowcell上,文库会和lane表面的寡聚核苷酸引物结合进行pcr,pcr完成后加入氢氧化钠碱溶液将一条链冲洗下去。
加入中性溶液,将lane表面复制完成的链与lane表面的另一端寡聚核苷酸引物结合,进行桥式pcr。重复这一过程,知道有足够的簇。然后通过切除基团的方式去除反向链。
ps:
Flowcell :流动池,就是一张芯片,如Hiseq2500有2张flowcell,即一次运行的测序量;
Lane:每张flowcell上通常都有多个通道,每个通道可以单独测不同的样品。 - 测序
通过3‘端的叠氮基团来暂时终止合成,通过荧光基团来识别碱基。然后通过化学试剂切除叠氮基团和荧光基团,即可逆终止,边合成边测序。
在第一次读段结束后,进行index的读取,每个样本都有特定的接头,每个接头都有特定的序列,即index。index读取是为了识别样本的来源,需要先洗去读段产物,然后加入index1的测序引物,进行第二轮测序,一般是六到八个碱基。
如果是双端测序,接下来就需要进行反向测序,先加入index2的引物进行测序,通过聚合酶完成桥式pcr的扩增,洗脱后留下反向链进行测序,得到read2序列。 - 分析数据
连续序列与参考基因组进行比对,来进行突变识别。
Illumina测序原理详解
二、测序相关
常用数据格式.png
测序历史.png
7天学习结束,感谢生信星球!