全基因测序主要有两种策略:逐步克隆法(clone by clone)和全基因组鸟枪法(whole genome shotgun sequencing,WGS)。
(1)逐步克隆法
逐步克隆法是比较传统的测序策略,是在高通量测序之前主要采用的方法。这个方法涉及到了物理图谱和遗传图谱,首先来简单了解一下这两个概念。
遗传图谱是指利用了DNA重组的原理,找到基因和多态性DNA路标的相对关系。最常用的图谱叫做序列标签位点(sequence tagged site,STS)图谱。一般来说,每个STS序列在基因组上都是唯一的,每隔100kb左右设立一个STS,可以是随机取的,也可以是表达序列。
接着要构建大片段的插入基因组文库(BAC文库)。将物种的所有基因打断成为大概200kb左右的大片段DNA,再与载体连接,转化克隆菌株。每一个菌落都带有相同的大片段DNA。将每个菌落在STS- PCR反应池中检验。检测不同的片段和STS的连锁情况。再进行测序得到它们之间的物理距离,通过STS进行拼接成为不同的contig。但是由于STS通常不能覆盖整个基因组,需要后续的延伸形成将不同的contig连接起来。
通常以这种方法得到的序列质量很好,但是很繁琐,构建图谱这一步就使得在一些物种的应用上受到限制。但是它对于计算机的要求比较低,需要具备一定的遗传知识。可以应用于人,线虫等物种。
(2)全基因组鸟枪法
这种方法的思路很简单,将基因组打断测序,由重叠序列进行拼接,这是高通量测序出现以后的主要测序策略。但是它对于拼接算法的要求很高,拼接质量也不如上个方法好,但是胜在速度快。可以应用于果蝇,拟南芥,水稻等物种。
该方法一般需要经历以下的步骤:
基因组特征预测,包括基因组大小,杂合度,倍性,重复性等等-全基因组测序-序列测序的质量评估和控制-基因组拼接-拼接质量评估。
参考链接:
https://max.book118.com/html/2018/0330/159374809.shtm
https://wenku.baidu.com/view/8ad53f27f46527d3240ce089.html