靶向测序是将感兴趣的基因组区域通过捕获试剂盒进行富集后进行测序的研究策略,根据不同的应用,利用较少的数据量就能得到超高的灵敏度和准确度,实现变异位点的快速筛选。相较全基因组测序和全外显子测序,靶向测序能够聚焦所关注的区域,去除冗余数据的干扰,同时最大限度地利用测序reads,测序成本低且测序深度深,尤其适用于在临床应用中样本量少时的选择。例如人类全基因组大小约为3Gb,外显子区域仅占2%(约60M),全基因组测序(WGS)深度一般为30X—50X,单样本数据产出为90Gb-150Gb,全外显子测序深度一般为100X-200X,数据产出为6-12Gb,而针对一个目标区域大小为2M的panel来说,测序深度2000X,数据量也仅为4Gb。
常见的靶向捕获测序方法主要有以下三类
1.杂交捕获
杂交捕获测序是针对感兴趣的目标区域,基于碱基互补配对原理,设计合成核酸探针,对DNA文库进行目标区域杂交富集,并进行测序。其中杂交捕获探针可以与目标区域全部互补,也可以是部分互补。根据杂交介质的不同,可分为固相杂交和液相杂交。
目前NGS应用最广泛的还是液相杂交,将生物素探针、封闭液、DNA在液相环境下进行杂交,使用链霉亲合素磁珠进行富集,通过洗涤除去非特异性结合的核酸,随后对纯化后的文库扩增富集,并进行测序。液相杂交捕获测序可适用于几kb到上百Mb的基因组目标区域的检测,可检测SNV,InDel,CNV,SV,基因融合等。
1.1 探针
市面上常用的杂交捕获探针厂家有roche,Agilent,IDT,twist等
IDT | Angilent | Roche | Twist | |
---|---|---|---|---|
Probe type | ssDNA | ssRNA | ssDNA | dsDNA probes |
Oligo length | 120mer | 120mer | 60-95mer | 120 bp |
Probe design | End-to-end | End to end | overlap tiling | |
Scale | ≥50 probes | ≥100 probes | ||
QC | Each oligo gets Mass spec and OD260 | NGS QC of all probes |
在探针设计时,需要评估覆盖位置的序列特征,如果探针有很多落在重复序列区,或者高拷贝序列区,则探针会结合较多的非目标区域。设计更加特异性的探针则可以有效减少非特异序列的结合,提升捕获特异性。
1.2 封闭剂 blocker
在杂交捕获过程中,重复序列导致的文库之间互相结合,以及文库接头序列导致的文库之间互相结合,都会导致非特异性捕获。通过添加高效的重复序列封闭组分和接头封闭组分,可以显著降低上述文库之间的结合,从而大幅提升捕获效率。
1.3 捕获试剂
杂交捕获试剂盒厂家则有roche,Agilent,IDT,swift,twist等
杂交和漂洗的严谨性是影响捕获效率的重要因素,通过降低盐离子浓度和升高漂洗温度都会增加漂洗严谨性,更高的漂洗严谨性则会带来更高的捕获效率。但是对于漂洗条件的优化要慎重,漂洗条件的改变虽然会提升捕获效率,但也会影响覆盖均一性。
2.多重PCR
多重扩增子测序即针对感兴趣的目标区域,设计多重PCR引物进行扩增富集并进行测序的技术。通常适用于检测几十到几千个位点,或几十kb以下的区域。
3.分子倒置探针
分子倒置探针(MIP)技术其原理是设计一个口袋状探针,探针结构如图所示,H1和H2能和目标区段退火,然后利用DNA聚合酶将探针缺口补齐,同时添加DNA连接酶,将缺口处磷酸二酯键连接,即可构成一个完整的环状探针。然后通过外切酶将游离的探针消化,完整的探针包括目标区段的序列,利用通用序列(H1、H2之间序列)作为后续文库构建的引物(可添加index和测序引物),扩增产物可以直接作为二代测序文库。
这种方法的优势是特异性好而且捕获完成后的片段直接完成了建库(杂交捕获后还需要构建测序文库,主要是添加Index和测序接头),劣势就是捕获效率很低。