HiFi测序原理
PacBio测序即单分子实时测序,其原理是:当DNA与聚合酶形成的复合物被ZMW(零模波导孔)捕获后,4种不同荧光标记的dNTP通过布朗运动随机进入检测区域并与聚合酶结合,与模板匹配的碱基生成化学键的时间远远长于其他碱基停留的时间。因此,统计荧光信息存在时间的长短,可区分匹配的碱基与游离碱基。通过统计4种荧光信息与时间的关系图,即可测序DNA模板序列。
HiFi 与CLR 比对
PacBio平台有CLR和HiFi两种测序模式。
CLR测序模式称为超长测序模式(插入片段30kb以上),产生的数据是基于单循环测序的结果,一次插入片段只测序一次,准确度和PacBio常规测序保持一致,在85%左右。CLR测序可以利用自身的数据进行纠错,当数据深度达到50X左右时,一致性序列准确性超过99.999%(QV50)。
HiFi的准确度超过Q20(99%),并且还能兼顾超过10kb,甚至可达20kb的长读长测序模式。由于HiFi插入片段只有10-20kb, 因此测序时酶会绕着DNA模板(插入片段)进行滚环测序,即插入片段会被多次测序。这样单词测序中造成的随机测序错误,可以通过算法进行自我纠错校正,最终得到高精度的HiFi Reads。