Hi-C由3C技术发展而来,3C即染色质构象捕捉技术(Chromosome conformation capture, 3C),Hi代表新技术是高通量的。因而,欲理解Hi-C技术原理及功能,学习3C技术的核心才是根本。
白墨石(CSCD博主)简述了从3C发展至Hi-C各技术的区别与各自功能,比较了各技术的异同[1]。简言之,3C仅检测指定序列片段内的潜在互作,依照技术规范开展实验,经PCR+二代测序,将结果map至基因组草图。若存在交互,即存在交联蛋白,那么序列末端便可按潜在的方式连接,于是将所得序列定位至参考基因组后可观察到预期的排列,即证明了该交互,亦获得了交互双方在基因组中的物理位置。
序列末端存在多种潜在的连接方式:如Naumova等[2] 图2中描述的那样,仅交叉末端的相连方属有效。网络有许多频繁转载的示意图,但常具误导性,因为它们让上游工序经内切酶切开的末端重新接上,而这实际为一无效连接,相关的文字表述又模糊不清。这一步Hi-C 实现了高通量,在随后的测序环节(原理描述及示意图见参考文献)[3],基于二代测序原理[4],可以推知map至参考基因组存在交互的有效双端(valid pairs)有四种排布模式[3]。安诺基因_discard[5] 整理了各类不合规连接,并对各连接导致的测序后异常序列排布进行展示,分析了常见异常出现的潜在原因。尽管该文的一些细节可能存在错误,但颇具提示意义。
最后是Hi-C实验的第一结果:热图。这一工序被称作Hi-C组装,但与基因组组装不同,这一步主要是将互作序列识别并定位到基因组草图中,制作序列互作的热图,进而将基因组组装至染色体水平。
参考文献
[1] 白墨石(CSCD博主). Hi-C 测序技术(图解详解)[EB/OL]. 2021[2023-8-27]. https://blog.csdn.net/u011262253/article/details/113725316.
[2] Naumova N, Smith E M, Zhan Y, et al. Analysis of long-range chromatin interactions using Chromosome Conformation Capture[J]. NIH Public Access, 2012, 58(3):192-203.
[3] 生信师姐(简书博主). Hi-C | 基础介绍[EB/OL]. 2022[2023-8-27]. https://www.jianshu.com/p/049330217e36.
[4] Yizhe_Lin(简书博主). 新一代测序技术[EB/OL]. 2022[2023-8-27]. https://www.jianshu.com/p/0a00bc29109b.
[5] 安诺基因_discard. 如何获得高质量Hi-C数据?资深大神告诉你答案~ [EB/OL]. 2017[2023-8-27]. https://www.sohu.com/a/210740052_307557.