HiCuT

细胞核内基因组的三维(3D)结构对基因表达调控具有至关重要的作用。由特定蛋白质介导的长距离(>20kb)DNA-蛋白质相互作用的失调与多种病理表型密切相关。现有解析此类互作的方法,如HiChIP和ChIA-PET,虽能提供有价值的信息,但其高细胞起始量(>50万细胞)、大数据量需求(>1亿测序读数)以及复杂的数据处理流程,极大地限制了其在原代细胞、临床组织样本及稀有细胞群体中的应用。近日,Sati S. 等人在《PLoS Genetics》发表的“HiCuT: An efficient and low input method to identify protein-directed chromatin interactions”一文,报道了一种名为HiCuT的新技术,为解决上述瓶颈提供了有效方案。

HiCuT技术:核心原理与流程

HiCuT (Hi-C Coupled chromatin cleavage and Tagmentation) 是一种基于转座酶辅助的tagmentation策略,旨在高效、高分辨率地捕获蛋白质导向的长距离染色质互作。其核心流程包括:

  1. 细胞双交联与Hi-C 3.0处理: 首先使用甲醛和DSG(disuccinimidyl glutarate)对细胞进行双重交联,以稳定蛋白质-DNA及蛋白质-蛋白质复合物。随后,采用Hi-C 3.0方案,通过DdeI和DpnII双酶切进行染色质消化。
  2. 邻近连接: 酶切后的DNA末端被修复、标记(如生物素化,尽管原文中提到HiCuT省略了Hi-C的生物素富集步骤以捕获更多DNA并减少PCR偏好),并在稀释条件下进行连接,使得空间上邻近的DNA片段优先连接。
  3. 抗体捕获与pAG-Tn5 Tagmentation: 邻近连接后,细胞核与伴刀豆凝集素A(Concanavalin-A)磁珠结合,然后孵育特异性抗体以捕获与目标蛋白质相关的染色质互作复合物。关键创新在于,随后使用预装载测序接头的pAG-Tn5转座酶进行tagmentation。这一步骤不仅特异性地切割了目标蛋白结合区域的DNA,并同时完成了测序文库片段的接头连接。
  4. 文库扩增与测序: Tagmentation产物经PCR扩增后进行高通量测序。
  5. 数据分析: 测序数据通过HiC-Pro等流程进行处理,识别信息丰富的有效配对末端标签(paired-end tags)。

HiCuT技术的显著优势

与现有方法(HiChIP、ChIA-PET)相比,HiCuT展现出多方面优势:

  • 极低的细胞起始量: 仅需10万个细胞,相较于传统方法的50万细胞起,降低了至少5倍。
  • 显著减少的测序深度:1200万条测序读数即可获得高质量数据,相较于传统方法的1亿读数,降低了约8倍。
  • 高分辨率与低背景信号: HiCuT产生的片段化文库分辨率高,且背景信号极低。这使得数据解读更为直接,对复杂计算处理的依赖性大大降低。研究表明,60-80%的HiCuT互作末端锚定在已知的ChIP-seq峰内。
  • 简化数据处理: 由于信噪比高,HiCuT数据通常不需要复杂的loop calling算法或过滤流程即可识别高频染色质接触。文章指出,简单的距离阈值筛选(如20kb-2Mb)即可有效识别长距离互作。
  • 高效性: 实验流程耗时缩短约50%。
  • 双重信息获取: HiCuT不仅能鉴定长距离互作,还能同时提供高质量的蛋白质-DNA结合(类似ChIP-seq)信息。

实验验证与性能比较

研究团队通过在GM12878细胞中针对CTCF和RNA聚合酶II (Pol2) 进行HiCuT实验,并与已发表的Hi-C、HiChIP及ChIA-PET数据进行了严格比较:

  • CTCF互作: 使用10万GM12878细胞进行的CTCF HiCuT实验(汇集3个重复共30万细胞数据进行分析),能够捕获约52%由高深度Hi-C(约1.25亿细胞,65亿读数)鉴定的loops。这一比例与使用200万细胞、产生18倍测序读数的HiChIP方法(42%)相当甚至更优。APA(Aggregate Peak Analysis)分析显示,CTCF HiCuT数据集相较于HiChIP具有更高的中心富集度和APA得分。
  • Pol2互作: Pol2 HiCuT(30万细胞数据)捕获了约84%由ChIA-PET(1亿细胞)鉴定的互作,尽管起始细胞量和测序深度分别减少了325倍和约40倍。APA分析同样显示Pol2 HiCuT具有更高的富集度。
  • 原代细胞应用: 在10万原代人皮肤角质形成细胞中,利用H3K27ac抗体进行的HiCuT实验成功鉴定约7.6万个长距离互作。结合GWAS数据,HiCuT将725个与皮肤炎症疾病相关的SNPs与潜在候选基因(其中343个互作锚定在基因启动子区)联系起来,并通过基因本体论分析验证了其与皮肤疾病的相关性。此外,对互作锚定区域的基序分析无偏倚地识别出了p63、Fra-2等角质形成细胞关键转录因子。

HiCuT的创新之处与前景展望

HiCuT的成功关键在于几个方面:1) Tagmentation产生高度特异且片段较小的DNA,提高了loop锚定点的分辨率;2) 省略Hi-C生物素富集步骤,减少了PCR偏好,同时并未显著增加噪音(长距离读数比例与HiChIP相似);3) 基于Hi-C 3.0方案(双交联、双酶切),其检测长距离染色质loops的灵敏度本身就高于早期Hi-C版本。

HiCuT技术的开发,显著拓宽了蛋白质导向的3D基因组学研究的应用范围,使其能够应用于以往难以企及的样本类型,如原代细胞、临床组织样本和稀有细胞群体。它不仅降低了实验成本和对计算资源的高度依赖,还为从功能层面连接遗传变异与疾病易感基因、以及无偏倚地识别细胞特异性调控网络提供了强有力的工具。HiCuT有望成为研究人类遗传学、个性化表观基因组学以及疾病病理生理机制的普适性工具。

image.png

参考文献:
Sati S, Jones P, Kim HS, Zhou LA, Rapp-Reyes E, Leung TH (2022) HiCuT: An efficient and low input method to identify protein-directed chromatin interactions. PLoS Genet 18(3): e1010121. https://doi.org/10.1371/journal.pgen.1010121

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容