Defining genome architecture at base-pair resolution | Nature
在高等真核生物中,许多基因受到远离启动子的104-106个碱基对(bp)的增强子的调控。增强子包含转录因子结合位点(通常在7-22bp 左右) ,并且启动子和增强子之间的物理接触被认为是调节基因表达所必需的。虽然染色质结构已经被广泛地定位在1千碱基及以上的分辨率; 在决定基因表达的蛋白质的尺度上定义物理接触是不可能的。在这里,我们使用一种染色体构象捕获方法(Micro-Capture-C)来详细定义这些相互作用,这种方法能够在基对分辨率下确定不同类别监管元素之间的物理接触。我们发现增强子、启动子和 CTCF (CTCF)位点之间存在高度点状的接触,我们表明转录因子在维持增强子和启动子之间的接触中起重要作用。我们的数据显示,当活性启动子和增强子位于中间的染色质内时,CTCF 位点之间的相互作用增加。这支持了染色质环挤出1依赖于活性启动子和增强子上的粘附素负载的模型,这解释了组织特异性染色质结构域的形成而不改变 CTCF 结合。
我们开发了一种高分辨率的3C 方法(Micro-Capture-C (MCC)) ,它允许我们在单个转录因子的分辨率下确定调控元件之间的物理接触,从而获得对基因调控的独特见解。与所有其他可用的3C 方法相比,分辨率显着增加,包括 Hi-C2,Micro-C3,4,5,启动子捕获 Hi-C6,4C7和下一代(NG)捕获 -C8(图1)。这是通过结合 NG Capture-C8方法的五个进步(扩展数据图1)实现的,该方法目前为来自个人视角的3C 数据提供了最大的灵敏度和分辨率9。首先,用微球菌核酸酶(MNase)代替限制性内切酶。MNase 片段基本上独立于 DNA 序列3,10,我们发现亚核小体细节可以通过滴定 MNase 来维持核小体间接头来解析(扩展数据图2a)。其次,我们发现通过使用用洋地黄素透化的完整细胞使核结构的破坏最小化,可以显着提高分辨率,而以前的3C 方法主要在溶液或纯化的细胞核中使用染色质。第三,我们从个人观点(每120bp 观点多达500,000个独特联系人(平均140,000))产生了非常深入的数据(补充表1)。这相当于使用 Hi-C 和 Micro-C 等“所有与所有”方法获得的数据深度的1,000倍以上(这种覆盖全基因组深度需要超过3万亿个连接连接)。第四,我们通过直接测序不同位点读数之间的连接连接来生成具有碱基对精度的接触图。这是通过将 MNase 3C 文库超声处理至200bp 片段并用300bp 读数进行测序(扩展数据图1) ,从配对末端测序中重建单个读数来实现的。第五,开发了一个新的分析管道,使连接连接精确定位和蛋白质-蛋白质相互作用重建(扩展数据图1)。与其他 Capture-C 方法一样,MCC 可以在一个实验中同时并行地研究大量的观点。在原代小鼠红细胞和胚胎干细胞(ES)中,从330个观点产生了全基因组图谱,包括启动子、增强子和 CTCF 结合位点。数据具有高度可重复性,MNase 消化对照的测序显示横跨整个基因组,并且没有偏向于超敏位点的偏好(扩展数据图2b,c)。未捕获的 MNase 3C 文库的测序显示没有明显的序列偏差,尽管观察到对超敏位点的偏倚的次要证据,这可能是由于连接的变异性而不是 MNase 切割。值得注意的是,这种效应的校正并没有明显地改变接触轮廓或检测到的峰值(扩展数据图2b-f 和补充表2)。
图1: 在 α-珠蛋白基因(Hba-a1和 Hba-a2)的启动子处的红细胞中 MCC 与其他3C 技术的比较显示 MCC 提供的分辨率显着增加。
图2: MCC 定义了启动子和增强子之间在许多特征明显的位点上的高度特异性接触。