一、3D基因组之ChIP-seq
基因组的三维立体结构的主要组成是DNA和蛋白质。研究基因组的三维立体结构就是研究DNA与蛋白之间的互作。ChIP一直是研究蛋白与DNA互作的重要方法。他可以显示众多调节蛋白在基因组上的分布。下表是生物体内常见的几种DNA调节蛋白。
Histone是核小体的基本组成蛋白,核小体是染色质的基本组成单位。组蛋白的修饰(如:甲基化,乙酰化,磷酸化等)使核小体在DNA上发生移动,改变核小体的位置。这使得特定的组蛋白修饰代表特定的生物学特征。例如H3K27ac代表激活型启动子区域,H3K27me3代表抑制型启动子区域,等等。
除了组蛋白外,还有一类重要的调控元件-转录因子来调节染色质的结构和功能,然而,转录因子要与RNA聚合酶II互作,才可以调控基因表达。
CTCF是一类重要的绝缘子蛋白,与RAD21蛋白形成稳定的3维立体结构区域,维持染色质的正常形态。
另外,您需要根据目的基因的表达情况选择相应的ChIP组合方式。
1.ChIP-seq数据分析
ChIP-seq的数据呈现形式是多种多样的。但主要以3种形式出现在文章中。
①最常见的peak图
②研究转录起始位点的TSS距离分布图,可以清楚的观察到TSS位点处,多种蛋白的分布情况。
③比较直观的热图,可以清楚的看出同一DNA区域,不同蛋白的分布情况,以及同一蛋白在不同DNA区域的分布情况。
二、3D基因组之Hi-C技术
Hi-C(High-throughput/resolutionchromosome conformation capture)技术,以整个细胞核为研究对象,利用高通量测序技术,结合生物信息学方法,研究全基因组范围内整个染色质DNA在空间位置上的关系;通过对染色质内全部DNA相互作用模式进行捕获,获得高分辨率的染色质三维结构信息。
1.Hi-C技术流程
Hi-C,Hi-C的基本流程是首先将染色质,用交联HindIII限制性核酸内切酶将DNA片段切开,形成粘性末端,将带有dCTP-biotion补齐粘性末端,用T4连接酶连接,纯化链接产物,用链霉亲和磁珠捕获带有biotion的DNA互作片段,测序比对DNA互作区域。
如何看懂Hi-C结果
如图所示,Hi-C主要有两种表现形式,一种是原始的方形图,一种是比较直观的三角图,其实,这两种图实际上是同一张图,先看方形图,横纵坐标都代表同一条染色体,对角线上的点像横纵坐标的投影,因此,对角线也表示染色体。内部马赛克点分别向横纵坐标及对角线延伸,延伸得到的焦点,为互作基因在染色体上的位置。马赛克点的颜色越深,代表基因互作强度越大。
Hi-C得出的数据是非常强大的。Hi-C的最小分辨率为5kb,在这个分辨率下,我们可以清楚的观察到基因的成环结构。这其中包括基因环,转录环,结构环以及增强子-启动子环。
当Hi-C分辨率到达10kb时,我们会发现多个相关连loop组成的拓扑相关结构域(TADs)。且TADs边界上一般都会有CTCF的富集。
当分辨率到达50kb时,我们可以看到由相关TADs组成的染色质区域。
当我们继续增大分辨率,我们将看到全部染色体的互作情况。
Hi-C数据强大我们已经看到,但想精确地模拟3D基因组的结构,还需要与ChIP-seq、RNA-seq、DNase-seq、FAIRE-seq等联合分析,才能精确构建3D模型。
三、3D模型验证技术
基因组模型构建完成后,我们需要对模型进行验证。主要从两个方面对模型进行验证,一个是模型结构进行验证,一个是对模型功能进行验证。对模型结构验证,我们也是从两个方面进行验证,一个利用DNA FISH对模型的空间定位进行研究,一个是利用3C对模型的空间结构进行验证。对模型的功能验证,我们主要利用CRISPR技术去除模型结构,观察对应基因及细胞代谢的变化。
1.DNA FISH-模型空间定位验证
DNA FISH的基本流程与RNA及蛋白FISH相似,但DNA FISH探针要求更加严格,且细胞内的DNA及探针均需要变性。DNA FISH是观察细胞核中DNA分步,这需要更高放大倍数的共聚焦显微镜。
如下图所示,在母本染色体中,三个基因是分开的,在父本染色体中,3个基因经过环形折叠在一起。
2. 3C-模型空间结构验证
3C的基本流程如下图所示。染色质先进行交联,交联后酶切,连接,再进行QPCR检测。3C技术主要捕获的是两基因间的互作,因此这种技术常用来验证基因间的互作。
下图所描述的是基因promoter区与增强子区的互作验证,我们可以看到FIP1L1与914kb处的增强子有互作。
3.CRISPR-模型功能验证
我们利用CRISPR 技术敲掉CTCF motif,使CTCF无法结合,基因组的3D结构模型被破坏,相应基因的表达受到影响,细胞功能也可能会受到影响。CRISPR的功能是强大的,您可以根据您的需要敲除增强子,沉默子,绝缘子,甚至基因。