本篇简单介绍3D基因组在近期主流的两个获得数据的手段:Hi-C及ATAC-seq。
首先需要理清几个概念:
1. 染色体疆域(Territory):指每条染色体都占据着一个独特的区域,同一染色体上的交互频率高于不同染色体之间的交互频率,且交换频率与基因座之间的线性距离近似服从幂次定律(Power Law)。
2. 拓扑相关结构域(Topologically Associating Domains, TAD):是由遗传编码的边界元件定义,构成染色体。其边界富集 CTCF的结构域、大量的持家基因、tRNAs、SINE 反转录转座子等 DNA 元件。
3. CTCF(CCCTC binding factor):绝缘子结合蛋白,能够基因编码的转录因子,与靶顺式元件的结合可阻断增强子和启动子的相互作用,从而将增强子的活性限制在一定的功能区域。
4. Chromatin Looping:染色质成环,调控元件与其靶基因进行通信的主要机制之一,这使得线性距离很远的基因座在空间上密切接近。
5. 基因组隔间(Genome Compartments):根据互作图谱,能够将基因组近似分为A(常染色质-转录活跃区域),B(异染色质-转录非活性区)。
----------------------------------------------------------------------------------------------------------------------------------------------
3D基因组主要依据染色体构象捕获技术(Capturing Chromosome Conformation),用于解释细胞内DNA物理长度与细胞核直径之间及功能复杂性之间的矛盾,大致的实验技术主要包括:
1. 3C (Chromatin Conformation Capture),one-to-one:通过基因座特异性引物PCR检测单个连接产物,大多数3C通常仅能分析几十到几百Kb染色质之间的相互作用。
2. 4C (Circularized Chromatin Conformation Capture),one-to-all:使用反向PCR产生单基因座的全基因组相互作用图,研究已知DNA片段(bait)与全基因组未知DNA片段之间的互作。
3. 5C (Chromatin Conformation Capture Carbon Copy),many-to-many:基于3C的基本原理,结合连接介导的扩增 (ligation-mediated amplification,LMA)来增加3C检测的通量,识别两组大量位点之间并行的数百万个相互作用。
4. Hi-C(High-throughput chromosome conformation capture),all-to-all:用于对整个基因组所有位点间进行无偏差的作用分析的3C衍生技术。
5. ATAC-Seq(Assay for Transposase-Accessible Chromatin with high throughput sequencing)及结合免疫沉淀相关技术包含ChIP-loop(chromatin immunoprecipitation-loop assay)、ChIA-PET(chromatin interaction analysis by paired-end tag sequencing)等。
Hi-C技术能够应用的方面包括辅助基因组组装、 研究基因间空间调控机制/构建基因组三维结构模型 、构建基因组单体型图谱。而ATAC-Seq能够探究染色质的开放性、开放区域定位、TF footprint、核小体定位、调控元件定位。两者都是通过特定的手段获得互作片段,通过二代测序获得高通量数据。Hi-C着重于互作矩阵的分析及图谱构建,而ATAC-Seq着重于对开放片段的分布及功能分析。
最后,点击链接有惊喜 #3D基因组 #表观遗传