Despite an ever-growing body of work published on DNA methylation each year, it remains difficult to pinpoint the precise function of most DNA methylation found across the genome[1].
DNA甲基化于1925年在细菌(Mycobacterium tuberculosis)中被发现(也有文献说是在1948年calf thymus中发现),尽管经过几十年的研究,被揭示的生物学过程和调控仍是冰山一角。虽然认识不足,我们还是忍不住要对其进行灵魂三问:它是谁?从哪来?到哪去?
一、什么是DNA甲基化?
DNA甲基化是指通过酶促反应将CH3基团添加到碱基上的一种DNA修饰(其类型有5-mC, 5-hmC, N6-mA[主要存在于细菌中], 7-mG等),这种修饰非常稳定,不会改变DNA的碱基顺序,但对基因具有调控作用。其酶促反应如下:
但并不是所有的C都能进行甲基化的修饰,一般发生最多的是在和G相连的C上,即CpG中的C上。There are 56 million CG sites in the human genome, about 60–80% of which are methylated, which corresponds to 4–6 % of all cytosines[2]。CpG主要分布在基因的启动子区,人们形象地将其称为CpG island (The CG islands are defined as regions of at least 550 bps in length, with the ratio of observed CG/expected CG > 0.65 (in the bulk of the genome it is around 0.1–0.2[2]),50%以上的基因启动子区存在CpG island。导致这种分布不均匀的推测是5-mC的突变特性导致的(5-mC的水解脱氨作用会导致TG错配的出现,而且TG错配的修复效率远低于UG错配)。
二、DNA甲基化如何发生?
从上图中可知DNA甲基化主要是通过DNMTs(DNA methyltransferases)来进行反应的。负责DNA甲基化的DNMTs主要有三种:DNMT1、DNMT3a和DNMT3b。DNMT1主要负责对半甲基化的DNA(hemimethylated DNA)进行甲基化和维持DNA的甲基化状态。DNMT3a和DNMT3b则是负责DNA的从头(de novo)甲基化,而且也参与甲基化的维持。DNMT3a有两个亚型,DNMT3b则有超过30个亚型[3]。DNMTs的结构域如下所示:
I至X motif主要负责结合SAM并定位胞嘧啶,ADD和PWWP motif主要负责与DNA结合同时引导酶入核。DNMT3L无催化活性,但可作为DNMT3a和DNMT3b共结合因子增加其催化活性,具体结构域的功能可参考[2]。DNMT3a与DNA结合后的结构如下:
三、DNA甲基化的调控与维持
DNA甲基化的初始模式在胚胎发育的早期阶段就已经形成。受精后,合子(受精卵)会经历一次密集的重编程过程,以在早期胚胎中建立全能性。在这个阶段,基因组广泛的去甲基化,但带有印记的基因和某些转座元件除外。在胚胎植入时期,由DNMT3重新建立甲基化模式。在原始生殖细胞的生殖系发育过程中,会经历第二波新的甲基化,这对配子中基因组印记的建立至关重要。因此,去甲基化和甲基化的循环过程在哺乳动物中形成了一个表观遗传周期,并导致形成了一个独特的DNA甲基化模式,这是哺乳动物基因组的一个标志性特征[2]。
目前认为DNMT3对DNA序列的偏好性导致了基因组上CpG甲基化的特征(转座子高甲基化、高表达基因启动子高甲基化、性别特异性甲基化印记等)。几个可能的机制如下图所示:
1、DNA甲基转移酶可能通过与额外的域相互作用,被选择性地吸引到带有特定组蛋白修饰的基因组区域。
2、DNA甲基转移酶可能通过其他以序列特异性方式结合到DNA的蛋白质被招募。
3、通过那些与染色质标记特异性相互作用的蛋白质被招募。
哺乳动物DNA甲基化动态过程如下:
DNA甲基化可通过DNA的复制进行维持,同时也能主动或被动的去甲基化。其可能的机制如下:
1、Dnmt1(DNA甲基转移酶1)具有对半甲基化胞嘧啶-鸟嘌呤(CG)位点进行甲基化的内在偏好。这意味着Dnmt1更倾向于对已经有一个甲基化胞嘧啶的CG位点的另一个胞嘧啶进行甲基化,从而维持了甲基化模式。
2、Dnmt1通过与增殖细胞核抗原(PCNA)的相互作用,在新合成的DNA上富集。PCNA是DNA复制机器的一部分,这种相互作用有助于Dnmt1在复制的DNA上定位,以维持甲基化模式。
3、Dnmt1被UHRF1(具有PHD和环指结构域的泛素样蛋白1)定向到半甲基化DNA。UHRF1能够识别半甲基化的DNA位点,并将Dnmt1招募到这些位点进行甲基化,这对于保持基因组的甲基化模式至关重要。
4、Dnmt3酶家族与高度甲基化的染色质结合。Dnmt3酶不仅在建立新的甲基化模式中起作用,而且还参与在复制过程中对已经高度甲基化的染色质区域进行维护甲基化。
四、DNA的去甲基化
DNA的去甲基化主要通过两种途径进行,如下图所示[5]:
1、AM-AR途径(the process of active modification–active removal):5mC在TET( ten-eleven translocation (TET) family enzymes )酶的作用下被氧化为5hmC、5fC和5caC,然后在TDG(thymine DNA glycosylase)和BER(base excision repair)作用下转变为胞嘧啶;
2、AM-PD途径(the process of active modification-passive dilution):5hmC、5fC和5caC等中间产物在DNA复制时被稀释,然后最终被替换为胞嘧啶。
TET蛋白是铁离子和α-KG依赖的双加氧酶,其去甲基化包括三个层面:
1、 Physical Processivity(物理进程性):指的是TET蛋白沿DNA从一个CpG位点滑动到另一个CpG位点的能力。但体外研究表明TET并不表现出物理进程性。
2、Chemical Processivity(化学进程性):指的是TET蛋白在不释放底物的情况下,连续催化5mC逐步氧化至5caC的能力。关于TET的化学进程性,两项体外研究得出了相互矛盾的结论,一种解释是TET的反应可能根据反应条件以化学进程性或非化学进程性的方式进行。
3、Genetic Processivity(遗传进程性):指的是TET介导的氧化在基因组中的遗传结果,这由多种因素决定,包括酶的内在属性、其他因素的调节以及局部染色质环境。在小鼠胚胎干细胞(ESCs)中,许多基因组区域或CpG位点被5hmC修饰而不是5fC或5caC,而其他区域则相反,表明5mC在不同基因组区域或CpG位点被处理成不同的状态。
最后用下面这张图总结一下DNA甲基化对基因表达的调控:
更多精彩内容,请见:DNA甲基化博览
- Alexandra L. et al. DNA methylation: a historical perspective. Trends in Genetics 38, (2022).
- Renata Z. et al. Structure and Function of Mammalian DNA Methyltransferases. Chembiochem, (2011).
- Duymich C.E. et al., G. DNMT3B isoforms without catalytic activity stimulate gene body methylation as accessory proteins in somatic cells. Nat. Commun. 2016.
- Susan C. Wu and Yi Zhang. Active DNA demethylation: many roads lead to Rome. Nat Rev Mol Cell Biol 11, (2010)
- Xiaoji Wu and Yi Zhang. TET-mediated active DNA demethylation: mechanism, function and beyond. Nature Reviews Genetics. 2017