1. DNA甲基化
1.1 基本概念
DNA甲基化是表观遗传修饰的主要方式,能在不改变DNA序列的前提下,改变遗传表现。为外遗传编码(epigenetic code)的一部分,是一种外遗传机制。它是由DNA甲基转移酶(DNA methyl-transferase, DNMT)催化S-腺苷甲硫氨酸(S-adenosylmethionine, SAM)作为甲基供体,将DNA的CG两个核苷酸的胞嘧啶被选择性地添加甲基,主要形成5-甲基胞嘧啶(5-mC)(常见于基因的5'-CG-3'序列)和少量的N6-甲基嘌呤(N6-mA)及7-甲基鸟嘌呤(7-mG)结构。基因含有很多CpG 结构,2CpG 和2GPC 中两个胞嘧啶的5位碳原子通常被甲基化,且两个甲基集团在DNA 双链大沟中呈特定三维结构。DNA甲基化可能使基因沉默化,进而使其失去功能。而且,生物体甲基化的方式是稳定的,可遗传的。此外,也有一些生物体内不存在DNA甲基化作用。
DNA甲基化的主要形式:
5-甲基胞嘧啶(5-mC):最重要的一种DNA甲基化修饰,广泛存在于植物、动物等真核生物基因组中, 称誉为“第五碱基”。
5-羟甲基胞嘧啶(5-hmC):哺乳动物的“第六碱基”。
N6-甲基腺嘌呤(N6-mA):在细菌、藻类及动植物基因组中存在。
7-甲基鸟嘌呤(7-mG)
DNA甲基化作为生物标志物的潜力:
相比基因组,DNA甲基化能够反应环境的影响
DNA甲基化不像基因组那么一成不变,也不像转录组和蛋白组那么不稳定。
DNA甲基化处于动态变化中,能够像年轮一样记录环境因素的影响。
DNA甲基化标志物是最有应用前景的表观遗传标志物。
1.2 CpG岛
某些区域CpG序列的密度比平均密度高10~20倍,GC含量大于50%,长度大于200bp的区域,称为CpG岛。正常细胞中,CpG二核苷酸在人类基因组中占10%,包括散CpG和CpG 岛。其中,70-90%的散在CpG呈高甲基化状态,而大部分CpG 岛中的CpG呈低甲基化状态(未甲基化的CpG成簇地组成CpG岛)。CpG岛主要位于结构基因的启子和第一外显子区域(结构基因启动子的核心序列和转录起始点),约有60%以上基因的启动子含有CpG岛。人类基因组序列草图分析结果表明,人类基因组CpG岛约为28890个,大部分染色体每1Mb就有5-15个CpG岛,平均值为每Mb含10.5个CpG岛,CpG岛的数目与基因密度有良好的对应关系。CpG岛通过甲基化与去甲基化,从而调控下游基因的表达。DNA 甲基化可引起基因组中相应区域染色质结构变化,使DNA 失去核酶ö限制性内切酶的切割位点,以及DNA 酶的敏感位点,使染色质高度螺旋化,凝缩成团,失去转录活性。5位C甲基化的胞嘧啶脱氨基生成胸腺嘧啶,由此可能导致基因置换突变,发生碱基错配:T2G,如果在细胞分裂过程中不被纠正,就会诱发遗传病或癌症。
2. DNA甲基化的主要功能
DNA甲基化能引起染色体结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式改变,从而控制基因的表达。
- 保持基因组遗传物质的稳定性 研究证明,细菌DNA复制起始与DNA甲基化及DNA与细菌质膜的相互作用有关,DNA甲基化作为一种标签决定了复制起始点,控制了复制起始,使得DNA复制与细胞分裂保持一致;DNA错配修复是细胞增殖过程中纠正DNA复制错误的重要手段。复制后双链DNA在短期内(数分钟)保持半甲基化状态,错配修复系统从而能够区分旧链与新链,为新链中掺入的错误碱基提供了分子标记。
- 调控基因的表达 DNA甲基化为非编码区(如内含子等)的长期沉默提供了一种有效的抑制机制。基因启动区域内CpG位点的甲基化通过三种方式影响基因转录活性:DNA序列甲基化直接阻碍转录因子的结合;甲基CpG结合蛋白结合到甲基化CpG位点与其他转录抑制因子相互作用;染色质结构的凝集阻碍了转录因子与其调控序列的结合。)
- DNA甲基化与胚胎发育 在胚胎发育的过程中,基因组范围内的DNA甲基化水平会发生剧烈的改变,其中,改变尤为剧烈的是配子形成期与早期胚胎发育阶段。错误甲基化模式的建立可能会引起人类疾病,如脆性X染色体综合征。
- DNA甲基化与肿瘤发生 肿瘤中普遍存在DNA甲基化状态的改变,其特点是总体甲基化水平的降低与局部甲基化水平的升高。在肿瘤细胞中,癌基因处于低甲基化状态而被激活,抑癌基因处于高甲基化状态而被抑制。
3. 甲基化测序
甲基化测序中的核心化学反应,是用亚硫酸氢盐处理DNA。在弱酸性条件下,亚硫酸氢根会结合到没有甲基化的C碱基的6位,而甲基化了的C碱基不会发生这个反应。然后用碱来处理,结合了亚硫酸氢根的非甲基化的C就会被脱氨基,并且脱亚硫酸根并转化成U碱基。甲基化或羟甲基化了的C碱基保持不变。
亚硫酸盐处理可以让99%左右的非甲基化C碱基变成U。
接着通过高通量测序的方法,可以精确地看到单个碱基的甲基化水平。经过亚硫酸氢盐转化过的DNA,经过PCR,PCR新和成的链,U碱基的位置就被替换成了T碱基。在接下来的测序过程中,测到的也是T碱基。而甲基化的C没有被转化,在接下来的测序过程中还是C碱基。这样通过测序即可根据单个 C 位点上未转化为 C 未转化为 T 的 reads 数目与所有覆盖的 reads 数目的比例,计算得到甲基化率。
4. cfDNA甲基化测序
DNA甲基化作为一种重要的表观遗传修饰机制,在细胞生长、分化和疾病发展等过程中发挥关键作用。不同组织和器官有其独特的DNA甲基化特征,当组织或器官受损时,凋亡细胞释放cfDNA入血,而cfDNA会维持原本的组织器官甲基化特征。随着多种器官组织甲基化图谱的公开,可以根据cfDNA甲基化模式结合反卷积算法确定cfDNA的组织来源。cfDNA甲基化分析可能成为组织损伤检测的一种极有前景的无创诊断方法。