DNA甲基化的前世今生
DNA甲基化作为一种可遗传的表观遗传修饰,在生物个体的生长发育与繁殖过程中,维持遗传物质的稳定性是至关重要的。在真核生物基因组中,编码基因仅仅占一小部分,例如在人类基因组中编码基因还不到2%,那么在大量非编码DNA存在的情况下,实现精确控制基因的表达,降低周围的转录噪音对生物体至关重要,而DNA甲基化则为非编码DNA的长期沉默提供了一种有效的抑制机制。近年来的大量研究表明,DNA异常甲基化与肿瘤的发生、发展、细胞癌变有着密切的联系。DNA甲基化在肿瘤中的作用主要表现在以下几个方面:一是甲基化的CpG岛二核苷酸中的胞嘧啶以较高的频率脱氨基变成胸腺嘧啶,造成基因突变;二是抑癌基因和DNA修复基因由于超甲基化而沉默;三是癌基因甲基化水平降低而活化;四是基因组总体甲基化水平降低使转座子、重复序列活化导致染色体稳定性下降。这些因素是导致肿瘤发展、转移、恶化最终导致患者死亡的重要原因。DNA总体甲基化水平和特定基因甲基化程度改变可作为肿瘤诊断指标。正是由于DNA甲基化在维持正常细胞的功能、基因组结构稳定、遗传印记、胚胎发育、及肿瘤和疾病的发生、发展等方面发挥重要作的作用,所以在科研中受到越来越多的重视。
在基因组所有甲基化的碱基中占比最多的是5-甲基胞嘧啶(5mC),在哺乳动物中占比为98%左右,由DNA甲基转移酶家族(Dnmts)催化甲基从S-腺嘌呤甲硫氨酸(SAM)转移至胞嘧啶残基的第五个碳而形成。与此同时,5mC可以在氧化蛋白TET的作用下转化为5-羟甲基胞嘧啶(5-hmC),进一步在TET的氧化下转化为5-甲酰基胞嘧啶(5-fC),最终在TET的氧化下转化为5-羧基胞嘧啶(5-caC)。在基因组中含有很多CpG结构,60%~ 90% 的CpG 都被甲基化,未甲基化的CpG 成簇地组成CpG 岛,位于结构基因启动子的核心序列和转录起始点。关于甲基化的维持只要受DNMT1和UHRF1两个蛋白控制,用于在DNA复制时让新生成的链维持原有的甲基化模式。目前,在植物中,主要存在两种去甲基化方式,一是被动去甲基化,即DNA复制时新生成的链丢失甲基化;二是主动去甲基化,在DNA糖基化酶(DME)和ROS1的作用下,通过碱基错配修复途径(BER)去除甲基化。在哺乳动物中,被动去甲基化与植物相同,而DNA修复酶-胸腺嘧啶DNA糖基化酶(TDG)在DNA主动去甲基化上扮演了重要角色,关于主动去甲基化的过程还需进一步的研究。
目前,关于DNA甲基化的测序方法分为两大类,一类是以蛋白质特异性结合为基础的富集方法,该类方法类似ChIP-seq,可以将甲基化区域富集下来,然后测序分析甲基化情况,该类方法有一个很明显的缺点就是不是单碱基分辨率水平,因为富集到只是区间没法确定具体是哪一个位置发生了甲基化。如果只是想知道某些区域是否发生甲基化,得到一个定性的结论,那么用该类方法就很方便;二是以C碱基转化为T碱基为基础的测序方法,随着技术的发展,该类方法又可以分为两种技术,一种是将未甲基化的C碱基转化为T,另一种是将甲基化的C碱基转化为T。目前市场上还是以未甲基化的C碱基做转化的方法为主流,这其中以重亚硫酸盐处理的方法被大家认为是甲基化测序的“金标准”。该类方法有一个很明显的特点就是甲基化的分辨率可以达到单碱基的水平,再结合NGS的高通量特点,让科研人员很容易就能得到全基因组上的甲基化图谱。虽然优势很明显,但其也存在一些缺陷,体现在以下几个方面:1、对DNA的破坏,亚硫酸盐处理的反应条件比较剧烈,高温高酸的条件下会使很多DNA序列发生降解,使得DNA序列的多样性下降。为了达到很好的建库效果就需要高质量高有浓度的DNA样本;2、亚硫酸盐处理方法依赖未碱基化的C碱基转化为T碱基,而基因组范围内95%左右都是为甲基化的C,转化后导致文库碱基严重失衡,对测序结果造成影响,故这类文库上机测序时需要参入一定比例的Phix文库。同时,如果C->T的转化效率低,由于其基数很大也会造成很高的假阳性。随着技术的发展,一些将甲基化的C转碱基化为T的方法崭露头角脚,这些技术的天然优势就是甲基化的C碱基本身占比就很少,而且反应条件比较温和,基本不会引起DNA降解保持很好的序列多样性和复杂度,通过测定C->T转化有一种“所见即所得的感觉”,可以降低假阳性的产生。Bisulfite-free技术也在发展。虽然这些技术还不很成熟,但其优势却很明显,未来技术成有所突破一定会让其成为主流。
写在最后
通过对DNA甲基化方面的知识做一个梳理,自己从中有所收获。个人觉得了解一个方面的知识,最好的方法可能是找一些好的综述来阅读。关于DNA甲基化,下面给出了一篇不错的综述,虽然文章发表于2014年,距离现在已经过去有些年限,但对于不了解的人来说里面的内容还是属于比较经典的,值得一看。今天就分享到这了~~~
Wu H , Zhang Y . Reversing DNA methylation: mechanisms, genomics, and biological functions.[J]. Cell, 2014, 156(1-2):45-68.