DNA甲基化

DNA的甲基化是在DNA的序列不变的条件下，在其中某些碱基上加上甲基的这样一个过程。DNA甲基化的结果，一般是使甲基化位点的下游的基因表达量变少。
DNA甲基转移酶家族（Dnmts）催化甲基从S-腺嘌呤甲硫氨酸（SAM）转移至胞嘧啶残基的第五个碳，形成5-甲基胞嘧啶（5mC）。
（a）Dnmt3a和Dnmt3b是从头 Dnmts并将甲基（红色）转移到裸DNA上。
（b）Dnmt1是维持Dnmt并在复制期间维持DNA甲基化模式。当DNA经历半保守复制时，亲本DNA支架保留原始DNA甲基化模式（灰色）。Dnmt1与复制灶相关联，并通过在新形成的子链（蓝色）上添加甲基（红色）来精确复制原始DNA甲基化模式。

DNA甲基化与组蛋白修饰和microRNA（miRNA）一起调节转录。在真核生物中，DNA与组蛋白结合，有助于将长链DNA包装到小核区。将包括甲基化，乙酰化，遍在蛋白化和磷酸化的化学修饰添加到N-末端组蛋白尾部的三个特定氨基酸上。这些修饰不仅影响DNA链的包装方式，还影响其转录活性。松散DNA与组蛋白结合的组蛋白修饰通常为转录提供了允许的环境，而紧密包装DNA和组蛋白的组蛋白修饰抑制了基因表达。Dnmts直接与调节通常参与基因抑制的组蛋白修饰的酶相互作用。已知Dnmt1和Dnmt3a都与组蛋白甲基转移酶SUV39H1结合，后者通过H3K9上的甲基化来限制基因表达。此外，Dnmt1和Dnmt3b都可以结合组蛋白脱乙酰酶，去除组蛋白的乙酰化，使DNA包装更紧密，限制转录的进入。通常，Dnmts与组蛋白修饰酶配合，所述组蛋白修饰酶参与添加和/或剥离组蛋白标记，以便在基因区域上施加抑制状态。

用亚硫酸氢盐来处理DNA。DNA当中，没有甲基化或羟甲基化的C碱基，就会被转化成U碱基。
在弱酸性条件下，亚硫酸氢根会结合到没有甲基化的C碱基的6位。而甲基化了的C碱基不会和亚硫酸氢根发生这个反应的。然后用碱来处理。结合了亚硫酸氢根的非甲基化的C，就被脱氨基，并且脱亚硫酸根。然后，就被转化成U碱基。甲基化或者羟甲基化的C碱基还保持了是“C”。
用亚硫酸氢盐来处理DNA，可以让99%左右的非甲基化的C碱基变成U。也就是说这种方法的的转化效率非常高，转化效率达到了99%。
经过亚硫酸氢盐转化过的DNA，再经过PCR，PCR新合成出来的链，U碱基的位置，就会被替换成了“T”。那么在接下来的测序过程中，测到的也是T碱基。而甲基化的C，因为没有被亚硫酸氢盐所转化，所以，在接下来的测序过程中，被测到的，还是“C”碱基。

甲基化的建库过程。
第一种，Illumina公司的Truseq DNA建库方法。
因为Illumina Truseq DNA建库试剂盒当中，它所提供的接头上的C碱基都是已经经过甲基化修饰了。所以，用这些接头做出来的文库，在用亚硫酸氢盐做转化的过程当中，它的（接头上的）C还是保持是C ，不会被转成U。带了这些接头的文库分子，就可以和测序芯片上的草皮DNA发生互补杂交。并且进一步发生桥式PCR反应。生成测序用的DNA的簇（Cluster）。但是，这个方法有一个缺点，就是在用亚硫酸氢盐处理DNA文库的时侯，90%以上的DNA链会断掉。这样，已经建好的文库，其中90%分子会被破坏掉。也就是说文库的丰富度就会损失90%以上。它的好处就是，在这个建库过程当中用的PCR循环数较少。所以它PCR扩增效率不同，所引起的文库不均一程度也就较低。也就是我们通常所说的PCR bias较少。
第二种，EpiCentre公司开发的EpiGnome方法。
第1步，亚硫酸氢盐先处理DNA，把未甲基化的C都转变成U。
第2步，把带标签1的随机引物加入，进行第一次的复制。得到第1条的复制链。
第3步，消化掉过量的引物。
第4步，加入带末端终止碱基、并带标签2的随机引物。这个引物的作用是让第1复制链延伸，并且加上标签2。
第5步，加入建库的PCR引物，进行PCR。通过PCR，把Index序列和成簇引物序列加入到链的两侧。得到真正的文库。
这个方法的优点是，把亚硫酸氢盐处理的过程，放在了建库之前。这样建成的库的丰富程度会比较高。但缺点就是要做较多的PCR循环，那么有了比较多的PCR循环之后，PCR产物的扩增均一性是不太好的。也就是说PCR bias会比较大。

因为甲基化文库中经过亚硫酸氢盐处理，绝大多数的C都变成了T。所以，这个文库中是严重地缺少C碱基的，也就是四种碱基的比例是严重不平衡的。这样在用HiSeq 2000或2500测序仪来测甲基化文库的过程当中，文库测序得到的数据质理就较差。并且经过PF过滤得到的有效的数据产量也会较低。为了弥补甲基化文库的碱基不平衡性，一般情况下，在上机过程当中，是掺入大比例的基因组文库，或者PhiX文库，来补充比较多的C碱基，一般会掺30%的PhiX文库、或者基因组文库。在掺入30%的PhiX文库的条件下，一条HiSeq 2000 V3 PE100的Lane，大概可以得到20G 左右的甲基化文库数据。也就是说，在HiSeq 2000或者2500平台上，甲基化文库的测序数据产量，一直都不是很高。质量也比较低。

来源：thinkando

DNA甲基化

DNA甲基化

相关阅读更多精彩内容

友情链接更多精彩内容