1.DNA甲基化概念
胞嘧啶cytosine,在SAM(腺苷甲硫氨酸)和DNMTs催化下,变成5mc;脱甲基化需要在TETs催化下变成5-羟甲基胞嘧啶(5hmC),后可以被氧化成5-甲酰基胞嘧啶(5fC)和5-羧基胞嘧啶(5caC)。
DNMT1维持甲基化,DNMT3A,DNMT3B在生长发育,即最初修饰时发挥作用,DNMT3L。
TET1,TET2,TET3去甲基化,在IDH1/2突变后,2HG增加而抑制其活性。
Reader: 含有MBD,即甲基化结合结构域的蛋白,一般会介导基因沉默。
可能一些代谢的相关基因亦会影响DNA甲基化。
2.DNA甲基化检测的基本原理:
1)限制性内切酶:特异性识别甲基化碱基位点的酶,如MspI, HpaII, NotI, SmaI, and BstUI
2)亲和沉淀:特异性抗体,如用特定的MBD蛋白或5hmC特异性抗体,类似于CHIP-SEQ
3)重亚硫酸氢盐反应:C变U后变T,5mC仍为C;
4)区分5hmC和5mC:先把5hmC氧化后,在进行检测;主要通过工具酶和化学修饰对5hmC保护或添加修饰,随后Bisulfite转化将带修饰的5hmC与C、mC区分,通过识别测序中的C和T达到5hmC检测的目的。
5)质谱:碱基作为一种化学分子,修饰不同,质量不同;
3.DNA甲基化数据分析:不同实验方法形成的数据类型不同,分析流程会有所不同
The three main steps of computational analysis of DNA methylation data are as follow: (1) data processing and quality control;(2) data visualization and statistical analysis; (3) validation and interpretation.
1)DNA甲基化芯片:Illumina 450K DNA甲基化芯片,850K芯片,Agilent 的甲基化芯片,Roche-NimbleGen甲基化芯片等。最常用的前面两种,包含两种类型探针(I型探针和II型探针)。
2)DNA测序后的碱基序列数据,如WGBS全基因组重亚硫酸氢盐甲基化测序,简化甲基化测序,单细胞WGBS等。拿到的数据是碱基序列,需要比对参考基因组进而明确具体甲基化位置,因此这里的参考基因组与比对方法是DNA甲基化特有的。
TCGA里主要用的是DNA甲基化芯片测序,分析流程生信星球的文章,值得参考学习: