DNA甲基化是一种重要的表观遗传修饰,对调控基因组功能有多种作用。其水平在整个基因组中具有空间相关性,通常在被抑制区域较高,在转录因子(TF)结合位点(TFBS)和活性调控区域较低。然而建立全基因组和TF结合位点甲基化模式的机制仍不清楚。
2024年6月6日,欧洲分子生物学实验室EMBL(European Molecular Biology Laboratory)Maša Roller团队设计了一项比较表观基因组学研究以研究转录因子结合区域内的DNA甲基化(DNAm)模式。从五种哺乳动物(人类、猕猴、小鼠、大鼠和狗)的肝脏生成全基因组重亚硫酸盐测序(WGBS)数据,并检索匹配组织中五种转录因子的公开可用ChIP测序数据。其中四种(CEBPA、HNF4A、ONECUT1和FOXA1)是肝脏特异性调控网络的关键组分,而CTCF是一种广泛存在的多功能蛋白。作者利用这些数据集来表征转录因子结合区域(TFBRs)的DNA甲基化,揭示不同功能基因组元件中的差异DNAm模式,并表明DNA甲基化和转录因子结合共进化。相关研究成果以“DNA methylation patterns of transcription factor binding regions characterize their functional and evolutionary contexts”为题发表在《Genome Biology》期刊。
标题:DNA methylation patterns of transcription factor binding regions characterize their functional and evolutionary contexts(转录因子结合区域DNA甲基化模式表征了其功能和进化背景)
时间:2024-6-6
期刊:Genome Biology
影响因子:IF 12.3 / Q1
技术平台:ChIP-seq、WGBS等
研究摘要:
本研究采用比较方法来探究DNA甲基化与哺乳动物中转录因子(TF)结合位点进化之间的联系。具体来说,通过实验对DNA甲基化进行分析,并将其与已发表的五种不同转录因子(CTCF、CEBPA、HNF4A、ONECUT1、FOXA1)在五种哺乳动物(人类、猕猴、小鼠、大鼠、狗)肝脏中的占据情况相结合。
转录因子结合位点通常甲基化水平较低,但也通常具有中等甲基化水平。即使在核心结合motif中没有CpG位点,结合位点的甲基化水平也会受到其更广泛结合区域内CpG位点的影响。
通过采用分类和聚类方法,研究人员提取了在转录因子结合区域具有物种保守性的不同DNA甲基化水平模式。CEBPA、HNF4A、ONECUT1和FOXA1具有相同的甲基化模式,而CTCF的模式则具有差异。这些模式表征了转录因子结合区域的不同功能和染色质景观。
利用系统发育框架分析,揭示了转录因子占据的进化丧失中出现了DNA甲基化增加,表明了协调进化的存在。此外,每种甲基化模式都有其自身的进化轨迹,表征了其基因组背景。
总之,本研究通过表观基因组分析表明,DNA甲基化在物种间的转录因子结合变化中发挥作用,特定的DNA甲基化谱可以表征转录因子结合,并与其调控活性、染色质背景和进化轨迹相关联。
研究方法:
结果图形:
(1)通过WGBS实验和ChIP-seq数据分析转录因子结合区域的DNA甲基化
图1:比对哺乳动物中的甲基化组。
A. 示例区域:从五种哺乳动物分离的肝脏中SMG6位点周围的体内5mC甲基化和转录因子结合。上面显示通过亚硫酸盐测序检测的CpG甲基化水平,下面显示通过ChIP-seq检测的五种转录因子结合轨迹(CEBPA、CTCF、FOXA1、HNF4A、ONECUT1)。
B. 每个物种中WGBS数据的基因组覆盖率。y轴显示百分比,点半径表示正链和负链覆盖的CpG总数
C. 每个物种的全基因组CpG甲基化密度分布。所有分布都是双峰的,绝大多数CpG位点呈现高甲基化状态。
(2)转录因子可以结合所有甲基化水平的DNA
图2:转录因子结合区域(TFBRs)的甲基化谱。
A. 每个转录因子和物种中至少含有一个CpG的TFBRs和转录因子结合位点(TFBSs)的百分比及其结合motif。大多数TFBRs包含CpG位点,但在转录因子结合位点很少见。为每个转录因子显示了基于人类样本计算的位点权重矩阵(PWMs)。
B. 转录因子结合区域(TFBRs)和转录因子结合位点(TFBSs)的定义。TFBRs是ChIP-seq峰,已在物种和转录因子内按长度归一化。TFBSs覆盖ChIP-seq峰最顶端最近的结合motif。
C. TFBRs的平均甲基化水平。在所有物种和转录因子中的分布是双峰分布。所有转录因子都具有低甲基化模式,而CTCF具有较高的高甲基化模式,其余转录因子具有较低模式。
D. TFBRs和TFBSs的CpG甲基化密度分布。除了CTCF在所有物种中单峰分布外,所有分布都是双峰分布。高甲基化区域的阈值用灰色虚线标记(即平均甲基化60%)。
E. 高甲基化TFBR中甲基化水平与转座子元件和非重复相关元件重叠。当TFBRs与转座元件重叠时其有较高5mC水平。
F. 选定的转座元件组中高甲基化TFBRs相对于对照低甲基化TFBRs的相对正富集。
(3)转录因子结合多种共有的DNA甲基化谱
图3:转录因子结合区域的差异甲基化。
A. 大鼠转录因子结合区域的平均5mC和CpG频率分布图,以ChIP-seq peaks峰值为中心,向两侧各扩展600 bp。每个图谱中分类的区域数量如图B所示。
B. 大鼠CEBPA、小鼠FOXA1和猕猴CTCF结合区域的5mC分布图,以ChIP-seq peaks峰值为中心,归一化为1200 bp长度。这些区域有四种类型的甲基化图谱:“flat”(平坦)以深绿色表示,“left”(左)和“right”(右)分别以紫色和橙色表示(文中均称为“specular”即镜像),“high”(高)以浅绿色表示,“mid”(中等),这是CTCF特有的,以粉红色表示。
C. 与B图中定义的每个聚类甲基化谱相关的转录因子结合区域的注释。右侧条形图显示每个甲基化谱中的转录因子结合事件的百分比,这些事件位于基因组的未甲基化区域(UMRs)、低甲基化区域(LMRs)或完全甲基化区域(FMR)(分别以黄色、橙色和红色表示)。左侧是每个5mC图谱中的转录因子结合事件被注释为活性启动子、活性增强子或准备增强子的百分比。条形颜色根据TFBRs甲基化图谱分配而定,并通过调节元素注释进行着色——活性启动子最浅,活性增强子较深,准备增强子最深。星号表示注释类别显著富集(经Bonferroni校正的z检验,*p值<0.05)。
D. 每个转录因子结合区域与最近转录起始位点距离累积分布,按B图中定义的甲基化图谱分组。x轴以log10比例尺表示。
(4)DNA甲基化水平与转录因子结合的多样性相关联
图4:哺乳动物中甲基化与转录因子(TF)结合的共进化。
A. 使用系统发育简约性方法示意图,以定义物种保守性类别和具有结合保守性的物种数量。简单来说,首先跨物种对齐并比较转录因子结合事件,然后使用简约性原则来划分特定于谱系和特定于类群的结合丢失,以及特定于谱系和特定于类群的结合获得。在物种中实验确定有结合的区域被称为同源结合的,没有结合的称为未结合的。高保守结合事件被定义为在所有物种中都有结合。下图展示了由共有转录因子结合事件的物种总数定义的相应物种保守性程度示例。
B. 同源结合区域、同源未结合区域和基因组背景(BG)的平均5mC水平分布。
C. 狗CEBPA和猕猴CTCF同源结合和同源未结合区域,根据A图中定义的物种保守性类别划分的平均5mC分布(Jonckheere-Terpstra趋势检验,p值<2.2e106)。
D. 简约性方法将狗和大鼠的转录因子结合区域(TFBRs)的同源结合和同源未结合区域进一步划分为进化结合丢失和获得事件。
E. 物种保守性与5mC图谱之间的关系。气泡图显示了狗CEBPA和猕猴CTCF转录因子结合事件的5mC图谱和转录因子结合保守性类别之间关联分析(独立性的卡方检验)的标准残差。正值表示物种保守性程度与甲基化谱之间存在正相关,而负值表示负相关。例如,狗的CEBPA结合事件,具有平坦特征的与较高水平的物种保守性正相关,而与谱系特异性结合事件负相关。气泡的大小与对总卡方得分的贡献百分比成比例,因此突出了物种保守性与甲基化谱组合对整体统计数据影响最大的组合。
参考文献:
RimoldiM, Wang N, Zhang J, Villar D, Odom DT, Taipale J, Flicek P, Roller M. DNAmethylation patterns of transcription factor binding regions characterize theirfunctional and evolutionary contexts. Genome Biol. 2024 Jun 6;25(1):146. pii:10.1186/s13059-024-03218-6. doi: 10.1186/s13059-024-03218-6. PubMed PMID:38844976.