对 Signac-TF Footprint Plot 的理解与解释

生物背景:

snATAC-SEQ 数据由Tn5 转座酶 切割产生的DNA片段组成(fragments file)。这种酶倾向于在染色质的开放(可访问)的区域进行切割,这些区域的DNA不被组蛋白等蛋白质捆绑或结合。当转录因子(transcription factor,TF)与一段 DNA 区域结合时,该区域对 Tn5 的可及性会降低,因为 TF 会物理性地占据结合位点,从而阻挡 Tn5 的切割。

计算原理:

用于 snATAC-seq 数据分析的 Signac 包中提供了 Footprint() 函数用于对感兴趣的 motif 进行 转录因子(TF)footprint 分析,尤其是那些在特定比较中 富集于差异可及性峰(differentially accessible peaks) 的 motif。

SignacTF足迹分析 结果非常具有价值,因为它能够让我们在不进行多次 ChIP-seq 实验的情况下,基于概率估计多种转录因子的活性。在这种情况下,ChIP-seq 可以作为后续验证手段,用来确认足迹分析所提示的、可能在特定样本或条件下处于活跃状态的转录因子的真实活性。

TF足迹图解读:
通过 SignacPlotFootprint() 函数,可以绘制 结合在富集 motif 上 的转录因子的 Footprint 图。

pacman::p_load(Seurat,Signac,dplyr,ggplot2)
sigObj <- qs::qread("xxx.qs")
DefaultAssay(sigObj) <- "peaks"
Idents(sigObj) <- "<select the conditions being compared.>"
### 假设以下一些 motif 显示出在选定的 DaPeaks 上显著富集
motifs_logo <- c(
    "NR1D2_1246#NR/19|nuclearreceptor|48|0",
    'CREM_188#CREB/ATF/1|bZIP|49|0',
    'CREM_190#CREB/ATF/1|bZIP|49|0',
    ...
)
sigObj <- Footprint(object = sigObj,motif.name = motifs_logo, in.peaks = TRUE,genome = BSgenome.Mfascicularis.NCBI.5.0)
### 绘制 Footprint 图
p <- PlotFootprint(sigObj, features = motifs_logo) + patchwork::plot_layout(ncol = 1)


以该 Footprint图 为例:横轴表示相对于转录因子结合的 motif 的位置。位置 0 表示 TF 的精确结合位点,而左右的数值表示与结合位点的距离,分别向两侧延伸至 200 个碱基。纵轴上有两个使用相同横轴的子图:

  • 上方子图:表示围绕所研究 motif 的 Tn5 切割频率富集情况,该富集程度反映了 DNA 的可及性。

    • 在上方的子图中,我们可以看到,随着位置逐渐接近转录因子(TF)的结合位点,切割频率逐渐升高,并在靠近该位点时达到峰值。到了位置 0(即 TF 与 DNA 结合的确切位置)时,切割频率会急剧下降。 这种形状像一个倒置的 “V”——两侧是峰,中间是谷。它的含义是:转录因子在结合位点上会物理性地屏蔽 DNA(形成谷),而在结合位点周围,由于 染色质重塑作用(转录因子结合不仅是简单地“站在”DNA 上,它还会招募染色质重塑复合物(chromatin remodeling complexes,例如 SWI/SNF、ISWI 等,这些复合物会移走或滑动核小体,调整核小体间距,增加 DNA 可及性),使得 TF 周围的 DNA立即变得 更开放、更裸露,所以 Tn5 在这些区域切割的概率就上升,于是在 footprint 的两侧出现了比背景更高的切割频率(形成两侧的峰)
  • 下方子图:表示预期或理论上的 Tn5 切割分布(背景),显示在没有转录因子作用时预期的切割水平。

    • 底部的图显示的是 在假设该区域没有转录因子(TF)结合干扰切割的情况下,Tn5 酶在该区域的预期切割水平。 “背景信号” 曲线—— 它反映了如果 TF 不存在,单纯从 DNA 序列、核小体布局或其他物理特性推测出来的切割分布。用它可以帮助 校正上图实际观测到的切割频率图,去掉可能由序列偏好、技术噪音等带来的偏差,从而更准确地凸显 TF 结合信号的真实性。
    • 在 TF footprint 分析中,这个“背景”是很关键的,因为 Tn5 本身对某些 DNA 序列有切割偏好,而且染色质结构本身也会造成切割差异,如果不扣掉背景,就可能把随机效果或技术伪影形成的足迹当成是由于TF的存在。

如下图所示为没有活跃TF时 Footprint 的情况

  • 观测数据中表现出平坦或均匀分布,类似于背景,说明该区域没有明显被 TF 结合影响;
  • 观测数据与背景相比,结合位点的侧面没有明显的富集峰;
  • 在实验数据的切割频率图中没有形成中央谷(central valley),切割率没有明显下降;

TF 足迹图的多组比较

在评估 TF footprint 图时,非常重要的一点是 将 Tn5 的切割模式在不同样本或条件之间进行比较。通过这样的比较,才可以揭示转录因子在不同样本或条件下活性的潜在差异,从而了解哪些 TF 在特定状态下可能更活跃或被调控。

例如通过观察下图,我们可以做出一些判断,转录因子(TF)ZNF384 在两组间(01 和 02) 显示出了差异的 Footprint 活性特征:

ZNF384 FootPrint Plot 的观测数据与背景进行比较,我们可以进行如下 组间 Footprint 模式解读:

  • 组 01(红线):在结合位点附近(结合位点左侧)出现明显的峰,这种趋势与背景不同,尤其在倒置 “V” 区域附近,显示出潜在的足迹特征。这表明转录因子 ZNF384 在该组可能具有活性。

  • 组 02(蓝线):切割分布更接近背景,没有在结合位点附近出现明显峰值,分布平坦且均匀。这表明 ZNF384 在该组可能不活跃,或者活性较低,因为切割模式没有显示出结合位点周围的显著富集或中心保护。

\therefore ZNF384 很可能在 组 01 活跃,切割模式显示出 footprint,结合位点周围有富集峰,且结合中心收到了切割保护。 而在 组 02 活性较低,切割模式平坦且与背景相似,没有明显的 footprint 特征。


Reference

https://www.science.org/doi/10.1126/science.aav1898
https://github.com/stuart-lab/signac/discussions/968
https://bioinformaticamente.com/2024/11/14/how-to-interpret-the-tf-footprint-plot/

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
禁止转载,如需转载请通过简信或评论联系作者。

推荐阅读更多精彩内容