最近和很多小伙伴聊到ATAC-seq这个组学技术,正好趁此机会学习分享一下。
染色质结构
要想知道ATAC-seq的作用,首先必须知道染色质的结构,以human为例,有一定molecular biology背景的人都知道,人类的DNA并不是裸露的,长度惊人的DNA链是以一种特殊的结构被“收纳”在细胞中的:DNA缠绕在组蛋白上,形成串珠式的结构。这样的结构还能够进一步折叠、浓聚,并在其他架构蛋白的辅助下,进而形成染色体。
转录调控
新的问题在于,这样的高级结构必然会导致转录的难以进行,那么细胞如何调整来进行正常的转录呢?答案就在于染色质重塑(chromatin remodeling),染色质重塑是通过对染色质结构的动态修饰,从而允许凝聚的基因组 DNA 与调控转录机制的相关蛋白相互作用,从而控制基因表达。[1]基于这样的调控机制,可以将染色质分为两类:常染色质(松散或开放染色质,euchromatin)结构可用于转录;异染色质(紧密或闭合染色质,heterochromatin)结构更紧凑,不易进行转录。
ATAC-seq
基于上面的描述,我们如何对基因组上不同的染色质结构进行研究呢?ATAC-seq给了我们这样的机会,ATAC-seq全称Assay for Transposase-Accessible Chromatin using sequencing,是一种在全基因组范围内评估染色质开放性的组学技术,是表观遗传学研究的重要方法,该项技术于2013年被斯坦福大学William Greenleaf教授团队开发,相关论文发表在Nature Methods上。[3]
原理概述
转座子(transposons)是基因组上的一种元件,它能够改变自己在基因组上的位置,具有“跳跃性”,这个生物学过程就是由转座酶介导的(transposase),Tn5就是一种转座酶。已经有研究表明,在体外例如转座子更倾向于插入开放染色质区域。[4]所以ATAC-seq利用这个特点,将测序所用adaptor加在Tn5转座酶上,这样Tn5转座酶就可以将adaptor添加到开放染色质区域的DNA两端,这样就可以对这部分序列进行测序了。(当然作者们对其可行性进行了一波三折的评估,包括将其与之前经典的染色质结构研究组学技术DNase-Seq和FAIRE-Seq结果的比较)
所以实际上这些序列在基因组上的位置就是开放染色质区域,这样ATAC-seq就实现了在全基因组定位开放染色质区域的目的。我们将下机数据利用bowtie2或者bwa等比对工具进行比对之后,在利用UCSC或者igv进行可视化,信号越强的区域其开放性就越大了。
类似技术
还有其它的技术能够实现这样的目的,它们分别是DNase-Seq、FAIRE-Seq和MNase-seq*,原理相通~
Reference:
[1] https://en.wikipedia.org/wiki/Chromatin_remodeling.
[2] Xu J, Liu Y. Probing Chromatin Compaction and Its Epigenetic States in situ With Single-Molecule Localization-Based Super-Resolution Microscopy. Front Cell Dev Biol. 2021;9:653077.
[3] Buenrostro JD, Giresi PG, Zaba LC, Chang HY, Greenleaf WJ. Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position. Nat Methods. 2013;10(12):1213-1218.
[4] Gangadharan S, Mularoni L, Fain-Thornton J, Wheelan SJ, Craig NL. DNA transposon Hermes inserts into DNA in nucleosome-free regions in vivo. Proc Natl Acad Sci. 2010;107(51):21966-21972.