最近在学习ATAC-seq,整理了笔记分享一下,欢迎批评指正
a、为啥要ATAC-seq?
ATAC-seq全称Assay for Transposase Accessible Chromatin with high-throughput sequencing,即利用转座酶研究染色质可进入性的高通量测序技术。
要理解这项技术的作用,首先需要认识染色体/质的结构。
真核生物的核DNA并不是裸露的,而是有蛋白质即组蛋白与之相结合的。DNA一圈一圈地缠绕在组蛋白上,形成串珠式的结构。而这样的结构还能够进一步折叠、浓聚,并在其他架构蛋白的辅助下,形成染色体。
这样做的意义在于,能够将超长的DNA链,折叠成很小很小的结构,从而塞进小小的细胞核里。比如说,人类的DNA链如果完整展开,那么大概会有2米那么长。而经过这样的折叠,就变成了纳米至微米级染色体/质的结构了。
这就好比我们在电脑中,将一个记录着ATCG四个碱基的纯文本文件,通过算法将其压缩成zip文件。
但是我们又知道,DNA的复制,基因的转录,是需要将DNA的高级结构解开的。这就类似于,要从zip文件中获得信息,首先需要解压缩。但是,这里的解压缩并不需要将整个zip全部打开,而只需要打开一部分,即需要表达基因的区域即可。而这一个过程,主要由染色体组蛋白的修饰(尤其是乙酰化)来实现的。
这部分打开的染色质,就叫开放染色质(open chromatin)。而染色质一旦打开,就允许一些调控蛋白(比如转录因子和辅因子)跑过来与之相结合。而染色质的这种特性,就叫做染色质的可及性(chromatin accessibility)。
我们如何去寻找开放的染色质区域呢?
传统的实验方法主要是借助MNase-seq和DNase I hypersensitivity assay。
这两个实验的主要思路是一致的:染色质变得开放,就意味着DNA和组蛋白的浓聚程度降低,就会有一部分DNA暴露出来。而一旦失去了蛋白质的保护,这部分DNA就可以被DNA酶(MNase或DNase I)所切割。然后,我们再把切割完的DNA拿来测序,和已知的全基因组序列相比较,就能发现被切掉的是哪些地方,没有被切掉的地方又在哪里,从而获知开放的染色质区域。
不过,这两个方法都有明显的缺陷,即耗时费力与重复性差。具体就不展开讲,亲手做过的就知道这两个方法有多么讨厌。
b、ATAC-seq原理和结果
2013年,美国Stanford大学的William Greenleaf教授研发了一种全新的方法,利用DNA转座酶结合高通量测序技术,来研究染色体的可进入性,即ATAC-seq。
DNA转座,是一种把DNA序列从染色体的一个区域搬运到另外一个区域的现象,由DNA转座酶来实现。这种转座插入DNA,也是需要插入位点的染色质是开放的,否则就会被一大坨高级结构给卡住。
那么,如上图a,我们只要人为地,将携带已知DNA序列标签的转座复合物(即带着红色蓝色测序标签的转座酶Tn5),加入到细胞核中,再利用已知序列的标签进行PCR后测序,就知道哪些区域是开放染色质了。而这也就是ATAC-seq的原理。
即为了找到开放染色质区,基因组被TN5转座酶处理。在ATAC-Seq中,修饰后的TN5将与NextEra接头相对应的DNA序列插入到基因组的开放区域,同时,DNA被转座酶的活性剪切。
ATAC-seq出来的结果,和传统方法出来的结果具有很强的一致性,同时也和基于组蛋白修饰marker的ChIP-seq有较高的吻合程度。也就是说,ATAC-seq中的peak,往往是启动子、增强子序列,抑制子,以及一些反式调控因子结合的位点。
启动子是靠近转录起始点(TSS)的DNA区域。它包含转录因子的结合位点,这些转录因子将招募RNA聚合酶。增强子是可位于启动子下游或上游1Mb的DNA区域。当转录因子与增强子结合,并与启动子区域接触时,该基因的转录增加。相反,抑制子会减少或抑制基因的表达。
相比起来,ATAC-seq的重复性,比MNase-seq和DNase-seq的更强,操作起来也更加简单,而且只需要很少的细胞/组织量,同时出来的信号更加漂亮。目前已经是研究染色质开放性首选的技术方法。
c、ATAC的升级版本---Omni-ATAC
据说,目前市面上的公司做ATAC-seq基本上采用的都是Omni-ATAC这套Protocal,稳定性比较好。
而Omni-ATAC到底怎么回事儿呢?
2017年12月,Greenleaf实验室发表在Nature Methods上的文章An Improved ATAC-seq Protocol Reduces Background and Enables Interrogation of Frozen Tissues(DOI: 10.1038/nmeth.4396)中详细的介绍的ATAC升级版---Omni-ATAC!!!
这个作者是不是有点眼熟,对,你没看错,就是那个首先发明ATAC的作者,他的实验室对ATAC方法进行的一次重要改进!
摘要是这么写的:We present Omni-ATAC, an improved ATAC-seq protocol for chromatin accessibility profiling that works across multiple applications with substantial improvement of signal-to-background ratio and information content. The Omni-ATAC protocol generates chromatin accessibility profiles from archival frozen tissue samples and 50-μm sections, revealing the activities of disease-associated DNA elements in distinct human brain structures. The Omni-ATAC protocol enables the interrogation of personal regulomes in tissue context and translational studies.
protocol的主要改进:
使用多种去污剂(such as NP40, Tween-20, and digitonin),以提高通透效果和去除线粒体
裂解后用Tween-20洗,以更好地去除线粒体
转座酶切时使用PBS,以提高信噪比
protocol的链接:https://protocolexchange.researchsquare.com/article/nprot-6107/v1
主要步骤
收集细胞、离心,裂解、离心,清洗、离心,得到细胞核。
转座酶切反应。
clean-up。
PCR预扩增,qPCR确定扩增轮数,扩增。
文库浓度测定。
评价
作者评价:Omni-ATAC相比standard-ATAC和FAST-ATAC,有更好的适应性,适用于冻存样品,且线粒体污染较少,信噪比较高,耗材成本较低。
其他评价:
推荐这篇protocol是因为它是目前被测序公司广泛使用的ATAC-seq方法,有必要了解一下其中的技术细节。
本方法所需细胞数为5万,酶切前需破膜离心提核。
如果使用该方法可以成功建库的话,就只要照着做就行了。
对于提核有难度的细胞,有大佬推荐试试梯度离心。
对于免疫细胞,FAST-ATAC和Omni-ATAC哪个更合适,可能还需要更多的探讨。
文中T细胞是Omni略胜一筹,B细胞Omni明显胜出。
对于髓系细胞和造血干细胞,文中未有提及。坐等作者再次更新方法啦,学无止境
----------------------------------------------------------------------------------------------------------------------------------I am a line!-----------------------------------------------------------------------------------------
链接:https://www.jianshu.com/p/9f49f88b0109