复制过来的,原文章链接等下复制一下
在基因组中,大部分的染色质紧密缠绕在细胞核内,不具有转录活性。染色质重塑作用可以使部分致密的染色质变得松散,这部分松散的染色质被称为开放染色质(open chromatin)或可接近性染色质(accessible chromatin)。
可接近性染色质(来源:http://www.genome.cn/News/Industry/767.html 安诺基因)
对染色质开放区域的定向测序可以帮助我们了解细胞的转录调控过程,确定哪些基因在细胞中具有转录活性。
对开放染色质的测序主要有以下几种方法:
DNase-seq
MNase-seq
ATAC-seq
ChIP-seq
FAIRE-seq
今天这篇笔记主要讲ATAC-seq, DNase-seq和MNase-seq 的原理,和探测区域的异同。
三种测序方法探测区域的差异:
三种测序方法探测区域的差异,来源https://www.the-scientist.com/lab-tools/reveling-in-the-revealed-34261
DNase-seq
DNase-seq 从他的名字就能看出来,使用了限制性内切酶(DNase I)对样品进行了片段化处理。
在染色质致密区域,DNA链被致密结构很好地保护起来,使得内切酶无法接近这些区域,只能切割开放区域的DNA。
同样,在开放区域,缠绕在核小体上的DNA被核小体结构所保护,只有核小体之间的DNA序列能够被DNase I切割,这些区域内能够被DNase切割的位点也被称为DHS,即DNase超敏感位点(DNase hypersensitive sites)。
该测序方式的特点:
DNase-seq 已经被广泛应用在各个物种中,可靠性得到了很好的验证。
定向切割开放区域内的DHS位点,而不会切割受保护的区域,可以通过DNase-seq 推测核小体可能的位置,和染色质开放性的变化。
DNase-seq需要数以百万计的细胞作为样品,现在已经开发了单细胞的DNase-seq,但无法区分致密的染色质区域和测序过程中丢失的情况(没有重复的弊端)。
DNase I 存在切割偏好性,需要通过计算消除这种偏好。
得到的序列信息不能完全还原开放区域内无保护序列。
可以推断转录因子结合位置。
2. MNase-seq
这种测序方法和DNase-seq原理类似,探测区域互补。MNase-seq使用的酶是限制性外切酶,将不受保护的区域统统切除,只余下核小体上缠绕的DNA序列。
该测序方法的特点:
MNase-seq 同样被广泛应用到了很多物种中。
结合其他方法,MNase-seq可以探测和核小体相关的调控因子,比如ChIP-seq。
单细胞的MNase-seq还没有被开发出来,因此依然需要大量的细胞作为样本。
MNase 的切割同样具有偏好性,AT含量更高的区域更容易被切割。
3. ATAC-seq
前两种方法都需要限制性酶,他们的缺点是切割下来的片段都不是完整的开放染色质信息。
开放染色质具有转座酶敏感性,转座酶能够随机插入到不受保护的DNA序列上(类似DNase),但转座酶不像限制性内切酶那样能够切割DNA。
Tn5 插入染色质开放区域, 来源: Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position.
ATAC-seq使用改造的Tn5转座酶,将转座DNA设计为接头,随机插入染色质的开放区域。
改造后的转座酶 来源:Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position.
因为Tn5 不具有切割能力,能够完整地将整个开放区域的序列直接捕获下来,所以ATAC-seq现在被广泛应用到开放染色体的测序当中。
ATAC-seq的特点:
对样本数量的要求较低,单细胞ATAC-seq的方法也已经被开发出来,但存在假阴性。
能够完整地捕获整个开放区域的信息,但是测序结果不能和DNase-seq、MNase-seq的结果完全匹配。
建库的准备工作较为繁琐,试剂比较昂贵。
可以在ATAC-seq的基础上结合其他测序手段(如ChIP-seq或RNA-seq),进行多组学分析。
参考:
三种测序的差异(这个文章是2016年的,能够感受到最近两年单细胞测序技术的飞速发展):
https://www.the-scientist.com/lab-tools/reveling-in-the-revealed-34261
read是读长,就是一个反应能测出的碱基数 congtig是将很多read根据序列拼接在一起拼出的片段