一、组蛋白结构
我们都知道在细胞核中的染色体是高度压缩的,而折叠时DNA缠绕的就是组蛋白。将组蛋白区域放大,我们就会看到这样一串念珠,组蛋白被一根DNA序列串起来。
“核小体”是染色体的基本结构单位,一个核小体由两个组蛋白H2A,两个组蛋白H2B,两个组蛋白H3,两个组蛋白H4组成的八聚体和147bp缠绕在外面的DNA组成。
也就是说,核小体 = 组蛋白八聚体(2个H2A + 2个H2B + 2个H3 + 2个H4) + DNA(147bp)
下面是检测到的组蛋白三维结构示意图。可以看到,在每种组蛋白结构都会伸出来一小段“线头”,这是蛋白质的N端,也叫尾巴(tail)。
事实上,每个组蛋白结构都会延伸出这个“尾巴”:
而组蛋白修饰就是在这个尾巴上进行的。
也就是说,组成核小体核心区域的组蛋白游离在外的N-末端的氨基酸,在相关酶的作用下可以发生不同的修饰。许多组蛋白修饰都能够影响基因的转录活性。
二、组蛋白修饰的描述规则
这种修饰时一种以共价方式进行的蛋白质翻译后修饰(PTM),包括:甲基化(me
)、乙酰化(ac
)、磷酸化(p)、泛素化、SUMO化和ADP-核糖化等等。其中最常见的修饰形式是组蛋白甲基化和乙酰化。组蛋白甲基化和乙酰化状态是否正常通常都会影响各类疾病发生,特别是在肿瘤、免疫等疾病中。
由于组蛋白修饰的类型众多,因此在描述组蛋白修饰时,有一个规则:
组蛋白结构 + 氨基酸名称 + 氨基酸位置 + 修饰类型
在实际的应用中,我们一般这样写:
H3K4me3:代表H3组蛋白的第4位赖氨酸的三甲基化
H3K14ac:代表H3组蛋白的第14位赖氨酸的乙酰化
这些修饰都会影响基因的转录活性。而组蛋白H3是修饰最多的组蛋白。
三、组蛋白修饰类型
1. 组蛋白甲基化
通过组蛋白甲基转移酶(HMT)将甲基转移至组蛋白突出的“尾巴”中,尤其是N末端的尾巴。
组蛋白甲基化的位点通常是在赖氨酸(K)和精氨酸(R)残基上。
赖氨酸可以分别被一、二、三甲基化,精氨酸残基则可被单、双甲基化。
组蛋白甲基化修饰既与基因的转录抑制相关,又与转录激活相关,这取决于修饰的不同位点。例如:H3K4 的甲基化与基因激活相关;H3K9,H3K27单甲基化与基因激活有关,三甲基化与基因沉默相关;H3K9,H3K27甲基化会介导异染色质的形成。
2. 组蛋白乙酰化
通过组蛋白乙酰化转移酶(HAT)将乙酰辅酶A的乙酰基转移到组蛋白氨基末端特定的赖氨酸残基上。特定基因区域的组蛋白乙酰化和去乙酰化是以一种非随机的、位置特异的方式进行。组蛋白乙酰化主要通过中和赖氨酸的正电荷从而增加组蛋白末端的黏性,从而促进核小体变得松散,使转录得以发生。所以通常组蛋白乙酰化与转录激活相关,去乙酰则与转录抑制相关。
这些组蛋白修饰也可以共同作用来完成调控,比如,H3K9ac也与H3K14ac和H3K4me3高度共存共同作为活性基因启动子的标志。
3. 其他组蛋白修饰
四、常见组蛋白修饰
1、H3K27ac
组蛋白H3上的第27位赖氨酸残基发生乙酰化,与较高的转录激活有关,因此被定义为活性增强子信号,H3K27ac在TSS(转录起始位点)的近端远端都有发现。
1.1、赖氨酸的乙酰化与去乙酰化
蛋白质通常在赖氨酸残基上发生乙酰化,这个反应依赖于乙酰辅酶A作为乙酰基团的供体。在组蛋白乙酰化和去乙酰化过程中,组蛋白在N-末端赖氨酸残基上乙酰化和去乙酰化,是基因调控的一部分。这些反应是由具有组蛋白乙酰转移酶(HAT)或组蛋白去乙酰化酶(HDAC)活性的酶催化的,尽管HATs和HDACs也可以改变非组蛋白的乙酰化状态。通过乙酰化和去乙酰化对转录因子、效应蛋白、分子伴侣(molecular chaperones)和细胞骨架蛋白的调控是一种重要的翻译后调控机制。这些调节机制类似于激酶和磷酸酶作用下的磷酸化和去磷酸化。蛋白质的乙酰化状态不仅可以改变其活性,而且最近有研究表明,这种翻译后修饰还可以与磷酸化、甲基化、泛素化、素酰化等相互作用,以动态控制细胞信号转导。
1.2、与H3K4me1的平衡
由于H3K27ac和H3K27me3修饰在组蛋白尾部的相同位置,它们相互拮抗。H3K27ac常用于寻找活性增强子和平衡增强子,这些增强子是由含有所有增强子的另一个增强子标记H3K4me1减去的
1.3、基因上调
乙酰化通常与基因的上调有关。H3K27ac是一个积极的增强标记。它存在于基因的远端和近端区域。它在转录起始位点(TSS)中富集。H3K27ac与H3K27me3共享一个位置,它们之间存在拮抗作用。
2、H3K27me3
H3K27me3是组蛋白H3上的27位赖氨酸发生三甲基化,这种三甲基化通过形成异染色质区域下调附近基因。
2.1 机制与功能
在赖氨酸27上放置抑制标记需要通过转录因子募集染色质调节子。 这些修饰物要么是组蛋白修饰复合物(这些复合物可以共价修饰组蛋白以在核小体周围移动并打开染色质),要么是染色质重塑复合体(涉及核小体的移动而无需直接修饰它们)。如H3K27me3所见,这些组蛋白标记可以用作其他共激活因子的停靠位点(docking sites)。 这是通过组蛋白甲基化和色域相互作用通过多梳介导的基因沉默而发生的。 聚梳抑制复合物(PRC); PRC2通过组蛋白甲基转移酶活性介导赖氨酸27上组蛋白3的三甲基化。 该标记可以募集PRC1,它将结合并促进染色质的紧实。H3K27me3与DNA损伤修复有关,尤其是由同源重组导致的双链破裂。
2.2 与其他修饰的关系
H3K27可以进行发生多种其他修饰。可以以单甲基和二甲基状态存在。单甲基与二甲基的研究不如三甲基清楚。然而,PCR2倍认为与H3K27me相关的所有不同的甲基化有关。
H3K27me1与转录的促进有关,并且可以在转录的基因中积累。组蛋白-组蛋白相互作用在此过程中起作用。这种调控是通过依赖Setd2的H3K36me3累积发生的。
H3K27me2广泛分布在核心组蛋白H3中,并被认为通过抑制非细胞型特异性增强子发挥保护作用。最终,这导致转录失活。[9]
乙酰化通常与基因的上调有关。 H3K27ac中就是这种情况,它是一个有效的增强标记。它存在于基因的远端和近端区域。它丰富了转录起始位点(TSS)。 H3K27ac与H3K27me3共享一个位置,并且它们以拮抗的方式相互作用。
H3K27me3通常在二价结构域中与H3K4me3相互作用。这些结构域通常在胚胎干细胞中发现,对于适当的细胞分化至关重要。 H3K27me3和H3K4me3决定一个细胞是否仍未指定或最终分化。小鼠中的Grb10基因利用了这些二价结构域。 Grb10显示印迹的基因表达。基因从一个亲本等位基因表达,而同时在另一亲本等位基因中沉默。[13]
其他特征明确的修饰是H3K9me3以及H4K20me3,就像H3K27me3一样,它们通过形成异色区域与转录抑制相关。 H3K27,H3K9和H4K20的单甲基化都与基因激活有关
3、H3K4me3
H3K4me3是组蛋白H3蛋白的第4个赖氨酸残基处的三甲基化。H3K4me3通常与附近基因的转录激活有关。 H3K4三甲基化通过NURF复合物通过染色质重塑来调节基因表达。这使得染色质中的DNA更容易被转录因子所利用,从而允许基因在细胞中转录和表达。具体来说,研究发现H3K4me3通过携带组蛋白乙酰化酶和核小体重构酶(NURF)来正向调节转录。H3K4me3在干细胞潜能和谱系的遗传调控中也起着重要作用。这是因为这种组蛋白修饰更常见于与发育和建立细胞身份有关的DNA区域。
3.1 调控基因表达
H3K4me3是常用的组蛋白修饰。 H3K4me3是最不丰富的组蛋白修饰之一。 然而,它在转录起始位点(TSS)附近的活性启动子上高度富集,与转录呈正相关。 H3K4me3在表观遗传研究(通常通过染色质免疫沉淀法鉴定)中用作组蛋白编码或组蛋白标记,以鉴定活性基因启动子。H3K4me3通过NURF复合物的作用促进基因激活,NURF复合物是一种蛋白质复合物,通过PHD手指蛋白质基序起作用,从而重塑染色质。这使得染色质中的DNA可被转录因子访问,从而允许基因在细胞中转录和表达。
4、H3K4me1
H3K4me1是组蛋白H3的第四个赖氨酸残基处的单甲基化,通常与基因增强子有关。
4.1 机制与功能
H3K4me1富集在活性和primed增强子区域内。 增强剂由组蛋白H3K4单/二甲基转移酶MLL4引发,然后由组蛋白H3K27乙酰转移酶p300激活。H3K4me1会微调增强子的活性和功能,而不是控制。具有MLL3 / 4的H3K4me1也可以作用于启动子并抑制基因
5、H3K9me3
H3K9me3时组蛋白H3的第9个赖氨酸残基处的三甲基化,与异染色质有关
6、H3K36me3
H3K36me3时组蛋白H3的第36个赖氨酸残基处的三甲基化,与基因区域有关,通常H3K36me3定义了exon,与DNA损伤修复有关。
五、组蛋白修饰的检测
一般我们使用 ChIPseq 来对样本测序,以此来拿到全基因组上的组蛋白修饰图谱。
详见:一文读懂 ChIPseq