真核生物有3种依赖DNA的RNA聚合酶,即RNA聚合酶1、2、3。RNA聚合酶1负责转录rRNA。RNA聚合酶2负责转录结构基因mRNA和部分snRNA。RNA聚合酶3负责转录tRNA和5s rRNA。
真核生物RNA聚合酶2必须与多与20个转录因子TF2(transcription factor; 或称转录起始因子,transcription initiation factor,TIF;或称一般转录因子,general transcription factor,GTF)逐级组装成“完全的转录起始复合物”(complete transcriptional initiation complex,complete TIC)才能启动转录过程。
真核生物中没有类似原核生物中可以识别启动子的α亚基的对应物,所以真核生物RNA聚合酶2在行使转录起始时,需要TF2先期识别或结合启动子,帮助RNA聚合酶2定位到DNA上的转录起始位点,并与RNA聚合酶2共同组装成转录起始的基本装置(basal apparatus),此时由于一个或多个TF2的作用,DNA的构象从封闭式转换为开放式。
基本转录作用的开始需要许多基本因子(basal factor),称为一般转录因子(general transcription factor, GTF),简称转录因子(transcription factor, TF),每个转录因子在转录起始作用时所扮演的角色都不尽相同。
步骤一:TFⅡD
如图二,一般DNA的转录起点前面都有一段DNA序列叫做启动子(promoter),是由腺嘌呤(adenine, A)及胸腺嘧啶(thymine, T)所组成的,称为TATA盒(TATA box),其标准序列(consensus sequence)为TATAAAA。
在最先,转录因子TFⅡD蛋白(分子量120~140kDa)会找出这段TATA盒序列,并与这段DNA序列进行蛋白/DNA结合作用。早期的研究指出,TFⅡD是一个复合体(complex),由多个多胜肽链(polypeptide)组合而成,因此在TFⅡD复合体中专门与DNA结合的蛋白,我们就称它为TATA结合蛋白(TATA binding protein,简称TBP)。
TBP的分子量因不同的生物体而异,由27kDa(酵母菌)到38kDa(果蝇与人类细胞)都有。虽然TBP专责与DNA结合,但TBP跟其他能与DNA结合的DNA结合蛋白(DNA binding protein,简称DBP)有许多不同的地方。首先,TBP只需要单独行动即可,是以单元体(monomer)形式和DNA作用,而非一般DBP要形成二聚体(dimer)才能和DNA结合(可进一步参考《科学月刊》25卷8期〈简述视黄酸的讯息传递〉中以二聚体形式作用的DBP)。其次,TBP是与DNA分子螺旋结构上的小沟(minor groove)地方作用,而非一般DBP作用是在大沟(major groove)上;另外,TBP在蛋白上本身无法区分具有特定功能的功能部位(domain),亦即当TBP缺乏一些胺基酸片段后,它的DNA结合能力与转录启动活性均告丧失(参考《科学月刊》25卷8期〈简述视黄酸的讯息传递〉中有功能部位区分的核中受体)。从分子结构层次来看,TBP整个分子呈对称的马鞍状,与DNA的结合方式就好像马鞍套在马背上一样。当TBP与DNA结合后,除了TBP蛋白本身的形状改变外,DNA亦会被扭曲,以便让以后其他的转录因子来作用(可参阅1993年十月份英国的《Nature》中的许多计算机立体图形)。
TFⅡD除了TBP之外,还有另外六个蛋白,它们被称为TBP附着因子(TBP-associated factor, TAF),能与其他TFⅡD以外的蛋白作用,例如活化子与抑制子,所以它们是负责转录活性调控的功能。
由于TFⅡD中的TBP结合到DNA的TATA序列上,是整个转录作用的首要之务,随后引发一连串事件,最终促使转录之进行,因此这个蛋白(TFⅡD)与DNA的复合物,称为起始复合体(initiation complex)。
在早期的实验指出,另外有一个转录因子TFⅡA会结合到起始复合体上并稳定其结构,但目前已证实TFⅡA只是在纯化TFⅡD时一起沉淀下来的蛋白而巳,在转录的起始过程中并非是必需的因子。
步骤二:TFⅡB
如图三,转录因子TFⅡB对起始复合体的结合与否,为转录起始作用过程的速率限制步骤(rate-limiting step)。而RNA聚合酶Ⅱ能否与起始复合体结合并开始转录作用,也完全视乎TFⅡB的结合与否。一些能使转录作用增强的活化子之所以能使转录作用加速,其原因就是可以加速TFⅡB结合到起始复合体上。
TFⅡB为单一蛋白结构,分子量由35kDa(老鼠细胞)到41kDa(酵母菌)都有。TFⅡB的功能是让RNA聚合酶结合到起始复合体上,并且测定出转录起始点的位置。
步骤三:TFⅡF与RNA聚合酶
图四中,另外一个转录因子TFⅡF是由两个分子量分别为30kDa与74kDa的多胜肽链所组成的异型二聚体(heterodimer),所以又称为RAP30/74。它首先在细胞核中与未和DNA结合的游离RNA聚合酶结合,然后携带着RNA聚合酶与前述在起始复合体上的TFⅡB结合;因此TFⅡF就好像「媒人」一般,拖着RNA聚合酶与TFⅡB认识并与之结合。目前已知能与RNA聚合酶结合的蛋白除了TFⅡF与TFⅡB之外,前述TFⅡD中的TBP也被证实有跟RNA聚合酶结合的能力。
值得一提的是:RNA聚合酶二型在转录过程中有两个形式存在,一是没有被磷酸化(non-phosphorylation)时称为A型(即RNA polymerase ⅡA),而如果已被磷酸化(phosphorylation),则称为O型(即RNA polymerase ⅡO)。磷酸化的位置集中在RNA聚合酶的羰基端,称之为羰基端功能部位(carboxyl-terminal domain, CTD)。而TFⅡF只与RNA聚合酶A型作用。
这时,RNA聚合酶A型结合到DNA上,整个复合体已有能力打开DNA的双股螺旋结构了,但它还未有足够的能力移动而停留在原地,这时的DNA与众多的蛋白所形成的复合体,称为起始前复合体(pre-initiation complex, PIC)或最小起始复合体(minimal initiation complex)。
步骤四:TFⅡE(但是也有文献说是TFⅡA在这一步起作用,我们先说是E吧)
图五中,转录因子TFⅡE已证实能与前述的TBP、TFⅡF及RNA聚合酶ⅡA型、和下一步的转录因子TFⅡH结合(详见步骤五)。TFⅡE由两个多胜肽链(分别为34kDa及56kDa)所组成,它与PIC的结合可以稳定PIC,并引导下一个转录因子TFⅡH往PIC上结合。
从一开始的第一步(TFⅡD与DNA上的TATA序列结合),一直至目前(TFⅡE与PIC结合),所有的蛋白与DNA或蛋白与蛋白的结合反应都是可逆的步骤(reversible pathway),所以表示转录因子就算结合后也不一定会往下一步走。
步骤五:TFⅡH
图六中,当转录因子TFⅡH(又称为BTF2)结合到TFⅡE上时,整个包括RNA聚合酶的复合体可称为完整起始复合体(complete initiation complex)。TFⅡH是一个多功能蛋白,由五个多胜肽链所构成的复合体(大约有200kDa),它最特别的地方是:在目前众多转录因子的功能中,只有它拥有激酶(kinase;进行磷酸化的酵素种类)、螺旋酶(helicase;能打开DNA螺旋结构的酵素)及ATP水解酶(ATPase;水解ATP分子而产生能量的酵素种类)的活性。而当TFⅡE及TFⅡH与PIC结合后,这时TFⅡH的ATP水解酶活性就会水解ATP分子而释出能量,而螺旋酶的活性也可使双股DNA打开的地方更大,这时期称为启动子廓清(promoter clearance)阶段,它可以说是介于启动复合体与延长复合体(elongation complex)之间。而TF ⅡH的激酶活性是用来对RNA聚合酶的CTD作磷酸化作用的,藉以把RNA聚合酶ⅡA型转变成ⅡO型,而CTD被磷酸化之后,RNA聚合酶随即可以移动并开始转录作用。我们可以想象TFⅡH是一个开关,可以打开RNA聚合酶的动力机制,使之前进。
另外,在今年七月份英国《Nature》期刊中指出,TFⅡH中有一个与酵母菌RAD25蛋白很像的次单位(subunit),称为ERCC3(因此又称为RAD25/ERCC3次单位),它具有修补(repair)的作用,当转录中RNA聚合酶遇到有错误序列时,可能会促进修补机制之进行,而使转录机制与修补机制偶合在一起(transcription-repair coupling)。
步骤六:TFⅡG及TFⅡJ
目前还有两个转录因子TFⅡG及TFⅡJ,但研究人员对其功能与存在的必要性仍有争议,只知道它们出现在TFⅡH以后的步骤中。
步骤七:转录启动
RNA聚合酶被磷酸化后,即可向前移动,当到达转录起启点时,即可开始利用核 酸来进行聚合反应(polymerization)而合成RNA。
当RNA聚合酶向前移动时,完整起始复合体却没有完全分解开,反而分成三大阵营:一部分留在原地(TATA序列上),一部分跟着RNA聚合酶移动,剩下的部分解离出去。目前已知TFⅡD和TFⅡB停留不动,死咬着TATA序列不动;而TFⅡF与RNA聚合酶一起移动,共同进退;至于TFⅡE及TFⅡH则从复合体中解离出去,重获自由身。
TFⅡD和TFⅡB停留在原地之复合物被称为后启动复合物(post-initiation complex),它们赖着不走的目的主要是要与下一个转录因子作用,也就是说在下一轮的转录作用中,TFⅡD不必再花费时间和能量再去找TATA序列,TFⅡB也不必再重新找一遍TFⅡD,而重复做一次PIC的形成过程(见图七)。
第一个被聚合的核苷酸经常是嘌呤,大约在mRNA被转录出30个核苷酸后,鸟嘌呤转移酶将第一个核苷酸修饰成一个帽子结构。所以RNA聚合酶2的转录起始位点有时也称为帽子位点。
上面所述得有个问题就是TF2F只能和RNA聚合酶A型结合,那么RNA聚合酶被磷酸化后为什么没有脱离呢?
参考:
Roeder, Robert G. (1991). "The complexities of eukaryotic transcription initiation: regulation of preinitiation complex assembly". Trends in Biochemical Sciences. 16: 402–408. doi:10.1016/0968-0004(91)90164-Q