自从孟德尔用不同表型的豌豆品种进行杂交试验以探讨生物的遗传规律以来,一部遗传学的发展史反映了人类对基因不断深化认识的过程。特别在分子遗传学诞生以后,有关基因的结构、突变、表达、调节与克隆等方面的研究取得很大的进展。这不但帮助生物学各分支学科找到了深化自己研究问题的思路,同时也为解决医药与农业上的许多难题提供了新的技术与途径。但是目前对基因仍有许多不够了解的地方,还有许多基因尚未被克隆。这有待不同学科研究者的共同努力来完成。下面就近年有关植物中编码蛋白质的核基因的结构,以及表达调控方面的一些进展作一简单的介绍。
本推文分两个部分介绍,第一部分为基因的结构,第二部分为基因的表达调控,每一部分又分一小章节进行介绍,以下是内容目录。
•一. 基因的结构
•1.1、5’上游区
•1.2、5’非翻译区
•1.3、编码区
•1.4、3’非翻译区
•二. 基因的表达调控
•2.1、器官与组织专一性表达的基因
•2.2、受环境因素诱导而表达的基因
•2.3、基因表达的调节机理
克隆植物中核基因的方法
•在研究一个基因的结构之前,先要克隆到这个基因。目前常用来克隆植物中编码蛋白质的核基因的方法大致有以下几种:
a.序列克隆;b. 依据序列同源性克隆基因;c. 人工合成并克隆基因;d. 表型克隆 ;e. 功能克隆
f. 定位克隆 ;g. 转座子标记法
a . 序列克隆:
根据已知基因的序列设计并合成一对引物,从植物中提取DNA进行PCR扩增,扩增的片段经纯化后通过TA克隆连接到合适的载体上,测序,并与已知基因序列进行比较。
b . 依据序列同源性克隆基因 :
在其它种属的同源基因已被克隆的前提下,构建cDNA文库或基因组文库,然后以已知的基因序列(序列片段)作为探针来筛选目的克隆。
例子:根据甜菜碱醛脱氢酶基因序列克隆菠菜碱醛脱氢酶基因、自交不亲和 基因、花形态建成基因。
c . 人工合成并克隆基因
根据已知的氨基酸或核苷酸序列,采用植物偏爱的密码子,人工合成并克隆该基因。(可对基因进行改造)
d. 表型克隆:
利用植物的表型差异或组织器官特异表达产生的差异来克隆植物基因。此方法试图把表型与基因结构或基因表达联系起来,从而分离特定表型相关基因。不必事先知道基因的生化功能或图谱定位,根据基因的表达效应就直接分离该基因。
例子:利用表型差异从拟南芥中克隆出赤霉素合成酶基因。
e. 功能克隆
根据性状的基本生化特性这一功能信息,在鉴定和已知基因的功能后克隆。方法:纯化相应的编码蛋白→构建cDNA文库或基因组文库→筛选基因。特点:用基因表达的产物蛋白质来克隆基因。
此方法有两种
Ⅰ.根据基因表达的蛋白质
首先将纯化的蛋白质进行氨基酸测序,推测可能的mRNA序列,据此合成寡核苷酸探针从文库中筛选编码基因。然后将相应的编码蛋白制成相应的抗体探针,从文库中筛选相应基因并克隆。最后根据mRNA序列设计相应的寡核苷酸引物,对核DNA或cDNA进行PCR扩增。
Ⅱ.根据基因的表型突变互补功能
植物的许多基因与细菌或酵母的突变体互补。 如拟南芥的cDNA文库可与酵母的8个营养缺陷突变体互补。根据这一特性可分离一些基因,如来自蛋白激酶基因和葡萄糖载体基因等。利用此法分离基因需做大量的转化工作,且转化细胞中突变体频率较低。
f. 定位克隆
根据遗传连锁分析,染色体步移将基因定位到染色体的一个具体位置上后不断缩小筛选区域进而克隆该基因。连锁分析:通过基因与DNA标记之间的重组系数估计两者之间的距离,若某种性状的基因与DNA标记在子代不分离,即有连锁在一起的趋势。因此可将与某一DNA标记连锁的基因在染色体上定位。
g. 转座子标记法
转座子是可以从一个基因位置转移到另一位置的DNA。转座子标记法是把转座子作为基因定位的标记和通过转座子在染色体上 的插入和嵌合来克隆基因。在转座过程中,原来位置的转座子并未消失,发生转座的只是转座子的拷贝。基因发生转座可引起插入突变,使插入位置的基因失活并诱导产生突变型或在插入位置上出现新的编码基因。通过转座子上的标记基因(如抗药性等)就可以检测出突变基因的位置和克隆出突变基因来。
一、基因的结构
转入正题,基因克隆完成后就要对基因的结构进行分析
近年来,很多科学家对植物基因的结构进行了研究,结果表明它们与其他真核基因的结构很相似。下面将他们对植物基因中4个区域结构的研究结果简述如下:
1.1、5’上游区
这是指基因转录起始点5’端上游包括启动子在内的一段很长的区域,其中包含着与基因转录起始与表达调控有关的许多元件。这个区域在结构上有以下几点值得注意:
a 转录起始位点
b TATA box、 CAAT box
c 顺式作用元件
a 转录起始位点
Joshi曾比较了79个高等植物基因启动区的DNA顺序,推衍出在基因转录起始点附近的一致顺序(consensus sequence)是CTCATCA。当中的一个A是转录起始的核苷酸,一般都将此核苷酸编号为+1位。转录本中的核苷酸位置均以正数表示,而A的5’上游区非转录核苷酸则以负数表示,A的两边通常是嘧啶核苷酸。
b TATA box、 CAAT box
Joshi的总结中还指出,在转录起始点上游-32±7核苷酸对(bp)处有一段一致顺序TCACTATATAG,简称为TATA box,这些顺序对RNA聚合酶Ⅱ准确地使基因起始转录是必需的。在TATA box 上游-75bp附近常有一致顺序GC(T/C)CAATCT,简称CAAT box.这些顺序有增强基因特录的作用。在有些植物基因中.没有明显的TATA box,在另一些植物基团中,AGGA box替代了CAAT box
c 顺式作用元件
在5’端远上游区域中.还存在对基因的表达有增强或阻遏作用的顺序、决定基因在特定时空表达的顺序以及对激素或外界胁迫有应答作用的顺序,由于这些顺序对基因表达起调控作用,因此统称为调控元件,又由于它们与基因位于同一条DNA链上,故又称顺式作用元件(cis-acting element)。有些研究论文中提到的启动子有时也指包括了这些元件在内的很长一段区域
1.2 5’非翻译区
基因的转录起始位点到翻译起始密码子之间的一段顺序被称为5’非翻译区。该区的5’端是前体mRNA加帽(7-甲基鸟嘌呤核苷)的位点。有些基因的5’非翻译区中还有一些茎环结构。这些茎环结构与翻译起始密码子的旁邻顺序对翻译的效率都有影响。此外在有些值物基团的5’非翻译区中还鉴定出有内含子存在。如在Ubiquitin基因、Sh基因、Actin基因、Ashl基因与Wx基因的5’非翻译区中均有内含子存在,且这些内含子都有增强基因表达的作用。
1.3 编码区
这是指从翻译起始密码列终止密码之间的一段区域,或者说是指这一区域中的所有外显子部分。
(1)Kozak比较了47种植物基因与植物病毒基因中翻译起始位点附近的23个核苷酸,除了一个基因例外,其余的都是从5’端的第一个AUG作为翻译起始密码子的。例外的是菜豆的凝集素基因,它的转录本5’端有4个AUG,但彼此的读码框不同。可能由于前面3个AUG的旁邻顺序不适宜核糖体的识别而不被使用,第4个AUG才是真正的翻译起始密码子。
(2)关于编码区外显子中4种核苷酸的比例,Murray统计了54种单子叶植物基因与3种双子叶植物基因,总结出单子叶植物基因的AU含量为54%,双子叶植物基因中AU含量为43%。主要的差别是发生在密码子的第3个碱基上,双子叶植物基因对A、U、C、G 4种碱基的选用机率基本相似,而单子叶植物基因则偏向于选择A与U。
(3)像其他真核基因一样,植物基因的编码区中也常有数目不等的内含子,而且有些编码区中的内含子也有增强基因表达的作用。
(4)有些真核基因中的一个外显子正好对应此基因所编码蛋白质中的一个结构域,因此有人推测在基因演化过程中,一个内含子可能会带着相邻的外显子在基因间飘移,从而构成由不同结构域组成的不同蛋白质分子
1.4 3’非翻译区
指转录本中终止密码子后面的一段顺序,这段顺序中也有一些调控元件,它们对mRNA的稳定性和翻译的效率均起重要的调节作用。
Angenon等分析了748种植物基因中围绕终止密码子的18个核苷酸顺序,总结出所有3种已知的终止密码子都能被植物基因用作翻译终止讯号,但使用的比例则因植物的不同而有差别。单子叶植物基因使用UGA作为终止密码的占46%,UAA与UAG的分别占28%与26%,而双子叶植物首选UAA占46%,而用UGA与UAG的分别为36%与18%,而琥珀密码子UAG选用的百分比最低。 在mRNA末端有1或2个加polyA信号,多数植物基因均为AAUAAA,有少数基因其中的个别核苷酸有不同