在大肠杆菌中进行异源蛋白质的表达时,有时会发现重组蛋白质的表达量很低,给后面的分离纯化造成很大的困难。有些技术人员可能比较困惑,表达的蛋白质不是毒蛋白,载体是商用载体,一般商用载体的启动子效率都很高,这也排除了转录水平低的问题。那为什么蛋白质表达水平还那么低,这种情况你就要考虑是不是密码子偏性的问题。
什么是密码子偏性呢?可以这么理解,宿主经过千百万年的进化,密码子与反密码子之间已经形成了一个平衡,有些密码子出现的频率高,其对应的tRNA水平也就高,密码子频率低对应的tRNA水平也就低。如果插入的外源基因上携带大量在宿主中频率很低的密码子,那么对应的tRNA就会出现不够用的情况,宿主首先要保证自身的蛋白质合成,剩下的才能用于异源蛋白质的合成,虽然宿主可以提高tRNA的水平,但对于异源蛋白质来说,合成的晚了或者慢了,就会引起翻译过程一系列的连锁减慢,合成的效率就会严重下降。
基于这一原理,要提高某一基因在异源宿主中的表达量,常用的策略之一就是将目的基因的稀有密码子进行同义替换,使之更接近于宿主细胞的密码子使用方式。通过这种方法,提高外源基因在大肠杆菌宿主中表达量的报道已有很多。
我硕士期间做的一个研究内容,以多粘类芽孢杆菌β-葡萄糖苷酶为例,分析了密码子偏性程度并提出密码子替换的方式。感兴趣的同学可以找到该文献看一看。
[2]Gustafsson C, Govindarajan S, Minshull J. Codon bias and heterologous protein expression[J]. Trends in biotechnology, 2004, 22(7): 346-353.
这是一篇密码子偏性与异源蛋白表达的综述,对密码子偏性理论,密码子优化方式,密码子优化成果做了总结,很有参考价值。
我这里制作了一个大肠杆菌所有密码子偏好的数据集,表中RSCU代表该密码子在所有同意密码子中的相对概率,计算方法为: [该密码子出现频率] / [同义密码子概率的和] × 同义密码子个数。可以根据密码子RSCU判断其偏性,进行密码子替换时,将RSCU值低的密码子替换成值高的密码子即可提高异源蛋白的表达量。
密码子 | 氨基酸 | RSCU | 密码子 | 氨基酸 | RSCU | 密码子 | 氨基酸 | RSCU | 密码子 | 氨基酸 | RSCU |
---|---|---|---|---|---|---|---|---|---|---|---|
UUU | Phe F | 1.15 | UCU | Ser S | 0.87 | UAU | Tyr Y | 1.14 | UGU | Cys C | 0.89 |
UUC | Phe F | 0.85 | UCC | Ser S | 0.89 | UAC | Tyr Y | 0.86 | UGC | Cys C | 1.11 |
UUA | Leu L | 0.78 | UCA | Ser S | 0.73 | UAA | Stop | 1.94 | UGA | Stop | 0.87 |
UUG | Leu L | 0.77 | UCG | Ser S | 0.93 | UAG | Stop | 0.19 | UGG | Trp W | 1.00 |
CUU | Leu L | 0.62 | CCU | Pro P | 0.63 | CAU | His H | 1.14 | CGU | Arg R | 2.28 |
CUC | Leu L | 0.63 | CCC | Pro P | 0.50 | CAC | His H | 0.86 | CGC | Arg R | 2.42 |
CUA | Leu L | 0.21 | CCA | Pro P | 0.76 | CAA | Gln Q | 0.69 | CGA | Arg R | 0.38 |
CUG | Leu L | 2.99 | CCG | Pro P | 2.11 | CAG | Gln Q | 1.31 | CGG | Arg R | 0.59 |
AUU | Ile I | 1.53 | ACU | Thr T | 0.66 | AAU | Asn N | 0.90 | AGU | Ser S | 0.90 |
AUC | Ile I | 1.26 | ACC | Thr T | 1.75 | AAC | Asn N | 1.10 | AGC | Ser S | 1.67 |
AUA | Ile I | 0.21 | ACA | Thr T | 0.51 | AAA | Lys K | 1.53 | AGA | Arg R | 0.22 |
AUG | Met M | 1.00 | ACG | Thr T | 1.07 | AAG | Lys K | 0.47 | AGG | Arg R | 0.12 |
GUU | Val V | 1.03 | GCU | Ala A | 0.64 | GAU | Asp D | 1.26 | GGU | Gly G | 1.35 |
GUC | Val V | 0.87 | GCC | Ala A | 1.08 | GAC | Asp D | 0.74 | GGC | Gly G | 1.62 |
GUA | Val V | 0.62 | GCA | Ala A | 0.85 | GAA | Glu E | 1.38 | GGA | Gly G | 0.43 |
GUG | Val V | 1.49 | GCG | Ala A | 1.43 | GAG | Glu E | 0.62 | GGG | Gly G | 0.60 |
同时,也给出两个做密码子优化的网页工具:OPTIMIZER 和 Jcat。Optimizer进行密码子优化时会考虑GC含量、密码子平衡(如果将全部低频密码子换成最高频密码子,会导致细菌表达压力过大,不利于自身生长,这也是不行的),还可行规避酶切位点,自己指定参考集等,功能强大,推荐使用该工具。Jcat简单粗暴,直接将低频密码子替换成高频密码子。如果你只有蛋白质序列可以使用我自己编写的一个工具:http://www.liuzhen106.com/tools/103_2.html。
什么进化压力导致了密码子使用偏性,还没有定论。一些研究者推断,密码子偏性能够减少同工tRNAs的多样性,一些稀有密码子的tRNAs含量较少,有利于生物在快速生长条件下节约部分能量,从而降低了新陈代谢负荷。不管是什么原因导致了密码子偏性,但密码子偏性对异源蛋白表达水平确有深远的影响。