密码子优化涉及的优化点可以从基因合成、载体构建、基因转录、mRNA翻译、翻译后修饰等过程中提取,目的只有一个,就是便于相关过程的高效达成。以下内容将详细列举优化参数,并对关键参数进行概括描述。
1 全基因合成:平衡GC含量,正反向重复序列,二级结构
2表达载体构建:目标基因上下文,酶切位点
3基因转录:平衡GC含量平衡CpG岛,SD序列, Kozak序列,TATA框, Chi位点 ,终止信号
隐蔽剪切位点。
4 mRNA翻译及折叠
密码子偏好性,GC含量, polyA位点信号,mRNA二级结,mRNA自由能核糖体绑定位点
特定功能的Motif
许多motif在基因表达过程中承担着重要的角色,随着研究的不断开展,功能性
motif也在不断被发现,我们会将其不断地添加到南京德泰生物的密码子优化工具中。举例如下:
TATA框:
是构成真核生物的启动子元件之一,位于转录起始点上游-30bp处,它可以保证转录的正确定位
SD序列: 作为原核表达的核糖体绑定位点,是翻译必不可少的信号。
Kozak序列:真核生物中符合Kozak规则的基因,其转录及翻译效率较好。
Chi序列:在原核生物中能够增加自然重组的几率,可能会影响人工重组蛋白的表达隐蔽剪切位点:真核生物中存在大量的隐蔽剪切位点(cryptic splice sites),一旦被激活,会造成mRNA的剪接偏离我们的预期。
重复序列:重复序列过多,会增加基因合成的难度。反向互补序列也对
mRNA二级结构有重要影响。
GC含量
相对于AT配对需要2个氢键,GC配对是3个氢键,GC含量直接影响着
PCR退火温度。在启动子等保守区域GC含量相对较高。GC含量也影响着
mRNA热力学稳定性及mRNA二级结构。
mRNA二级结构
mRNA二级结构是影响翻译过程的重要因素,复杂稳定的二级结构会阻碍翻译过程的顺利进行,特别是核糖体绑定位点(RBS)附近的二级结构。mRNA的二级结构预测是一个复杂的过程,需要考虑碱基配对、自由能等多种因素,南京德泰生物的密码子优化系统可以快速有效识别发卡(Hairpin)结构区并进行有效规避。
密码子偏好性
不同物种的种属之间,对同义密码子的使用频率是不同的。在外源基因的同义密码子使用频率与表达宿主相匹配的情况下,外源基因的表达水平会显著提高。常用密码子适应指数(Codon Adaption Index)来表示。
限制性酶切位点
限制性酶切位点需要根据实际情况进行排除,以免与需要用到的酶切位点产生冲突,
影响重组基因的操作。