摘要:
- 在生命的各个领域中,蛋白质都是由核糖体在翻译过程中合成的。翻译调节的幅度超过了转录、mRNA降解和蛋白质降解之和。因此,有必要在全局范围内对翻译进行研究。与其他“组学”方法一样,翻译组学研究翻译过程中的所有成分,包括但不限于翻译mRNAs、核糖体、tRNAs、调节性RNA和新生多肽链。近年来的技术进步在全球范围内对这些成分的研究取得了突破性进展,包括它们的组成和动力学。这些方法已被应用于越来越多的研究中,以揭示翻译控制的多个方面。翻译的过程并不局限于将mRNA编码序列转化为多肽链,它还以一种精细而敏感的方式控制蛋白质组的组成。因此,翻译组学在蛋白质组学、癌症研究、细菌应激反应、生物节律性和植物生物学等领域都具有独特的创新能力。翻译中的合理设计可以使重组蛋白的产量提高数千倍。本文综述了翻译组学的主要研究方法,着重介绍了该领域的最新发现,并介绍了翻译组学在基础生物学和生物医学研究中的应用。
本文关键词:translatomics
; RNC-mRNA
; translation regulation
; RNC-seq
; Ribo-seq
; polysome profiling
ORF:Open reading frame
RFP: Ribosome footprints, equivalent to ribosome protected fragments, RPFs
Ribo-seq: Ribosome profiling
RNC: Ribosome nascent-chain complex
RNC-mRNA: Translating mRNAs
RNC-seq: Full-length translating mRNA profiling
ROS: Reactive oxygen species
SSU: Small subunit of ribosome
TRAP-seq: Translating ribosome affinity purification sequencing
UTR: Untranslated regions of genes
1、介绍:
蛋白质执行生命中的各种生物功能,因此,它们处于微妙的控制之下。根据分子生物学的中心法则(描述基因信息从DNA经mRNA到蛋白质的流动),整个蛋白质组的产生包括四个主要的调控步骤:
RNA合成
(包括表观遗传和转录调控)、RNA降解
、蛋白质合成
(即翻译调控)和蛋白质降解
。随着当前组学技术的发展,数学模型和组学测量表明,翻译调节占所有调节幅度的一半以上,超过了所有其他调节的总和。因此,翻译调控是生物体中最重要的调控步骤。20世纪70年代以来,人们对翻译过程进行了大量的研究,但全球范围的研究是近几年才取得的成果。与全基因组的“基因组学”、所有转录本的“转录组学”、所有蛋白质的“蛋白质组学”一样,“翻译组学”一词被用来研究与翻译有关的所有元素。由于技术上的困难,
翻译组学
在一段时间内几乎没有受到重视。首先
,核酸和蛋白质都参与翻译的调节,增加了复杂性和翻译过程中涉及到的生物大分子的多样性。翻译组学研究需要多种组学工具和技能。第二
,翻译机制是非常复杂的,对环境和生理变化的反应需要在几分钟内对翻译机制进行快速和具体的适应,这使得实验具有挑战性。缺乏对翻译组学的研究表明,对遗传信息流动中最重要的调控步骤的理解存在很大的差距。近年来,翻译调控领域取得了持续的发展,使我们可以用综合的方法来研究翻译的特点。
2、翻译组学研究方法
- 翻译体的广义定义包括所有直接参与翻译过程的元件,如
待翻译的mRNAs
(也称为RNC-mRNAs)、核糖体
、tRNAs
、一些调节性RNA
(miRNA、lncRNA等。请注意,并不是所有的调节性RNA都参与翻译
)、新生的多肽链
和各种翻译因子
。通常术语“Translatome”代表翻译mRNA的整体
。在翻译组学研究中,RNA和蛋白质是两类主要的大分子。它们的静态成分和动态是由一个复杂而复杂的系统来调节的。对于翻译中涉及到的每一个元素,已经开发出了在全球范围内进行研究的具体方法。
2.1 对于正在翻译的mRNA的方法
- mRNA为蛋白质合成提供了蓝图。研究
正在翻译的mRNA
是翻译组学的首要任务。由于核糖体与mRNA的非共价结合,核糖体新生链复合物(RNC)
非常脆弱,在细胞裂解后易发生解离或降解。发展了几种重要和经典的方法来分析正在翻译mRNAs的不同特征:多聚体分析(polysome profiling)
、正在翻译的全长mRNA分析(RNC-seq)
、正在翻译核糖体亲和纯化(TRAP-seq)
和核糖体分析(Ribo-seq)
。这些方法的基本原理如图所示。
2.1.1. Polysome Profiling
20世纪60年代,在蔗糖梯度超速离心的基础上发展了
Polysome Profiling
。核糖体是大多数高密度细胞中最大的高分子机械。与较多核糖体结合的mRNA分子在蔗糖梯度中沉积较快。因此,蔗糖密度梯度离心后,游离RNA
和蛋白质
由于浓度的不同而漂浮在蔗糖梯度的顶端。将蔗糖溶液从底部缓慢泵入,可分离出与不同数量核糖体结合的mRNA。然后用Northern杂交
、微阵列
或RT-PCR
等方法对各组分中的mRNA进行分析,以反映转录本翻译的分布。该技术通常用于检测翻译中的大
的变化。例如,在高渗压力
下,单个核糖体的组成显著增加,在氧化应激
下,与单个mRNA结合的核糖体数量显著增加。值得注意的是,研究人员认为,活跃的翻译mRNA通常结合多个核糖体。然而,最近的研究表明,对于那些
结合单个核糖体的mRNAs来说,翻译是活跃的
。例如,在HEK293细胞和指数生长的大肠杆菌(E.coli)中,被认为在翻译中非常活跃的单体组分(原核生物的70S,真核生物的80S)占主导地位
。当单体部分被分离并转移到无细胞翻译系统时,核糖体可以恢复翻译并产生蛋白质。在酿酒酵母中,单体是延伸的,而不是起始的。短的开放阅读框架(ORF)
、快速翻译基因
和低丰度的mRNAs
倾向于在单体部分中富集。这些结果证明翻译活性与mRNA上的核糖体数量不成正比。polysome profiling
的主要缺点
是难以对所有翻译mRNA(RNC-mRNA)进行深入分析。由于蔗糖梯度的体积大,每个组分中RNC-mRNA的浓度都很低
,高浓度的蔗糖抑制了一些进一步的酶反应
。从蔗糖梯度中回收的RNC-mRNA的总量一般只够RT-PCR定量,但除非使用大量的起始材料,否则很难获得足够的mRNA用于全谱分析,如微阵列或RNA测序。
2.1.2. RNC-Seq
-
正在翻译mRNA全长测序(RNC-SEQ)
显示出独特的优势,有效地解决了这一问题。将细胞裂解物负载在30%
蔗糖垫上,超速离心分离所有与核糖体相关的翻译mRNA和游离mRNA及其他细胞成分
。超速离心可使RNC沉积。RNC-mRNA可从制粒的RNC中回收
,有效地避免了高浓度蔗糖的干扰,有利于下游研究。新一代RNC-mRNA测序技术揭示了翻译mRNAs的全长信息
,包括mRNAs的丰度
和类型
。通过优化离心和蔗糖缓冲液,RNC的回收率可达90%,在适当的缓冲液条件下,RNC仍保持翻译活性
。RNC-SEQ的技术难点在于完整的RNC的分离
。RNC的脆弱性
导致核糖体的解离和mRNA的断裂/降解,从而导致RNC-mRNAs的偏倚分析
。
2.1.3. Ribo-Seq
核糖体图谱(Ribo-seq),由Ingolia等人
2009
年Science上首次发表。从另一个角度研究翻译。用低浓度的核糖核酸酶(RNase)
处理细胞裂解物,使mRNA降解
,但核糖体保护的RNA片段除外
。然后,用下一代测序(NGS)分析22-35 nt
的mRNA片段(即核糖体足迹:RFPs),相当于核糖体保护片段(RPFS),以揭示核糖体的位置和密度。基于位置信息、核糖体在每个转录本上的分布和密度,可以推断出诸如起始密码子位置(包括非ATG起始
)、密码子使用偏差、上游ORFs(uORFs
)和翻译暂停景观等信息。这些方面不能用其他翻译方法来研究。2016年,发展了一种优化的Ribo-seq方法
-超分辨率核糖体剖面分析(super-resolution ribosome profiling
),该方法能够在单个转录本
中观察到强大的全局的3nt周期性
。此外,这种方法提高了Ribo-seq揭示小ORF(sORFs)
和未注释的新编码区
的能力,可能编码来自注释的非编码RNA
和假基因的蛋白质
。核糖体图谱中使用的核糖核酸酶(Ribonuclease)也被考虑在内,发现核糖核酸酶T1(RibonucleaseT1)是最能保持核糖体完整性的酶,同时也能将多聚体转化为单核小体。Ribo-seq的一种变体是翻译复杂轮廓排序(translation complex profile sequencing:TCP-seq)
。用甲醛
交联快冷酵母细胞,使其与mRNA的翻译复合物在其天然位置停滞,然后对其进行RNase消化
。然后用蔗糖梯度超速离心
分离全核糖体和小亚基(SSU)
,并对这些片段上长达250nt
的RNA片段进行测序,分别在翻译的起始阶段、延伸阶段和终止阶段
得到自然分布的图谱。该方法能够观察mRNA的5'非翻译区(UTR)
上的SSU足迹,并捕捉任何类型的核糖体-mRNA复合体
在翻译的各个阶段的位置。然而,
Ribo-seq
实验复杂又昂贵的。与RNC-SEQ
相比,它需要大量的细胞作为起始材料。由于所有物种的Ribo-seq都需要基于杂交的rRNA耗竭,Ribo-seq通常仅限于几种模式生物。对于许多其他物种,尤其是种类繁多的细菌,Ribo-seq由于缺乏rRNA探针而难以执行
,而rRNA探针的昂贵定制似乎是唯一的选择。许多其他因素影响RFP的数量,例如伪RPF
。由于Ribo-seq
主要分析编码序列(CDS),其中核糖体与mRNA结合。与翻译调节高度相关的非翻译区(UTR)不能被有效地分析
。此外,Ribo-seq经常生成许多被比对到非编码RNA的“RFP”,这表明相当大的假阳性率。另一个缺点是
RFP长度短
(原核生物为24~26 nt,真核生物为28~30 nt),受核糖体大小的限制,不能进一步延伸。为了获得中等丰度
的mRNAs的足够覆盖范围,需要扩大测序量(通常每个样本的reads数超过1亿
),这意味着测序和计算成本很高。尽管如此,许多翻译事件,特别是剪接变体
和环状RNA的剪接
连接仍然很难被覆盖。拼接比对算法在这些短读取中检测连接点的效果较差。相反,全长的RNC-seq
序列是整个mRNA的序列;因此,较长的读数长度是适用的
。较长的reads
导致几乎完全覆盖大多数翻译mRNA,包括低丰度的mRNA。这样就可以有效地检测和量化连接,例如,翻译BDP1和BRF1的各种剪接变体以及翻译循环RNA CircLINC-PINT,这些使用Ribo-seq几乎是不现实的。值得强调的是,
RFP的密度
并不代表翻译活性。RFP密度与平移起始率成正比
,与延伸率成反比
。如果翻译完全停滞在某一mRNA上,则RFP将在该mRNA中高度富集,但翻译活性为零
。
2.1.4. TRAP-Seq
-
Inada
等人报道了核糖体亲和纯化
(Ribosome affinity purification: RAP)或翻译RAP
(translating RAP: TRAP)。利用在组织特异性启动子
和融合亲和标签
(如多组氨酸
、绿色荧光蛋白(GFP)
等)控制下产生的大核糖体亚基蛋白Rp25p
。在C末端
。然后,这些核糖体被亲和纯化((beads or columns
),从其他细胞类型的核糖体中分离出来。TRAP-SEQ
在难以分离的样品中特异性地富集RNC-mRNA,而且TRAP-SEQ
所分离的核糖体不可能被与核糖体共沉淀的非核糖体mRNPs污染
,因为TRAP-SEQ
不使用超离心。TRAP-SEQ
在复杂组织中从特定细胞类型中分离翻译mRNA有其独特的优势。然而,TRAP-seq
需要一个稳定转染的细胞系来产生标记的核糖体蛋白。当应用于植物和动物时,构建稳定的转基因生物是必然的。这既费时又费钱,而且不适用于
尚未建立稳定转化方法的物种。此外,标记核糖体蛋白的过量生产有可能改变这些核糖体的结构和性质。因此,该系统不再处于生理条件下;在将所有结论应用于一般情景之前,应仔细评估所有结论。