转座元件

转座子(transposable element,TE、转座子或跳跃基因)是 DNA 中的一个核酸序列,它可以改变自己在基因组中的位置,有时会产生或逆转突变,改变细胞的基因特性和基因组大小。转座常常导致同一种遗传物质的复制。在人类基因组中,L1和 Alu 元素是两个例子。芭芭拉·麦克林托克的发现为她赢得了1983年的诺贝尔奖。它在个体化医学中的重要性正变得越来越相关,并且在数据分析中得到越来越多的关注,因为在非常高维的空间中很难进行分析。

转座因子构成了基因组的很大一部分,并且在真核细胞中负责大量的 DNA。尽管 TE 是自私的遗传因素,但许多在基因组功能和进化中都很重要。转座子对研究人员来说也是非常有用的,可以用来改变生物体内的 DNA。

至少有两类 TE: I 类 TE 或逆转录转座子通常通过逆转录起作用,而 II 类 TE 或 DNA 转座子编码蛋白质转座酶,这是它们插入和切除所需的,并且其中一些 TE 也编码其他蛋白质。

芭芭拉·麦克林托克发现

芭芭拉·麦克林托克在纽约的冷泉港实验室发现了首批玉米中的 TE。麦克林托克正在用染色体断裂的玉米植株做实验。

在1944-1945年的冬天,麦克林托克种植了自花授粉的玉米粒,这意味着花朵的丝从自己的花药接受花粉。这些籽粒来自一长串自花授粉的植物,它们的第九条染色体末端有断裂。随着玉米植株开始生长,麦克林托克注意到了叶子上不寻常的颜色模式。例如,一片叶子上有两个大小几乎相同的白化斑块,并排坐落在叶子上。麦克林托克假设,在细胞分裂过程中,某些细胞丢失了遗传物质,而其他细胞得到了它们丢失的东西。然而,当比较当代植物和父代植物的染色体时,她发现染色体的某些部分已经改变了位置。这驳斥了当时流行的基因理论,即基因在染色体上的位置是固定的。麦克林托克发现,基因不仅可以移动,而且由于某些环境条件或在细胞发育的不同阶段,基因也可以打开或关闭。

分类

转座因子代表几种类型的可移动遗传因子之一。根据它们的转换机制,TE 分成两种,分别是为复制和粘贴型(I 类 TE)剪切和粘贴型(II 类 TE)

逆转录转座子(Retrotransposon):复制粘贴

I 类 TEs 的复制分为两个阶段: 首先,它们从 DNA 转录成 RNA,然后产生的 RNA 反转录成 DNA。然后,这个复制的 DNA 被插入到基因组中的一个新位置。

逆转录步骤是由一个逆转录酶催化的,通常是由 TE 自己编码的。逆转录转座子的特性类似于逆转录病毒,例如 HIV。

反转录转座子通常分为三类:

  • 逆转录转座子(Retrotransposons):具有长末端重复序列(lTRs) ,编码逆转录酶,类似于逆转录病毒
  • 反转录子(Retroposons),长散布核元件( long interspersed nuclear elements,LINEs,LINE-1s,或 L1s) ,编码逆转录酶但缺乏长链反转录酶,并被 RNA聚合酶Ⅱ转录
  • 短散布核元件(Short interspersed nuclear elements,sINEs):不编码逆转录酶,而是由 RNA 聚合酶 III 转录

逆转录病毒也可以被认为是 TE。例如,逆转录病毒 RNA 转化为宿主细胞内的 DNA 后,新产生的逆转录病毒 DNA 被整合到宿主细胞的基因组中。这些整合的 DNA 被称为前病毒。原病毒是真核生物逆转录转座子的一种特殊形式,它可以产生可能离开宿主细胞并感染其他细胞的 RNA 中间体。逆转录病毒的转座周期与原核生物的转座周期有相似之处,表明二者之间存在着遥远的关系。

image.png

DNA 转座子:剪切粘贴

II 类 TE 的剪切-粘贴转位机制不涉及 RNA 中间体。转位是由几种转座酶催化的。一些转座酶不特异性结合 DNA 中的任何靶位点,而另一些转座酶则与特异性靶序列结合。

转座酶在目标位点进行交错切割,产生粘性末端,切除 DNA 转座子并将其连接到目标位点。DNA 聚合酶填补了粘性末端的空隙,DNA 连接酶关闭了磷酸糖骨架。

这导致靶位点重复,并且 DNA 转座子的插入位点可以通过短直接重复(由 DNA 聚合酶填充的靶 DNA 的交错切口)随后的反向重复(这对于转座酶的 TE 切除是重要的)来鉴定。

如果 TEs 转位发生在细胞周期的 S 期,当供体位点已经被复制但目标位点尚未被复制时,剪贴 TEs 可能被复制。目标位点的这种复制可能导致基因重复,这在基因组进化中起着重要作用。

II 类 TEs 占人类基因组的比例不到2% ,其余的为 I 类。

自主及非自主的移位

在第一类和第二类TE中,移位可以分为“自主的”和“非自主的”。自主的 TE 可以自行移动,而非自主的 TE 则需要另一个 TE 的存在才能移动。这通常是因为依赖性 TE 缺乏转座酶(对于 II 类)或逆转录酶(对于 I 类)。

激活元件(Activator element,Ac)是自主 TE 的一个例子,而解离元件(dissociation elements,Ds)是非自主 TE 的一个例子。没有Ac,Ds就不能转位。

image.png

第三类元件

一些研究人员还确定了第三类转座因子,这种转座因子被描述为“一个由转座因子组成的抓包,这些转座因子显然不适合另外两类转座因子”。
这类转座因子的例子包括黑腹果蝇的折叠(FB)元件、紫海胆的 TU 元件和微型反向重复转座因子。

分布

大约64% 的玉米基因组是由 TEs 组成的,44% 的人类基因组是由 TEs 组成的,几乎一半的小鼠基因组是由 TEs 组成的。

转座元件的新发现显示了 TEs 在转录起始位点(TSSs)和增强子中的确切分布。最近的一项研究发现,启动子包含25% 的含有 TEs 的区域。目前为止,在 TSS 位置没有发现较老的 TE,因为只有距离 TSS 有一段距离,TE 才开始发挥功能。一个可能的理论是,TEs 可能干扰转录导致暂停或第一时间介入剪接。如前所述,TSS 位置关闭的 TE 的存在与其进化年龄(TEs 在此期间可发生的不同突变的数量)相关。

负面影响

转座子已经与真核生物共存了数千年,并且通过它们的共存已经整合到许多生物的基因组中。通俗地说就是“跳跃基因”,转座子可以在基因组内部和不同的基因组之间移动。

虽然转座子在宿主真核生物基因组中有许多积极的作用,也有一些实例表明 TE 对基因组具有诱变作用,导致疾病和恶性遗传改变/

诱变机制

TEs 是一种诱变剂,对形成新的些元件与活细胞中发现的许多转录因子相连的顺式调控 DNA 元件的有着很大的作用; TEs 可以经历许多进化突变和改变。这些通常是遗传疾病的原因,并给异位表达的潜在致命影响

TEs 可以通过不同的方式破坏宿主细胞的基因组:
1.将自身插入功能性基因的转座子或逆转座子可以使该基因失去功能。
2.在 DNA 转座子离开基因后,由此产生的缺口可能无法正确修复。
3.同一序列的多个拷贝,如 Alu 序列,可能会阻碍有丝分裂和减数分裂过程中精确的染色体配对,导致不平等的交叉,这是染色体复制的主要原因之一。

TEs 使用许多不同的机制来引起宿主基因组的遗传不稳定性和疾病:

  1. 抑制正常细胞功能的致病、破坏性蛋白质的表达
  2. 许多 TE 含有启动子,它们驱动自身转座酶的转录。这些启动子可以引起连锁基因的异常表达,导致疾病或突变表型。

转座子分类与转座子结构。

(A)分类法基于多种分类方案和转座子数据库使用的分类法。(B)自主的、转座能力强的转座子具有特征性的结构和蛋白质特征,这取决于它们的类别。这些蛋白质是转座子通过类别特异性转座机制运动所必需的。结构特征和蛋白质特征是不同转座子类和子类的特征的完全自主转座子的 x 标记。(x)标记不需要但如果存在的特征是指示性的。

image.png

TransposonUltimate: software for transposon classification, annotation and detection | Nucleic Acids Research | Oxford Academic (oup.com)

分析软件

image.png

基因组转座元件及其生信分析工具 - 简书 (jianshu.com)

Transposable element - Wikipedia

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容