基因组结构与植物和动物的物种形成

基因组结构与植物和动物的物种形成

关于物种形成的特定主题已有大量研究,但令人惊讶的是,将不同生物类群的物种形成模式和过程进行比较的论文却寥寥无几。在本综述中,作者部分填补了这一空白,探讨基因组结构的差异如何影响植物和动物界的物种形成。首先,作者简要总结了关于这些类群物种形成的已有认识;值得注意的是,植物的分化率约为动物的两倍,并且植物的物种隔离壁垒可能在分化的早期阶段就已形成。接着,作者讨论植物与动物基因组演化方式的几个主要差异,以及它们如何影响生殖隔离壁垒的演化,进而可能影响物种形成率。关键差异包括:(1)植物中全基因组复制(WGD)发生频率更高,且基因共同区保存性衰减更快;(2)动物中性染色体存在率更高,分化程度更强;(3)动物线粒体基因组的序列变异率更高,但结构演化速率低于植物;(4)植物基因组中转座子(TEs)的丰度通常更高。总体而言,植物基因组在结构上比动物迅速分化(尽管有许多例外),这可能促成了植物中更快的基因流隔离壁垒的出现。然而,作者也发现,在不同界之间进行基因组演化比较时,方法和结构演化速率指标的不一致阻碍了分析。另一个主题是:每一界内部的基因组结构变异巨大。尽管这种变异使得广泛概括更加复杂,却也为将基因组结构差异与物种形成的模式和过程联系起来的强大比较分析提供了可能。

引言

我们对生物学的理解在很大程度上依赖于模式生物研究,这些模式生物因易于培养和操作、世代短、繁殖力强而被选中。选择这些生物进行研究的基本逻辑是:在模式物种中发现的规律可以推广到与其亲缘关系较近或具有相似遗传、发育或性系统的其他生物身上。这一策略在阐明分子、生物细胞及发育生物学的基本原理和机制方面取得了卓越成果。但经典模式生物(如大肠杆菌、酿酒酵母、秀丽隐杆线虫、果蝇、斑马鱼、小鼠和拟南芥)在生态学和进化生物学方面的影响力则相对有限。这是因为它们虽然适合作为分子生物学或细胞生物学的模式,却并不能全面代表生物多样性。这一局限性在研究适应性辐射、物种形成等复杂过程时尤为明显,促使生态与进化模式系统的发展。在植物界,典型系统包括猴面花属植物、千里光属、向日葵及其野生亲缘种、番茄和水稻。在动物中,三刺棘胸鱼、达尔文雀、小鼠和蝴蝶等研究为我们对物种形成的理解做出了重要贡献。

尽管这种进化模式的扩展提供了生态与遗传基础的新见解,但研究偏向那些易于培养、世代短且起源自温带地区的生物。然而,随着高通量测序与计算生物学的兴起,这一局面正在被改变,几乎任何生物类群的基因组分化与物种形成过程都能被研究。因此,现在有可能对主要谱系间的物种形成模式进行广泛推断。同时,我们已掌握了足够数量的高质量参考序列,覆盖生命之树各支系,从而可以鉴定进化过程中出现的基因组差异,并将它们与生殖隔离障碍的发展及物种形成的大趋势联系起来。

本篇综述旨在探讨植物与动物基因组的结构、大小与内容如何影响生殖隔离与物种形成。由于篇幅限制,作者未涉猎其他生物类群,但这样的更广泛调查同样值得深入研究。首先,作者重点指出植物与动物物种形成模式的主要差异;接着,作者描述两界间以及其内部基因组结构的差异,并尝试将其与物种形成的模式与过程联系起来。最后,讨论进行关键实验证据所需的数据与研究策略。

植物与动物的物种形成模式

迄今为止,大多数关于物种形成的讨论集中于特定问题,如生态选择、杂交、强化或杂交不相容性的形成,亦或是在某一类群中的模式与过程研究。也有一些优秀的专著,从更广义角度探讨物种形成。然而,将不同生物组进行比较以研究物种形成模式的论文却寥寥无几。以下列举其中涉及植物与动物界的若干广泛差异:

分化率:Scholl 与 Wiens(2016)通过对生命树的研究表明,植物(0.028/Myr)的分化率(物种形成率减灭绝率)约为动物(0.014/Myr)的两倍,这主要归因于开花植物(0.033/Myr)的高分化速度。

Monnett 等(2025)研究发现,植物物种隔离壁垒形成于net divergence ≈0.2%,而动物约为0.6%。这表明植物可能存在较高物种形成率,但也可能因植物移动性差等其他因素所致。

杂交频率:Mallet(2005)估算:至少25%的植物物种和10%的动物物种存在杂交和基因渗入,这一比例与基于基因组的研究相一致。鱼类动物中基因渗入率最高。尽管植物的物种形成率与杂交率均较高,但这也可能是因物种通常以表型差异来描述,年轻物种更具杂交潜力。

多倍体育种形成率:Wood 等(2009)使用系统发育与细胞数据估计:开花植物约15%、蕨类约31%的物种形成事件伴随倍性变化;Mayrose 等(2011)将结果校正后,开花植物和蕨类的多倍体育种形成率分别为29.7%、38.7%。动物中,多倍体育种形成率远低于植物,估计 <1% 至 3.9%。哺乳动物和鸟类几乎无多倍体育种现象。

地理格局:Hernández‑Hernández 等(2021)发现,异域隔离(allopatric)在动物中约占58%,在植物中约为30%,表明植物中伴随基因流的物种形成更为常见。

生殖屏障类型:生态分歧驱动物种形成在植物(65%–80%)和动物(昆虫80%、有鳞类动物80%、海洋软体动物62%)两界普遍存在。合子前隔离(prezygotic)比合子后隔离(postzygotic)形成速度更快。某些障碍类型具有界特异性,例如植物的传粉障碍和动物的行为障碍。


基因组结构变异及其对物种形成的影响

本节分析植物与动物基因组结构的主要差异,并探讨这些差异如何促成生殖隔离与物种形成模式。

基因组复制(WGD)

古老的多倍体育种在植物中比动物更为普遍。据“千种植物转录组计划”报道,植物分化历程中发生了240多次古老WGD,而动物中约有不到30次。具体而言:

所有开花植物均至少经历过两次古老WGD,多数达3–5次;裸子植物有1–2次;蕨类有2–5次,而许多藻类则看来没有WGD记录。

兽类(脊椎动物)共有两次古老WGD,此外硬骨鱼、鲑鱼类和鲟鱼及矛尾鱼祖先中也存在WGD事件。但哺乳动物与鸟类未发现古老WGD。

无脊椎动物中,蛛形纲、蝎子等并无明确WGD证据,但马蹄蟹、陆生腹足纲软体动物中已有发现。节肢动物(昆虫)中也发现 14 目共18次 WGD。这反映出鉴定古老WGD本身存在挑战。

WGD 不仅能立即形成生殖隔离,还能引发表达基因数目变化、基因剂量效应、共同区演化速率改变,以及杂交不相容性等下游影响。这些因素可能解释植物与动物物种形成模式与速度的差异。例如,更高的植物多倍体育种形成率可能直接推动其分化速度更快。但这里作者更关注 WGD 在后续基因组影响中的作用。

一种可能机制是“重复基因的分歧解析”。当重复基因在不同地理隔离群体中分别丢失或发生分化时,会导致杂交后代功能缺失,从而产生不育或不可育性。这种模式与 Bateson–Dobzhansky–Muller(BDM)不相容性模式相似,但避免了穿越适应性的“谷”。


目前已有至少八个植物例子表明,杂交不相容性似乎是通过这一机制产生的。其中五个涉及功能丧失突变,两个依赖于表观遗传沉默,另一个同时涉及这两种机制。与植物的情况相比,作者只知道两个动物中的例子:一个在果蝇中,另一个出现在剑尾鱼中。尽管这些例子有些重复基因是通过复制转座或其他过程产生的,但全基因组重复(WGD)显然是植物中基因复制数多于动物的主要原因,因此在此重点讨论。

那么,这一机制是否导致更高的物种形成率?Muir 和 Hahn(2015)对宏观进化时间尺度上的重复基因分歧解析驱动物种形成进行了建模,发现加速物种形成的条件十分严格。这些条件包括:奠基种群中存在大量基因复制体(或亚功能);同域种群迅速转变为异域种群;分化群体之间几乎完全中断基因流。后两者在不同类群中具有高度特异性,这或许部分解释了全基因组复制对不同类群及不同时间段物种形成率影响不一致的现象。尽管如此,这一过程在自交谱系中特别有效;自交减少基因流并增强遗传漂变作用,从而被动丢失基因复制体。值得注意的是,前段提到的所有植物例子都至少涉及一个自交谱系,并且杂交不育屏障在自交植物物种中似乎比在异交植物中进化更快。对假基因的选择(例如避免产生非功能性或有毒蛋白)为加速这一过程提供了另一种解释,并使其对基因流的敏感性降低。有趣的是,两个动物例子都出现在具有大有效种群量的异交物种中,因此选择可能是这些谱系中重复基因分歧解析的主要驱动力。

对比分析显示,在较短(属级)时间尺度上,植物的多倍体育种谱系比二倍体谱系有较低的物种形成率和更高的灭绝率(即更高的替换速率)。然而,在科或目级别,趋势则相反——全基因组复制与更高的分化率相关,这表明自 WGD 发生以后,其净效应会从负面转为正面。这一现象催生了“时间滞后假说”,即多倍体的一些积极影响要在 WGD 之后很长时间才显现。在鱼类中,对科级水平的分析表明,在鲟科和鳅科中多倍体与分化率无明显关联,但在鲤形目鱼类亚科中多倍体与更高分化率相关。然而,许多研究者推测,除了重复基因分歧解析外,还有其他因素可能解释 WGD 在更长时间尺度上对分化率的积极影响。这些因素包括:共同区演化速率提高、重复基因的新功能化、生态位演化加速、通过多倍体实现的快速物种形成途径,以及重复基因组所提供的冗余或缓冲效应使物种在环境压力下更具韧性。后者被认为是降低大灭绝时期灭绝率的一种途径。

染色体组型(核型)演化

植物的染色体核型演化速度远高于动物。部分原因是全基因组复制加速了 synteny(共线性)的变革。WGD 后,物种通常经历再二倍化过程,包括恢复双价染色体配对、基因与染色体丢失以及染色体重排。结果是,动物基因在共线块中的保守程度高于植物。例如,Murat 等(2012)估计,在脊椎动物中,约有一半基因在超过 5000 万年前的分化后仍保持严格共线,而植物则仅有 10%–20%。Schranz(2019)在起源于约 1.7 亿年前的哺乳动物与开花植物中进行对比,发现前者大多为单拷贝且高度保守,而后者则存在多拷贝与谱系特异分布(可参见图 2)。


无脊椎动物中的共线性保守性甚至更强。当然,也存在例外,如某些被囊动物中,多数其他后生动物中保存的基因连锁已丧失。植物也有例外,例如蕨类和石松类尽管频繁经历 WGD,但共线性演化率依旧较低;这可能归因于它们的对称减数分裂机制,其中所有减数分裂产物都能存活,因此缺乏中心粒偏向传输驱动。相比之下,动物与异孢植物具有不对称的减数分裂,仅有一份配子发育为卵细胞。

染色体裂分与融合

与植物(25%–31%)和动物(29%)相比,约有相似比例的物种形成事件伴随染色体数目变化。然而,在植物中,染色体数目变化最常见的原因是全基因组复制(WGD)和染色体融合;而在动物中,裂分与融合的发生频率大致相等。染色体的裂分与融合可阻碍基因流:不同染色体数目的个体杂交可能导致后代生育力或重组能力下降。尽管这种影响通常比其他染色体重排方式更温和,但若涉及性染色体,则例外可能更为显著。

Zhan 等(2021)报告指出,在开花植物中,染色体数目微变(通过少数染色体变化)与物种分化率的提高相关,尽管效果小于 WGD。更有意思的是,染色体融合对植物分化率的促进作用比裂分更强,这可能与 WGD 后的再二倍化过程有关。与新近多倍体不同,发生染色体微变的谱系并未显示出较高的灭绝率,从而呈现出独特的宏观进化模式。

在动物中,染色体数目演化与哺乳动物和鳞翅目的物种形成率增加呈正相关。在蝴蝶中,分岔性变化主要与染色体裂分相关,且在较年轻的分支中影响更显著。一项结合染色体微变及其他核型变化的爬行动物研究发现,多条谱系的核型变化与物种丰富度呈正相关。

尽管两界中染色体微变的频率相似,但每一界内部率的变化很大。在植物中,莎草科速率极高,这可能与其具有全着丝粒染色体有关,其中着丝点功能分布于整条染色体上。然而,在昆虫中,研究未发现全着丝粒与单一着丝粒类群在染色体数目演化速率上存在差异,Márquez‑Corro(2018)也未发现植物与动物中全/单着丝粒谱系在多样性速率上有显著区别。

倒位(Inversions)

植物与动物在倒位频率上没有明显差异。不过,由于基因组测序质量和研究中报告的倒位大小范围不一致,直接比较不同类群中的倒位置固定速率仍具挑战性。

一项研究估计开花植物每百万代会积累 4–25 个长度超过 1 kb 的倒位。在水稻及其野生亲缘种群中,这一速率更高,达 45–619 个/百万年。令人意外的是,Hirabayashi 和 Owens(2023)未能检测出分歧时间与倒位积累间的显著相关性,这可能是因不同谱系在种群结构、选择和突变方面表现出高度差异性。

大猩猩类的倒位固定速率(约 7 个倒位/百万年)与植物相当,但比猫科约高十倍。在果蝇中,大型倒位(>3 Mb)固定率为 5.2/百万年,与早期估计一致,但不同谱系之间速率差异可达 30 倍。

动物性染色体上的倒位常见于昆虫、有袋类和鸟类,其频率高于常染色体,且在物种内常为固定态而非多态态。性染色体倒位降低了此区段的基因渗入率,强化了性染色体在物种形成中的重要作用。

有关物种内同源倒位多态的数据同样丰富。基于群体基因组、长读长与 Hi‑C 技术的研究表明,鹿鼠检测到约 21 个倒位,向日葵三种检测到约 35 个,中华滨螺检测到18个,海藻蝇检出7个。

尽管大型倒位可导致重组子代携带重复和缺失,理论上可能使生育力最多下降 50%,小倒位因涉区域较小、重要基因少而影响较弱,但多数实证研究表明大多数倒位对生育力影响轻微或几乎无影响,可能是由于倒位环路成对失败或非重组染色体偏向卵细胞。

倒位作为重组抑制因子在伴有基因流的物种形成中作用突出。机制包括:

在自然选择分歧和配型机制之间建立连锁不平衡;

防止既存 BDM 障碍丧失并促进新障碍积累;

避免共选基因组合解体,从而强化局域适应。局域适应通常被视为物种形成的第一步,倒位由此在物种形成中广泛发挥作用。

比较研究指出,倒位在旁带或邻近地理谱系形成中同样关键。鸟类中,物种间倒位数与地理重叠相关;植物中,杂交系群倒位固定率更高。这些结果一致支持倒位在伴基因流物种形成中的作用。

染色体易位(Translocations)

在植物中,染色体易位的速率远高于动物,但对比存在挑战,部分原因是易位在基因组组装中不如裂分/融合或倒位明显,随着长读长与 Hi‑C 技术的广泛应用,这一问题正逐步改善。此外,复制转座相关的可复制易位机制也使易位的鉴定复杂化,同样因报告的大小与类型标准不统一而难以比较速率。

在辣椒与番茄、马铃薯基因组比较中,易位速率分别为 30.6 和 21.4 个/百万年,略高于它们各自的倒位速率(23.4 与 18.4 个/百万年)。棉花中的易位速率更高(至 86 个/百万年),在近缘植物种之间的大块易位也被频繁报道。

动物中,染色体易位并不常见,通常作为与杂合相关的有害多态性存在。不过,在长臂猿、非洲侏儒鼠和线虫等动物谱系中,易位曾推动核型快速演化。线虫中的易位速率估计为 4.1–9.7 个/百万年,接近植物中报道的速率,但属例外。相比之下,比对分化超过 2 亿年的龟与鸡基因组,未发现互易易位,仅发现两次融合(可算作易位)。类群祖核型重建显示,鸟类进化中仅一次裂分,无互易易位;人类、树懒和牛的祖先谱系进化也未见易位,仅少量裂分/融合。

大型易位通常具有强烈的劣势,即杂合易位者约有 50% 配子带有重复或缺失。当易位较小或涉及对称性结构(如中着丝粒染色体)时,平衡配子的产出相对较高,劣势减弱。

尽管其建立机制尚未完全明了,研究表明在猴面花等植物中,对易位杂合体进行基因组加倍可消除其杂交不育,从而显示结构性原因优于基因性原因。由于重组仅在易位断点附近被抑制,捕获局域适应基因并不太可能解释强劣势易位的建立。加上在具有较大的有效种群的异交植物中也发现高易位率,这削弱了自交与遗传漂变在易位建立中的普遍作用。最新研究表明,减数分裂偏差可能助力易位建立,尽管为何动物中的情况不如植物频繁仍是谜。

性染色体

关于性染色体在物种形成中的作用已有广泛综述。在此,作者聚焦新兴理论与数据可能带来的新见解,并对比植物与动物性染色体在物种形成中的作用。

性染色体是一对决定雌雄配子类型的小型染色体,在动物和陆地植物中多次独立演化。在表达为二倍体阶段的系统中,主要有雄性异配系统(XX 雌/XY 雄)和雌性异配系统(ZW 雌/ZZ 雄),两类均存在于动植物中。为简便,作者主要讨论雄性异配系统,但许多模式也适用于雌性异配系统。在植物中,苔藓类植物在单倍体阶段表达性别,拥有 U(雌)或 V(雄)染色体,二倍体阶段均为 UV。尽管 UV 系统在考察性染色体作用上具有独特价值,目前相关研究仍很稀少,故作者将讨论范围限于具有 XY 或 ZW 系统的植物。

大多数物种的 X 与 Y 曾为同源染色体,在两者间重组停止后开始分化。除准常染色体区外,Y 上重组中断导致选择效率下降,许多 Y 染色体上的基因遭到序列或调控退化,使雄性中 X 相关基因呈现单倍状态。

然而,X–Y 之间重组抑制的程度及 Y 染色体的退化程度差异很大,导致性染色体在大小或基因含量上可能相似(同型)或差异显著(异型)。此前人们认为 X–Y 的分歧与年龄密切相关——Y 会不可避免地退化并异化。然而,现今研究表明这一趋势与时间往往无关:一些谱系快速分化,另一些则保持长时间的同型状态。因此不同物种,即使是近亲,也可能在 X 染色体单倍性比例和性染色体异型性上表现差异。这种多样性对于评估性染色体参与物种形成机制至关重要。

性染色体与两大物种形成法则

性染色体与两条关键的物种形成规律相关联:

哈尔丹法则(Haldane’s Rule)指出,如果某一个性别在杂交 F1 后代中“缺失、稀有或不育”,则通常是异配性别(XY)一方。这一内在杂交不相容性可能加速具有性染色体谱系的物种形成,并减少基因渗入。这主要被解释为雄性中 X 的单倍状态与基因组其他部分的相互作用所致,尽管也有其他机制提出。

性染色体剂量补偿机制也被认为与哈尔丹法则相关,但鲜有实证检测。X 染色体剂量补偿要求大范围染色体区域进行性别与染色体特异性调控,若错误表达可能致死。XY 杂交后代中剂量补偿机制异常已被用于解释哈尔丹法则。X 剂量补偿的机制在不同物种间差异巨大——有些只补偿剂量敏感基因,另一些则对整个 X 染色体进行调控。

Fast‑X 与 Fast‑Z 演化

在多数物种对比中,X 或 Z 染色体的分化通常高于常染色体。Presgraves(2018)的数据显示,ZW 系统(橙色线)与 XY 系统(蓝色线)相比,Fast‑Z 的效应幅度更大,这部分源于雄性性选择导致 Z 染色体的有效种群规模下降,而 X 染色体有效种群规模则相对提高。

虽然已有大量证据支持 X 染色体在哈尔丹法则中的重要作用,但 Y 染色体亦可能发挥作用,尤其在那些 Y 染色体保留大部分编码内容的物种中,作者可能预计出现“Large‑Y 效应”,其影响可独立于 Large‑X 效应。这是因为异性染色体与常染色体之间的相互作用,X 和 Y 都适用,而 Y 染色体往往富含与雄性生育力及吸引力相关的功能基因,这可能使其在杂交功能障碍中发挥不成比例的重要角色。

尽管 Y 染色体基因稀少,物种杂交研究中已有证据表明,Y 与常染色体之间的不兼容可导致雄性杂交不育;随着长读长测序与组装技术的发展,对各种物种中 Y 染色体的研究愈加深入,有望全面解析其在物种形成中的作用。例如,如果 Y 染色体在哈尔丹法则有效中发挥作用,XO 系统的雄性相比 XY 系统的雄性可能更少表现出不育或不存活。作者还可以假设在 XY 物种中,如果 Y 染色体保留功能基因比例较高,其对雄性存活或生育力的影响会更明显。此外,如果 Y 染色体在 F1 杂交中带来不利表型,作者可能会观察到其跨物种渗透性较低。


陆地植物与动物性染色体差异

尽管 X–Y(或 Z–W)之间重组停止是推动性染色体形成的共通机制,动植物性染色体在多方面存在显著差异,这些差异可能影响其在物种形成中的作用。包括:

雌雄异株比例:大多数陆地植物中雌雄异株较少,这在多数植物科中为衍生特征,限制了性染色体的普遍性。相比之下,雌雄异株在多数主要动物类群中为祖先状态,性染色体在动物中十分常见。

Y 染色体退化程度:动物在 Y 染色体退化程度及年龄方面差异巨大,有些动物物种(如蛙类、软体动物)性染色体基本同型,而昆虫(>4亿年)、软骨鱼类(>1亿年)、有胎盘动物(>1亿年)则保留高度异型的性染色体系统。

植物性染色体保守性:大多数陆地植物性染色体仍为同型。这意味着,在多数植物中,哈尔丹法则与 Large‑X 效应相对不显著——作者仅知两例涉及异型性植物。

植物性染色体同型的原因之一可能在于单倍体阶段较长,并经历更强的单倍体选择,这源自其生活史与动物的基本差异。这使得性染色体对物种形成的预测更加复杂,并可能导致雌雄异株对植物分化率的影响在不同群体中不一致。例如,单倍体选择可加速 X–Y 非重组区的扩大,这可能导致性染色体非重组区域快速增长,但仍保留许多功能性 Y 基因,因此导致较少的雄性单倍表达。相比之下,动物中 Y 基因往往大量丢失。

最新理论指出,同型性染色体可能减弱 Faster‑X 进化的选择力,从而削弱 Large‑X 效应。在 X–Y 已停止重组但 Y 尚未退化的系统中,雄性单倍显性有害突变可在年轻的 X 基因上积累,因为它们受到功能性 Y 拷贝的“庇护”(但该现象在鱼类中未显著,陆地植物中可能更普遍)。

最后,由于植物 Y 染色体保留更多基因,其选择 X 染色体剂量补偿的压力较低,完全剂量补偿在陆地植物中罕见,仅见于大麻,而动物系统中该机制则多次独立演化。如果剂量补偿与哈尔丹法则有关,则完整剂量补偿机制可能会增强该法则的效应。

BOX 1 性染色体与物种形成法则拓展

作者简化讨论 XY 染色体系统,但 Haldane(1922)已指出其规律适用于 XY 和 ZW。Fast‑Z 进化与 Large‑Z 效应均已观察到。然而,ZW 系统中 W 染色体与线粒体(在植物中则包含叶绿体)通过母系共遗传,这导致 W 或线粒体上的选择扫荡同步影响所有母系基因组(。鉴于线粒体–核基因相互作用在局域适应与物种形成中作用显著,ZW 系统或许通过这一路径推动物种形成速率更高。此外,W 上的正选择若源于胞质基因组,也可能使 Large‑W 效应强于 Large‑Y。

另一个有趣假说认为性染色体可能妨碍多倍体育成。Muller(1925)认为性染色体会干扰染色体加倍后的配对随机性,从而抵制由全基因组重复引起的物种形成。然而某些情况指出,性染色体并非必然妨碍 WGD 驱动物种形成。

植物与动物的胞质–核基因联合演化与物种形成

胞质–核基因组的协同进化被认为在植物和动物的物种形成中具有重要作用,且展现以下两大模式:

胞质基因组变异往往对应新物种边界,使胞质序列能作为物种鉴定的条码。

植物和动物物种形成初期杂交不相容性中,胞质–核相互作用的比例显著高于平均值。

从进化历史看,约在 20 亿年前,α‑变形菌祖先型线粒体被吸收至早期古菌宿主中,形成早期真核生物;约在 10 亿年前,又将蓝藻吸收进祖植物中,成为祖叶绿体。此后,胞质基因向宿主核基因转移,以及胞质–核表达协调机制的演化,使细胞内基因组更加相互整合,但仍保持一定独立性。这些联合进化过程,在真核生物各谱系间产生了生殖隔离壁垒,也促进了形态与功能的分化。

基因组间协同与不相容性

细胞器在真核生物的适应性中扮演核心角色:叶绿体通过光合作用捕获光能,线粒体则氧化营养物质生成 ATP,维持细胞大多数生命活动。这两种功能都依赖胞质基因组(细胞器)与核基因组之间的精密协作。当不同谱系通过杂交打破了长期共适应的胞质–核遗传复合体时,杂交后代因器官基因与核基因不匹配而适应性下降,从而加速生殖隔离形成。

胞质–核基因协同与混合不相容性可增强“Orr 雪崩效应”:在传统模型中,两条隔离分化谱系的核基因会以指数方式累积新的不相容突变。而若将这种过程扩展到真核胞质基因组,特别是在动植物中线粒体和叶绿体的共演化,将进一步加速不相容性的积累(见图4)。


线粒体

尽管植物与动物线粒体源自同一α-变形菌祖先,两者在基因组规模、组织结构、重组频率和突变谱方面却有显著差异,这些特征影响胞质–核协同进化并最终作用于物种形成。

动物线粒体:通常体积小(约15–17 kb),携带37个基因,仅占原 α‑变形菌蛋白的14–16%,其余基因已转移至核基因组。少数例外(如海葵、海绵)可达81 kb。

陆地植物线粒体:基因数略多(37–83个),但基因组规模巨大且高度变异(200–11 300 kb),拥有大量非编码区。

藻类线粒体:大小差异大(26–202 kb),有的类似动物线粒体。

比较而言,动物线粒体通常为单一圆形染色体结构;而植物则多呈多种圆形或线性结构,并可产生DNA异构体与嵌合基因,这些嵌合基因与细胞质雄性不育(CMS)相关。CMS在超过140种植物中被报告,但在动物中仅见一种——淡水螺,这可能与动物异株制度中雄雌必须共存有关。动物线粒体重组极少发生,虽在线虫中观察到同源重组。

核苷酸替代率方面,动物线粒体相对于植物而言快 50–100 倍。动物细胞中线粒体与核基因的替代率比在无脊椎动物约为2–6,在脊椎动物可超过20;而植物(单子叶和双子叶)仅约为0.1。植物线粒体低突变率是由于同源重组的 DNA 修复作用。若将此纳入雪崩模型,速率更高的动物线粒体应更快积累不相容变异(见图4C,D)。

叶绿体基因组

叶绿体基因组通常较为保守,大小为 120–160 kb,含有约 120–130 个基因。它以单个圆形染色体形式存在,仅在两段倒位重复区之间发生重组。替代率约为核基因组的四分之一。已知与叶绿体相关的杂交不相容情况较少(,但这可能是因为叶绿体效应难以与线粒体效应区分。

叶绿体与光合作用强相关,直接影响植物对光水环境的适应。当地适应是植物物种形成早期关键因素,叶绿体变异因而能促进地理生态隔离、入侵者不育和外源性合子后隔离隔离。这种机制同样可适用于线粒体作用。

细胞器遗传

多数细胞器为母系遗传,但植物中也存在父系遗传案例,如香蕉、黄瓜的线粒体,胡萝卜和多数裸子植物的叶绿体。动植物中也偶见双亲遗传。在杂交群体中,胞质双亲遗传能缓解近交衰退,如美国桔梗属中双亲叶绿体遗传允许选出兼容叶绿体类型,从而逆转 不相容。某些松属和娃娃鱼中观察到物种间胞质基因重组,为不相容的救济提供另类路径。

基因组间冲突与差异化

植物细胞中含有 20–100 个叶绿体,而植物和动物中每个细胞含成百上千个线粒体异体,它们在细胞周期中独立复制。这种半自主复制导致细胞内细胞器变体之间产生复制和传递竞争,利于“自私”胞质基因型的扩散,但后者可能损害宿主适应性。母系遗传胞质基因的“母亲诅咒”现象尤为显著,表现为对雄性的负面效应。CMS 是其典型表现。细胞器与宿主基因组之间的利益冲突可引发“核–胞质军备竞赛”,加速基因组分化与不相容性积累。

宿主细胞通过核基因型的补偿进化以缓解胞质自私行为,例如通过 PPR 蛋白家族恢复 CMS 表型。这种军备竞赛或能促进不相容性的快速累积,同时也可能在共存基因型逃逸机制出现时削弱种间差异。

第二,众多新插入所累积的诱变负担在不同转座元(TE)景观的基因组融合时,可能触发杂交后代的不育或不可存活。经典的果蝇P元件诱发性发育异常就是一个典型例子,类似综合征也见于湖白鲑和合成多倍体小麦。另一种密切相关但机制上不同的情况是双亲存在不匹配的沉默系统。动物主要依赖piRNA通路,而植物依赖RNA导向的DNA甲基化(RdDM)。这些机制在分子细节、作用靶标及鉴定新转座元的速度上各不相同。当两种防御系统在杂交中融合,往往重新激活休眠TEs,引发DNA损伤及大规模错误表达。F1杂交的荟萃分析显示,>70%的案例中发生了局部甲基化丧失或piRNA覆盖下降,表明表观遗传脱耦可能是常态而非例外。这一机制为解释植物中快速形成合子后生殖障碍提供了一个以转座元为中心的“基因组冲击”模型。

第三,TE可重塑核型,从而改变重组景观,并在杂交中导致不育或不可存活。高密度TE区段可作为重组冷点、诱导非等位重组,或为倒位、易位和罗伯逊融合提供底物。例如,棘鱼中对海水-淡水分化至关重要的倒位INV1就被L1残片界定;玉米的近着丝粒区域主要由Gypsy反转录元构成,在渗入杂交中保护适应性等位基因块;而扁虫的新长读长组装表明,TE在不到500万年内促成了三次独立融合。这些重排减少了有效重组,有助于保留协同进化复合体以抵御基因流,这是Bateson–Dobzhansky不相容性积累的前提。

表1汇总了三种机制的代表性案例研究;表2描述了主要TE家族的典型基因组影响:LTR反转录转座子主要导致大规模结构变异(机制3),非LTR反转录元擅长劫持单个基因(机制1),DNA转座子则驱动诱变爆发(机制2)。因此,详尽的转座元图谱有望预测各类群中TE如何影响生殖隔离。

全基因组复制(WGD)似乎可放大上述三种机制。多倍体形成一夜之间加倍所有插入数;随后红二倍化伴随着剧烈的拷贝数变化、广泛的甲基组重塑,并在植物中反复捕获TE片段并整合为新的嵌合基因或顺式调控元件。硬骨鱼类呈现相似模式:鱼类特有的古老WGD之后,特定类群经历TE爆发,其遗迹至今主导多个染色体。因此,植物TE负荷之重不仅源于活跃性高,也受序列WGD驱动。WGD通过增加诱变负担延长机制2进程,并在同源位点播下结构重排的种子,增强机制3。

值得注意的是,TE活性并非纯随机事件。生态压力、扩散和杂交可调节转座率,在种群动态与基因组可塑性之间形成反馈机制。数值模型预测,仅两倍转座率提升即可使杂交不相容性积累速率提高一个数量级。玉米、番茄和果蝇的种群重测序证实:插入数量与位置在种内高度可遗传变异,为选择作用提供了稳定性材料。

未来进展依赖于将高覆盖度、长读长mobilome图谱与功能实验证据结合,以量化特定TE插入或其表观足迹如何改变适应性地形。追踪TE在物种形成连续体中活性的比较数据集——从种群分裂、部分隔离到谱系独立——将揭示上述关联是否具有因果性,以及是否适用于不同生物界的预测模型。

结论与未来方向

本文探讨了植物与动物在基因组结构方面的若干差异,这些差异可能影响物种形成的速度与机制。其中最关键的区别可能是植物中更高频率的全基因组复制(WGD),其下游影响深远——从倍性差异直接造成的生殖隔离,到重复基因分化导致的不相容性,再到核型进化速率的提升。

另一个显著差异是动物界中性染色体的更高普遍性。性染色体支撑了两条重要的物种形成法则:哈尔丹法则与Large‑X效应,并推动了Large‑Y效应的提出。

第三个关键区别在于胞器演化。植物和动物线粒体基因组在序列和结构变异速率上差异显著,而植物还有一个额外的器官——叶绿体。这些特征导致植物中胞质雄性不育及器官相关局地适应更为常见。

植物基因组往往还包含更多TE,这些元素通过多种路径促进物种形成,最重要的是通过加速核型分化。

作者也认识到尚未讨论的其他差异对物种形成具有重要意义,例如:基因结构、可变剪接、表观基因组演化、基因表达分化、生殖系列隔离、重组景观结构、免疫与生殖隔离染色体等——其中后三项已在附录中探讨。

尽管本文主要聚焦于植物与动物间的差异,但作者也强调各界内基因组结构的巨大多样性。例如,古老的WGD虽在多数动物类群中稀少,在硬骨鱼类中却相当普遍。同样,两个界别中在器官基因组、性染色体与TE丰度方面差异巨大。这种差异虽然妨碍泛化总结,却也为分析特定基因组结构如何影响生殖隔离及物种形成与灭绝速率提供了独特机会。

本综述得益于大量代表性参考基因组的问世,但基因组的演化推断仍受限于测序与组装方法的差异。特别是长读长组装的比较方法与报告方式仍在发展中。这些问题在比较结构变异速率时尤为明显:例如,多数研究未区分大小倒位,或者采用的大小阈值彼此不一致。Mérot等(2020)建议系统性地表征所有类型与大小的SV,作者赞同此建议,并进一步建议数据格式应利于后续筛选与分析。从进化角度看,估计重排是否具有劣势性或是否受抑制重组的选择作用,更好方法是基于重排中基因数而非其物理长度。重组信息也很关键,因此理想状况下应报告基于基因数、重组率与物理距离的重排规模。

在WGD之后,尤其在基因组结构显著分歧时,可能难以准确重建重排的数量与顺序。此时需借助共线性方法,一些基于共线网络的新方法已被提出。但目前尚无统一标准评估各类群之间共线性进化速率。

最后,作者鼓励更多实验室/温室实验或长期野外研究,直接建立基因组结构特征与生殖隔离的联系。这包括利用越来越强大的关联分析和功能研究方法解析具体生殖障碍的遗传基础。泛基因组方法特别有希望鉴定结构变异并将其与表型相关联。作者也鼓励研究物种初分化阶段基因流与基因渗透的模式,尤其在已有高质量参考基因组(或泛基因组)条件下。这类研究可量化各种生殖隔离机制及其背后基因组结构在阻止基因流动中的效果。作者推测,植物基因组结构的快速分歧可能导致植物种群在物种形成早期更快建立物种屏障。

test
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容