发现自己得了拖延症晚期,只有在简书里写出来,才能有动力去学习。
Nothing in biology makes sense except in the light of evolution.
Nothing in evolution makes sense except in the light of co-evolution.
个人理解,协同演化也是我们探究物种多样性是如何形成的一种解释机制,但是更倾向于解释存在较强种间互作的两类群的物种分化。
协同演化(co-evolution)指存在种间互作的生物类群被对方造成的选择压力驱动,进行相互影响的演化,双方演化出的适应性性状是对二者互作关系的响应。共生系统中的种间互作通常更为紧密,对双方演化的影响更明显。
大量的实例证明,存在密切种间互作的类群, 其系统发育并不是独立的,而会受到另一方的影响。有假说认为那些在生命周期中有一部分时间寄生在宿主体内或体表的寄生物类群,其系统发育往往与宿主类群的系统发育关系相吻合(parasites that spend part of their life in or on their hosts track the phylogeny of their hosts) 。双方系统发育树拓扑结构的相似性也被称为一致性(congruence)。但在自然界中,系统发育关系的完全一致的互作类群几乎是不存在的,因为除了共物种形成(co-speciation),还存在其他的演化事件,比如寄主转移(host switch),谱系分选(sorting event)等。
我们要对这一假说进行验证,探究互作类群系统发育关系一致性的程度,就要用到共系统发育分析。
Congruence quantifies the extent to which each node in a given tree maps to a corresponding position in the other tree and perfect congruence can be interpreted as evidence for co-speciation, which may or may not result from co-evolutionary mechanisms
进行共系统发育分析是为了探究存在相互作用的两组类群的系统发育关系的一致性情况,一般是探究两组物种的系统发育树的一致程度是否显著,并为不一致的地方寻求可能的解释。系统发育树的一致性体现在:拓扑结构的一致程度(共系统发育分析)和分化时间的一致程度(共分化时间分析)。
传统共系统发育分析的两类方法
下面介绍常见的几种共系统发育分析的方法,但不管使用哪种方法,我们都需要保证一个大前提:输入数据质量的可靠性。研究者需要保证对研究涉及到的类群进行了较为全面的采样,对物种进行了准确的鉴定,尤其是普遍存在隐存种的共生物类群。
Both approaches are only as good as the information supplied to them. Consequently, one must make sure that all taxa have been sampled and that species have been delimited accurately with a proper account of cryptic diversity.
(Blasco-Costa, 2021)
基于事件的分析方法(event-based method):Jane为例
文献来源:https://almob.biomedcentral.com/articles/10.1186/1748-7188-5-16
基于事件的共系统发育分析指用演化事件(如共物种形成co-speciation,物种复制duplication,寄主转移host switching,物种丢失loss)作为可能路径,将依赖方(寄生物/共生物)的系统发育树映射到被依赖方(寄主)的系统发育树上。不同的演化事件对应不同的代价值,在映射的过程中使总的代价值达到最小。很多程序(如Jane, TreeFitter、Component 、 TreeMap、Tarzan)都能执行基于事件的共系统发育分析。
Cospeciation occurs when a vertex (speciation event) in the parasite tree is associated with a vertex (speciation event) in the host tree.
Duplication occurs when a vertex in the parasite tree is associated with an edge in the host tree. This event implies that the parasite lineage speciated independently of the host lineage.
Host switching occurs when a duplication event is accompanied by one of the two descendants of the parasite vertex switching to an edge in a different part of the host tree.
Once the parasite vertices are mapped onto the host tree, loss occurs when the path between a parasite vertex and its child passes through a host vertex.
基于事件的分析方法存在几个问题:
问题一:这种分析方法存在NP问题。
什么是NP 问题呢?之前讲系统发育分析中的最大简约法时也提到过这个问题,简单来说就是,随着分析中的分类群的增加,可能的演化历史也会爆炸性增加,但是这个方法的原理是先列举出所有可能的演化历史,然后找到代价值最小的一个演化历史,而计算所有可能的演化历史的带价值是一个相当大的计算量。
问题二:一些寄主转移事件会带来时间上的不兼容性问题。
时间不兼容的问题又分为强时间上不兼容的寄主转移事件和弱时间上不兼容的寄主转移事件。
如下图(a)中的a(寄生物)从寄主系统发育拓扑结构中的边(edge)(u,w)转移到了边(t,v)上的子代b,会暗示u出现在v之前。c(寄生物)从寄主系统发育拓扑结构中的边(edge)(v,y)转移到了边(t,u)上的子代d,会暗示v出现在u之前。这种矛盾就是强时间不兼容性
如下图(b)中的a(寄生物)从寄主系统发育拓扑结构中的边(edge)(t,v)转移到了边(u,w)上的子代b,会暗示a出现在u之后,也出现在c之后。c(寄生物)从寄主系统发育拓扑结构中的边(edge)(t,u)转移到了边(v,z)上的子代d,会暗示c出现在v之后,也出现在a之后,这和前面的是不兼容的,但是这个问题是可以解决的,比如在图(c)中,我们把a寄主转移的时间提前,放置在边(t-u),然后通过增加一次物种丢失事件出现子代b,这样就不是不兼容的了,也称为弱时间不兼容性。
一系列基于演化事件的共系统分析方法的软件出现了,我们重点要介绍的是Jane,这个软件是对之前的Tanzar的补全(不得不说,科研工作者起名还是有点小浪漫的)。
Jane软件的优点包括:
1.在最后推算出的共系统发育演化历史中,对寄主和寄生物类群的谱系分化事件都给出了时间范围。
2.可以设定寄主转移距离的上限(寄主转移距离指寄生物从原寄主节点出发到转移后的寄主节点,所跨越的寄主节点个数)。
3.宿主树中的顶点可以被任意划分为多个区域,并且可以为每一对区域设置独立的寄主转移事件的代价值。甚至宿主树中的每个节点都可以被划分为独立区域,我们能够依据如上面提到的寄主转移距离等认知,为所有可能的宿主转换单独设定代价值。
4.Jane图像化的交互界面,便于直观的看到不同解决方案对应的共演化情况。
通过简单介绍Jane的原理,相信能更好理解Jane的这些优点。
Jane首先对寄主系统发育树进行了“定时(timing)”,也就是树中的所有的内部节点都被限定在相对的时间上,从直觉上,我们也能感受到,被定时的树在估算演化历史时会相对容易得多。
在下图的(c)和(d),二者唯一的区别就是b和c出现的相对的时间顺序,一个在c前一个c在后,把这样两个系统发育树称为邻近树(neighbor)。
随着树中分类单元的增长,可能存在的定时的系统发育树的数量也指数增加,这是,我们就可以用元启发式方法(meta-heuristic approach),对于随意一个给定的定时系统发育树,我们寻求它的最优演化重建,估算这一演化路径下的代价值,然后再估算它的邻近树的演化重建和代价值,最后,决定保留邻近树中的哪一个由我们使用的特定的元启发式方法本身规定。
常见的元启发式方法包括梯度下降法,模拟退火(simulated annealing)和遗传算法。
比如最简单的梯度下降元启发法(gradient descent meta-heuristic)就是比较邻近树的代价值,保留代价值小的那一个,直到找到区域范围内代价值最小的系统发育树。研究人员通过比较几种元启发式方法,发现遗传算法(genetic algorithms)的表现最好。
这里简单解释一下遗传算法(genetic algorithm),以下内容来自chatGPT:
遗传算法是一种基于自然选择和基因遗传机制的优化算法,模拟的是**“适者生存”**的进化过程。它通常用于解决复杂、无法用传统方法轻松求解的优化问题
用生物进化类比一下遗传算法的核心流程:
1初始化:随机生成一组“解”(种群)
2评估适应度:每个解根据目标函数打分
3选择:选出更好的解作为“父母”
4交叉:随机配对父母生成新解
5变异:对部分新解进行随机微调
6替换:生成新一代种群
迭代:重复步骤2~6,直到满足停止条件(如达到最大代数或找到最优解)
在这里还要解释一下交叉操作的概念。在第4步交叉中,其定义是随机配对父母生成新解,即交叉操作(crossover operator)。
在自然界中,生物通过有性繁殖产生后代,父母的染色体会交换部分基因片段,使得后代拥有来自双亲的新组合特征。
交叉操作就是在模拟“基因重组”,把两个个体的信息混合,生成新的个体。
交叉操作的作用是:
从两个“父代”中提取部分基因信息,通过交叉规则生成一个或多个“子代”。这些子代可能拥有比父代更优的解
下面,我们从Jane选择的交叉操作方法入手,更深入地理解一下:
T1和T2是随机的定时系统发育树,之后我们又从树中随机地选出了一个树子集T,如下图三角框框出的部分:
我们取T1中除了子集T的部分和T2中的T部分,组成一个新的树Tnew。接下来我们要做的就是给Tnew中的内部节点(a-g)相对时间顺序。我们列一个表格,来自T1的节点在T1中的时间序列,来自T2的节点在T2中的时间序列。Tnew的时间序列对应的节点暂时是空白的,也就是未知。
首先考虑第一时间位,T1和T2的第一时间位分别是a和f,但是F节点的上一辈c还没有被分配时间,所以a占据第一时间位。根据相同的步骤,b和c占据第2和第3时间位,即表2的状态。d和f竞争第4时间位,他们之前分别是T1中的第3三时间位和T2中的第5时间位,和第4时间位的距离相同,因此随机选择一个,这里选的是f。根据相同的方法,我们就得到了Tnew上所有内部节点的时间排位。
如果想要引入其他的变化,我们可以选取部分进行变异,比如说调换不存在上下辈关系的两节点的时间排序。
整体拟合的分析方法(global fit methods):以PACo为例
Global-fit methods are used to quantify the degree of congruence between two given topologies, and identify the associations contributing to the co-phylogenetic structure.
整体拟合的分析方法可以量化两个给出的拓扑结构的一致性,并且找到对共系统发育结构有贡献的相互关联的物种对(寄主A 和寄生物a)。虽然整体拟合的方法并不能推断演化历史中可能发生的事件,但其估算出的系统发育关系一致性的量化值也能表明共演化(co-evolution)在互作系统中的重要程度。
PACo(Procrustean Approach to Cophylogeny)可以执行整体拟合的共系统发育分析。其工作流程大概如下图:
我们之后将会用一个实例来感受PACo的应用。
共系统发育研究的进一步进展
Next-generation cophylogeny: unravelling eco-evolutionary processes.
文献来源:https://www.sciencedirect.com/science/article/pii/S0169534721001798?ref=pdf_download&fr=RR-2&rr=9354ed739834d10b
将互作性状纳入共系统发育分析 Integration of traits in cophylogeny
我们之前介绍过的PACo方法用到了寄主-寄生物的互作关联矩阵,这是一个二元矩阵,有关联的物种对为1,无关联为0(如下图中的B)。虽然这种方法也能反映基础的共系统发育关系,但它忽略了种间互作强度(如下图中的B)等因素,阻碍我们更深刻理解共系统发育的过程。为解决这个问题,应该引入互作相关性状(interaction traits)这一类可被量化的数据,到共系统发育分析中。互作相关性状有很多种,比如在传粉者-植物这一系统中,传粉者的访问频率这一互作性状就反映了传粉者定位被访问植物的能力,以及被访问植物对传粉者的吸引力。除此之外,互作双方常具有一对互相演化的性状,比如传粉者的嘴部长度往往能反映被访问植物的特定花部特征,这种性状也被称为双方互作性状(two sided interaction traits)。
关注尺度和网络组织 Focus on scale and network organization
之前的共系统发育分析方法针对互作双方的整个类群,但是如果我们从不同尺度上进行分析,可能会发现不同组织层面上(群落或某一地域)上存在的不同的共演化情况,帮助揭示共同演化是在哪个地理范围和哪个时间段内发生的。
将模式和机制联系起来 Linking patterns with mechanisms
之前常常将较强的共系统发育信号作为互作双方发生高度共物种形成的证据。但是很多不同的共演化过程都会产生共物种形成,或者说较高的系统发育一致性这一结果,包括共演化(co-evolution),地理隔离 (vicariance) ,系统发育追随(phylogenetic tracking)和垂直传递(vertical transmission)。
研究者在这里提出了共演化空间(cophylospace)的概念,共演化空间是对形成共系统发育背后机制的一种定量构架。通过三个定量参数(共系统发育信号,双方互作矩阵分别与每一方的系统发育关系的关联性)形成了一个三维空间,有三个参数决定一个互作系统在共演化空间中的位置,该位置反映不同的演化机制对该系统的作用。
评估互作矩阵和寄主/寄生物系统发育树的关联强度(系统发育信号phylogenetic signal)可以帮助我们探究背后的机制。比如,如果互作矩阵和寄主系统发育树的系统发育信号较强,和寄生物系统发育关系之间的系统发育信号较弱,可能暗示了寄生物的物种分化是由寄主决定的,也就是系统发育追随。共系统发育信号较弱的情况往往不支持共物种形成是互作系统演化进程的主要作用力,但并不意味这互作双方之间的物种分化不受对方的影响,也可能存在弥散共演化(diffuse coevolution)的情况。比如,如果双方互作矩阵和某一方的系统发育强相关,那么可能暗示存在不对称的物种分化(asymmetric diversification);而如果双方互作矩阵和双方的系统发育都相关,那么就是对称的物种分化(symmetric diversification)。
共系统发育分析的展望
今后的共系统发育应该纳入分子钟相关研究的理论和应用,因为当系统发育树内部节点被限定在一定时间范围内,可以帮助排除一些不可能的演化过程,增加运行的效率。
物种形成还还包含微进化水平的过程,也就是种下水平。现在的基因组研究越来越关注种群水平上的个体差异,而目前大多数共系统发育研究还是将物种看做均质的实体(homogeneous entities)。今后的共系统发育研究应该更加关注种内差异,尤其是在群落尺度上探讨共系统发育时,因为此时真正的有效单元可能是种群而非物种。
自然状态下,物种的演化并不是系统发育树展现出来的二歧关系,更有可能是网状关系(因为存在杂交,不完全谱系分选和横向基因转移等)。但是现在的共系统发育分析大多还是针对二歧系统发育树,应该考虑如何对网状的演化历史进行分析。
在进行共系统发育分析时,应该纳入研究对象已知的生物地理信息,可以帮助我们排除一些不可能存在的演化情况。
之前研究讨论的多是两个类群之间的共演化,但在自然中存在多级营养结构,如寄主-寄生物-复寄生物,应该考虑把多级营养系统也纳入共系统发育分析的研究范畴。