“基于系统发育树的快速进化蛋白的鉴定”意思是利用系统发育树这种分析方法和工具,来确定在物种进化过程中进化速度较快的蛋白质。
系统发育树是一种展示物种或基因之间进化关系的树形图。通过比较不同物种中相同或相似蛋白质的序列差异,并构建系统发育树,可以了解这些蛋白质在进化历程中的变化情况。
例如,假设我们研究一组相关物种中某个特定的蛋白质。对这些物种中该蛋白质的氨基酸序列进行比对和分析,然后根据这些序列差异构建系统发育树。在这个树上,如果某些分支上的蛋白质序列变化较大,与其他分支相比显示出更显著的差异,那么就可以认为这些分支所对应的蛋白质在进化过程中经历了快速的变化,从而将其鉴定为快速进化蛋白。
比如说,在研究哺乳动物的某个特定酶的进化时,通过构建系统发育树,发现灵长类动物这一支上该酶的氨基酸序列与其他哺乳动物分支相比有较多的改变,就可以认为这个酶在灵长类动物的进化中是一种快速进化蛋白。这种鉴定对于理解物种的适应性进化、功能创新以及生物进化的机制等方面都具有重要意义。
方法:首先,用 mafft v7(Katoh and Standley, 2013)对每个单拷贝直系同 源基因组(OG)的蛋白质序列进行多序列比对,参数设置为:--maxiterate 1000 --localpair。利用 trimAl(Capella-Gutiérrez et al., 2009),将多序列比对的结果进 行过滤和裁剪,参数设置为:-automated1。使用物种系统发育树的拓扑结构作为 参考,用 IQ-TREE2(Minh et al., 2020)估算每个 OG 进化树的枝长,ModelFinder2 (Kalyaanamoorthy et al., 2017)用于预测每个 OG 的最佳氨基酸替代模型。接着, 对于每一个 OG,应用 python 脚本计算每个物种该基因到膜翅目祖先(HA)的 总枝长,并进行排序。排名越靠前,表示该蛋白在该物种中的进化速率越快。统 计每个 OG 在不同物种中的排名,将排名前两位是两种小体形寄生蜂的蛋白定义 为 Tpre-Trem 快速进化蛋白。
考虑到不同的蛋白质有不同的基础进化速率,并且和基因组成正相关 (Tourasse and Li, 2000; Pál et al., 2006)。为了更进一步的鉴定在两种小型化的 寄生蜂中特异快速进化的蛋白,采用了已报道的基因系统发育树的进化速率排序 策略(Lindsey et al., 2018)。首先计算出每个 OG 的枝长总和,从 1 到 2189 给每 个 OG 进行排序,代表每个蛋白质的基础进化速率的快慢。接着,计算出前面获 得的每个 OG 中每个物种到 HA 距离的排序与该 OG 基础进化速率的排序的差 值,表示该蛋白在该物种中是加速进化还是减速进化。最后,筛选出该差值在两 种小型化寄生蜂中均大于 300 的作为小型化的寄生蜂中特异快速进化的蛋白,即 Tpre-Trem 加速进化蛋白(Tpre-Trem rapid proteins)。