共线性:物种间的共线性是由于物种间产生分歧,从同一祖先继承来的遗传信息经过各自的进化后,仍保留了大量的高度相似序列。分析:通过基因/基因组序列基于同源基因对鉴定共线性区块(Mcscan等)或全基因组比对鉴定共线性区块(LAST、MUMmer等)。
基因家族聚类:基因家族(gene family),是进化上存在共同祖先的一类基因,基因家族的成员之间序列相似并通常具有相近生物学功能。通过OrthoMCL,可以将多个同源物种的蛋白序列聚类成基因家族。
基因家族的扩张和收缩:根据进化树及物种分歧时间,通过CAFÉ计算相对于最近的共同祖先(MRCA)有多少基因家族发生了扩张和收缩。 1.扩张基因家族:物种独立的进化历史中成员增加的基因家族。可能和人工/自然选择,以及物种的环境适应性相关。2.收缩基因家族:物种独立的进化历史中成员收缩的基因家族。
通过将显著扩张和显著收缩的基因进行功能富集,可以鉴定可能与物种生物学特征相关的功能和参与的代谢通路。