阅读人:刘绵宇
3 群体遗传学
3.1简介
鱼类育种的目的不是改变鱼类个体,而是改变鱼类种群。因此,我们对孟德尔遗传的认识必须从个体层面扩展到群体层面。群体遗传学可以定义为在共享一个共同基因库的一组杂交个体中研究孟德尔遗传学。这个基因库中的基因数量取决于物种,从大肠杆菌中的约4000个到脊椎动物基因组中的约30000个不等。由于突变在很长一段时间内积累,这些基因的DNA序列在群体中的个体之间可能略有不同。这些不同形式的基因称为等位基因。如果不同的等位基因导致基因产物的差异,结果可能是群体内该性状的遗传变异。基因库中每个基因的不同等位基因的比例,即等位基因频率,决定了种群的遗传特征。这些等位基因的表达产物与种群生存的环境相互作用。其中一些相互作用使携带特定等位基因构象的个体比其他组合具有优势。自然选择导致这些有利的等位基因在群体中积累,并导致等位基因频率的变化。
3.2 Hardy-Weinberg 哈迪-温伯格定律 遗传或基因平衡定律
1908年,英国数学家G.H.Hardy和德国医生W.Weinberg发现,在一个大的杂交群体中,等位基因频率在一代到下一代之间保持不变(他们假设交配是随机的,没有选择压力或其他因素改变等位基因频率)。据说这样的群体处于哈迪-温伯格平衡状态
为了了解Hardy-Weinberg平衡是如何发生的,假设一个二倍体生物体,其中体细胞有两个拷贝,每个基因位于从母亲和父亲那里获得的同源染色体对上的特定位置或位点。孟德尔第一定律指出,在有性生殖的有机体中,两个等位基因在配子的产生过程中分离。基因型频率可以从等位基因频率中计算出来,因为等位基因在群体中的比例等于包含该等位基因的配子的比例。因此,基因型频率完全由群体中的等位基因频率决定。这在Hardy-Weinberg定律中被阐明,只要等位基因频率不变,只要交配是随机发生的,基因型频率在群体中保持不变。
罗非鱼体色的例子说明了Hardy-Weinberg 平衡的结果,罗非鱼的色素沉着受一个基因控制,只有两个等位基因A和a。设A在群体中的频率为p,a在群体中的频率为q,p+q=1(因为群体中只有两个等位基因)。正常着色的黑罗非鱼是纯合子AA,杂合子Aa是青铜色,金个体是纯合子aa(图3.1)。如果在罗非鱼种群中等位基因A的频率设置为0.7,那么根据孟德尔第一定律,任何精子或卵子(配子)携带A的概率为0.7。那么,受精时两个A染色体配子结合在一起的概率是p×p=p2=0.49。因此纯合子AA,或黑色个体,在群体中的频率是49%。同样,由于等位基因a的频率为1-0.7=0.3,配子携带a的概率为0.3。因此,连接两个a-配子的概率是q x q=q2=0.09。因此,种群中有9%的鱼是纯合子aa(这些鱼是金色的)。杂合个体的频率为pq+qp=2pq=0.42,或42%。总之,黑色、青铜色和金色个体的频率加起来等于罗非鱼种群中的所有个体,p2+2pq+q2=1。
当考虑多个位点的等位基因时,情况变得更加复杂。如果两个等位基因对 A/a和B/a 位于同一染色体上,它们在配子形成时不会独立分离。因此,对于任何尚未处于平衡状态的种群,基因座之间的连锁将延迟平衡的实现。这被称为连锁不平衡。在达到平衡之前,可能需要许多代的随机交配,而更紧密连锁的位点需要更多代的交配(因为两个位点之间重组的机会较低)。
在群体研究中经常使用Hardy Weinberg平衡测试来测试随机交配和是否存在影响等位基因频率改变的因素。基于在平衡群体中观察到的等位基因频率,基因型频率将近似适合Hardy-Weinberg公式。但是,如果基因型频率与预期的Hardy-Weinberg值显着偏离,则有必要从以下两个方面出发:
1.非随机交配的模式,包括近交和杂交。
2.选择,迁移,突变或遗传漂移引起的等位基因频率变化。
3.3近交
近亲繁殖是有亲缘关系的亲本繁殖后代的过程。最极端的近亲繁殖形式是自我受精,这在一些用于水产养殖的物种(如某些扇贝)中是可能的。系统的交配模式,如全同胞交配,半同胞交配,都会导致近亲繁殖。在一个有限大小的种群中,近亲繁殖会随着时间的推移而积累,即使是随机交配,因为某些相关个体可能会交配。
近亲繁殖系数F是指个体中任何一个位点上的两个等位基因通过血缘是相同的概率(即两个等位基因都可以追溯到同一个共同起源)。对于非随机交配系统和具有随机交配的有限大小种群,都有可能计算近交积累率ΔF。例如,在有限大小的随机交配种群中,每代近亲繁殖的累积率为:
其中N是繁殖个体的有效数量,或者更准确地说是一个理想化的种群的大小。理想化种群是指(Falconer 1981):
-交配仅限于同一系的成员。换句话说,不包括迁移
-世代分明,没有重叠
-各品系和各世代的育种个体数相同。繁殖个体是那些将基因传递给下一代的个体
-在每一行中,交配是随机的,包括随机的自交
-任何阶段都没有选择
-突变被忽略
大多数水产养殖种群的有效种群规模往往较小,因为水产养殖种群的高繁殖力意味着繁殖大种群所需的亲鱼数量相对较少。例如,当每一代使用n个雄性和n个雌性f时,有效种群大小为:
因此,如果一个鱼类繁殖计划使用一个雄性对两个雌性的交配比例,如每一代使用25个雄性(50个雌性),那么有效种群大小约为67。采用上述公式,该育种方案的近交积累率为每代0.75%。
近亲繁殖的效果是增加纯合子基因型的频率。一个直接的结果是,更多的隐性等位基因在近交群体中表达。最有害或疾病的条件是隐性的,因此更可能在近交群体中表达。因此,近亲繁殖群体的适应度会下降。近亲繁殖也会导致近亲繁殖抑制,这将在第6章讨论。
3.4杂交
与增加纯合子频率的近亲繁殖相比,杂交或不相关个体的交配增加了杂合度。通过增加杂合子基因型的频率,隐性等位基因表达的可能性较小,因此可以提高群体的适应度(至少在杂交后的一代)。当一个特定性状的后代平均值超过两个亲本系的平均值时,杂交个体的杂合度增加常被视为杂交优势。杂种优势已在某些动植物育种系统中得到利用,但并未广泛用于水产养殖物种中。菲律宾的尼罗罗非鱼是一个例外。在一项大规模试验中, O. aureus x O. spilurus 和 O. mossambicus x O. niloticus两个不同的杂交显示其杂种优势分别为22%和25%。另一个例子是O. mossambicus and O. niloticus的杂交比纯罗非鱼对盐分的耐受性更高(Tayamen等,2002)。
与基因型频率相比,群体中的等位基因频率本身不受近亲繁殖或杂交的影响。但其他因素,如自然或人工选择、突变、遗传漂变和迁移,共同负责进化,则确实改变了群体中等位基因的频率。
3.5选择
选择发生在特定基因型比其他基因型有更大的繁殖成功。例如,如果某个基因的某个等位基因比种群中的其他动物具有生殖优势,那么种群中该等位基因的频率可能会随着时间的推移而增加。
假设一个大的随机交配种群具有一个基因座,种群中有两个等位基因A和一个α,以证明选择的效果(来自Gardner和Snustad,1981)。设1-q为A的频率,q为a的频率。在这种情况下,A完全占主导地位。假定显性表型AA(和AA)比aa基因型具有持续的选择优势。基因型AA,Aa和aa的繁殖率分别为1:1:1-s。选择系数s衡量生物体相对于选择中的特定参考基因型的劣势,因此代表选择的强度。如果aa是致死性的(例如,Al鱼中的白化病),则s =1。如果初始种群中的q和s都已知,则每个连续世代中a的减少频率可以计算为:
这个公式可以用来说明需要多个世代来减少致死隐性等位基因的频率(在杂合子Aa不受影响的情况下)。在上述白化病等位基因的例子中,如果a的初始等位基因频率为50%,则需要大约50代来降低a等位基因的频率到5%一下如表3.1所示。
开始时,对等位基因a的选择较快,但随着a频率的下降而下降。实际上,等位基因a可能永远不会因为选择在种群中彻底消失,当q足够小,使得纯合子很少出现时,隐性等位基因仍然存在于Aa杂合子中。在杂合子比两个纯合子都更具活力的情况下,两个等位基因都不会消除另一个,因为优势杂合子包含两个等位基因。这种现象被称为平衡多态性。
实际上,任何一个基因座的选择系数通常都非常小,因此自然选择需要许多代才能改变种群中的等位基因频率。这使得不同等位基因形式的遗传变异得以保留在种群中。如果连续的变化有利于不同的等位基因,种群可以对自然环境的变化做出反应。
人工选择性繁殖动物的结果也是影响选定性状的基因的等位基因频率发生变化。如果性状是由一个或少数几个基因决定的,例如罗非鱼的肤色,那么由于高强度的选择而导致的等位基因频率变化会很快。这可能导致基因型比例的快速变化,图3.2。
3.6变异
突变会将一个等位基因更改为另一个等位基因,例如将A等位基因更改为a。忽略向后突变(即从a到A),a的频率变化与A的突变率(u)和A的频率(p)成正比。等位基因频率给定变化所需的世代数(t)可以是根据方程式计算得出(Falconer,1981)
这里的pt和p0 分别为t代和初始代的等位基因频率,由于每个基因座的突变率很小,因此需要大量的世代才能对等位基因频率产生明显的影响。例如,通过以10-6的突变率积累突变,需要9050代才能将a的频率从0.1%更改为1%。
变异的一个更重要的结果是产生新的等位基因变异,这些变异可以通过选择作用。数百万年来DNA变化的累积,提供了使一个物种与另一个物种不同的变异来源,也为同一物种个体之间的差异奠定了基础。虽然有些突变有时会使机体受益,但大多数突变是有害的,并且因为选择通常在种群中保持在较低的频率。考虑突变和选择(s=选择强度),可以预测群体中等位基因频率的趋势。如果稀有(有害)等位基因的频率很小,则每代等位基因频率的变化约为-sq2,而突变使稀有等位基因(a)的频率每代增加u。在平衡状态下,两种力相等,稀有等位基因将达到的频率q可以估计为(Falconer,1981):
所以再考虑一下我们在鲶鱼中白化病的例子,其中aa基因型是致命的(s=1)。如果从野生型到白化等位基因的突变率为每代10-6,且s=1,则该等位基因在种群中获得的估计频率为10-3。
3.7遗传漂变
遗传漂变是在小群体育种过程中,由于等位基因的抽样而引起的等位基因频率的随机波动。人口越少,这种抽样效应就越大。一个极端的例子是双亲都是杂合子基因型。如果他们只产生两个后代,有25%的概率都是AA基因型,从而a等位基因将从群体中丢失。当繁殖个体的数量在几十或几百个时,遗传漂变的过程是很重要的。Falconer(1981)指出,基因漂移的方向无法预测,但它的大小,表示为一代取样后等位基因频率变化的标准差,可以表述为:
其中q0是基群中一个等位基因的频率,N是每一代取样的亲本个数。由于每代取样的育种个体数量较少,等位基因频率变化的标准查较大,见图3.3。
遗传漂移的作用是减少遗传变异。减少的可变性可能会降低人群适应环境变化的能力。当一小群人与一大群人分开时,明显的遗传漂移就很可能发生。在一些偶然的情况下,这些先驱者可能只携带父母群体遗传变异的一小部分。由此,两个种群的基因库在一开始就不同。这种现象称为创始人效应。当一个种群的许多成员死亡,而剩下的少数个体交配以恢复种群数量时,也可能发生遗传漂移。这个过程被描述为种群瓶颈。瓶颈之后,新种群的基因库将比原始种群受到限制。
3.8迁移
种群可能通过一些机制与同一物种的其他种群隔离,包括河流和山脉等物理屏障。
不同环境下的遗传漂变和选择过程会导致群体间等位基因频率的差异。如果在这些原本相互独立的群体之间有一些个体的移动,并且这些移民与本地群体杂交,那么接收群体中的等位基因频率可能会改变。频率的变化与本地群体和迁入间的等位基因差异成正比。让我们假设一个群体由每一代的n个新迁入者组成,1-n个是本地种。让某一特定基因的某一等位基因频率在迁入者中为qn,在本地种中为qo。那么等位基因在混合群体中的频率qm将是:
通常,移民来自邻近的人群,他们可能没有时间开发出与所考虑的人群明显不同的等位基因频率。然而,从一个偏远的种群进口动物,或在驯化的种群中引入精子和卵子,可能会显著改变等位基因频率,或确实产生全新的等位基因。这种情况可能发生在一些引入的等位基因在新环境中具有适应性和优越性。这种交换的极端情况发生在种间杂交期间(种群之间的杂交非常不同,以至于它们被列为单独的种类)。尽管远没有一个物种中的基因流(指生物个体从其发生地分散出去而导致不同种群之间基因交流的过程,可发生在同种或不同种的生物种群之间。)常见,但其影响更为明显,因为等位基因频率可能已经分化了更长的时间。实际上,一个物种中的许多等位基因可能不在另一个物种中(Gardner和Snustad,1981)。
3.9遗传距离和种群分化
由于遗传漂变、选择和突变的力量,相互分离的群体在等位基因频率上可能出现差异,特别是当群体规模较小或选择是针对不同群体的不同特征(例如,不同疾病)时。事实上,群体间等位基因频率的差异程度可以用来推断群体被分离的时间和它们之间基因流动的程度。
Nei(1975)提出了一种简单的统计检验方法,用于测量多个群体之间累积的等位基因差异。Nei的遗传距离(D)估计如下:设xi , yi为两个随机交配群体X和Y中等位基因Ai的频率。从每个群体中随机抽取一个等位基因,选择相同等位基因的概率jxy=xiyi的和,再X群体中两个相同等位基因的概率jx为xi平方的和,在Y中jy为yi平方的和。如果Jxy Jx 和 Jy 分别是jxy和jx和jy的算数平均值,则遗传距离D为:
Nei的遗传距离被广泛用于量化群体间的遗传差异。分子技术的最新进展和高多态性重复DNA元件的鉴定,使得对大量位点进行基因分型相对容易和廉价,提高了遗传距离的估计。(见第20章)。
该方法用于研究8个罗非鱼品系之间的遗传距离(Macaranas等人,1995)。包括1972年至1988年经以色列、泰国、新加坡和台湾引进的菲律宾养殖罗非鱼品系,以及来自埃及、加纳、肯尼亚和塞内加尔的4个野生捕获非洲品系。对30个位点的基因型进行整理和分析,以研究遗传距离。
结果如图3.4所示。菲律宾4个养殖品系之间的遗传距离较低,接近埃及和加纳的品系,塞内加尔品系,特别是肯尼亚品系之间的遗传距离较远。
3.10总结
通过将孟德尔定律从个体水平扩展到群体水平,就有可能推导出群体中某一特定位点等位基因频率和基因型变化的表达式。最简单的情况是在没有选择、突变、迁移和遗传漂变的情况下随机交配。由HardyWeinberg定理预测,在这种情况下,基因型频率将在世代之间保持不变。非随机交配模式,如近亲繁殖或杂交,改变基因型频率,但不改变等位基因的频率。选择、突变、迁移和遗传漂变的力量作用于改变群体中的等位基因频率。等位基因频率的这种变化会导致两个具有相同祖先基因库的群体之间的差异。