Xiang, B., & Li, B. (2001). A new mixed analytical method for genetic analysis of diallel data. Can. J. Forest Res., 31(August), 2252–2259. http://doi.org/10.1139/cjfr-31-12-2252
Diallel是一种用于作物和树木育种计划的流行的交配设计,但它的单一观察的独特特征具有两个相同主效应,一般组合能力(GCA)的水平,使得难以用标准统计程序进行分析。在本研究中开发了一种使用SAS PROC MIXED的新方法,用于分析来自diallel交配的遗传数据。首先用SAS PROC IML构建GCA效应的假变量,然后使用PROC MIXED程序估计方差分量并获得固定效应的BLUE(最佳线性未偏估计值)和随机遗传效应的BLUP(最佳线性无偏预测值) (GCA和特异性组合能力(SCA)效应)。该新方法还可用于使用BLUP方法预测个体育种值,将SAS IML应用于PROC MIXED提供的输出以计算后代测试中每个个体的育种值,针对固定效应例如测试位置进行调整。准确的BLUP预测,估计个体育种值的能力和易用性将使这种新方法对于分析树木育种数据特别有吸引力。
双列交配设计,特别是一半或部分双列,广泛用于作物和树木育种计划(Griffing 1956; Hallauer和Miranda 1981; Zobel和Talbert 1984; Huber 1993; Yanchuk 1996; Li等人1996)。双交配是流行的,因为它可以产生关于亲本的一般组合能力(GCA),杂交的特异性组合能力(SCA)和其他遗传参数(如方差组分和遗传力估计)的遗传信息。信息和参数估计对于开发育种策略至关重要。根据具体设计,拨号交配还可以提供一个用于正向选择的纯种子代群体(Talbert 1979; Zobel和Talbert 1984)。
虽然包括普通最小二乘法(OLS),一般最小二乘法(GLS),最佳线性预测(BLP)和最佳线性无偏预测(BLUP)的几种分析方法可用于二级测试的分析(Borralho 1995; White和Hodge 1988),使用这些统计工具仍然存在实际问题。 Diallel设计是独一无二的,每个观察包含两个相同的主效应的层次,这限制了许多现有的统计程序用于其分析(Johnson和King 1998)。虽然计算并不是简单的平衡数据(Griffin 1956),他们可以变得更加复杂的不平衡数据,即,当有缺失地块或缺失交叉(Garretsen和Keuls 1978; Dean 1988; Huber et al。 1992)。已经开发了一些用于某些用途的分析包,例如DIALL(Schaffer和Usanis 1969),DAG(Dean 1994),GAREML(Huber 1993)等。这些分析包通常需要以特定格式制备数据,选项用于混合模型分析,一些具有不友好的用户界面。其他限制包括这些包可以处理的数据大小有限,并且在定义分析模型和方差分量估计选项方面的灵活性较低。大多数这些包装不能用于估计个体繁殖值。统计分析系统(SAS)是用于统计分析的流行和强大的计算机程序,但是到目前为止,分析人员还没有能够直接使用它来分析diallel遗传数据。 Sanders(1987)提出使用虚拟变量来获得使用SAS程序(PROC GLM和PROC REG)的全同胞平均数据的期望效应的平方和。然而,这种方法不能直接估计方差分量,并且对于具有复杂设计或缺失观察的个体数据是不可行的。最近,Xu和Matheson(2000)也使用PROC GLM来估计GCA和SCA效应及其标准误差。虽然程序可以处理更复杂的情况,遗传效应必须被视为固定的,而且不能获得方差分量。 Johnson和King(1998)提出了一种使用方差分量程序(PROC VARCOMP;需要两次单独运行)的实用方法,以获得二分位数据的方差估计。他们的方法提供了平衡数据的无偏估计,但给出了不平衡数据的近似。另一个SAS程序(Diallel-SAS)由Zhang和Kang(1997)提出,用于处理涉及F1杂种的特殊拨号以及它们与作物种类中的作物和作物的相互作用。该程序是基于PROC GLM开发的,并且具有与基于VARCOMP的方法(Johnson和King 1998)类似的限制。虽然所有上述程序都使用虚拟变量方法,但上述方法都不使用最新的程序,如SAS中的混合模型程序(PROC MIXED)。有限的选择分析方法或模型选择是这些程序在实际数据分析中的常见问题。此外,这些方案中没有一个解决了BLUP分析父母育种价值或BLUP方法的混合模型中个体育种值的估计的问题。 SAS PROC MIXED为混合模型分析和BLUP预测提供了灵活性(Littell等人,1996),但是在线性模型中并入GCA效应的问题限制了其直接用于分析diallel数据。在这项研究中,我们开发基于BLUP的分析方法通过结合SAS PROC MIXED与SAS PROC IML来分析来自diallel交配设计的遗传数据。将所提出的方法与两个现有程序DIALL和GAREML进行比较。我们还描述了如何扩展该方法以估计个体育种值。由于SAS是森林搜索和育种计划中最常用的统计程序,它将大大简化diallel遗传分析的难度,提高遗传参数估计的准确性。从一系列进展测试中估计个体树育种值的能力将提高树木改良计划的选择效率,并提高遗传收益。