选种和选配是动物遗传改良最重要的两个部分,选种用于遴选优秀个体,选配则用于确定优秀个体之间的配对,选种和选配二者相辅相成,选配验证、巩固选种,选种加强选配。
生产实践中,以猪为例,杜洛克、长白、大白三系配套杂交是商品猪生产的主流模式,满足了我国90%以上的猪肉供应,主要是通过3个品种的配套杂交来提高商品猪生产性能。随着高通量测序技术发展,基因组信息开始用于选配,能够将传统配套系的“品种水平”群体选配升级为“个体水平”基因组选配。基因组选配(Genomic Mating, GM)是指利用公母猪的基因组和标记效应信息来优化公母畜交配组合,从而达到最大化后代性能表现、控制群体近交水平等目的。基因组选配主要流程包括:1)利用三元商品猪群体估计目标性状标记效应值;2)根据待配公母猪的基因组信息计算所有交配组合后代的基因型概率;3)整合标记效应和三元商品猪后代的基因型概率信息计算其期望遗传值,以后代期望遗传值最大化为原则推荐杜洛克公猪和长大二元母猪的最佳配对组合,主要流程见下图:
HIBLUP可以通过参数--mating进行基因组选配分析,预测公母畜所有交配组合后代的期望遗传性能。分析时,用户需要输入公畜、母畜的基因型数据(合并为一个文件)以及SNP的加性和显性效应值,相关命令如下:
--mating:进行基因组选配;
--score:输入SNP效应值文件。SNP标记效应值的估计方法可见HIBLUP教程|第6期:单性状模型遗传参数估计,文件格式如demo.snpeff所示:
其中第一列为SNP位点的名称;第二列和第三列为该SNP位点上的两个等位基因A1、A2的形式。用于基因组选配的.snpeff文件中的每个SNP的等位基因应与.bim文件中的等位基因一致;第四列为等位基因A1的基因频率;第五列为估计的SNP加性效应值;如果考虑SNP显性效应值,可放置在第六列;文件应包含表头。
需要注意的是:在进行基因组选配分析时,应清楚地标明公母畜的性别。性别信息位于.fam文件的第五列,其中1表示公畜,2表示母畜,其他标记表示该个体性别未知,性别未知的个体会将会在分析时被删除。demo.fam文件如图所示:
程序运行效果如下:
从运行效果中的WARNING信息可以看到,共有225个性别未知的个体在分析中被删除。
程序运行完成后在工作目录中生成demo.mating和demo.log文件。demo.mating格式如下:
其中第一列为父本个体的ID;第二列为与其交配母本个体的ID;第三列为不同交配组合后代的期望遗传值,用以判断该交配组合的优劣。