HIBLUP教程|第9期:G×G、G×E以及E×E互作模型拟合

性状的形成受到遗传和环境因素的相互作用。因此,个体的性状表现是遗传和环境因素共同作用的结果,环境的变化往往会导致性状表现的变化。在进行选种时,某一环境条件下选择出来的优秀个体,到了另一个环境条件下其性状表现反而较差,这表明同一个体对不同环境条件的适应性存在差异,这种现象称为遗传与环境互作(Genetic-Environmental interaction, G×E)。

除了遗传与环境的相互作用外,不同的环境因素间也可能存在相互作用,即环境互作(Environmental interaction, E by E);等位基因及非等位基因间也存在相互作用,即遗传互作(Genetic interaction, G by G)。在估计个体育种值时,模型中考虑多种互作效应,可以更精确估计方差组分,从而提高性状的预测准确性。

在使用HIBLUP拟合单性状以及多性状模型中,用户可以根据需要在模型中添加环境互作、遗传互作和遗传与环境互作,当命令行中检测到冒号时,HIBLUP能够自动识别并根据需求在模型中拟合互作效应。

1、环境互作Environmental interaction (E by E)

不同环境间的互作效应可以作为固定效应或随机效应加入到模型中,使用冒号作为各环境间的分隔符。如同时考虑多个环境效应的互作命令行输入:

demo.phe文件中第1列为个体ID;第2列至第7列分别为性别、季节、日龄、初生重、场和母本的记录;第8至第10列分别为个体三个性状的表型值。因此上述命令表示,对该性状拟合模型时,添加了两个固定效应,分别是性别以及性别、季节、场的三个因素之间的互作效应。需要注意的是,多个环境效应项间用逗号隔开,一个效应项内的多个因素互作用冒号隔开。

程序运行效果如下:

如上图所示,HIBLUP将拟合的模型形式打印到日志信息中:

T1 = 1 + sex(F) + sex:season:location(F.ExE) + day(C) + bornweight(C) + dam(R) + GA(GR) + e

其中,T1为表型的名称,性别以及性别、季节、场间的互作均作为固定效应(F: fixed effect),日龄和初生重为协变量(C: covariate),母本为环境随机效应(R: random),基因组加性关系矩阵(GA: genome-based relationship matrix)为遗传随机效应(GR: genetic random)。程序运行后生成demo.vars、demo.beta、demo.anova、demo.rand和demo.log共5个文件。

所有随机效应的估计方差和遗传力储存在demo.vars文件中,格式如下:

其中第一列为各随机效应对应的名称,包括环境随机效应,遗传随机效应和残差效应;第二列为估计的随机效应方差;第三列为随机效应方差的标准误;第四列为随机效应的遗传力;第五列为随机效应遗传力的标准误。

所有固定效应及协变量的回归系数估计值保存在demo.beta文件中,格式如下:


文件的第一列为均值、固定效应的各个水平(包含各互作项水平)以及协变量的名称;第二列为对应的估计值;第三列为估计值的标准误。

方差分析表保存在demo.anova文件中,格式如下:

方差分析表的第一列为固定效应和协变量名称;第二列为自由度;第三列为总平方和;第四列为均方;第五列为F检验的统计量F值;第六列为显著性检验得到的P值,可以通过P值判断该效应的影响是否显著。

所有个体的随机效应预测值保存在demo.rand文件中,格式如下:

其中,首列为个体ID,其后的列包括环境随机效应、遗传随机效应和残差效应的估计值。

如果将环境互作作为随机效应,命令行输入:

同样,上述命令表示在对该性状拟合模型时,将场、母本以及场和母本间的互作作为环境随机效应。HIBLUP拟合的模型形式如下:

T1 = 1 + sex(F) + season(F) + day(C) + bornweight(C) + location(R) + location:dam(R.ExE) + dam(R) + GA(GR) + e

其中,T1为表型的名称,性别和季节为固定效应,日龄和初生重为协变量,场、母本以及场和母本间的环境互作为环境随机效应,基因组加性关系矩阵为遗传随机效应。

对于多性状模型,用户可以对不同的性状指定不同的固定效应、协变量和随机效应。命令行输入如下:

多性状模型的同一个性状内的多个效应间用逗号隔开,多个性状间用空格隔开,一个互作项内的各因素间用冒号隔开。对于上述命令,HIBLUP拟合的模型形式如下:

T1 =1+ sex:season(F.ExE) + day(C) + location(R) + GA(GR) + e

T2 =1+ dam(R) + location:dam(R.ExE) + GA(GR) + e

T3 =1+ sex(F) + season(F) + sex:season(F.ExE) + bornweight(C) + GA(GR) + e

这表示对于该多性状模型,共包含三个性状。其中,第一个性状的固定效应为性别和季节的互作效应,第二个性状不添加固定效应,第三个性状的固定效应为性别、季节以及性别和季节间的互作效应;第一个性状的协变量为日龄,第二个性状不添加协变量,第三个性状的协变量为初生重;第一个性状的环境随机效应为场,第二个性状的随机效应为母本以及场和母本间的互作效应,第三个性状不添加随机效应。

2、遗传互作Genetic interaction (G by G)

在拟合遗传互作时,HIBLUP通过参数--xrm输入个体关系矩阵来实现。例如,加性效应和加性效应间的互作,加性效应和显性效应间的互作,显性效应和显性效应间的互作,并且HIBLUP对一个互作项内的遗传随机效应的数量没有限制。HIBLUP中N个遗传随机效应的基因互作可以用以下数学公式表示:

其中N是个体的数量,⨀是所有矩阵的Hadamard积(即逐元素乘法),tr()是矩阵的迹。

HIBLUP要求用户通过参数--xrm输入预先构建好的个体关系矩阵的前缀,并通过冒号连接具有相互作用的遗传关系矩阵。构建不同类型个体间关系矩阵的详细步骤可见HIBLUP教程|第3期:不同类型个体间关系矩阵的构建及格式转换

以拟合基因组加性效应和显性效应间的互作为例,命令行输入: 

程序运行效果如下:

HIBLUP拟合的模型形式如下:

T1 = 1 + sex(F) + season(F) + day(C) + bornweight(C) + location(R) + dam(R) + demo.GA:demo.GD(GR.GxG) + e

其中,T1为表型的名称,性别和季节为固定效应,日龄和初生重为协变量,场和母本为环境随机效应,基因组加性关系矩阵和显性关系矩阵间的互作效应作为遗传随机效应。

HIBLUP也可以同时输入多个个体关系矩阵作为遗传随机效应:

3、遗传与环境互作Genetic-Environmental interaction (G by E)

对于遗传与环境的互作拟合,HIBLUP提供了参数--rand-gxe来实现。环境效应由该环境因素在表型文件中所在列的位置表示,遗传效应由个体间关系矩阵文件的前缀表示。

同样,一个互作项内的各因素间通过冒号作为分隔符,多个互作项间使用逗号作为分隔符。命令行输入如下:

HIBLUP拟合的模型形式如下:

T1 = 1 + location:demo.GA(R.GxE) + location:demo.GD(R.GxE) + GA(GR) + e

其中,T1为表型的名称,场与加性遗传效应的互作、场与显性遗传效应的互作、基因组加性关系矩阵均作为遗传随机效应拟合在模型中。

程序运行效果如下:

三个及三个以上效应间的互作只需要将多因素通过冒号连接即可,例如:

对于多性状模型,同一个性状内的多个效应间用逗号隔开,多个性状间用空格隔开,如果某个性状不存在基因与环境互作,则必须用0代替。以拟合三个性状的模型为例:

HIBLUP拟合的模型形式如下:

T1 =1+ location:demo.GA(R.GxE) + GA(GR) + e

T2 =1+ location:demo.GA(R.GxE) + dam:demo.GA(R.GxE) + GA(GR) + e

T3 =1+ GA(GR) + e

上述命令表示第一个性状的遗传随机效应是场和加性遗传效应间的互作,第二个性状包含场和加性遗传效应间的互作以及母本与加性随机效应间的互作共两个遗传随机效应,第三的性状则不考虑遗传与环境的互作,仅拟合加性遗传效应。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容