近期,张志武&王嘉博老师在Molecular Biology and Evolution上发表GAPIT Version 4。
GAPIT 第4版的核心是将全基因组关联分析(GWAS)结果整合到基因组预测(GP)中,提出了一种称为 GAGBLUP(GWAS-Assisted Genomic BLUP) 的新方法。
[图片上传失败...(image-1489a-1777431497913)]
研究背景
GWAS 用于发现与性状相关的基因位点,GP(基因组预测) 用于预测育种值,两者传统上是独立进行的
将GWAS发现的显著标记整合到GP中可能提高预测准确性,但存在挑战:显著标记之间可能存在高度连锁不平衡(LD),导致冗余和过拟合
核心方法
提出GAGBLUP。
使用 QR分解 筛选GWAS鉴定的关联标记,去除高度相关的冗余标记;
将筛选后的显著标记作为固定效应纳入模型;
利用剩余标记构建亲缘关系矩阵(kinship)作为随机效应;
整合了7种GWAS方法:GLM、MLM、CMLM、SUPER、MLMM、FarmCPU、BLINK。
主要结果
|
方面
|
发现
|
| --- | --- |
| GWAS方法比较 |
多位点模型(BLINK、FarmCPU、MLMM)显著优于单位点模型(GLM、MLM),统计功效更高,假发现率更低
|
| 模拟数据(玉米) |
BLINK-GAGBLUP比标准GBLUP预测准确性提高超过50%
|
| 真实数据(桃) |
GAGBLUP比GBLUP提高21%,比MAS提高30%
|
| 遗传架构适应性 |
GAGBLUP在不同遗传架构下表现稳定:当因果基因数极少(<5)或极多(>100)时,其表现至少与MAS或GBLUP中较好者持平;在中间范围时优势最明显
|

关键结论
BLINK 是表现最佳的GWAS方法,整合到GAGBLUP后效果最优;
GAGBLUP结合了MAS(利用大效应基因)和GBLUP(利用全基因组多基因效应)两者的优势,是一种"安全"的整合策略;
该方法已在R包GAPIT中实现,用户只需提供表型和基因型数据即可自动完成分析。


软件可用性
- GAPIT源代码、用户手册、教程和示例数据集可在 http://zzlab.net/GAPIT 免费获取