在生猪育种领域,如何低成本、高效率地获取高精度基因组数据,一直是科学家们努力的方向。近日,一项针对大白猪的重要研究给出了令人振奋的答案。
该研究团队基于 1,423头大白猪的遗传数据,深入探讨了低覆盖度全基因组测序(lcWGS) 这种低成本技术的最佳应用方案。研究发现,利用30头高覆盖度测序(~10x)的核心祖先作为“参考模板”来填充校正低覆盖度(~1x)数据,是最优策略。
这种方法填充出的基因型准确率高达99%以上,效果远超传统芯片。更关键的是,利用这套高质量数据:
育种值预测更准了:对总产仔数等重要经济性状的基因组预测准确性,稳定提升了 0.31% - 1.04%。
基因挖掘能力更强了:在全基因组关联分析中,犹如装上了“高清雷达”,成功新发现了14个与猪繁殖性状相关的候选基因,大大提升了遗传解析的深度。
这项研究为猪育种行业提供了一套“花小钱办大事”的可靠技术路径,通过优化lcWGS数据填充策略,能以更低成本实现更精准的遗传评估和基因发掘,加速优良种猪的选育进程。
1. 研究思路:系统性的数据填充与效用验证流程
实验样本与数据生成
核心群体:1,423头大白猪
测序数据:
低覆盖度全基因组测序 (LCWGS):平均深度 ~1x
高覆盖度全基因组测序 (HCWGS):30头核心祖先,平均深度 ~10x

2. 核心发现 I:填充策略性能对比
结论:Ref_LG策略在填充准确性和效率上取得最佳平衡。
填充策略平均填充准确度 (r²)运行时间综合评价
Within_LG(自我填充)0.9893最快(比Ref_LG快19-30%)速度快,精度高,但无需外部参考面板
Ref_LG(参考面板填充)0.9899 (最高)中等最优策略,精度最高,耗时可接受
Mix_HLG(混合填充)0.9875最慢精度最低,耗时最长,不推荐
对比:SNP芯片填充0.8522-LCWGS填充精度远高于传统SNP芯片
3. 核心发现 II:对基因组预测(GP)的改进
结论:基于Ref_LG策略填充的序列数据可小幅但稳定地提升GP准确性。
与芯片数据相比:对四个繁殖性状(总产仔数TNB等)的预测准确性提升了0.31% - 1.04%。
与填充后的芯片数据相比:预测准确性提升了0.7% - 1.05%。
意义:尽管提升幅度不大,但证明了利用LCWGS获取全序列数据用于GP的可行性和微弱优势。
4. 核心发现 III:对全基因组关联分析(GWAS)的增强
结论:LCWGS数据极大增强了GWAS发现候选基因的能力。
数据类型检测到的显著SNP数量(示例)鉴定出的候选基因
SNP芯片数据极少很少
Ref_LG填充的LCWGS数据显著增多
(例如:妊娠期GL性状,显著SNP从0个增至13个)
共鉴定出18个候选基因
关键基因:研究发现了与猪繁殖性状相关的18个候选基因,如EPC2、MBD5、IKBKE、MSTN等。
新颖性:其中14个基因为新发现的候选基因,凸显了LCWGS在发掘新遗传信号方面的强大威力。
5. 结论
本研究基于1,423头大白猪的LCWGS数据,通过系统比较确定以30头核心祖先的HCWGS作为参考面板(Ref_LG)是最优填充策略(准确度r²>0.989),该策略使基因组预测准确性提升0.31%-1.04%,并新鉴定出14个与繁殖性状相关的候选基因。