综述的主要结论
全基因组序列数据的采用并没有导致对因果变异进行更精细的绘制。
更大的样本量和多样性比更高的变异密度更有利。
多品种全基因组关联研究或荟萃分析提高了检测能力。
需要应用更好的实践和适当的验证方案。
整合组学是识别因果变异的一种有前途的方法。
摘要
背景
牲畜全基因组关联研究 (GWAS) 是一种强大的方法,可以更深入地了解控制复杂性状的生物机制,通常着眼于提高生产效率。主要牲畜物种的 GWAS 的全基因组序列 (WGS) 数据已被广泛采用。
综述目标
通过重点关注一些最具代表性的工作的成果,对基于 WGS 的 GWAS 对牲畜的贡献进行重要调查。
内容
首先,作者们回顾了与标记阵列相比,WGS 数据对 GWAS 的有效性的实证结果,以及目前正在采用哪些策略来提高基于 WGS 的 GWAS 的检测能力。
然后,作者们回顾了基于 WGS 的 GWAS 对理解复杂性状遗传结构的贡献,以及数据结构和实践中什么阻碍因果变异的精细映射。
作者们对识别候选基因和变异、GWAS 结果的实际相关性以及数据共享方面提供了看法。
随着未来 WGS 数据的可用性不断增长,需要应用更好的 GWAS 实践。
一些感兴趣的细节
- 关联的主要变体(即具有最低p值的变体)可能不是因果变体。在大多数情况下,这是极其密集的变异组中普遍存在连锁不平衡(LD)的结果。局部 LD 结构尤其会阻碍由众多影响较小的 QTL 决定的多基因性状。
- 多重测试校正应该考虑整个基因组中独立测试的数量,而不是考虑实际基因分型的变异数量
- 定义QTL区域,考虑局部 LD 结构
- 一般来说,多品种 GWAS 比个体内品种 GWAS 检测到更多的关联,并且置信区间更窄(即,包含较少数量的变体,便于精细映射)。然而,必须注意某个品种数量过多的情况,因为它可能主导多品种 GWAS 结果并阻碍检测来自其他种群的较弱信号
- 据观察,品种内 GWAS 中的 QTL 几乎没有重叠
- 多性状荟萃分析也可用于检测与进行单性状 GWAS 时未达到显着性阈值的多个性状相关的基因组区域。作为多性状荟萃分析的替代方案,一些研究使用多元线性混合模型,与单变量模型相比,这种方法的结果好坏参半。
- 其其他组学的GWAS:mGWAS,。然而,对于实际应用,需要将中间性状发现的关联转化为生产水平上感兴趣的复杂性状的有意义的关联。然后,具有高遗传力估计的代谢物可以用作协助选择的生物标志物。
- 相关变体的功能类别对后来因果变体的精细映射具有影响。一组显着变异通常富含基因变异,尽管这些变异大多是内含子或位于下游和上游调控区
- 低MAF的变异可能存在关键信息。由于清除选择,有害的错义变体通常保持在低MAF,这反过来会损害插补准确性和变体效应的估计
- GWAS很难直接鉴定出因果突变。 基于 WGS 的 GWAS 的经验证据进一步表明,尽管在某些情况下推定的因果突变是 QTL 中的主要变异,但这通常是例外而非正常情况
- 缩小鉴定显著关联区域的范围。 减少 QTL 区域中候选因果变异数量的一个强大策略是评估它们的频率以及它们与独立群体中感兴趣的性状的关联强度和标志
- 多组学: 将 GWAS 结果与有关相关基因组区域可能功能的其他信息来源相整合可能会铺平前进的道路。使用多组学数据 帮助制定具体的评分来确定变体的优先顺序
- 模拟表明,使用基于 GWAS 预选的 WGS 变体进行基因组预测对于具有简单遗传结构的性状表现更好,即具有高遗传力和少量具有大效应的数量性状核苷酸
结论
- 主要牲畜品种的 GWAS 已广泛采用 WGS 数据,但由于 LD 损害了精细绘图,这一趋势并未转化为因果变异的更多发现。
- 经验证据表明,增加样本量和单倍型多样性比增加变异密度更有利于检测新的关联。在这方面,多品种 GWAS 或荟萃分析似乎是有前途的方法,如果克服牲畜数据共享的限制,可能会受到青睐。
- 由于 WGS 数据的可用性预计将继续增长,我们必须谨慎,不要将基于标记阵列的 GWAS 的相同逻辑应用于基于 WGS 的 GWAS。仅举几例,重要的是,我们应用更好的实践来进行多重测试校正或 QTL 区间定义,我们的目光超越 SNP 和具有令人信服的功能注释的变异,并且我们应用合适的验证方案来将谷物与谷壳分开。
- 综合组学将成为未来的重要组成部分
参考文章
The contribution of whole-genome sequence data to genome-wide association studies in livestock: Outcomes and perspectives(https://doi.org/10.1016/j.livsci.2024.105430)