Melo, 2019, ‘apparent’: a simple and flexible R package for accurate SNP-based parentage analysis in the absence of guiding information. 10.1186/s12859-019-2662-3
“apparent”:一个简单而灵活的R包,用于在缺乏指导信息的情况下进行基于SNP的精确亲子关系分析
摘要
背景
在原位自然居群和迁地遗传资源库中准确地确定亲子关系可以极大地提高植物育种/驯化的努力,并支持植物遗传资源保护策略。虽然有一系列的亲子关系分析工具可用,但是没有一种工具能够在完全没有指导性信息的情况下,使用全基因组单核苷酸多态性(SNP)数据来推断这种关系,例如世代、部分谱系或性别。在这里开发和呈现的R包(“apparent”)解决了这一差距。
结果
“apparent”采用了一种新的亲子关系分析策略,基于理论预期后代(EPij)和所有潜在后代(POk)之间的遗传一致性测试,其基因型状态可在一对假定双亲(i和j)的所有纯合位点上推断,而所有潜在后代(POk)则由给定种质集合的k个个体代表。利用Gower相异性度量(GD),EPij和POk之间的遗传同一性被作为个体i和j是后代k的真正父母的证据。给定的三元组(亲本pairij + offspringk)的显著性相对于群体中所有GDij | k值的分布进行评估。在没有提供任何指导信息的情况下,在77份猕猴桃种质的测试群体中,“apparent”正确地识别出了15个已知系谱系的亲本对,这一性能是其他五种常用亲子分析工具无法比拟的。在由于测试群体中没有一个亲本而导致的不确定的三元组分析的情况下,“apparent”可以进行后续的二元分析,以确定给定后代的可能单亲。在完全没有家系信息的情况下,二元分析的平均准确率为73.3%,但在提供最小世代信息(成人与后代)时,二元分析的准确率提高到100%。
结论
“apparent”R软件包是一种快速而准确的亲子关系分析工具,它使用全基因组的SNP数据来识别没有家族结构先验知识的群体中的亲子关系。