Piepho 2015 AR(1)模型中的问题

  1. Piepho H, Möhring J, Pflugfelder M, Hermann W, Williams ER. Problems in parameter estimation for power and AR (1) models of spatial correlation in designed field experiments. Commun. biometry Crop Sci. 2015;10:3–16.

AR(1)和空间相关的功率模型在现场试验数据的分析中是流行的。当自相关参数ρ倾向于为零或一致时,可能发生这些模型的估计和解释的数值困难。这里使用三个不同的示例来考虑这些问题。第一个例子是基于部分复制设计的模拟数据,其中真实的底层方差协方差结构是已知的。其他两个例子涉及来自精确农业试验和植物育种试验的真实数据。我们建议四个选项来处理观察到的数值问题,并说明它们与示例的使用。在示例中示出,AR(1)模型的空间坐标的重新缩放或重新参数化作为指数模型可以有助于模型收敛。我们得出结论,AR(1)模型的个别参数估计应仔细解释,特别是当自相关估计接近零或单位时


引言

在混合模型框架中嵌入的空间方差 - 协方差结构在现场试验的分析中已经变得流行(Gilmour等人1997,Piepho等人2008,Gonçalves等人2010)。最常见的空间模型假设与距离的空间相关性的非线性衰减。在每个图的单次观察的随机化实验中,可以在同一块中的图之间假定空间相关性(Williams 1986)。类似地,在具有大图的农场试验中,可以获得每个图的许多空间参考测量(即记录空间坐标的测量),以及相关的协变量信息。对这些试验的全面分析需要考虑同一地块重复测量之间的空间变化(Piepho et al。2011)。用于具有等间隔图的场试验的非常流行的非线性空间模型是一阶自回归AR(1)模型。该模型暗示与空间距离​​的相关性的指数衰减,根据图之间的滞后距离测量,等于间歇图的数量加1。模型也可以扩展到两个维度,最流行的变量是可分离的AR(1)⊗AR(1)模型(Gilmour等人,1997)。当对每个地块进行重复观测时,正如在精确农业实验中常见的情况,观测通常是不规则的间隔,而不是形成一个精确的矩形网格(Piepho et al。2011)。 AR(1)模型不适用于这种实验,因为它需要相等的间距。然而,AR(1)模型可以容易地扩展到不等间隔测量,如所谓的功率模型或指数模型(Gotway和Schabenberger 2004)。这两个模型是基本上相同模型的不同参数化(参见下文)。通常,当试图使用提供混合模型分析的各种统计包来基于残差最大似然(REML)将非线性空间模型拟合到现场试验数据时遇到数值问题。例如,REML算法可能无法收敛,或者最终的Hessian矩阵可能不是非正定的。在本文中,我们考虑AR(1)和功率模型的这些问题,并看看可能的补救措施,以实现收敛到一个正确的解决方案。还考虑参数估计的解释。使用三个不同的示例来说明在实践中遇到的典型问题,并且讨论可能的解决方案。第一个例子是基于部分复制(p-rep)设计的模拟数据(Cullis等人2006,Williams等人2011,2014),而其他两个例子涉及精确农业试验和植物的真实数据育种试验。
本文组织如下。首先我们介绍三个例子。接下来,我们描述空间模型。随后简要介绍尝试适合这些模型时的潜在问题,在收敛问题的情况下解决故障的可能措施以及这三个示例的应用。本文最后简要讨论和我们的建议。

讨论和结论

我们调查了在随机试验中拟合功效和AR(1)模型时可能出现的一些数值问题。我们还考虑了一些选项,当默认设置失败时,实现收敛到基于REML的过程的正确解决方案。关键问题是,空间分量可能与熔核方差或对于实验单位例如块(在每个图的单次观察的随机化实验的情况下)和图的随机效应混淆(在随机化实验的情况下在同一图上进行的重复和空间参考测量)。我们表明,需要小心解释各个参数估计。通常,它们可以产生空间相关性显着的印象,而对于块和独立残留误差的基于随机化的效应很小。但是本文中阐明的混杂问题意味着在模型的不同参数的估计之间存在相互作用,并且大的自相关估计可能实际上是由于块效应的大变化,反之亦然。类似地,与大的空间方差相关联的小自相关估计实际上可能与块金方差混淆,并且与空间距离​​的相关性的衰减可能如此之快,使得块内的拟合的成对残差相关对于大多数对图。因此,仅仅查看空间方差估计可能是误导。也许最好避免单独对各个参数估计的强烈解释。相反,重点应放在数据的整个拟合方差 - 协方差结构上。在随机现场试验中,建议使用具有简单随机效应的基于随机化的模型(Nelder 1965)。这可以被视为涉及空间附加组件的更精细建模的出发点。当空间模型难以拟合或不提供改进时,这样的模型也可以作为后退选项(Piepho和Williams 2010)。我们建议反对在设计涉及阻塞时拟合纯空间模型而不影响块的常见做法。存在一些危险,即当实际上如果块被拟合以反映随机化布局时,空间相关性被错误地报告为高。可以通过用基于随机化的模型开始建模过程并且仅将空间协方差视为可选的附加组件来避免这样的问题。
在本文中,我们使用了一个特定的REML包(SAS的MIXED过程)。在某种程度上,统计程序的数值问题总是软件特有的。由于REML算法的迭代过程的实现的差异,其他软件可以产生不同的解决方案,特别是当难以实现收敛时。在这里我们不打算比较不同的混合模型包。然而,在我们的经验中,AR(1)和功率模型的问题与大多数包相似,尽管相同数据集的收敛行为有一些差异。这主要是由于当ρ→0或→1时的混杂问题,这是ρ是模型本身的固有性质而不是所使用的特定包装的固有性质。我们已经考虑过处理这些问题的选项,并用三个例子来说明。可以推荐重建AR(1)模型的空间坐标或重新参数化作为指数模型,以帮助模型收敛。在给定情况下,以下哪些选项可能工作很大程度取决于数据集。 LV模型是非线性空间模型(如AR(1))的可行替代方案,在我们的经验中,它通常具有良好的收敛行为。因此,我们建议在探索竞争空间附加组件到基于随机化的模型时定期考虑这个模型。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容