An Interpretable and Sparse Neural Network Model for Nonlinear Granger Causality Discovery翻译
个人学习笔记,转载参考请注明出处
摘要
虽然大多数经典的格兰杰因果关系检测方法依赖于线性时间序列假设,但神经科学和经济学应用中的许多交互作用是非线性的。我们发展了一种使用多层感知器的非线性格兰杰因果关系检测方法,其中网络的输入是所有序列的过去时间滞后,输出是单个序列的未来值。在这种情况下,Granger非因果关系的一个充分条件是,输入数据的所有输出权重(序列的过去滞后)到第一个隐藏层都为零。对于估计,我们使用一组套索惩罚将输入权重组缩小为零。我们还提出了一个等级惩罚同时格兰杰因果关系和滞后估计。我们在稀疏线性自回归模型和稀疏非线性Lorenz-96模型的模拟数据上验证了我们的方法。
介绍
格兰杰因果关系量化了一个时间序列的过去活动对另一个时间序列的预测程度。当研究一个完整的时间序列系统时,相互作用网络可能会被发现[2]。经典上,估计格兰杰因果关系的大多数方法假设线性时间序列动力学,并使用流行的向量自回归(VAR)模型[9,8]。然而,在许多现实世界的时间序列中,序列之间的依赖是非线性的,使用线性模型可能导致格兰杰因果相互作用的不一致估计[12,13]。估计时间序列中相互作用的常见非线性方法使用加法模型[12,4,11],其中每个序列的过去可能有一个相加的非线性效应,在序列之间解耦。然而,加性模型可能会忽略预测因子之间重要的非线性相互作用,因此也可能无法检测到重要的Granger因果关系。
为了解决这些挑战,我们提出了一个框架,以解释非线性格兰杰因果关系发现使用正则化神经网络。用于时间序列分析的神经网络模型传统上只用于预测和预测,而不用于解释。这是因为,由于隐藏层中相互作用的节点错综复杂,输入的影响难以精确量化。我们避开了这个困难,而是构建了一个简单的体系结构,允许我们精确地选择对输出没有线性或非线性影响的时间序列。
我们将最近关于神经网络体系结构选择稀疏诱导惩罚的研究[1,7]应用到我们的案例中。特别是,我们通过在输入的输出权重上添加一组套索惩罚[14]来选择格兰杰因果关系,我们称之为编码选择。我们还探讨了一种自动滞后选择的分层套索惩罚[10]。当真实的非线性相互作用网络是稀疏的时,该方法将选取Granger引起的输出序列和这些相互作用的滞后的几个时间序列