交通流预测是交通领域研究人员和实践者的一个关键问题。然而,由于交通流通常具有高度的非线性和复杂的模式,这是非常具有挑战性的。现有的大多数交通流预测方法缺乏对交通数据动态时空相关性建模的能力,无法获得满意的预测结果。本文提出了一种新的基于注意力的时空图卷积网络(ASTGCN)模型来解决交通流预测问题。ASTGCN主要由三个独立组件组成,分别对交通流的三个时间属性进行建模,即最近依赖性、日周期依赖性和周周期依赖性。具体而言,每个分量包含两个主要部分:1)有效捕捉交通数据动态时空相关性的时空注意机制;2)时空卷积,同时使用图卷积捕捉空间模式,同时使用通用标准卷积描述时间特征。对三个分量的输出进行加权融合,得到最终的预测结果。在来自Caltrans性能测量系统(PeMS)的两个真实数据集上的实验表明,提出的ASTGCN模型优于最先进的基线
背景:
综上所述,高速公路网交通数据相关性在空间维数和时间维数上均表现出较强的动态性。如何探索复杂的非线性时空数据,发现其内在的时空模式,并进行准确的交通流预测是一个非常具有挑战性的问题。
面临的问题:已经存在的方法不能同时对交通数据的时空特征和动态相关性进行建模。
方案:我们提出了一种新的深度学习模型:基于注意力的时空图卷积网络(ASTGCN)来集体预测交通网络中每个位置的交通流。该模型可以直接在原始的基于图的交通网络上处理交通数据,有效地捕捉动态的时空特征。
Traffic Networks
问题定义
1)划分时间间隔
(1) The recent segment:
(2) The daily-periodic segment:
(3) The weekly-periodic segment:
这三个组成部分具有相同的网络结构,每个组成部分由多个时空块和一个完全连通的层组成。在每个时空块中都有一个时空注意模块和一个时空卷积模块。为了优化训练效率,我们在每个组件中采用了残馀学习框架(He et al. 2016)。最后,根据参数矩阵将三个分量的输出进一步合并,得到最终的预测结果。整个网络结构是精心设计的,以描述交通流的动态时空相关性
框架:
Spatial-Temporal Attention
它包含两种注意,即空间注意和时间注意
1)Spatial attention
2)Temporal attention
在时间维度上,不同时间片上的交通状况之间存在相关性,且在不同情况下其相关性也不同。
Spatial-Temporal Convolution
时空关注模块让网络自动对有价值的信息给予相对更多的关注。本文提出的时空卷积模块包括空间维度上的图卷积,从邻近时间捕获空间相关性,以及沿时间维度上的卷积,利用邻近时间的时间相关性(在时间维度和空间维度上实现卷积)
1)Graph convolution in spatial dimension
本文采用切比雪夫多项式近似
2)Convolution in temporal dimension
综上所述,时空卷积模块能够较好地捕捉交通数据的时空特征。时空注意模块和时空卷积模块构成时空块。将多个时空块进行叠加,进一步提取更大范围的动态时空相关性。最后,添加一个全连通层,以确保每个构件的输出与预测目标具有相同的尺寸和形状。最后全连接层使用ReLU作为激活函数。
Multi-Component Fusion
Experiments
1)
2)图显示了各方法的预测性能随预测区间增加的变化情况。总的来说,预测区间越长,相应的预测难度越大,预测误差也越大。
3)
为了直观地研究注意机制在我们模型中的作用,我们进行了一个案例研究:从PeMSD8中挑选出一个含有10个检测器的子图,并显示训练集中检测器之间的平均空间注意矩阵。看最后一行,我们可以知道第9个检测器的流量与第3和第8个检测器的流量是密切相关的。这是合理的,因为这三个探测器在空间上接近真实的交通网络,
Conclusion and Future Work
本文提出了一种新的基于注意力的时空图卷积模型——ASTGCN,并成功地应用于交通流预测。该模型结合时空注意机制和时空卷积,包括空间维上的图卷积和时间维上的标准卷积,同时捕捉交通数据的动态时空特征。在两个真实数据集上的实验表明,该模型的预测精度优于现有模型。
实际上,公路交通流量受到许多外部因素的影响,如天气和社会事件。未来,我们将考虑一些外部影响因素,进一步提高预测精度。由于ASTGCN是一个通用的图结构数据时空预测框架,我们也可以将其应用于其他实际应用,如估计到达时间。