都市流量猜测作为智能交通中的一个重要问题,致力于大概猜测都市中分别地区的流量信息,从而更好地实现地区间的流量管控、拥塞控制以及保障都市公共安全。本文将介绍一种鉴于时空图扩散网络的都市交通流量猜测模型。本文工作是由京东数科硅谷研发试验室,京东都市和华南理工大学合作的一篇论文《Traffic Flow Forecasting with Spatial-Temporal Graph Diffusion Network》,目前该论文已经被人工智能领域的顶级会议AAAI 2021(CCF A类)接收。
一、研究背景
对都市中分别地区间流量的猜测,作为智能都市应用平台中非常重要的任务,服务于智能交通系统。比如鉴于大概的汽车流量猜测结果,交通服务平台可以举行实时的交通调度以缓解由于流量过大带来的拥堵。与此同时,及时对未来时刻人流量的猜测,可以在一定程度上降低由于人流过大引起踩踏事件的概率。尽管地区间流量的猜测在实现都市智能化中起着重要的作用,对复杂的时空流量数据举行准确的建模是一个非常困难的任务。其中需要从时候与空间两个维度出发,对流量数据的动态变迁形式举行大概的进修,从而实现对都市地区间流量的精准猜测。
为了实现更加大概的交通流量猜测,我们的研究工作安排了一种鉴于层级图神经网络的深度进修模型, 分别从时候和空间上对分别地区的流量信息举行建模。具体而言, 我们开发的猜测模型鉴于多粒度的Attention机制, 对分别时候粒度上的流量变迁的形式举行自动进修。与此同时, 该研究工作对交通流量在空间维度上的变迁形式也举行了建模。分别于现有的方法仅仅只考虑局部的空间关系, 我们从整个都市的全局空间范围进修分别地区间的流量变迁的关系。通过层级图神经网络的联合建模进修到全局的空间流量的变迁形式以及鉴于地理位置的空间上下文信息。为了考证模型的有效性, 我们在多个公开数据集上举行了试验。试验结果考证了模型相较于现有流量猜测算法的优越性,以实现整个都市分别地区更加大概的流量猜测结果。
二、模型方案
1.鉴于时候维度的流量变迁建模
在实际时空数据猜测场景中,地区的流量信息在时候维度上呈现出动态的变迁形式。为了更加大概地进修流量数据在时候维度上的表示向量,作家通过在分别时候粒度下分别举行特征编码,以获取到分别周期下的流量变迁趋势,比如每小时,每天,以及每周的流量波动的规律。针对每一个时候粒度下的流量序列建模,作家采用鉴于self-attention机制的信息融合模块对历史分别时候区间中流量数据间的关系举行进修。具体而言,在self-attention机制中,通过将输入的表征向量在query, key 和value维度上分别举行特征表示的映射,从而计算出分别时候区间中流量数据点间的关系权重大小。鉴于进修到的权重值,将时候维度上分别的特征表示举行融合,以实现在分别时候粒度下流量变迁形式的进修。
2. 空间上下文信息的融入
与此同时,为了从全局角度对都市分别地区间流量变迁的关联性举行进修,作家安排了一种鉴于Graph Attention网络的表征信息更新模块,用于显式进修地区间流量变迁形式的相关性。通过在所构建的地区图中举行鉴于Attention进修的embedding传递,最后进修到的地区表征向量中潜在地融入了其他相关地区的流量信息,以辅助针对流量信息表征进修的过程。
在都市流量猜测的任务中,对空间维度上下文信息的刻画也至关重要。在作家所提出的模型框架中,通过安排另一层的图扩散模型对地区间的空间信息举行进修。在构建地区关联图上,我们将具有空间邻接关系的地区,以及在上一层全局Graph Attention中具有较高关联性的地区,生成连接边以构建相应的关联图。鉴于所构建出来的图结构信息,我们首先生成相应的邻接矩阵,并以此作为基础举行消息的扩散与融合。通过对每个地区的出入流量的表征信息举行传递以及鉴于邻接矩阵的标准化操作,所进修到的每个地区的表征信息可以在一定程度上反应出鉴于空间的地区关系信息。因此,通过以上鉴于时候维度的流量变迁建模以及空间上下文信息的融入模块,所提出的模型方案可以实现对流量数据的复杂时空变迁形式举行有效的表征进修,对分别时候粒度的表征信息的合并机制,以促进分别粒度下所进修到分别时空模型的融合。
三、试验
该工作中所提出的模型通过在多个数据集上举行了效果的考证试验。所使用到的数据集包括纽约市的出租车、共享单车的流量数据,以及北京市的出租车流量数据。为了更加全面地考证模型的有效性,作家在考证中将其与鉴于分别架构的现有流量猜测方案举行了对比试验。结果如下表所示:
该工作采用了RMSE和MAPE作为考证的指标来考证分别方法的猜测精度。通过上表的结果可以看出,作家所提出的方法ST-GDN (Spatial-Temporal Graph Diffusion Network)在分别的数据集上均优于现有的流量猜测算法。新模型在猜测效果上的优势主要归功于所安排的鉴于层级结构的图扩散网络对于分别地区间流量信息的关联性举行了更加精准的进修。与此同时,本文对所安排的分别子模块的有效性举行了考证。试验中安排了多个模型变种,分别对流量序列的Self-attention编码器,鉴于Graph Attention的表征更新机制,空间上下文建模模块举行了考证。考证效果如下图所示:
通过上图的试验结果可以观察到,所安排的整体流量猜测模型(ST-GDN)在分别地区流量猜测的精准度上均优于其他模型的变种。因此,可以说明每个子模块在进修复杂的时空模型表征中均起到了积极的作用。
为了进一步考证表征进修在分别的时候粒度下的作用,试验中通过在流量序列编码器中设置分别的时候粒度,举行了流量猜测的试验。在试验中,作家通过对每小时,每天以及每周的时候粒度举行分别的配置: 仅考虑鉴于小时周期的变迁形式(ST-GDNh),鉴于小时与天为周期的变迁形式(ST-GDNh,d),鉴于小时与周为周期的变迁形式(ST-GDNh,w),以及鉴于小时,天,周为周期的变迁形式(ST-GDNh,d,w)。试验考证结果如下图所示:
通过对上图结果的观察,我们可以总结出考虑鉴于三种分别的时候粒度举行时空表征进修刻画出分别周期下流量数据的动态变迁形式,从而进一步优化模型的猜测效果。通过对所开发模型中关键的超参数的影响举行进修,可以有助于更好地理解模型。如下图所示,我们可以观察到在分别的参数设置下,模型的猜测效果。比如较大的表征维度可能会造成模型的过拟合,以及较长的流量序列会在一定程度上引入噪音。