
yuyi
标题
道路交通网络的时空预测
期刊名称和出版年份
发表于 ACM KDD 2023 会议论文
作者
Mridul Gupta,Sayan Ranu
第一作者单位
印度德里理工学院Yardi人工智能学院
摘要
在道路网络上建模时空过程是一项日益重要的任务。尽管在开发时空图神经网络(GNNs)方面取得了显著进展,但现有工作建立在三个对真实世界道路网络不切实际的假设上。首先,它们假设道路网络的每个节点都能被感知。实际上,由于预算限制或传感器故障,所有位置(节点)可能没有配备传感器。其次,它们假设所有安装的传感器都可用历史数据。由于传感器故障、通信过程中丢包等原因,这也是不现实的。最后,它们假设道路网络是静态的。由于道路封闭、新道路建设等原因,网络的连接性会发生变化。在这项工作中,我们开发了Frigate来解决所有这些缺点。Frigate 由一个时空 GNN 提供支持,该 GNN 将位置、拓扑和时间信息整合到丰富的归纳节点表示中。通过门控Lipschitz嵌入和LSTM的创新组合,实现了这种多样化信息的联合融合。我们证明了所提出的GNN架构在表达能力上比用于最先进算法的消息传递GNN更强。Frigate的更高表达能力自然转化为对真实世界网络约束交通数据的优越的经验性能。此外,Frigate 对传感器部署的经济性、道路网络连接性变化和传感时间的不规则性具有很强的鲁棒性。
背景
在道路网络上建模时空事件的演变最近引起了极大的兴趣。具体来说,每个节点(或边)参与时间序列。这些时间序列不仅是时间的函数,还取决于网络中其他节点上发生的事件。预测任务的目标是建模每个节点上时间序列的演变并预测最近未来的值,例如下一小时。
方法
Frigate 由一个联合架构组成,该架构由Siamese GNN和LSTM堆栈组成,采用编码器-解码器格式。Frigate 采用门控Lipschitz嵌入进行消息传递,并结合LSTM进行时间编码,从而实现高效、鲁棒的时空预测。模型的关键创新包括使用Lipschitz嵌入进行位置编码、门控机制以避免过度平滑以及利用瞬时特征增强预测精度。
结果
在三个大城市(北京、成都和哈尔滨)的真实道路网络数据集上进行的广泛评估显示,Frigate 显著优于最先进的算法,并证明了其对数据噪声和网络变化的鲁棒性。实验表明,Frigate 在预测准确性上超过现有模型,平均 MAE 下降超过 25%。
讨论
Frigate 在处理实际道路网络中的各种挑战时表现出色,包括部分节点感知、道路网络拓扑更新以及时间数据不规则性。实验结果验证了 Frigate 在处理这些现实世界问题方面的有效性和鲁棒性。
新颖性
与现有方法相比,Frigate 在模型设计中显式考虑了现实世界的实际挑战,如有限的传感器访问、传感器故障和数据噪声。通过使用 Lipschitz 嵌入和门控机制,Frigate 在表达能力和预测性能上显著优于现有 GNN 模型。
局限性
尽管 Frigate 在各种场景下表现出色,但其在极端传感器故障或拓扑剧变的情况下的表现仍需进一步验证。此外,Frigate 的计算复杂度相对较高,在非常大规模的网络上可能需要进一步优化。
潜在应用
该方法可应用于多种需要时空预测的实际场景,如交通流量预测、智能交通管理和城市规划等。
理解数据集中使用的特定数据集及其代表的意义对于深入了解研究工作非常重要。以下是对这三个数据集(北京、成都和哈尔滨)的详细解释及其在研究中的意义:
北京数据集
成都数据集
哈尔滨数据集
这三个数据集代表了不同规模、复杂性和数据覆盖率的城市交通网络。通过这些数据集,研究可以全面评估 Frigate 模型在处理现实世界交通预测问题上的有效性和鲁棒性。
实验结果和性能对比
数据集
该论文使用了三个真实世界的数据集,分别来自中国的三个大城市:北京、成都和哈尔滨。这些数据集通过跟踪出租车的GPS轨迹收集。数据通过地图匹配处理与来自OpenStreetMap的相应道路网络关联。交通数据被聚合为每5分钟一个桶,传感器值对应每个节点在5分钟间隔内通过的车辆数量。
数据集 | 节点数 | 边数 | 地理面积 (km²) | 平均值 | 标准差 | 默认“可见”节点百分比 | 行程数 |
---|---|---|---|---|---|---|---|
北京 | 28465 | 64478 | 16,411 | 3.22 | 9.09 | 5% | 785709 |
成都 | 3193 | 7269 | 14,378 | 4.54 | 7.19 | 50% | 1448940 |
哈尔滨 | 6235 | 15205 | 53,068 | 77.85 | 124.11 | 30% | 659141 |
对比性能
实验对比了 Frigate 与以下基线方法的性能:DCRNN、STGCN、LocaleGN、STNN、GraphWavenet 和 STGODE。
预测精度(MAE、sMAPE、RMSE)
模型 | 数据集 | MAE | sMAPE | RMSE |
---|---|---|---|---|
Frigate | 成都 | 3.547 ± 0.20 | 131.17 ± 3.39 | 5.93 ± 0.31 |
STNN | 成都 | 5.633 ± 0.18 | 199.86 ± 0.00 | 9.50 ± 0.50 |
DCRNN | 成都 | 4.893 ± 0.26 | 138.17 ± 2.07 | 8.10 ± 0.48 |
LocaleGN | 成都 | 4.597 ± 0.22 | 192.80 ± 0.19 | 8.57 ± 0.33 |
STGODE | 成都 | 4.693 ± 0.19 | 147.12 ± 2.25 | 7.72 ± 0.39 |
STGCN | 成都 | 5.712 ± 0.33 | 198.38 ± 0.00 | 9.47 ± 0.50 |
GraphWavenet | 成都 | 5.308 ± 0.30 | 147.77 ± 1.81 | 8.89 ± 0.43 |
Frigate | 哈尔滨 | 73.559 ± 2.04 | 93.00 ± 1.89 | 105.01 ± 3.51 |
STNN | 哈尔滨 | 126.305 ± 4.54 | 199.68 ± 0.02 | 206.91 ± 6.93 |
DCRNN | 哈尔滨 | 124.109 ± 5.06 | 185.73 ± 0.68 | 204.75 ± 6.36 |
LocaleGN | 哈尔滨 | 128.674 ± 5.10 | 169.54 ± 1.43 | 207.36 ± 6.58 |
STGODE | 哈尔滨 | 122.493 ± 4.97 | 152.28 ± 1.27 | 198.81 ± 6.74 |
STGCN | 哈尔滨 | 无法完成训练 | 无法完成训练 | 无法完成训练 |
GraphWavenet | 哈尔滨 | 无法完成训练 | 无法完成训练 | 无法完成训练 |
Frigate | 北京 | 5.651 ± 0.11 | 169.73 ± 0.45 | 11.87 ± 0.30 |
STNN | 北京 | 6.215 ± 0.12 | 199.99 ± 0.01 | 12.82 ± 0.27 |
DCRNN | 北京 | 6.122 ± 0.14 | 195.56 ± 0.15 | 12.63 ± 0.24 |
LocaleGN | 北京 | 5.759 ± 0.13 | 172.73 ± 0.33 | 12.10 ± 0.03 |
STGODE | 北京 | 无法完成训练 | 无法完成训练 | 无法完成训练 |
STGCN | 北京 | 无法完成训练 | 无法完成训练 | 无法完成训练 |
GraphWavenet | 北京 | 无法完成训练 | 无法完成训练 | 无法完成训练 |
对比分析
节点频率划分的误差分布
训练节点数量的影响
模型鲁棒性和弹性
通过这些实验结果,可以看出 Frigate 在处理具有实际挑战的道路网络时空预测任务中具有显著优势。
Frigate 模型的预测结果在多个方面具有重要意义,以下是这些预测结果的具体意义:
Frigate 模型在实际应用中具有广泛而深远的意义,不仅能够提升交通管理和规划的效率,还能应对各种现实世界中的挑战,促进城市交通系统的智能化发展,提高公共服务质量,并对环境保护产生积极影响。通过这些方面的改进,Frigate 模型为构建智慧城市和可持续发展的未来交通系统提供了强有力的技术支持。
文章紧扣主题,观点鲜明,展现出深刻的思考维度。