yuyi
时空时序预测 Frigate: Frugal Spatio-temporal Forecasting on Road Networks
标题
道路交通网络的时空预测
期刊名称和出版年份
发表于 ACM KDD 2023 会议论文
作者
Mridul Gupta,Sayan Ranu
第一作者单位
印度德里理工学院Yardi人工智能学院
摘要
在道路网络上建模时空过程是一项日益重要的任务。尽管在开发时空图神经网络(GNNs)方面取得了显著进展,但现有工作建立在三个对真实世界道路网络不切实际的假设上。首先,它们假设道路网络的每个节点都能被感知。实际上,由于预算限制或传感器故障,所有位置(节点)可能没有配备传感器。其次,它们假设所有安装的传感器都可用历史数据。由于传感器故障、通信过程中丢包等原因,这也是不现实的。最后,它们假设道路网络是静态的。由于道路封闭、新道路建设等原因,网络的连接性会发生变化。在这项工作中,我们开发了Frigate来解决所有这些缺点。Frigate 由一个时空 GNN 提供支持,该 GNN 将位置、拓扑和时间信息整合到丰富的归纳节点表示中。通过门控Lipschitz嵌入和LSTM的创新组合,实现了这种多样化信息的联合融合。我们证明了所提出的GNN架构在表达能力上比用于最先进算法的消息传递GNN更强。Frigate的更高表达能力自然转化为对真实世界网络约束交通数据的优越的经验性能。此外,Frigate 对传感器部署的经济性、道路网络连接性变化和传感时间的不规则性具有很强的鲁棒性。
背景
在道路网络上建模时空事件的演变最近引起了极大的兴趣。具体来说,每个节点(或边)参与时间序列。这些时间序列不仅是时间的函数,还取决于网络中其他节点上发生的事件。预测任务的目标是建模每个节点上时间序列的演变并预测最近未来的值,例如下一小时。
方法
Frigate 由一个联合架构组成,该架构由Siamese GNN和LSTM堆栈组成,采用编码器-解码器格式。Frigate 采用门控Lipschitz嵌入进行消息传递,并结合LSTM进行时间编码,从而实现高效、鲁棒的时空预测。模型的关键创新包括使用Lipschitz嵌入进行位置编码、门控机制以避免过度平滑以及利用瞬时特征增强预测精度。
结果
在三个大城市(北京、成都和哈尔滨)的真实道路网络数据集上进行的广泛评估显示,Frigate 显著优于最先进的算法,并证明了其对数据噪声和网络变化的鲁棒性。实验表明,Frigate 在预测准确性上超过现有模型,平均 MAE 下降超过 25%。
讨论
Frigate 在处理实际道路网络中的各种挑战时表现出色,包括部分节点感知、道路网络拓扑更新以及时间数据不规则性。实验结果验证了 Frigate 在处理这些现实世界问题方面的有效性和鲁棒性。
新颖性
与现有方法相比,Frigate 在模型设计中显式考虑了现实世界的实际挑战,如有限的传感器访问、传感器故障和数据噪声。通过使用 Lipschitz 嵌入和门控机制,Frigate 在表达能力和预测性能上显著优于现有 GNN 模型。
局限性
尽管 Frigate 在各种场景下表现出色,但其在极端传感器故障或拓扑剧变的情况下的表现仍需进一步验证。此外,Frigate 的计算复杂度相对较高,在非常大规模的网络上可能需要进一步优化。
潜在应用
该方法可应用于多种需要时空预测的实际场景,如交通流量预测、智能交通管理和城市规划等。
理解数据集中使用的特定数据集及其代表的意义对于深入了解研究工作非常重要。以下是对这三个数据集(北京、成都和哈尔滨)的详细解释及其在研究中的意义:
数据集概述
北京数据集
- 节点数:28465
- 边数:64478
- 地理面积:16,411 km²
- 平均车辆数:3.22
- 标准差:9.09
- 默认“可见”节点百分比:5%
- 行程数:785709
成都数据集
- 节点数:3193
- 边数:7269
- 地理面积:14,378 km²
- 平均车辆数:4.54
- 标准差:7.19
- 默认“可见”节点百分比:50%
- 行程数:1448940
哈尔滨数据集
- 节点数:6235
- 边数:15205
- 地理面积:53,068 km²
- 平均车辆数:77.85
- 标准差:124.11
- 默认“可见”节点百分比:30%
- 行程数:659141
数据集的意义
- 节点数和边数
节点数表示数据集中记录的道路交叉点的数量,而边数表示连接这些节点的道路数量。更多的节点和边数意味着更复杂的道路网络,反映了实际城市交通网络的复杂性。 - 地理面积
地理面积表示数据集中覆盖的物理区域大小。不同城市的地理面积差异反映了它们在数据收集范围和交通网络密度上的差异。例如,北京的数据覆盖面积较大,而成都的覆盖面积较小,但节点密度可能更高。 - 平均车辆数和标准差
平均车辆数表示在给定时间间隔内通过每个节点的平均车辆数量。标准差表示车辆数的波动程度。标准差越大,说明交通流量的变化越大,这对预测模型提出了更高的挑战。哈尔滨的标准差最大,表明其交通流量变化最为剧烈。 - 默认“可见”节点百分比
这个值表示在实验中,默认情况下有多少百分比的节点安装了传感器(“可见”节点)。例如,北京只有5%的节点是“可见”的,这意味着大多数节点的数据是缺失的,而成都有50%的节点是“可见”的,这意味着数据相对完整。通过这种设置,研究可以测试模型在不同传感器覆盖率下的性能。 - 行程数
行程数表示在数据收集期间记录的总行程数量。更多的行程数意味着更多的数据点,这有助于提高模型的训练和测试效果。成都的数据集中行程数最多,这为模型提供了丰富的数据资源进行训练和验证。
在研究中的作用
- 评估模型的鲁棒性
使用不同城市的数据集可以评估模型在不同环境下的表现。例如,北京的数据集代表了一个大规模、复杂的交通网络,而成都的数据集则更紧凑且传感器覆盖率更高。哈尔滨的数据集中交通流量波动大,对模型的预测能力提出了挑战。 - 测试模型在部分感知和拓扑变化下的性能
通过设置不同的“可见”节点百分比,研究可以测试模型在部分感知数据下的预测能力。这对于实际应用非常重要,因为在现实世界中,传感器可能不会覆盖所有道路节点。 - 验证模型的泛化能力
使用多个城市的数据集有助于验证模型的泛化能力,即模型在不同数据分布和交通模式下的表现。这确保了模型在实际应用中能够适应不同城市的交通预测需求。
这三个数据集代表了不同规模、复杂性和数据覆盖率的城市交通网络。通过这些数据集,研究可以全面评估 Frigate 模型在处理现实世界交通预测问题上的有效性和鲁棒性。
实验结果和性能对比
数据集
该论文使用了三个真实世界的数据集,分别来自中国的三个大城市:北京、成都和哈尔滨。这些数据集通过跟踪出租车的GPS轨迹收集。数据通过地图匹配处理与来自OpenStreetMap的相应道路网络关联。交通数据被聚合为每5分钟一个桶,传感器值对应每个节点在5分钟间隔内通过的车辆数量。
数据集 | 节点数 | 边数 | 地理面积 (km²) | 平均值 | 标准差 | 默认“可见”节点百分比 | 行程数 |
---|---|---|---|---|---|---|---|
北京 | 28465 | 64478 | 16,411 | 3.22 | 9.09 | 5% | 785709 |
成都 | 3193 | 7269 | 14,378 | 4.54 | 7.19 | 50% | 1448940 |
哈尔滨 | 6235 | 15205 | 53,068 | 77.85 | 124.11 | 30% | 659141 |
对比性能
实验对比了 Frigate 与以下基线方法的性能:DCRNN、STGCN、LocaleGN、STNN、GraphWavenet 和 STGODE。
预测精度(MAE、sMAPE、RMSE)
模型 | 数据集 | MAE | sMAPE | RMSE |
---|---|---|---|---|
Frigate | 成都 | 3.547 ± 0.20 | 131.17 ± 3.39 | 5.93 ± 0.31 |
STNN | 成都 | 5.633 ± 0.18 | 199.86 ± 0.00 | 9.50 ± 0.50 |
DCRNN | 成都 | 4.893 ± 0.26 | 138.17 ± 2.07 | 8.10 ± 0.48 |
LocaleGN | 成都 | 4.597 ± 0.22 | 192.80 ± 0.19 | 8.57 ± 0.33 |
STGODE | 成都 | 4.693 ± 0.19 | 147.12 ± 2.25 | 7.72 ± 0.39 |
STGCN | 成都 | 5.712 ± 0.33 | 198.38 ± 0.00 | 9.47 ± 0.50 |
GraphWavenet | 成都 | 5.308 ± 0.30 | 147.77 ± 1.81 | 8.89 ± 0.43 |
Frigate | 哈尔滨 | 73.559 ± 2.04 | 93.00 ± 1.89 | 105.01 ± 3.51 |
STNN | 哈尔滨 | 126.305 ± 4.54 | 199.68 ± 0.02 | 206.91 ± 6.93 |
DCRNN | 哈尔滨 | 124.109 ± 5.06 | 185.73 ± 0.68 | 204.75 ± 6.36 |
LocaleGN | 哈尔滨 | 128.674 ± 5.10 | 169.54 ± 1.43 | 207.36 ± 6.58 |
STGODE | 哈尔滨 | 122.493 ± 4.97 | 152.28 ± 1.27 | 198.81 ± 6.74 |
STGCN | 哈尔滨 | 无法完成训练 | 无法完成训练 | 无法完成训练 |
GraphWavenet | 哈尔滨 | 无法完成训练 | 无法完成训练 | 无法完成训练 |
Frigate | 北京 | 5.651 ± 0.11 | 169.73 ± 0.45 | 11.87 ± 0.30 |
STNN | 北京 | 6.215 ± 0.12 | 199.99 ± 0.01 | 12.82 ± 0.27 |
DCRNN | 北京 | 6.122 ± 0.14 | 195.56 ± 0.15 | 12.63 ± 0.24 |
LocaleGN | 北京 | 5.759 ± 0.13 | 172.73 ± 0.33 | 12.10 ± 0.03 |
STGODE | 北京 | 无法完成训练 | 无法完成训练 | 无法完成训练 |
STGCN | 北京 | 无法完成训练 | 无法完成训练 | 无法完成训练 |
GraphWavenet | 北京 | 无法完成训练 | 无法完成训练 | 无法完成训练 |
对比分析
- Frigate 在所有数据集上均表现出色,显著优于其他基线方法,平均 MAE 下降超过 25%。
- STNN 和 DCRNN 的性能紧随其后,但与 Frigate 仍有显著差距。
- STGCN 和 GraphWavenet 在处理大规模数据集(如北京和哈尔滨)时无法完成训练。
- LocaleGN 和 STGODE 的性能相对较好,但仍低于 Frigate。
节点频率划分的误差分布
- 高频节点的误差更大,因其流量波动更大。
- 中频节点和低频节点的误差相对较小。
- Frigate 在高频和中频节点上的表现尤为突出,优于所有其他模型。
训练节点数量的影响
- 随着“可见”节点数量的增加,所有模型的预测准确性均有所提高。
- Frigate 在“可见”节点较少时表现也很出色,表明其具有良好的泛化能力。
- 基线模型在“可见”节点超过 70% 后,性能开始有所下降,可能是由于过拟合。
模型鲁棒性和弹性
- Frigate 在面对网络拓扑变化(如道路封闭或新道路开通)时表现出色,准确性下降最小。
- Frigate 能够处理时间步长不规则的情况,准确性变化很小,表现出强大的鲁棒性。
通过这些实验结果,可以看出 Frigate 在处理具有实际挑战的道路网络时空预测任务中具有显著优势。
Frigate 模型的预测结果在多个方面具有重要意义,以下是这些预测结果的具体意义:
1. 提升交通管理和规划效率
- 实时预测:Frigate 模型可以实时预测道路网络上的交通流量,帮助交通管理部门在高峰期和突发事件发生时迅速做出反应,从而有效疏导交通,减少拥堵。
- 长期规划:通过对历史交通数据的分析和未来流量的预测,城市规划者可以制定更合理的交通基础设施建设计划,如新道路的规划、现有道路的扩展等,从而提升城市交通系统的整体效率。
2. 应对传感器缺失和故障
- 部分感知数据的处理:Frigate 能够在传感器覆盖不完全的情况下,仍然提供高精度的流量预测。这对于预算有限、难以在所有路口部署传感器的城市尤为重要。
- 传感器故障的鲁棒性:Frigate 模型对传感器数据的不规则性具有高度鲁棒性,可以应对传感器故障或数据丢失的情况,确保预测结果的可靠性。
3. 应对网络拓扑变化
- 动态适应:Frigate 能够处理道路网络拓扑的动态变化,如新道路的开通、旧道路的关闭等。这种动态适应能力使其适用于实际城市中的多变交通环境。
- 降低维护成本:传统模型在面对拓扑变化时需要重新训练,而 Frigate 的设计使其无需重新训练即可适应变化,显著降低了模型维护成本。
4. 提升城市交通智能化水平
- 智能交通管理系统的基础:Frigate 提供的高精度交通流量预测数据,可以作为智能交通管理系统的基础数据,支持更高级的交通控制和管理决策,如信号灯优化、车流引导等。
- 支持自动驾驶技术:准确的交通流量预测对于自动驾驶技术的发展具有重要意义,能够帮助自动驾驶车辆更好地规划路径、避开拥堵区域,提升行驶效率和安全性。
5. 提升公共服务质量
- 公共交通优化:通过准确预测道路交通流量,公共交通系统可以优化公交车、地铁等的调度,提高公共交通服务的效率和准点率。
- 紧急服务保障:在紧急情况下,如自然灾害或重大事件发生时,准确的交通预测可以帮助紧急服务部门(如救护车、消防车)选择最佳路径,快速到达目的地,提高应急响应速度。
6. 环境保护
- 减少碳排放:通过优化交通流量,减少车辆在道路上的拥堵时间,可以显著减少车辆的燃油消耗和碳排放,有助于环境保护和空气质量的改善。
- 促进绿色出行:准确的交通流量预测可以促进市民选择更为环保的出行方式,如公共交通、自行车等,从而减少对环境的影响。
总结
Frigate 模型在实际应用中具有广泛而深远的意义,不仅能够提升交通管理和规划的效率,还能应对各种现实世界中的挑战,促进城市交通系统的智能化发展,提高公共服务质量,并对环境保护产生积极影响。通过这些方面的改进,Frigate 模型为构建智慧城市和可持续发展的未来交通系统提供了强有力的技术支持。