Spatiotemporal Adaptive Gated Graph Convolution Network for Urban Traffic Flow Forecasting

该研究针对城市交通流量预测的挑战,提出了一种融合空间邻域和语义邻域的动态加权图构建方法,并结合多头自注意时间卷积网络。模型通过自适应图门控机制捕捉时空依赖,有效处理交通数据的实时变化和道路的语义相似性。实验结果表明,该模型能有效提升预测精度。
Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen
文本生成
Qwen3

本镜像基于 RTX 4090D 24GB 显存 + CUDA 12.4 + 驱动 550.90.07 深度优化,内置完整运行环境与 Qwen3-32B 模型依赖,开箱即用。

Spatiotemporal Adaptive Gated Graph Convolution Network for Urban Traffic Flow Forecasting

1.文章概述

当前方法不足:

  • 交通数据实时变换,但大多数方法使用预定义图
  • 道路的语义相似性没被考虑到

创新点:

  • 通过寻找道路节点的空间邻域和语义邻域来构造动态加权图
  • 多头自注意时间卷积网络被用来捕获历史观测中的局部和远程时间依赖关系
  • 提出了一种自适应图门控机制

2. 问题定义

[Xt−T+1,⋯ ,Xt;G]⟶f(⋅)[Xt+1,⋯ ,Xt+M] \left[\mathrm{X}^{t-T+1}, \cdots, \mathrm{X}^{t} ; \mathcal{G}\right] \stackrel{f(\cdot)}{\longrightarrow}\left[\mathrm{X}^{t+1}, \cdots, \mathrm{X}^{t+M}\right] [XtT+1,,Xt;G]f()[Xt+1,,Xt+M]

给出前T个历史观察数据预测之后M个预测结果。

  • Spatial Neighbor Subgraph

Aijsp={1,vi and vj share the same intersection, 0, otherwise  A_{i j}^{s p}= \begin{cases}1, & v_{i} \text { and } v_{j} \text { share the same intersection, } \\ 0, & \text { otherwise }\end{cases} Aijsp={1,0,vi and vj share the same intersection,  otherwise 

  • Semantic Neighbor Subgraph

使用DTW算法计算两个时间序列的相似度,这里使用DTW算法是因为DTW算法计算的是两个序列距离并不是基于欧式距离的:

image-20210915201313199

如上图所示,可以发现DTW算法所计算出来的距离更时候表示两个时间序列的相似度

语义邻接矩阵定义如下
Aijse={1,DTW⁡(vi,vj)>ϵ0, otherwise  A_{i j}^{s e}= \begin{cases}1, & \operatorname{DTW}\left(v_{i}, v_{j}\right)>\epsilon \\ 0, & \text { otherwise }\end{cases} Aijse={1,0,DTW(vi,vj)>ϵ otherwise 

3. 模型

image-20210915201515684

模型框架如上所示,由三部分组成:自注意时间卷积网络、自适应门控图卷积网络和时空融合层

3.1 Self-Attention TCN

潜在子空间学习过程可以表示为:
Q=XWQ,K=XWK,V=XWV Q=X W^{Q}, \quad K=X W^{K}, \quad V=X W^{V} Q=XWQ,K=XWK,V=XWV
注意力计算公式如下:
 Attention (Q,K,V)=softmax⁡(QKTdk)V \text { Attention }(Q, K, V)=\operatorname{softmax}\left(\frac{Q K^{T}}{\sqrt{d_{k}}}\right) V  Attention (Q,K,V)=softmax(dkQKT)V
本文使用多头注意力机制:
 MultiHead (Q,K,V)= Concat ( head 1,…, head h)WO where head i= Attention (Qi,Ki,Vi) \begin{aligned} \text { MultiHead }(Q, K, V) &=\text { Concat }\left(\text { head }_{1}, \ldots, \text { head }_{h}\right) W^{O} \\ \text { where head }_{i} &=\text { Attention }\left(Q_{i}, K_{i}, V_{i}\right) \end{aligned}  MultiHead (Q,K,V) where head i= Concat ( head 1,, head h)WO= Attention (Qi,Ki,Vi)
多头注意力网络的计算结果作为TCN网络的输入,其中TCN网络对于时刻t的节点i在p通道上TCN可以表示为:
yi,t,p=∑k=1Kτ∑m=1Mwk,m,p⋅xi,t−d(k−1),m y_{i, t, p}=\sum_{k=1}^{K_{\tau}} \sum_{m=1}^{M} w_{k, m, p} \cdot x_{i, t-d(k-1), m} yi,t,p=k=1Kτm=1Mwk,m,pxi,td(k1),m
其中d为卷积扩张率,wk,m,pw_{k,m,p}wk,m,p是卷积核的元素。对整个TCN可表示为:
Ytcn=W∗dX \mathcal{Y}_{t c n}=\mathcal{W} *_{d} X Ytcn=WdX

3.2 Adaptive Gated Graph Convolution Network (AG-GCN)

image-20210915211123787

网络总框架中有两个AG-GCN模块,其差别在于输入数据一个是基于距离的关联矩阵,一个是基于语义信息的矩阵。在AG-GCN模块中,使用了两种不同的图形卷积方法,并使用一种自适应的图形门控机制将两种图形卷积的结果整合在一起,以实现知识的选择性更新和遗忘

  • Multi-head Graph Attention Network

    该模块输入数据为:h=h1,h2,…,hN∈RDh={h_1,h_2,\ldots,h_N}\in R^Dh=h1,h2,,hNRD,输出为:h′=h1′,h2′,…,hN′∈RMh^{'}={h^{'}_1,h^{'}_2,\ldots,h^{'}_N}\in R^Mh=h1,h2,,hNRM

首先节点通过共享线性变换和多头注意力机制计算两节点之间的注意力系数:
eij=a(Whi,Whj),j∈Ni e_{i j}=a\left(W h_{i}, W h_{j}\right), j \in \mathcal{N}_{i} eij=a(Whi,Whj),jNi

αij=softmax⁡j(eij)=exp⁡(eij)∑k∈Niexp⁡(eik) \alpha_{i j}=\operatorname{softmax}_{j}\left(e_{i j}\right)=\frac{\exp \left(e_{i j}\right)}{\sum_{k \in N_{i}} \exp \left(e_{i k}\right)} αij=softmaxj(eij)=kNiexp(eik)exp(eij)

K个独立的注意力机制结果concatenate形成最后的结果。

  • Adaptive Graph Gating Mechanism

为了防止出现过平滑问题,本文提出了自适应图门控机制,此次使用两个可学习向量Es,EtE_s,E_tEs,Et,获得自适应邻接矩阵:
Aadp=softmax⁡(ReLU⁡(EsEtT)) A_{a d p}=\operatorname{softmax}\left(\operatorname{ReLU}\left(E_{s} E_{t}^{T}\right)\right) Aadp=softmax(ReLU(EsEtT))
然后利用自适应邻接矩阵计算图形卷积的结果,得到门阈值γ\gammaγ
γ=σ(AadpXΘ) \gamma=\sigma\left(A_{a d p} X \Theta\right) γ=σ(AadpXΘ)
阈值γ\gammaγ用来控制这一层保留多少信息,1−γ1-\gamma1γ表示在下一层中忘记该层多少信息,并使用多少上一层的结果
yag−gcnl={X,l=0,γl⊙g(Zl)+(1−γl)⊙yag−gcnl−1,l=1,2,…,L y_{a g-g c n}^{l}= \begin{cases}X, & l=0, \\ \gamma^{l} \odot g\left(Z^{l}\right)+\left(1-\gamma^{l}\right) \odot y_{a g-g c n}^{l-1}, & l=1,2, \ldots, L\end{cases} yaggcnl={X,γlg(Zl)+(1γl)yaggcnl1,l=0,l=1,2,,L

3.3 Spatiotemporal Fusion Network

在获得时间、空间和语义域的高维特征后,如何聚合时空信息进行多步预测,本文探讨了三种融合机制机制:级联机制、最大池机制和LSTM注意机制

  • Concatenationconcatenate[hitp,hisp,hidtw]concatenate[h_{i}^{t p}, h_{i}^{s p}, h_{i}^{d t w}]concatenate[hitp,hisp,hidtw],最直接保留最多原始时空特征
  • Max-pooling:max[hitp,hisp,hidtw]max[h_{i}^{t p}, h_{i}^{s p}, h_{i}^{d t w}]max[hitp,hisp,hidtw]
  • LSTM-attention

预测方法:

  • auto-regressive prediction method

image-20210915215608381

  • Direct Multi-step Prediction

image-20210915215648311

您可能感兴趣的与本文相关的镜像

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen
文本生成
Qwen3

本镜像基于 RTX 4090D 24GB 显存 + CUDA 12.4 + 驱动 550.90.07 深度优化,内置完整运行环境与 Qwen3-32B 模型依赖,开箱即用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值