收藏 分销(赏)

基于多源异构时空数据融合的交通流量预测模型.pdf

上传人:自信****多点 文档编号:576119 上传时间:2024-01-02 格式:PDF 页数:14 大小:3.33MB
下载 相关 举报
基于多源异构时空数据融合的交通流量预测模型.pdf_第1页
第1页 / 共14页
基于多源异构时空数据融合的交通流量预测模型.pdf_第2页
第2页 / 共14页
基于多源异构时空数据融合的交通流量预测模型.pdf_第3页
第3页 / 共14页
亲,该文档总共14页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、69TOPIC 专题2023042-1基于多源异构时空数据融合的交通流量预测模型摘要交通流量预测问题具有多源异构性,未来时刻的流量不仅与之前时刻的流量相关,同时也受城市区域间关系、天气情况、兴趣点(point of interest,POI)等异构时空数据的影响。针对此问题,提出一种基于多源异构时空数据融合的交通流量预测模型MHF-STNet。首先使用聚类方法获得城市区域不同的流量模式,并使用拼接、权重相加、注意力机制等多种方式融合交通流量、城市区域间的位置关系、天气、POI、工作日、假期多个模态的时空数据,使用深度学习方法对异构数据统一建模,预测未来时刻的交通流量。在北京出租车、纽约出租车和

2、纽约自行车3个流量数据集上进行实验,与经典的交通流量预测模型相比,MHF-STNet的预测准确度有所提升。结果验证了MHF-STNet对异构时空数据统一建模的有效性。关键词交通流量预测;多源异构数据统一建模;时空相关性中图分类号:TP311 文献标志码:A doi:10.11959/j.issn.2096-0271.2023042Urban traffic flow prediction based on the multi-source heterogeneous spatio-temporal data fusionAbstractThe problem of traffic flow f

3、orecasting has multi-source heterogeneity.The traffic flow in the future is not only related to the flow at the previous moment,but also affected by heterogeneous spatio-temporal data such as the relationship between urban regions,weather conditions and POI(point of interest).To solve this problem,a

4、 traffic flow prediction model based on multi-source heterogeneous spatio-temporal data fusion was proposed,which was called MHF-STNet(multi-source heterogeneous fusion spatio-temporal network).Firstly,this model used clustering methods to obtain different traffic patterns in urban areas,and utilize

5、d various methods such as concatenation,weight addition,and attention mechanism to integrate spatio-temporal data of multiple modalities,including traffic flow,location relationships between urban areas,weather,POI and the time of day.Deep learning methods were used to uniformly AN Yang1,SUN Jianwei

6、2,LI Qian2,GONG Yongshun11.School of Software,Shandong University,Jinan 250100,China2.No.15 Research Institute,China Electronics Technology Group Corporation,Beijing 100083,China安洋1,孙健玮2,李倩2,宫永顺11.山东大学软件学院,山东 济南 250101;2.中国电子科技集团有限公司第十五研究所,北京 100083BIG DATA RESEARCH 大数据70model heterogeneous data and

7、 predict traffic flow in the future.Experiments were conducted on three real-world traffic datasets,TaxiBJ,TaxiNYC and BikeNYC datasets.The results showed that MHF-STNet achieved the best performance compared with some classic traffic flow prediction models,which verified the effectiveness of MHF-ST

8、Net for unified modeling of heterogeneous spatio-temporal data.Key wordstraffic flow prediction,unified modeling of multi-source heterogeneous data,spatio-temporal correlation0 引言随着城市交通运输量的不断增加,出行拥堵严重、道路资源紧缺等问题也随之而来。城市开始逐渐关注智慧交通的建设,使用人工智能、大数据等智能计算技术,深度挖掘交通数据之间的关系,分析并处理城市中的交通数据,为居民的出行畅通和城市的建设发展提供技术支持

9、。交通流量预测是智慧交通的经典问题之一,根据城市之前时刻每个区域的交通流量,预测接下来时刻城市各区域的交通流量。交通流量预测具有高度的复杂性,下个时刻的流量受城市中多种异构时空数据的共同影响。如图1所示,在时间维度上,前几个时刻的流量趋势影响下个时刻的流量。在空间维度上,城市区域的地理位置关系影响相邻区域的流量流动,同时由于城市不同的区域规划,其流量呈现不同的交通模式变化,比如包含车道的区域流量大,包含郊区的区域流量小。同时,交通流量还与当时的天气、是不是工作日、是不是假期、POI等跨管辖域的异构时空数据有关。因此,交通流量具有很强的时空相关性和多源异构性,如何对异构时空数据统一建模,充分融合

10、多模态时空数据,有效捕获城市区域流量的时空特征,建立一个有效准确的预测模型,是交通流量预测的关键任务。目前,研究人员提出了大量方法用于解决交通流量预测问题。由于交通流量复杂的时空关系,大部分研究方法从流量的时间维度和空间维度进行分析,时间维度即根据之前时刻的流量趋势预测未来时刻的流量,空间维度即根据城市区域的地理位置关系预测相邻区域的流量。但是还存在一些难点有待解决,具体如下。交通流量不仅与过去时刻的流量和区域空间关系有关,还与天气、时间、POI等实时属性有关,统一建模并有效融合多源时空数据,可以更准确地预测流量。城市区域间不仅存在地理位置关系,还存在隐式的相关关系。具有相似流量模式的区域之间

11、流量会相互影响,同时不同的流量模式呈现不同的流量变化。研究区域间的相关关系,可以更准确地捕获流量的变化趋势。针对上述问题,本文提出一个基于多源异构时空数据融合的城市交通流量预测模型MHF-STNet(multi-source 图 1交通流量预测的时空相关性和多源异构性2023042-271TOPIC 专题heterogeneous fusion spatio-temporal network),将交通流量、城市区域的空间关系、交通模式、天气、时间、POI等多源异构时空数据统一建模,利用深度学习方法有效融合多源时空特征。本文的主要贡献如下。研究区域之间的相关关系,根据区域的流量模式,使用K-Me

12、ans算法将具有相似流量模式的区域聚集起来,提取不同交通模式的流量特点。本文提出了MHF-STNet模型,将交通流量、城市空间关系、交通模式、天气、假期、POI多模态时空数据统一建模,使用拼接、加法融合、注意力机制等多种融合方法融合多源异构时空数据,联合提取交通流量的时空特性,预测未来时刻的流量。在北京出租车、纽约出租车和纽约自行车数据集上进行实验,与7个经典的交通流量预测模型相比,本模型预测准确度有所提高。1 相关工作与本文相关的工作主要有两类:交通流量预测和异构数据统一建模。1.1 交通流量预测很多学者从20世纪60年代开始研究交通流量预测问题,已经提出了许多交通流量预测方法。早期基于统计

13、的流量预测方法是对历史流量进行数学统计分析,获得预测流量的计算式,主要有历史平均模型(HA)和差分自回归平均移动模型(ARIMA)。历史平均模型1利用过去时刻的平均流量预测未来时刻的流量。差分自回归平均移动模型2将随时间变化的流量数据看成一个序列,使用模型拟合流量序列预测下个时刻的流量。这类模型只考虑了时间关系,不易处理复杂且非线性的交通流量数据。基于机器学习的流量预测方法使用智能算法提取流量的时空特征,可以对更复杂的流量数据建模,其主要使用的模型是K近邻3、支持向量机。但这类方法依赖于特征工程,需要依靠专家经验提取有效信息。随着深度学习算法的快速发展,越来越多的研究人员开始使用这种方法来预测

14、交通流量。2017年,Zheng Y等4提出时空预测模型ST-ResNet,根据交通流量的周期性,从小时、天、周3个维度分别用残差网络提取流量的临近性、周期性、趋势性特征,有效提高了流量预测的准确度。Kipf T N等5提出图卷积神经网络,根据图中节点的邻接关系聚集节点本身和邻居的特征,有效捕获图的拓扑结构。Guo S N等6提出基于图卷积的交通流量预测模型ASTGCN,通过自注意力机制7学习更重要的时间和空间特征,把学习到的动态空间关系与地理位置融合,利用图卷积网络提取区域的空间关系。Guo K等8提出基于动态图卷积的交通流量预测模型DGCN,将城市抽象成图,构造随时间变化的动态城市图的拉普

15、拉斯矩阵,使用图卷积神经网络获得区域间的邻接空间关系,进一步提升预测流量的准确度。AGCRN9学习城市中每个节点具体的流量特点,并利用节点特征自适应地学习城市图,有利于根据任务自适应学习时空关系,捕获更准确的时空特征。1.2 跨管辖域的异构数据统一建模异构数据统一建模是从多个信息源获取数据,利用模型提取不同数据的特征,2023042-3BIG DATA RESEARCH 大数据72并将特征融合获得更高阶有效的信息,以实现异构数据间的信息互补10-15。异构数据统一建模的难点在于多源异构数据的融合,不同数据有自己独有的特征,解决不同特征空间的差异并充分融合特征,有利于获得更全面的信息。多源数据融

16、合主要利用联合架构、协同架构、编解码架构实现模态之间的融合。联合架构是将每个模态的特征联合映射到一个公共子空间,常见的方法有加法融合和乘法融合。协同架构是寻找公共子空间中模态间的关联关系,主流的协同方法是交叉模态相似性方法,目的是学习一个子空间使不同模态的相关性最大化。编解码架构是编码器将源模态映射成中间状态,解码器将中间状态映射到与融合特征相同的子空间。大部分交通流量预测模型在针对不同的异构数据时使用不同的方法融合数据16-19。ST-ResNet使用联合架构融合方式,将小时、天、周3个维度的流量特征按权重相加融合为整体的时间特征,并与天气、工作日、假期等实时特征权重相加融合;ASTGCN、

17、DGCN把流量特征输入图卷积网络,根据地理位置关系聚集每个节点邻居的流量特征,将流量特征和空间关系融合;DeepSTN+20模型使用卷积网络提取城市区域的POI特征,并使用按位相加的方法融合POI特征和时间特征。本模型联合考虑流量、地理位置关系、天气、假期、工作日、POI等多种时空数据,使用多种方式将其融合为时空特征。首先利用拼接方式将天气、假期、时间的实时数据融合,使用卷积网络将实时数据和POI数据融合为外部特征;使用联合架构中权重相加的方式,将小时、天、周3个维度的时间特征融合,并将流量特征和外部特征相加融合为高阶特征;将提取的流量特征传入图卷积网络,根据地理位置关系提取城市空间关系。同时

18、本模型使用K-Means学习一个新的模态数据,根据城市区域的流量变化获得不同的交通模式,并使用软聚类的方式把流量特征映射到交通模式空间,使用注意力机制与交通模式融合。因此,本模型对过去流量、区域地理位置关系、流量模式、天气、POI等多源时空数据统一建模,使用多种方法充分融合多源时空数据,实现数据之间的互补,共同预测未来时刻的流量。2 问题定义根据经纬度将城市划分为IJ的均分网格,如图2所示,每个网格代表城市的一个区域,位置(i,j)表示第i行第j列的区域,共有N=IJ个区域。将城市表示成一个无向图G=(V,E,A),节点V代表城市区域,E代表区域之间的边,邻接矩阵A表示区域之间的邻接关系。每

19、个 时 刻 的 城 市 流 量 表 示 为2 I Jt XR,第 一 维in,0,()i jjtit=XX表 示从其他区域到(i,j)区域的入流,第二维out,1,()i jjitt=XX表示从(i,j)区域出去的流量。由于交通流量具有周期性,前几个时刻的流量趋势影响着当前时刻的流量,并且前几天、前几周同一时刻的流量与当前时刻的流量具有相似的关系。因此,本方法结合前几个小时Xh、前几天Xd、前几周Xw的流量共同预测未来时刻的流量Xt,其分别表示为:2(1)1,hhhlI Jht ltlt =XXXXR(1)2(1),dddlI Jdt ldtldt d =XXXXR(2)2(1),wwwlI

20、Jwt lwtlwt w =XXXXR(3)其中,lh、ld、lw是从小时、天、周3个维度获得时间片段的个数,小时数据每个流量间隔1个时间段,天数据间隔d个时间段,周2023042-473TOPIC 专题数据间隔w个时间段。输入数据如图3时间轴所示,预测1月30日早晨9点的流量,小时维度输入当天早晨6点到8点半的流量,天维度输入前两天早晨9点到9点半的流量,周维度输入前两周即16日和23日早晨9点到9点半的流量,利用3个时间维度的流量共同预测未来时刻的流量。因此,本问题可以表达为:weaweekholpoi(,;)hdwtF=XXXXXXXXG (4)其中,F是预测模型,对过去时刻的流量hX、

21、dX、wX、天气weaX、工作日weekX、假期holX、POI信息poiX、城市地理位置关系G等多源时空数据统一建模,充分融合异构时空特征,捕获城市流量的时空关系,预测未来t时刻的流量tX。3 基于多源异构时空数据融合的交通流量预测模型MHF-STNet本节首先介绍MHF-STNet的整体框架,然后介绍利用聚类学习交通模式的具体方法,最后详细介绍流量特征、外部特征、交通模式和空间特征的融合方法。3.1 总体框架由于交通流量的多元复杂性和时空相关性,本文提出一种基于多源异构时空数据融合的交通流量预测模型MHF-STNet,整体框架如图4所示,主要由4个部分组成。首先,利用K-Means算法将具

22、有相似流量变化的区域聚类获得不同的交通模式;之后使用残差网络从小时、天、周3个维度提取流量的时间特征,与天气、假期、POI等外部特征权重相加融合;其次利用软聚类方法将流量特征映射到交通模式空间,使用注意力机制融合交通模式,再利用图卷积网络捕获城市的空间关系,最后使用卷积网络预测下个时刻城市区域流量。3.2 利用K-Means算法学习交通模式由于城市区域的功能性不同,属于相似功能区的区域流量比较相似,而属于不同功能区的区域流量大概率呈现不同的交图 2城市区域网格图图 3模型输入小时、天、周 3 个维度的数据2023042-5BIG DATA RESEARCH 大数据74通模式。例如主干车道的流量

23、比较大,商场的流量在下午及晚上比较大。因此使用K-Means算法将具有相似流量变化的区域聚类,获得不同的交通模式。首先在训练过程开始之前,对所有数据聚类获得城市区域的交通模式特征。每个区域的特征由这个区域所有时刻的流量数据构成,过程如图5所示。首先将每一天相同时刻的流量求平均值作为这个时刻的特征,每个区域特征由这个区域一天中不同时刻的平均流量构成。使用K-Means对城市区域聚类,利用轮廓系数确定类别个图 4MHF-STNet 模型整体框架图 5使用 K-Means 算法获得交通模式的过程2023042-675TOPIC 专题数M,将类别中心作为不同交通模式特征M DPR,共有M个交通模式,每

24、个交通模式的特征维度D=2T,其中T是一天的时刻个数。3.3 相加融合流量特征和外部特征根据交通流量的周期性,从小时、天、周3个维度提取交通流量的时间特征,每一维度使用相同的网络结构。以小时数据为例,首先将流量从时间维度拼接为2hlI Jh XR,使用残差网络提取城市流量的时空特征。共有L层残差结构21,每一层表示为:1(;),0,1llllflL+=+=XXX (5)其中f是残差函数,其结构如图6所示,由2层ReLU激活函数和卷积核为33的卷积操作构成。第一层输入hX,利用L层卷积网络聚集时间特征和局部空间特征,捕获局部的时空相关性,输出流量特征LC I J XR。小时、天、周3个维度分别用

25、残差网络提取时间特征,获得输出LhX、ldX、lwX。由于3个时间维度对不同区域流量的影响不同,利用联合结构中权重相加的方法融合不同时间的特征:resLLLhhddww=+XWXWXWX(6)其中,表示哈达玛积,将不同特征按照权重相加,表示不同特征对城市每个区域的不同影响。交通流量与天气weaX、工作日weekX、假期holX等实时属性有关。天气好时出行人数增多,工作日到办公区的流量大。首先利用拼接方法把城市实时属性融合为实时特征TlTXR,使用多层感知机提取实时特征,之后变换形状使维度与时间特征相同timeC I J XR:weaweekholconcat(,)T=XXXX(7)time21

26、reshape()T=XWW X(8)城市不同区域有不同的POI分布,其呈现不同的流量变化。商业区比较多的区域晚上流量比较大,而办公区所在区域在上下班时期流量比较大。将城市区域的POI分布Xpoi通过卷积网络提取POI特征poiC I J XR,输出维度与流量特征相同。将POI特征和实时特征按位相加,并利用卷积网络中卷积核将对应元素聚集的方式充分融合为外部特征resC I J XR:restimepoiconv()=+XXX(9)其中,是卷积网络的参数。与流量特征的3个时间融合过程相同,将外部特征通过权重相加的方式与流量特征融合,获得高阶特征XcRCIJ:resextextc=+XXWX(10

27、)3.4 利用注意力机制融合交通模式城市不同区域呈现不同的交通模式。为了更好地捕获流量特征和交通模式的关系,首先使用软聚类方法对流量特征聚类,将流量特征映射到交通模式特征空间,再通过注意力机制与交通模式特征融合,在同一个特征空间更有利于特征间的信息交互与融合,过程如图7所示。图 6残差结构2023042-7BIG DATA RESEARCH 大数据76首先将流量特征XcRCIJ变换形状为XcRNC,N=IJ,使用全连接层获得区域和交通模式的关系BRNM:B=softmax(XcWc)(11)Xm=BTXc(12)其中,Wc是参数矩阵,将Xc变换维度,通过函数使每一行和为1,每个值代表区域呈现交

28、通模式的概率。根据概率聚集每个交通模式的区域特征,将流量特征映射到交通模式特征空间获得XmRMC。之后利用注意力机制将两者融合:(13)XM=Hgv(P)(14)其中,gm、gp、gv是全连接层,利用注意力机制获得流量特征和交通模式的相关关系H,根据H融合交通模式,获得经过交通模式调整的流量特征XMRMC。之后将交通模式根据区域-交通模式关系B映射到区域特征中,每个区域根据其呈现的交通模式指导其流量变化:Xp=BXM(15)3.5 利用图卷积提取城市空间关系城市区域具有空间关系,相邻区域之间的流量会相互影响,将提取到的流量特征通过图卷积网络提取空间关系,根据节点的地理位置关系聚集流量特征,将流

29、量特征和空间关系融合。城市区域图G=(V,E,A)的拉普拉斯矩阵为L=D-A,1()Nijji=DA是节点的度,利用其最大特征值max归一化为max(2/N=LLI)。图卷积神经网络根据拉普拉斯矩阵聚集节点和邻居节点的特征,有效捕获区域之间的地理位置关系:(16)其中,()kT L是通过切比雪夫多项式获得的区域K阶邻接关系12()2()()kkkTTT=LLLL,1()T=LL,0()NT=LI,K是K阶训练参数。将每个区域与其K阶邻居的特征聚集,捕获相邻区域之间的关系,提取城市区域的空间关系。3.6 模型预测模型已联合捕获了交通流量、交通模式、天气、假期、POI等多种时空特征,最后直接预测下

30、个时刻的流量为:tanh(reshape()ttGg=XX (17)先将特征形状XGRNC变换为网格形状XGRCIJ,使用卷积操作gt将特征维度变成预测流量维度,最后利用tanh激活函数将数据变为-1,1范围的值,获得t时刻图 7区域特征和交通模式融合过程2023042-877TOPIC 专题的预测流量2I Jt XR。最后模型使用均方差损失函数进行学习:(18)使用真实值ix与预测值ix的平均误差平方作为模型的优化函数,最小化损失函数调整模型参数。4 实验分析为验证本模型对异构时空数据统一建模的有效性,在3个真实数据集上进行实验。下面介绍数据集和模型设置,并对实验结果进行详细介绍和分析。4.

31、1 实验数据本 文 在 北 京出租车(Ta x i B J)、纽约出租车(TaxiNYC)和纽约自行车(BikeNYC)数据集上进行实验,选择的数据集涵盖了用户的时空轨迹,其中的时序特征可由多源ResNet结构捕获,空间特征可由空间聚类与图卷积模块捕获,因此本文提出的时空预测模型可以高效地解决城市流量预测问题。3个数据集都将城市按经纬度划分成网格形状,每个数据集都有节假日、工作日等外部信息。数据集的具体情况见表1。模型中将数据最大最小值归一化,特征维度是64,共训练500轮。北京出租车数据集使用12层残差结构,将城市流量聚成8种交通模式。纽约出租车数据集使用6层残差网络,将城市流量聚成5种交通

32、模式。纽约自行车数据集使用4层残差网络,将流量聚成5种交通模式,都使用前3时、前4天、前4周的流量预测未来时刻的流量。4.2 基准模型及评价指标将MHF-STNet模型与经典的交通流量预测模型进行对比,对比模型介绍如下。HA:历史平均模型,利用过去时刻的平均流量和当前时刻的流量加权作为未来时刻的流量。ARIMA:差分自回归平均移动模型,将过去时刻的流量差分为一个平稳的序列,累加之前时刻的误差消除随机波动,利用模型拟合之前的流量序列预测未来时刻的流量。RNN22:时间序列模型,每个时间模块将前一个时刻的流量和当前时刻的流量融合,再传入下个时间模块处理,捕获时间之间的相关性。LSTM23:也是时间

33、序列模型,在每个时间序列模型中利用遗忘门、更新门表 1实验数据集数据集数据类型时间范围时间间隔网格大小外部特征北京出租车数据集(TaxiBJ)出租车GPS数据2013年7月1日2013年10月30日2014年3月1日2014年6月30日2015年3月1日2015年6月30日2015年11月1日2016年10月4日30 min(32,32)41种假期16种天气14种POI纽约出租车数据集(TaxiNYC)出租车轨迹数据2015年1月1日2015年3月1日1 h(10,20)20种假期纽约自行车数据集(BikeNYC)自行车租借数据2014年4月1日2014年9月30日1 h(16,8)20种假期

34、2023042-9BIG DATA RESEARCH 大数据78和输出门提取流量的有效信息,有效解决RNN模块梯度消失的问题。DeepSTN+:学习区域的POI特征和时空特征,使用卷积分别提取POI特征和时间特征后相加融合,再利用残差网络提取流量短距离空间关系和长距离空间关系,预测未来时刻的流量。ST-ResNet:利用残差网络从小时、天、周3个时间维度提取流量特征,同时考虑天气、工作日、假期等外部因素,将时空特征和外部特征融合后预测下个时刻的流量。ASTGCN:考虑区域的流量数据和地理位置关系,根据地理位置关系使用图卷积网络提取城市区域空间关系,再输入时间卷积网络中提取时间关系,利用多层时空

35、块将时间特征和空间特征融合,预测下个时刻的流量。采用平均绝对误差(MAE)和均方差误差(RMSE)评价模型预测的准确度,其计算式为:(19)(20)4.3 实验结果将MHF-STNet模型与基准模型在3个数据集上实验,使用MAE和RMSE评价模型预测的准确度,实验结果见表2。实验结果表明,传统的流量预测方法HA和ARIMA无法建模复杂的交通关系,预测误差很大。时间序列模型RNN、LSTM关注时间之间的相关性,但忽视了区域间的空间关系,预测准确度也较差。而DeepSTN+、ST-ResNet、ASTGCN模型从时间和空间维度联合学习时空之间的相关性,有效地提取了流量特征。DeepSTN+考虑了流

36、量的时空关系和POI数据,在纽约出租车数据集上比时间序列模型LSTM更准确,表明POI有助于捕获区域属性从而提升准确率。ST-ResNet学习流量数据和天气、假期、时间实时数据,在北京出租车数据集和纽约出租车数据集上比其他对比模型准确率更高,说明实时数据有助于对预测结果进行调整,提供更准确的预测。ASTGCN利用图卷积提取城市区域的空间关系,准确率比仅考虑流量的时间序列模型有所提高。MHF-STNet模型联合考虑流量、地理位置关表 2不同模型预测的实验结果模型北京出租车数据集纽约出租车数据集纽约自行车数据集MAERMSEMAERMSEMAERMSEHA16.7030.769.2229.193.

37、778.61ARIMA17.3623.668.3817.973.075.24RNN11.1617.975.8512.662.575.04LSTM10.8917.535.6912.542.434.83DeepSTN+10.9017.325.4712.352.535.02ST-ResNet10.6016.954.9112.282.485.05ASTGCN10.7017.255.6712.892.444.84MHF-STNet10.5516.684.8211.982.364.682023042-1079TOPIC 专题系、实时数据、POI等多源异构时空数据,同时学习不同的交通模式,使用拼接、加法融合

38、、注意力机制等多种融合方法,融合多个模态的时空特征。该模型在3个数据集上预测的准确度都优于基准模型,在北京出租车数据集上该模型的RMSE较ST-ResNet下降1.5%,在纽约出租车数据集上MAE较ST-ResNet下降1.8%,在纽约自行车数据集上RMSE较ASTGCN下降3.3%。结果表明,该模型能有效对异构时空数据统一建模,充分实现数据间的信息融合与交互,更准确地预测未来时刻的流量。4.4 消融实验为研究不同模态数据对实验结果的影响,在BikeNYC数据集上进行实验,并与包括相同模态数据的模型比较,实验结果见表3,左侧3列是MHF-STNet模型在不同模态下的实验结果,右侧3列是包含相同

39、模态的模型的实验结果。实验结果表明,当只有流量数据时,预测结果的误差比较大,该模型与时间序列模型RNN的预测准确率差不多。当加入POI信息后,准确率有所提升,该模型使用卷积网络提取POI后与流量特征权重相加,DeepSTN+同样使用卷积网络提取POI特征直接与流量特征相加,结果表明通过权重相加的方式可以调节POI信息对每个区域的不同影响,使预测更准确。在流量数据中加入天气、工作日、假期等实时信息后,比只有流量数据的预测准确率更高,该模型与ST-ResNet的结果差不多。当在流量数据中考虑地理位置关系后,该模型预测的准确率比只有流量数据的MAE提升4.7%,表明未来流量的变化与地理位置关系较大,

40、相邻区域之间的流量会相互影响,该模型使用残差网络提取3个时间段的流量特征,通过卷积操作聚集局部的空间关系,再利用图卷积网络提取全局的邻接关系,而ASTGCN使用多层时空块中图卷积提取空间关系,结果表明同时考虑局部和全局空间关系可以获得全面的时空特征,预测结果有所提高。同时该模型学习了一个新的区域间隐式的相关关系,使用K-Means算法获得城市区域呈现的不同的交通模式。实验结果表明,交通模式有利于提升预测的准确度。同时该模型探究软聚类将流量特征映射到交通模式空间的方法是否有效。表3最后一行左侧的实验结果是该模型使用软聚类将流量特征映射到交通模式空间,并使用注意力机制融合流量特征和交通模式的结果。

41、右侧是该模型直接利用注意力机制将流量特征和交通模式融合的实验结果。结果显示,使用软聚类方式准确率更高,表明通过软聚类方式映射到同一特征空间后再使用注意力机制融合两种特征,更有利于特征之间的充分融合与信息交互。表 3不同模态数据的实验结果时空数据MAERMSE对比模型MAERMSE流量数据2.525.10RNN2.575.04流量数据+POI2.514.87DeepSTN+2.535.02流量数据+天气、工作日、假期2.454.95ST-ResNet2.485.05流量数据+地理位置关系2.404.78ASTGCN2.442.84流量数据+交通模式2.434.78MHF-STNet没有软聚类2.

42、444.812023042-11BIG DATA RESEARCH 大数据80同时研究随着模型融合的时空数据增加对模型准确率的影响,实验结果见表4。实验结果表明,随着模型融合的时空数据模态增多,模型预测的准确率不断增大。当只有流量单模态数据时,预测误差比较大。不断融合外部特征、交通模式、地理位置关系等多维时空数据后,RMSE从5.10下降到4.68,准确度提升8%。同时结果表明,不同模态的时空数据对提高准确度都有一定的作用,有效对异构数据统一建模,充分融合多源时空数据,有助于更全面地捕获流量的时空变化关系。5 结束语城市中多种时空数据共同影响交通流量的变化,本文提出一种基于多源异构时空数据融合

43、的交通流量预测模型MHF-STNet,对异构时空数据统一建模预测交通流量。首先使用K-Means捕获城市区域的交通模式,与过去流量、区域地理位置关系、天气、假期、POI等多维时空数据融合,对于不同的时空数据使用不同的融合方法将多源特征融合,捕获流量的时空相关性。在北京出租车、纽约出租车和纽约自行车数据集上进行实验,与经典的流量预测模型相比,该模型更加全面地捕获流量的时空特征,提高了预测的准确度。该模型使用多源异构时空数据统一建模预测交通流量,由于多源数据来自不同的传感器,不同传感器保存数据的时间和格式不一致,会造成多源数据缺失的问题。下一步工作将研究在缺失值情况下对多源数据统一建模,预测缺失时

44、刻和未来时刻的流量,同时将继续优化模型的融合策略,进一步提高预测的准确度。参考文献:1 STEPHANEDES Y J,MICHALOPOULOS P G,PLUM R A.Comparative performance eva luation of dema nd pred iction algorithmsJ.Traffic Engineering and Control,1981,22(10):544-547.2 WILLIAMS B M,HOEL L A.Modeling and forecasting vehicular traffic flow as a seasonal ARIM

45、A process:theoretical basis and empirical resultsJ.Journal of Transportation Engineering,2003,129(6):664-672.3 VAN L,VAN H.Short-term traffic and travel time prediction modelsJ.Artificial Intelligence Applications to Critical Transportation Issues,2012,22(1):22-41.4 ZHANG J B,ZHENG Y,QI D K.Deep spa

46、tio-temporal residual networks for citywide crowd flows predictionC/Proceedings of the AAAI Conference on Artificial Intelligence.New York:ACM Press,2017:1655-1661.5 KIPF T N,WELLING M.Semi-supervised classification with graph convolutional networksC/Proceedings of International Conference on Learni

47、ng Representations.S.l.:s.n.,2017.6 GUO S N,LIN Y F,FENG N,et al.Attention based spatial-temporal graph convolutional networks for traffic flow forecastingJ.Proceedings of the AAAI Conference on Artificial Intelligence,2019,33(1):922-929.7 VASWANI A,SHAZEER N,PARMAR 表 4增加不同模态的时空数据的实验结果时空数据MAERMSE流量数

48、据2.525.10流量数据+外部特征2.454.86流量数据+外部特征+交通模式2.424.75流量数据+外部特征+交通模式+地理位置关系2.364.682023042-1281TOPIC 专题N,et al.Attention is all you needJ.Adva nce s i n Neura l I nfor mation Processing Systems,2017,30.8 GUO K,HU Y L,QIAN Z,et al.Dynamic graph convolution network for traffic forecasting based on latent ne

49、twork of Laplace matrix estimationJ.IEEE Transactions on Intelligent Transportation Systems,2020,23(2):1009-1018.9 BAI L,YAO L N,LI C,et al.Adaptive graph convolutional recurrent network for traffic forecastingC/Proceedings of the 34th International Conference on Neural Information Processing System

50、s.New York:ACM Press,2020:17804-17815.10 何俊,张彩庆,李小珍,等.面向深度学习的多模态融合技术研究综述J.计算机工程,2020,46(5):1-11.HE J,ZHANG C Q,LI X Z,et al.Survey of research on multimodal fusion technology for deep learningJ.Computer Engineering,2020,46(5):1-11.11 王冬海,卢峰,方晓蓉,等.海洋大数据关键技术及在灾害天气下船舶行为预测上的应用J.大数据,2017,3(4):81-90.WANG

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服