收藏 分销(赏)

基于深度学习的网约车需求预测研究.pdf

上传人:自信****多点 文档编号:638904 上传时间:2024-01-22 格式:PDF 页数:6 大小:1.49MB
下载 相关 举报
基于深度学习的网约车需求预测研究.pdf_第1页
第1页 / 共6页
基于深度学习的网约车需求预测研究.pdf_第2页
第2页 / 共6页
基于深度学习的网约车需求预测研究.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、 10.16638/ki.1671-7988.2023.016.039 10.16638/ki.1671-7988.2023.016.039 基于深度学习的网约车需求预测研究 全煜坤(长安大学 汽车学院,陕西 西安 710064)摘要:网约车需求预测是一个典型的时间序列预测任务,准确的网约车需求预测能够辅助网约车平台合理地派单和规划路径,从而降低网约车的空驶率,具有重要的研究意义。文章利用长短时记忆模型(LSTM)及门控循环单元(GRU)进行网约车需求预测,对比了同一地区休息日和工作日,一周和一个月内的网约车需求及其变化,构建基于 LSTM 和 GRU 的需求预测模型,使用历史数据对未来需求进

2、行预测,使用 Geohash 代码对西安市进行区域划分,对数据和划分的网格进行匹配得到汇总数据,采用线性模型进行对照试验,结果表明,LSTM和 GRU 在网约车需求预测中的表现优于线性模型,二者相比 LSTM 预测精度更高。关键词:网约车需求预测;时间相关性;深度学习;长短期记忆神经网络 中图分类号:U491.1 文献标识码:A 文章编号:1671-7988(2023)16-188-06 Research on Demand Forecast of Online Car-hailing Based on Deep Learning QUAN Yukun(School of Automobile

3、,Changan University,Xian 710064,China)Abstract:The demand forecasting of online car-hailing is a typical time series forecasting task.The accurate demand forecasting can help the platform to arrange the order and plan the route reasonably,so as to reduce the empty driving rate of ride-hailing.It has

4、 important research significance.In this paper,long short-term model(LSTM)and gated recurrent unit(GRU)are used to forecast the demand of online car-hailing,demand for online car-hailing within a week and a month and its changes,building demand forecasting models based on LSTM and GRU,using historic

5、al data to predict future demand,and using Geohash code to map Xian by region,the data are matched with the grid to get the summary data,and the linear model is used for the control test.The results show that the performance of LSTM and GRU is better than that of the linear model in the demand forec

6、ast of online car-hailing,the prediction accuracy of LSTM is higher than that of LSTM.Keywords:Demand forecast of online car-hailing;Temporal correlation;Deep learning;Long short-term memory neural network 几乎全世界所有的城市都会面临出行困难问题,城市人口的快速增长带来了许多问题如城市作者简介:全煜坤(2000),男,硕士研究生,研究方向为深度学习,双挂汽车列车稳定性,E-mail:。第 1

7、6 期 全煜坤:基于深度学习的网约车需求预测研究 189 交通状况恶劣,出行难坐车难等,根据中国互联网络信息中心的数据,截至 2020 年 4 月,在中国拥有网约车经营许可的单位超过 140 家,全国合法运行的网约车驾驶员超过 150 万,一天的网约车网络下单数量达 2 000 多万。网约车用户规模和使用率在近几年大幅度提高,用户规模接近 4 亿,占网民整体的 40.1%1,越来越多的人选择网约车出行,如何精确地预测每个区域的需求数,减少等车时间成为了一个难题。网约车需求预测通常被当作一个时间序列短时预测问题来进行处理,目前应用于网约车需求预测的研究模型有线性、非线性和机器学习模型三类。线性预

8、测模型有历史均值法,整合移动平均自回归模型(Autoregressive Integrated Moving Average Model,ARIMA),以及卡尔曼滤波法(KF)等,历史均值法于 1981 年首次被应用于城市交通控制系统中2-3,主要使用于城市交通系统与高速公路交通量预测研究中4-5,胡佩锋利用历史信息和当天信息,构建了等步长和变步长的组合模型6;KF 即卡尔曼滤波法,1960 年 WELCH 等7学者第一次提出了这一预测方法,而国外学者 OKUTANI等8在 1984 年首次在交通流预测中使用了该方法,国内这方面也有研究如吉林工业大学的蔡晓禹等9在该算法的基础上建立了交通流量预

9、测模型,ARIMA 出现于 1976 年,具有较高的预测精度,杨高飞等10在 2012 年将 ARIMA 与卡尔曼滤波(KF)进行组合并构造了一个全新的组合预测模型。非线性预测模型主要有分形理论,小波分解重构及混沌理论等11,北京交通大学的熊杰12依据分形理论,对城市道路的交通特性进行了研究;陶丽13则使用了一个优化过的小波理论模型进行交通流量预测;湖北工业大学的常鹏阳14在小波 分析的基础上,通过算法优化,对交通流进行了预测研究。机器学习和深度学习这一领域应用较多的模型主要有决策树,神经网络模型,非参数回归法15等,非参数回归法首次出现在 1991 年16,随后在1995 年又被用于路段中单

10、点的短时交通流预测17;长安大学的周欣18使用基于 K 相邻的非参数回归法对高速公路的交通量进行了预测工作,2005 年杨胜等19等建立了一个基于传统决策树理论的交通流量预测模型;人工神经元网络算法则出现于1940 至 1950 年之间20,神经网络层即模仿生物神经系统,通过调整每一层神经元节点之间的关系和权重,进而很快地学习大量复杂信息,国内学者近些年也在预测中使用这些方法,如东南大学的张潇潇等21使用长短时记忆模型(Long Short-term Model,LSTM)预测了沪渝高速公路短时交通流;刘川22使用 LSTM 及其变体进行了 15分钟短时交通流预测;沈潇等23基于门控循环单元(

11、Gated Recurrent Unit,GRU)神经网络,计算了交通流数据的时间序列相关性,从而实现交通流的预测。本文旨在研究神经网络模型在时间序列预测中的表现,并探讨将其用于网约车需求预测的可行性,使用 LSTM 和 GRU 模型对网约车需求进行了预测,通过对比实验比较各个模型的精度,预测结果评估各个模型的预测表现,考虑了时间序列对需求变化的影响,为未来使用该方法进行更深层次的需求研究提供参考。1 数据处理及时间相关性分析 本文主要利用 LSTM和 GRU神经网络进行不同时间维度下的网约车需求预测,实验主要研究过程如图 1 所示。图 1 研究过程 1.1 数据预处理 本文选用的滴滴订单平台

12、数据是通过车载全球定位系统(Global Positioning System,GPS)设备记录下来的,选择的订单发生区域是西安主城190 汽 车 实 用 技 术 2023 年 区及周边各区,订单统计开始时间是 2018 年 1 月1 日,总计约 13 万条数据,本文采用随机抽样的方法,从中选择了两万四千余条作为实验数据,数据主要包括在线订单号、车牌号、驾驶员编号、出发地经纬度、终点经纬度、行驶距离、订单发生、结束时间。1.1.1 错误数据剔除 数据中存在统计错误,采用如下标准进行甄别和剔除:1)剔除由于输入错误导致经纬度记录为 0 的订单。2)剔除行驶时间和行驶距离过长或过短的数据。3)剔除

13、行驶速度不符合常理的数据。4)剔除 GPS 记录起始点,终点经纬度均不在研究区域内的数据,认定为 GPS 设备定位故障。1.1.2 地图标点 得到原始数据后本文将订单记录中的出发点经纬度在西安市地图上进行了标点,使用的软件为 ArcGIS。使用 Geohash 代码将西安市划分为若干个网格,对原始数据进行筛选处理、转换格式,与划分好的地图网格进行匹配。Geohash 是一种专门的地理信息编码算法,它将经纬度信息编码转化为一维的字符序列,研究区域的大致经纬度范围是东经 107.40到 109.48,北纬 33.42到 34.46。在得到区域划分的 Geohash 编码结果之后将订单与网格匹配,统

14、计了总需求数最多的三十个地区,对汇总数据进行时间切片处理,以二十分钟为间隔,得到了模型实验的输入数据,一个网格的编码,表征 1 km1 km 的实际区域。1.2 时间相关性分析 预测模型表现较好的前提是合理分析影响需求预测值的实际变量,本文的预测主要从时间因素考虑,需要对原始数据的时间相关性进行分析。1.2.1 同一区域工作日和休息日的需求分布 图 2 是同一区域在原始数据中连续三个工作 图 2 同一区域三个工作日的需求分布 日的需求分布,从图中看出局部虽有差异,但整体变化趋势非常相似,休息日情况类似。1.2.2 同一区域的一周和一月内需求分布 选择某一区域一周内的网约车需求数据,具体如图 3

15、 所示,一个月内的需求数据与之类似,从数据看出同一区域的需求量呈现一种循环重复的变化模式,具有相同特征的日期如工作日、节假日等,由于居民生活节奏相似,其同一区域的网约车需求相关性较高,因而利用时间相关性进行预测的精度就有了保障。图 3 同一区域一周之内的需求分布 综上,本文收集到的历史订单数据具有很强的时间序列特性,不同工作日和休息日,以及一周和一个月的需求分布表明具有类似特征的某些天,从较长的时间间隔考虑,同一区域的网约车需求分布呈现大致循环重复的模式,表明原始数据具有较强的时间相关性,为最终以时间为主要因素的预测结果的准确程度提供保证。2 网约车需求预测 网约车需求即通过网约车方式出行的总

16、量,假定将时间分为 N 个序列,将区域划分为 M 个网格,需求量用 D 表示,则 t 时刻(t0,T)m 区域(m0,M),流程即为模型通过学习 t 时刻前的若干个间隔内的数据,对 t 时刻后一段时间内该区域的需求数进行预测。2.1 基于深度学习的网约车需求预测框架 本文利用深度学习方法对网约车需求进行预测,框架如下,首先输入原始订单数据,进行数据预处理,经过筛查后删除错误记录,使用Geohash 代码进行网格划分,将划分好的网格与原始记录进行匹配,进行时间切片处理,得到汇总数据,然后进入实验模块,主要试验模型为 LSTM和 GRU 模型,汇总数据作为模型的输入值,模型经过训练及测试环节得到需

17、求量预测结果,然后进入评估模块,通过评估指标对模型预测结果和第 16 期 全煜坤:基于深度学习的网约车需求预测研究 191 真实订单值的误差进行计算,得到最终的评估结果。2.2 需求预测实验 从需求数目最多的三十个区域中挑选前五个进行实验,为了更充分地训练模型,本文对数据集以 8 比 2 的比例进行拆分,其中训练集包含 1 720 条数据,而预测集包含 440 条数据。2.2.1 实验环境 在数据实验中使用的电脑设备为 i5 处理器,电脑的操作系统是 64 位,机带运行内存为 4G,实验使用的软件主要有 Anaconda3,PyCharm,使用 Anaconda3 创建虚拟环境;使用 PyCh

18、arm 来运行相关程序;地图软件为 ArcGIS 软件。2.2.2 实验结果评估指标 选择均方根误差(Root Mean Square Error,RMSE),平均绝对误差(Mean Absolute Error,MAE),及平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)等评价参数作为需求预测结果的评估指标,公式如下:=NtttFANRMSE12)(1 (1)=NtttFANMAE1|1 (2)NAFAMAPENtttt100|arctanarctan|1=(3)上述各个公式中的“arctan”为正切功能;A和 F 为实际值和预测值;N 为时间片段

19、数目,数值越大表明实际值预测值误差越大。2.2.3 神经网络模型参数设置 分析隐含层不同神经元个数对结果的影响,选择了单层分别包含 32、64、128、256 个神经元进行了训练预测,结果表明 64 神经元误差最小,LSTM 模型的 RMSE 为 1.75;MAE 为 1.20;GRU模型的 RMSE 为 1.83;MAE 为 1.22,32 神经元最大;LSTM 模型的 RMSE 与 MAE 分别为 1.86和 1.29;GRU 模型为 1.97 和 1.31。Dropout 率是在隐藏层训练和拟合数据过程中避免过拟合的参数,分析了不同的 Dropout 率对结果的影响,分别选择了 0.2、

20、0.3、0.4、0.5 进行对比实验,结果表明取 0.4 时误差最小,LSTM 模型的 RMSE 为 1.76;MAE 为 1.24;GRU 模型的RMSE 为 1.80;MAE 为 1.26,取 0.3 时最大;LSTM模型的 RMSE 与 MAE 分别为 1.87 和 1.31;GRU模型为 1.88 和 1.34。综上,选择误差最小的参数构建模型,即隐藏层神经元个数设置为 64 个,Dropout 率设为 0.4,输入层输入历史数据,节点部分设置为 1,输出层输出模型预测结果,节点也设置为 1,隐藏层设为两层。2.2.4 模型训练 利用训练集对 LSTM 及 GRU 模型进行训练,误差随

21、迭代次数增加不断减少,表明模型预测精度越来越高,图 4 为 LSTM 模型训练情况,GRU模型与之类似,不再赘述。图 4 LSTM 模型训练图 2.3 预测结果 为了对比神经网络模型的预测效果,本文选择了线性回归(Linear Regression,LR)预测模型与支持向量机模型(Support Vector Machine,SVM)进行对比试验,实验结果如表 1表 4 所示。表 1 LR 模型实验结果 LR 第一组 第二组 第三组 第四组 第五组 RMSE MAE 5.412 362 4.355 025 3.699 725 2.978 424 3.122 656 2.512 502 3.11

22、5 946 2.178 063 2.285 145 1.800 785 表 2 SVM 模型实验结果 SVM 第一组 第二组 第三组 第四组 第五组 RMSE MAE 5.389 327 4.313 374 3.714 603 2.934 729 3.238 151 2.478 242 3.171 550 2.102 985 2.257 720 1.701 924 从结果中发现,线性回归模型的预测优于SVM,但二者偏差较大,不适合本文提出的预测任务,而 LSTM 和 GRU 模型的误差值较小,预测表现更优,而 LSTM 的预测误差整体低于 GRU,精度更高。192 汽 车 实 用 技 术 20

23、23 年 表 3 LSTM 模型实验结果 LSTM 第一组 第二组 第三组 第四组 第五组 RMSE MAE MAPE(%)1.840 103 1.253 784 67.502 884 1.832 176 1.226 752 52.088 091 1.793 901 1.182 654 53.521 247 1.716 555 1.235 951 61.108 781 1.838 463 1.203 799 45.050 388 表 4 GRU 模型实验结果 GRU 第一组 第二组 第三组 第四组 第五组 RMSE MAE MAPE(%)2.478 363 1.662 391 57.444 1

24、49 2.433 216 1.674 871 62.881 960 2.328 879 1.627 633 54.129 173 2.452 373 1.644 611 62.520 071 2.421 239 1.665 631 44.335 363 2.3.1 不同时间切片对预测结果的影响 用于预测的切片数据数量也会对预测结果产生影响,本文以 6 个、12 个数据为一组进行预测实验,结果如下:1)以 6 个时段的数据进行预测。LSTM 模型的 RMSE 范围是 1.761.98,五组均值为1.84;MAE为 1.191.30,五组均值为 1.25;MAPE 为 46.62%55.76%,五

25、组均值为 50.78%。GRU 模型 RMSE 范围是 2.282.45,五组均值为2.38;MAE 为 1.641.71,五组均值为 1.67;MAPE为 47.31%76.13%,五组均值为 58.76%。2)以 12 个时段的数据进行预测。LSTM 模型的 RMSE 范围是 1.731.88,五组均值为1.82;MAE为 1.211.29,五组均值为 1.23;MAPE 为 51.07%77.72%,五组均值为 61.33%。GRU 模型 RMSE 范围是 2.262.40,五组均值为2.36;MAE 为 1.571.69,五组均值为 1.63;MAPE为 50.10%83.31%,五组

26、均值为 63.96%。在增加每组时间切片数据的数量之后,两个模型的预测精度都有了提高,LSTM 模型的整体表现优于 GRU 模型,误差较小且每组实验结果中误差值变化幅度不大,较为稳定。而 GRU 模型整体误差值大,MAPE 数据出现异常可能是因为数据中的 0 值对计算产生了干扰,由于 LSTM 精度较高,使用 LSTM 模型进一步增加未来的预测时间片段数目来观察预测情况,在原先时间切片数目试验的基础上,增加了使用 20、45、60、120、180 个片段进行预测的实验,结果如下:1)预测未来 6 个片段。LSTM 模型的 RMSE 范围是 1.501.68,MAE为 1.021.15,误差最小

27、为 180 个片段,最大为 6个片段,随着预测片段的增加误差减小。2)预测未来 9 个片段。LSTM 模型的 RMSE 范围是 1.521.71,MAE为 1.051.21,误差最小为 180 个片段,最大为 6个片段,随着预测片段的增加误差减小。综上,模型训练的拟合程度与输入数据量呈正相关,与预测间隔负相关,预测间隔越大,整体误差越大。3 结论 本文利用深度学习模型进行了网约车需求预测,经过数据处理、模型构建、模型试验、结果分析等步骤最终验证了神经网络模型在处理时序问题的有效性,具体结论如下:1)同一地区休息日和工作日各个时间段的网约车需求量具有较强的时间相关性,表明时间因素可用于预测任务。

28、2)预测结果受多种因素影响,较多的训练数据会提高预测精度,模型参数如神经元个数,Dropout 率对预测结果也有影响。3)围绕时间维度的网约车需求预测进行设计并完成的实验和结果分析,包括 LR 和 SVM 的对比实验,表明 LSTM 深度学习网络在网约车需求预测中的表现优于其他三个模型,线性模型处理效果最差,用于预测的时间片段与预测精度成正比,预测值的时间跨度与精度成反比。参考文献 1 北京天创互生市场调查有限公司.中国汽车电子行业市场发展及前景预测报告M.北京:北京天创互生市场调查有限公司,2015.2 THISSEN U,BRAKELR V,WEIJER A P,et al.Using S

29、upport Vector Machines for Time Series Prediction J.Chemometrics and Intelligent Laboratory Systems,2003,69(1/2):35-49.3 朱松丽.交通需求和交通能源需求预测方法J.数量经济技术经济研究,2004(5):100-108.4 江小燕.短时交通流预测方法研究D.扬州:扬州大学,2018.第 16 期 全煜坤:基于深度学习的网约车需求预测研究 193 5 WANG L,YUAN X J,TING M F,et al.Predicting Summer Arctic Sea Ice C

30、oncentration Intra-Seasonal Variability Using a Vector Auto-Regressive ModelJ.Journal of Climate,2015,29(4):151208152351006.6 胡佩锋.交通流量短时预测方法研究D.北京:北京交通大学,2007.7 WELCH G,BISHOP G.An Introduction to the Kalman FilterM.Raleigh:University of North Carolina at Cha-pel Hill,1995.8 OKUTANI I,STEPHANEDES Y

31、J.Dynamic Prediction of Traffic Volume Through Kalman Filtering Theory J.Transportation Research Part B Methodological,1984,18(1):1-11.9 蔡晓禹,谭宇婷,雷财林,等.交通大数据环境下短时交通流量预测研究J.铁道运输与经济,2018,40(8):88-93.10 杨高飞,徐窖,秦鸣,等.基于 ARIMA 和卡尔曼滤波的短时交通预测J.郑州大学学报(工学版),2017,38(2):36-40.11 况东钰.基于时间序列分析的网约车需求短时预测研究D.北京:北京交通

32、大学,2019.12 熊杰.城市道路交通流分形特性研究D.北京:北京交通大学,2015.13 陶丽.基于改进小波神经网络模型的交通流预测研究D.上海:上海工程技术大学,2016.14 常鹏阳.基于 Spark 分布式蚁狮算法的小波神经网络 短时交通流预测研究D.武汉:湖北工业大学,2020.15 贺国光,马寿峰,李宇.基于小波分解与重构的交通流短时预测法J.系统工程理论与实践,2002(9):101-106,131.16 曹征.基于小波变换的交通流短时预测模型研究D.北京:北京交通大学,2010.17 徐娜,钱超.基于小波-SVR 模型的短时交通量预测研究J.公路交通技术,2015(4):14

33、1-145.18 周欣.基于 K 近邻非参数回归法的高速公路行程时间预测D.西安:长安大学,2018.19 杨胜,李莉,胡福乔,等.基于决策树的城市短时交通流预测J.计算机工程,2005,31(8):35-36.20 TECHNICOLOR T S,RELATED S O R,TECHNICO-LOR T S,et al.ImageNet Classification with Deep Convolutional Neural Networks R/OL.(2018-01-18)2023-01-08.https:/web.cs.ucdavis.edu/yjlee/teaching/ecs289g-winter2018/alexnet.21 张潇潇,龚龑.基于 LSTM 的沪渝高速公路短时交通流预测研究J.中国交通信息化,2022,274(9):133-137.22 刘川.基于 LSTM 及其变体的短时交通流预测J.交通节能与环保,2022,18(4):99-105.23 沈潇,李宗花.基于门控循环单元神经网络的交通流预测模型J.淮阴师范学院学报(自然科学版),2021,20(1):21-25.

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服