1、探 索 与 争 鸣 2023 NO.8 SCIENCE&TECHNOLOGY INFORMATION科技资讯SCIENCE&TECHNOLOGY INFORMATION科技资讯基于网络大数据建模对甘肃旅游现状分析孙玲 达举霞(兰州资源环境职业技术大学 甘肃兰州 730021)摘要:甘肃省有绝美的自然地貌和独特的丝路文化,拥有许多天然草场、草原碧绿、湖泊清澈的夏季景观、多样的地貌、大漠的风光。该文运用大数据方法分析各个因素数据,找出决定性因素,对甘肃旅游市场现状、旅游资源特色和未来发展趋势进行了剖析,做出了预测指标,并评价深度学习方法、灰色神经网络等机器学习技术在不同周期下对旅游需求建模与预测中
2、产生的效果。关键词:大数据 灰色神经网络 Topsis方法 甘肃旅游中图分类号:F832.51文献标识码:A 文章编号:1672-3791(2023)08-0247-04Analysis on the Current Situation of Tourism in Gansu Province Based on Network Big Data ModelingSUN Ling DA Juxia(Lanzhou Resources&Environment Voc-Tech University,Lanzhou,Gansu Province,730021 China)Abstract:Gansu
3、 Province has beautiful natural landforms and unique Silk Road culture,and has many natural grasslands,summer landscapes with green grasslands and clear lakes,diverse landforms and desert scenery.This paper uses the method of big data to analyze the data of various factors and find out the decisive
4、factors,analyze the present situation,the characteristics of tourism resources and the future development trend of the tourism market in Gansu and make prediction indexes,and evaluate the effects of machine learning techniques such as deep learning methods and grey neural network on tourism demand m
5、odeling and prediction in different periods.Key Words:Big data;Grey neural network;Topsis method;Tourism in Gansu1 国内外研究的现状和趋势旅游需求的研究,吸引了大量的来自不同学科的研究人员,鉴于准确预测动态和复杂的旅游市场的重要性,在过去几十年中,相关研究者发表了600多篇有关旅游需求建模和预测的论文1,这些研究主要集中在模型构建和性能评估上,其中一些研究提出了新颖的混合模型或者使用了多种方法的组合。目前,人们普遍认为,预测旅游需求的量化方法可分为三类,分别是时间序列模型2-4、计
6、量经济学模型5-12、人工智能(AI)的模型。时间序列模型推断感兴趣的变量的过去模式来预测未来值,常用的方法有包括UCM模、ARIMA模型、GARCH模型等。计量经济学模型通过使用权威的解释变量以提高预测精度,如经济指标、气候温度指标、大数据指标和市场情绪指标。一些前沿的计量经济学技术应用于旅游预测建模包括时变参数、混合数据抽基金项目:本文系甘肃省教育厅创新基金项目“基于大数据分析和机器学习技术的甘肃省旅游市场发展分析与预测”(项目编号:2022A-207);兰州资源环境职业技术大学校级教育教学改革研究项目(项目编号:JG22B18)。作者简介:孙玲(1983),女,硕士,副教授,研究方向为数
7、学建模。达举霞(1990),女,硕士,讲师,研究方向为常微分方程与动力系统。DOI:10.16661/ki.1672-3791.2211-5042-7903247 2023 NO.8科技资讯SCIENCE&TECHNOLOGY INFORMATION 探 索 与 争 鸣SCIENCE&TECHNOLOGY INFORMATION科技资讯样和贝叶斯模型等。随着AI技术的发展,许多相关的方法被引入到旅游需求建模与预测,这些方法包括人工神经网络方法、核极限学习方法、粗糙集模型和支持向量回归等。在大数据时代,大数据已成为开发基于AI的预测模型的重要驱动力。传统预测方法中使用的数据通常是自然聚合的,具有
8、时滞。而来自谷歌趋势、谷歌分析和百度索引等来源的搜索引擎数据已成为旅游需求预测的新数据源。现有的旅游需求研究主要集中与于ARIMA模型的应用,但是ARIMA模型并不总是优于其他模型,近期的研究表明,一些基于机器学习技术的人工智能方法在预测性能上优于传统的时间序列模型与计量经济学模型。Pai等在香港和台湾的旅游需求预测中发现支持向量机的性能优于ARIMA模型。CLAVERIA等的研究同样验证了支持回归向量回归,高斯过程回归和神经网络模型均优于传统方法。由于国际旅游的研究相对较少,同时,国内外该领域的研究者大多使用经济学和管理学的理论开展研究,很少有学者结合优化算法对于模型参数估计的应用。随着AI
9、技术的兴起,优化算法在模型效率提升中起到了关键作用,将机器学习技术与优化算法相结合也是未来研究的趋势之一。2 预备知识采用参与式观察、深度访谈、问卷调查等方法整理出近几年旅游景点营业额相关数据,从历史数据中提取影响旅游的特征信息,建立旅游评价模型,选择甘肃省6个相对较大的旅游景点,建立旅游景点营业额的月预测模型,并通过历史数据评价该模型。对于数据分析,选择考虑旅游景点的需求频数、景点的需求量、景点的变化趋势、景点门票4个特征,对于选取的284个旅游景点,计算这些景点在每个月的具体收益额、月平均收益额以及历史周期内的总和。选择适当的目标,建立景点相关信息库。对于景点选择,基于得到的景点信息库,选
10、择影响较大的一些指标赋予权重,建立评价模型,按模型评分从高到底的顺序选择6种相对较大的旅游景点。对于预测模型,基于调查历史数据的时序性及特征信息较少的特点,选择基于AI方法的时间序列预测模型,以及历史数据作为训练集和测试集来检验模型的预测结果。3 模型的假设由于部分旅游景点的收益额会受特殊原因的影响,如近两年疫情的影响历史数据失效,可以考虑正常情况下的历史数据。4 模型的建立与求解4.1 景点的评价指标查看177个月期间的历史数据,从旅游景点的需求频数、景点的需求量、景点的变化趋势、景点门票4个角度,建立评价指标来衡量各个景点的关注度。4.1.1 景点的需求频数景点的需求频数即对给定的177个
11、月的收益数据,建立频数矩阵:F=(fij)284177 (1)式(1)中,fij是第i个景点在第j个月的收益额,矩阵F存储了 284 个旅游景点每个月的需求次数。记Ftotali=j=1177fij,i=1,2,284,为第i个景点的历史需求总频数。而Favei=j=1177fij177为第i个旅游景点的月平均需求频数,可从需求频数的总数和月平均值两个角度去分析数据。4.1.2 景点的需求量景点的需求量即各个景点在177个月内需求量的总数,从总需求量和月平均需求量两个角度去分析数据,建立需求量矩阵:D=(dij)284177 (2)式(2)中,dij为第i个景点在第j个月的需求量,矩阵F存储了
12、284个大大小小的旅游景点每个月的需求量总数。记Dtotali=j=1177dij,i=1,2,284,为第i个景点的历史需求量的总和。而Davei=j=1177dij177为第i个景点的月平均需求量。4.1.3 变化趋势对于景点的趋势,考虑需求量的相对变化量,即对第i个景点,计算其每一个月与前一个月之间需求量的差值。建立趋势矩阵:T=(tij)284177 (3)式(3)中,tij为第i 景点在第j个月相对于第j-1个月需求量的改变量,其中:tij=dij-di,j-1,j=2,3,177同时,规定ti1=0,即初始阶段第一个月的变化量记为0。4.1.4 景点门票价格是衡量景点重要性的一个核
13、心因素,它影响248探 索 与 争 鸣 2023 NO.8 SCIENCE&TECHNOLOGY INFORMATIONSCIENCE&TECHNOLOGY INFORMATION科技资讯科技资讯到购买门票时的资金准备。通过历史数据发现,有一部分景点门票在不同需求下的销售单价有波动,为了方便计算,取其平均值作为销售单价。记piave为第i个旅游景点的销售单价。4.2 基于熵权法的Topsis模型基于熵权法对Topsis模型是一种常用的综合评价方法,能充分利用原始数据的信息,客观进行权重幅值,其结果能客观地反映各评价方案之间的差距。该方法的步骤如下:数据标准化;进行归一化处理;计算每个指标的信息
14、熵,并计算信息效用值,并归一化得到每个指标;计算信息效用值(信息熵冗余度);计算指标的权重系数。4.3 灰色神经网络预测模型灰色神经网络的拓扑图如图1所示。图1中,t为输入参数序号;y1(t),yn(t)为网络输入参数;2122,2n,3132,3n为网络权值;y1为网络预测值;LA、LB、LC、LD分别表示灰色神经网络的四层。令 2b1a=u1,2b2a=u2,2bn-1a=un-1则网络初始权值可以表示为11=a,21=-y1(0),22=u1,23=u2,2n=un-131=32=3n=1+e-atLD层中输出节点的阈值为=(1+e-at)(d-y1(0)灰色神经网络的学习流程如下。(1
15、)根据训练数据特征初始化网络结构,初始化参数a,b,并根据a,b的值计算u。(2)根据网络权值定义计算11,21,22,31,32,3n。(3)对每一个输入序列(t,y(t),t=1,2,3,N,计算每层输出。(4)计算网络预测输出与期望输出的误差,并根据误差调整权值和阈值。(5)判断训练是否结束,若否,返回步骤3。5 模型求解利用Excel软件与Matlab R2019a软件对附件数据进行量化分析,得到284个大大小小的旅游景点在177个月内的景点需求频数,景点需求量,景点需求变化量及景点门票。将这284个旅游景点相关信息汇总,得到284种方案,每一种方案由一个向量表示,它指某个景点对应的统
16、计信息。然后利用Matlab软件,通过基于熵权法的Topsis方法,对上述284个方案进行评价,选取评分最高的6个景点作为重点关注的景点。综上所述,再结合图2可以看出,通过基于熵权法的Topsis评价模型,选取出的景点综合考虑了景点的频数、门票的影响,并没有表现出某种特性的数值集中于某一区间的特性,比需求量、变化率及其对某一特性的数值倒序排列的方法,更具有合理性。基于历史数据,使用灰色神经网络作为景点需求的月预测模型,将模型能够很好地追踪需求量的变化趋势。图1 灰色神经网络的拓扑结构249 2023 NO.8科技资讯SCIENCE&TECHNOLOGY INFORMATION 探 索 与 争
17、鸣SCIENCE&TECHNOLOGY INFORMATION科技资讯6 结语该文以当前的相关研究成果为基础,理论上,紧紧围绕大数据与人工智能的时代背景,将机器学习方法引入到旅游之中,基于甘肃省各市州旅游市场发展的现状,调研了影响旅游市场发展的因素,建立有效的预测指标体系,开发高精度的预测模型,对未来甘肃省旅游市场的发展趋势进行了分析与预测。利用机器学习技术构建的高效预测模型有助于甘肃省旅游市场的合理规划,避免过度开发以及开发欠缺,降低旅游需求各种波动带来的负面影响。参考文献1 SONG H,QIU R T R,PARK J.A Review of Research on Tourism De
18、mand ForecastingJ.Annals of Tourism Research,2019,75:338-362.2 韦瑾.基于网络文本的民族旅游体验特征研究J.中国市场,2021(14):122-125.3 李琼.旅游大数据与挖掘分析研究J.当代旅游:下旬刊,2018(5):104-106.4 GAO Y.A Study on the Satisfaction of Practice and the Willingness to Stay in the Post of Students in Tourism Management Major Based on Big Data Ana
19、lysisJ.Journal of Physics Conference Series,2021,1744(3):032070.5 王强进.基于大数据分析的智慧旅游研究D.长春:长春工业大学,2021.6 LIM C,MCALEER M.Time Series Forecasts of International Travel Demand for AustraliaJ.Tourism Management,2002,23(4):389-396.7 DU PREEZ J,WITT S F.Univariate Multivariate Time Series Forecasting:An Ap
20、plication to International Tourism DemandJ.International Journal of Forecasting,2003,19(3):435-451.8 CHAN F,LIM C,MCALEER M.Modelling Multivariate International Tourism Demand and VolatilityJ.Tourism Management,2005,26(3):459-471.9 SONG H,WITT S F.Forecasting International Tourist Flows to MacauJ.Tourism management,2006,27(2):214-224.10 王小川,史峰,郁磊,等.MATLAB神经网络43个案例分析M.北京:北京航空航天大学出版社,2013.11 胡运权.运筹学基础及应用M.7版.北京:高等教育出版社,2021.12 GIORDANO F R,FOX W P,HORTON S B.数学建模M.5版.北京:机械工业出版社,2014.图2 某景点第121个月至177个月的实际订单数与预测250