1、412023 年 8 月第 35 卷第 4 期油 气 与 新 能 源文章编号:2097-0021(2023)04-0041-09加油站潜力测算的大数据分析方法与实证检验张蕾,邢治河,高鲁营,顾曦中国石油天然气股份有限公司规划总院引用:张蕾,邢治河,高鲁营,等.加油站潜力测算的大数据分析方法与实证检验J.油气与新能源,2023,35(4):41-49.摘要:对于石油企业来说,对已有加油站的销售水平进行评价和对新建加油站销量进行预测是企业决策中的重要一环,相应参数的测算也是经营和投资的重要参考。结合加油站的运营数据及空间数据,使用因子分析、聚类分析、判别分析等大数据技术构建了加油站指数体系,建立销
2、售潜力的预测模型,实现对已有加油站的销量(收入)评价,并给出新建加油站销售潜力的区间预测。应用包头、呼和浩特、巴彦淖尔、太原、运城、哈尔滨等 6 个城市的数据进行了实证分析,验证了模型的可行性与有效性。关键词:地理空间数据;POI 数据;因子分析;销量预测;区间预测中图分类号:TU249.6,U492.4 文献标识码:A DOI:10.3969/j.issn.2097-0021.2023.04.007Big Data Analytic Approach and Empirical Test for Estimating Gas Station PotentialZHANG Lei,XING Z
3、hihe,GAO Luying,GU XiPetroChina Planning and Engineering InstituteAbstract:Evaluating the sales level of current gas stations and estimating the sales of new gas stations is an essential aspect of corporate decision-making for petroleum firms,and the computation of associated metrics is also an impo
4、rtant reference for operation and investment.The gas station index system was created utilizing big data technologies such as factor analysis,cluster analysis,and discriminant analysis,as well as operational and spatial data from gas stations.Furthermore,a prediction model for sales potential was de
5、veloped to fulfill the sales(revenue)evaluation of current gas stations,as well as an interval projection for the sales potential of future gas stations.Data from six cities,including Baotou,Hohhot,Bayannur,Taiyuan,Yuncheng,and Harbin,were utilized for empirical study to validate the models practica
6、lity and efficacy.Keywords:Geospatial data;POI data;Factor analysis;Sales forecast;Interval forecast0引言加油站的销售潜力是指在现有的软硬件条件下,加油站可能达到的最大销售量在外部条件允许时可以转化为加油站的实际销售能力1。从实际应用来看,对加油站进行精确的潜力测算有两方面的意义:一是可以对正在运营的加油站进行测算,作为加油站提高量效的标准或者参考,也可以作为加油站转让或者运行评估的重要指标;二是对于准备规划或者建设的加油站进行虚拟测算,可以作为加油站建设可行性的重要参考。加油站的潜力测算是成品
7、油销售企业在站点投资、实际经营等方面非常重要的参考工具,是企业决策的重要依据。但从应用情况来看,当前常用的潜力测算方法存在较为明显的问题。一方面是投资决策的影响因素复杂:从国内外已有文献来看,全部影响因素指标可能达到 50 个甚至上百个;对于不同的站点之间,其影响因素的权重存在差异,甚至同一个站点的影响因素也会随时间和周边环境而变化。另一方面则是数据客观性不足:一是人工取数导致客观性不足,如道路车流量的估计一般由当地管理人员手工统计,可能由于地点、时间、人为操作等情况出现误差,导致数据不能反映周边道路的真实情况;二是调研数据存在滞后性,由于当前对42油气与新能源 政策与市场Vol.35 No.
8、4 Aug.2023周边环境、站前道路、站址条件等数据获取主要采取走访调研的方式,数据获取渠道不固定,指标权威性欠缺,且数据更新不够及时,导致站点投资的基础数据准确性不足,无法满足动态评估需求。因此,在愈加激烈的成品油零售市场竞争中,如何充分利用内外部数据信息和先进分析技术精确测算销售潜力,是当前亟需解决的重要问题。过去几十年,不断有新的预测理论和算法被提出,从传统的线性模型到现在广泛使用的机器学习、深度学习2,各种线性与非线性模型层出不穷。国内外用于能源领域的主流预测方法有各类基于回归模型3-4、时间序列模型预测的方法5,灰色预测的方法以及基于 BP 神经网络模型的预测方法6,等等。近些年来
9、 LSTM(长短期记忆网络)已被广泛应用于能源领域的预测问题中:Tulensalo 等7使用LSTM 学习电力市场与天气之间的关系,并对电力系统的总网损进行预测;Laib 等8使用 LSTM 模型来对不同地区的天然气消耗量进行预测;Li 等9提出结合 LSTM 模型与特征选择技术来对电价进行预测。众多的模型与其他领域的预测案例也为加油站潜在销量预测提供了方法思路和参考经验。传统的加油站销量预测一般转化为时间序列的预测问题,使用时间序列的滑动平均模型、指数平滑模型、ARIMA(差分整合移动平均自回归)模型等预测方法对销量进行预测。李艳东等10提出了一种采用指数平滑对加油站销量进行预测的方法,该方
10、法预测速度快但精度相对较低,对销量数据的平稳性有很高的要求,并且无法刻画其他因素对于销量的影响;杨庆等11基于线性判定将销量序列分为是否线性,对于非线性的销量序列则使用 BP神经网络对未来销量进行预测;张晨等12基于决策树与集成学习,使用混合决策树的方法,将随机森林与梯度提升树的预测结果进行加权作为对加油站销量的预测;卢晨辉等13与潘诗元等14都使用LSTM 结合其他对销量影响的特征构建加油站销量预测模型,对销量序列进行预测。上述销量预测方法主要是基于单个加油站销量的时间序列数据对其未来销量进行预测,因此纳入的特征也主要是天气、油价、气温等对销量有影响的时间序列数据,而对于反映加油站自身属性的
11、特征(如加油站分类、站点类型、占地面积等)以及所处的地理空间信息均没有纳入考虑,例如:占地大小不同的加油站之间销售能力存在差异;高速公路沿线加油站的销售能力也与城区内加油站的销售能力存在差异。因此上述方法无法适用于不同地点、不同特征的加油站的销售潜力预测。地理信息数据在国民经济各个领域都有着十分广泛的应用,POI(Point of Interest,兴趣点)数据作为一种代表地理实体的点状地理空间数据,反映了实体所承载的人类活动与地理位置之间的相互关联性。通过 POI 数据与其他地理信息数据的应用,能够在商业设施建设前综合考虑资源配置、交通条件、地理特征等当地的市场潜力因素,辅助设施建设的选址工
12、作15。杜兰等16结合景区内道路网与POI 信息,对景区游客接待中心的最优选址进行了研究。此外,帅春燕等17也曾结合换电数据、外卖数据和 POI 数据,使用线性回归与 K-Means 聚类算法,研究换电柜的需求与周边 POI 之间的关系,提出电动自行车换电柜的选址策略。本文结合加油站自身的属性、运营数据以及周边的地理空间信息,通过因子分析的方法构建指数,并通过聚类、分类等方法对影响加油站销售的周边地理空间环境进行建模,从而实现对不同地点、不同特征的已有加油站的销售情况的评价以及对新建加油站的销售潜力的预测,解决当前实际测算中遇到的问题,是利用大数据技术实现站点管理精细化的有益探索。1数据清洗与
13、变量构建考虑到影响加油站销售的变量较多,本文通过客观数据对加油站周边信息进行分解,如:用车流量数据来实现对汽车保有情况的估计;用网格内的人口、活动、道路、光强度等反映经济发展、消费需求、交通发展等;用 POI 数据反映周边的人流、车流、商业服务、竞争对手、能源替代等。本文所使用数据包括空间信息数据及运营数据,其中:空间信息数据包括道路环境数据、地理 POI数据及车流量数据;运营数据包括加油站自身明细数据及销售数据(汽油销量、柴油销量及非油品收入)。通过研究加油站周边的地理空间信息对加油站销售水平的影响,构建指数体系与预测模型对加油站的销售潜力进行预测。由于包头市是呼包鄂城市群中心城市之一,具有
14、发达的公路交通,代表性较强,因此以包头市为例对预测方法进行阐述。43第 35 卷第 4 期2023 年 8 月张蕾等:加油站潜力测算的大数据分析方法与实证检验1.1数据来源道路环境数据来源于中国科学院地理科学与资源研究所(简称地理资源所),包括调查和计算所得的人口数(POP)、活动指数(DAI、NAI)、道路密度(RD)、夜光强度(LI)和建筑地表面积(BSA)。地理 POI 数据来源于百度地图开放平台提供的API(接口),通过基于 Python 2.7 的爬虫程序爬取获得。POI 通常包含名称、地址、坐标、类别等 4个属性,一个 POI 可以是一个小区、一家商场、一个公交站等。加油站周边的
15、POI 信息可以反映各个加油站所在区域的地理特征,侧面反映人流量和车流量,对加油站的销售情况起到重要影响。车流量数据采用年度月平均道路车流量,包括汽油汽车、柴油汽车、摩托车。对于没有记录车流量的加油站,采用反距离加权插值法对其车流量进行插补处理,即该加油站的道路车流量是所有有记录加油站道路车流量的加权和,权重与距离成反比。加油站自身内部数据多为分类变量和定序变量,转化变量类型后可直接使用。销售数据中非油品收入采用当年日平均收入;汽油销量和柴油销量均采用当年日平均销量,且已合并油品型号。即使是同一个加油站,汽油、柴油和非油品的销售水平也并不一致。图 1 为各加油站 3 类商品销量对比,图中每一行
16、代表一个加油站,每一列分别代表汽油、柴油与非油品的销售情况,网格中颜色越深表示该加油站该类商品的销量(或收入)越高。可以看到:汽油和非油品的销售水平比较相似,汽油销量较高的加油站倾向于有较高的非油品销量;而柴油销售水平则与二者不太一致,柴油销售高的加油站往往汽油与非油品的销售水平较低。40 00030 00020 00010 0000汽油销量/L柴油销量/L非油品销量/元图 1各加油站 3 种商品销量对比1.2数据清洗原始的 POI 数据以每个 POI 作为个体,包括每个 POI 的名称、地址、地理坐标、所属类别等属性,数据量十分庞大,且不利于以加油站为个体分析周边地理环境对销售水平的影响。本
17、研究认为加油站的销售水平只会受周边的地理环境影响,因此,为方便后续的数据分析,以加油站为中心检索周边的POI 数据,并据此整理出每个加油站周边各类 POI的分布,以便用于接下来的数据分析。基于地理资源所提供的网格(边长为 1/600 的经度或纬度,约合 160 m),以加油站所在网格为中心,附近的 nn 个小网格组成网格单元,根据图2 所示 A、B、C、D 这 4 个边界点的经纬度确定检索范围,将网络单元内 n2个网格的道路环境数据及POI 数据汇总。ABDC图 2确定检索区域范围示意(以 n=5 为例)POI 数据提供的信息由检索范围的大小控制,若搜索范围过小,提供的信息太少;反之则会使得各
18、加油站周边存在交叉,减小了各加油站之间的地理差异。为了探索合适的搜索范围,分别尝试以多个检索范围(n=5,n=9 和 n=15)获取各个加油站的地理 POI 数据,得到对应的 POI 数据分布。最终确定以 n=15(即 2 400 m2 400 m)为检索范围进行 POI 数据的获取,得到 83 个 POI 变量,其中每个变量的数据代表相应关键词下的 POI 个数。由于数据中存在某些变量全部单一取值或是取值 0 的比例很高,这些变量无法在数据分析中提供有效的信息,为了提高后续数据分析结果的准确性,采取了两步预处理去除质量不佳的冗余变量,即去掉单一取值的变量以及取值为 0 的比例超过 80%的P
19、OI 变量。1.3指数构建为了探究影响加油站销售情况的因素,结合清洗后的数据,将各加油站的销售情况作为响应变量,将能够对其产生影响的解释变量用于解释与说明加44油气与新能源 政策与市场Vol.35 No.4 Aug.2023油站销售情况的变化。解释变量主要分为以下 3 类:反映加油站自身属性信息的变量,如资产性质、所在道路等;有关加油站各类面积的变量,如占地面积、便利店面积等;反映加油站周边区域空间信息的道路环境变量和 POI 变量。由于变量个数众多,达到 109 个,且 POI 变量取值较为稀疏,因此考虑在第二类和第三类原始变量的基础上构建指数,增强模型的效果与可解释性,同时也可以通过指数来
20、反映加油站区域范围内潜在客户群体的规模。为构建指数,需要先将原始变量按照一定的特征(如都是反映加油站周边商业服务设施的变量,或都是对加油站自身规模的变量等)分成几类,然后在每一类原始变量的基础上构建一个因子反映这一类变量中的信息,其作为一个指数变量,用于后续的分析。本文首先构造了 6 个连续型的指数。将预处理后的变量根据意义相近的原则,参考 GB 501372011城市用地分类与规划建设用地标准划分成了 6 个指数类,分别为活动指数、公共管理服务设施、商业服务设施、交通道路、绿地广场和加油站综合面积。各指数类包括变量如下:1)活动指数:POP、DAI、NAI、RD、LI、BSA、AREA。2)
21、公共管理服务设施:厕所、疗养院、养老院、大学、中学、小学、幼儿园、图书馆、培训、科研、博物馆、高尔夫球场、滑雪场、赛马场、体育馆、羽毛球馆、网球场、溜冰场、健身房、医院、邮局。3)商业服务设施:移动、联通、电信、小区、美容、商场、超市、便利店、烟酒、特产、服装店、体育用品、家具、建材、电器、度假村、农家乐、餐饮、银行、典当、证券、保险、影院、KTV、夜总会、棋牌室、网吧、婚庆、彩票、杂志社、报社、出版社、商务写字楼、工业园、工厂。4)交通道路:汽车销售、汽车服务、汽车维修、驾校、汽车租赁、高速服务区、停车场、检测站、火车站、地铁站、客运站、公交车站、码头、汽油汽车道路车数量合计、柴油汽车道路车
22、数量合计、摩托车道路车数量合计。5)绿地广场:公园、教堂、寺庙、钓鱼、动物园、植物园、水族馆、游乐园。6)加油站综合面积:占地面积、罩棚面积、停车场面积、便利店面积。基于上述分类,使用因子分析方法对每个指数类分别构建因子作为指数,通过方差贡献率反映变量对因子的依赖程度,包头市每个指数因子的方差贡献率见表 1。表 1包头市各指数因子方差贡献率活动指数公共管理服务设施类指数商业服务设施类指数交通道路类指数绿地广场类指数加油站综合面积类指数0.7230.6730.6920.4680.5270.619其次,各加油站周边竞品加油站数量转化为0-1 变量作为竞品指数,以反映加油站周边是否存在竞争,即在加油
23、站周边不存在竞品加油站时将竞品指数记为 0,反之记为 1。最后将上述构建的指数变量与原始解释变量中第一类反映加油站自身属性的变量合并,共同作为后续建模分析所使用的解释变量。2模型搭建与实证建立大数据模型的目的是对加油站的潜在销售能力进行测算。基于构建的指数因子,通过聚类分析评价现有的加油站销售水平,再通过判别分析实现对新加油站销售潜能的预测。图 3 为建模流程示意,主要分为超高销量(收入)甄别、非超高销量(收入)加油站的聚类分析、基于聚类结果判别新加油站的所属类别等 3 个步骤。2.1超高销量甄别进行超高销量甄别的主要原因是,一个城市内存在个别加油站的销量(收入)远高于其他加油站的情况,为保障
24、模型的稳定性,需要对这些特殊加油站进行专门的分析。依据加油站经验分布图中是否存在断层现象识别这类特殊加油站是否存在,若无断层现象则不存在超高销量(收入)的加油站。若一个加油站被判断为超高销量(收入)加油站,则其销量(收入)预测值为所有超高销量(收入)加油站的均值;若其被判断为非超高销量(收入)加油站,进行后续的分析。根据包头市 67 个加油站汽油销量的经验分布中的断层,将超高销量的加油站记为 1,非超高销量的加油站记为 0。如图 4 所示,汽油销量在 8 000 L处存在断层,因此将汽油销量超过 8 000 L 的 8 个加油站标注为超高销量的加油站。45第 35 卷第 4 期2023 年 8
25、 月张蕾等:加油站潜力测算的大数据分析方法与实证检验10 0005 000015 000汽油销量/L020406080100累积概率百分比/%图 4包头市加油站汽油销量的经验分布根据人工标注的结果,基于原始解释变量训练了随机森林分类器,参考随机森林分类器给出的重要变量和树的划分准则确定甄别准则。需要注意的是,由于超高销量与非超高销量的加油站数目过于悬殊,为了提高模型对于前者的识别能力,在训练随机森林模型前,先对超高销量加油站的数据进行了过采样处理,即通过有放回地抽取超高销量加油站,提高超高销量加油站的占比以构建一个平衡的数据集进行建模。根据随机森林分类器,找到重要性排名前三的变量,分别是便利店
26、、培训、特产。图 5 为重要变量分布图,其中较深的蓝色反映了超高销量加油站汽油销量的分布,反之则反映了非超高销量加油站汽油销量的分布。中销量加油站加油站属性车流量新加油站判别高、中、低销量预测区间=所属类别中位数区间P0I数据每组销量后10%的加油站为不达标加油站低销量聚类合成大类因子高销量均值预测预测值=站点平均值销量超高是否甄别对已有加油站评价对新加油站预测图 3模型主要流程示意501001257525010203040培训数量/个频数/个正常销量超高销量1020155010203040特产店数量/个频数/个正常销量超高销量406080200102030便利店数量/个频数/个正常销量超高销
27、量图 5重要变量分布综合选出的重要变量以及随机森林分类器中树的分节点情况,最终得到甄别为超高销量的标准为:便利店数量大于 30 个,培训机构数量大于 55 个,且特产店数量大于 7 个。使用超高销量加油站销量的平均值 10 583 L 作为包头市超高销量加油站销量的预测值,即:对于一个加油站,若其被甄别为超高销量的加油站,则使用 10 583 L 作为对其日均销量的预测;对于其他46油气与新能源 政策与市场Vol.35 No.4 Aug.2023非超高销量的加油站则继续进行建模分析。2.2聚类模型搭建考虑到特征上相近的加油站应当具有类似的销售潜力,因此对于其他未被甄别为超高销量的加油站,通过上
28、文合成的指数及自身属性所构造的解释变量对加油站进行聚类分析。为了在对加油站聚类时能够充分考虑加油站在特征上的差异以及在地理空间分布上的差异,本文采用加油站之间的 Gower(高尔)距离和空间距离的加权距离进行聚类。Gower 距离是一种可以同时处理特征中连续性变量、分类型变量及定序型变量的距离计算方法。设 Gower 距离为 dg,空间距离为ds,则加权距离 dw为:dw=wdg+(1-w)ds(1)式中权重 w 使用遍历搜索来确定最优权重,即令权重从 0.30 到 1.00,以 0.05 的间隔逐步增加,选择使得聚类效果最佳的权重作为最终用于构造距离的权重。为了评价、比较不同权重下的聚类效果
29、,使用“中位数差/标准差”指标(MS 指标)。该指标取值越大,表示各个类别的中位数之间存在差异越大且类别内部标准差较小,说明各个类别的销售水平差距越大,解释变量对销售水平的差异刻画得越好。因此选择使 MS 指标达到最大的权重。若聚为 2 类,MS 指标取值的定义为:M2MS=(m2-m1)/(s1+s2)(2)若聚为 3 类,MS 指标取值的定义为:M3MS=m3-m2+m2-m1s1+s2+s3=(m3-m1)/(s1+s2+s3)(3)式中:MMSMS 指标的值;m1,m2和 m3从小到大排列后的各类中位数;s1,s2和 s3对应各类内的标准差。MS 指标只能用在确定类数 K 之后选出最优
30、的距离权重,无法直接比较不同类别个数对应的聚类结果。为了确定最优的类别个数,研究使用 DBI(Davies-Bouldin Index,戴维森堡丁指数)指标,DBI 越小表示类内的样本距离类中心的距离越近,同时类间距离越远,即聚类效果越好。由于包括包头市在内的 6 个城市的加油站数量较少,只需要考虑类别个数是 2 或 3 的情况,选择使得 DBI 最小的类别个数。因此,在对加油站进行聚类时,首先固定类别个数为 2 和 3,通过 MS 指标分别选择聚成 2 类与聚成 3 类的最优权重,再通过 DBI 指标对比以上两个结果,确定最终的类别个数。2.3类别判断与应用去掉 8 个超高销量的加油站,将剩
31、下的 59 个非超高销量加油站按照解释变量进行聚类。根据 DBI指标,确定最优类别个数为 3 类。当聚成 3 类时:MS 指标随权重的变化情况见图 6,最终选择能够使 MS 指标取值最大的权重w=0.9;按照加权后的距离,将剩下的 59 个加油站聚成 3 类,将这 3 类按销量中位数从高到低分别命名为高销量(1 类)、中销量(2 类)、低销量(3类),各类加油站的汽油销量箱线图见图 7。0.50.40.30.30.40.50.60.70.80.60.70.80.91.0权重MS指标图 6MS 指标随 Gower 距离权重变化情况2 0001 0003 0004 0006 0005 0007 0
32、000销量/L销量分类123图 7汽油销量分类箱线图对于现有的加油站,将每个销量分类的销量的10%分位数作为对其销售水平评价的指标,销量低于该值的加油站评价为销量不达标。最终可以得到3 个销量分类 10%分位数分别为 1 362、265 和 217,即对于高销量分类的加油站,若其汽油月均销量低于 1 362 L 则判定其销量不达标。为了探索解释变量对销售水平影响的重要性,研究比较了不同类加油站之间变量分布的差异。在不同销量分类中差异越大的变量,说明其对聚类的影响越大,也即对汽油销量的影响越大。图 8 为 6 个连续型指数在不同销量分类中分布的箱线图,可以从中比较这些指数在聚类后所得不同分类中的
33、分布差异。47第 35 卷第 4 期2023 年 8 月张蕾等:加油站潜力测算的大数据分析方法与实证检验对于 8 个非连续型的解释变量(1 个竞品指数和 7 个描述加油站自身属性的变量),则可使用卡方检验法检验变量与分类之间的独立性,利用卡方检验法的 P 值来反映解释变量对于聚类的影响,P 值越小反映变量与分类之间的相关越强。各变量卡方检验 P 值见表 2。表 2各变量卡方检验 P 值变量P 值变量P 值资产性质0.68星级0.32加油站分类 0.01地理位置 0.01便利店分类0.24所在道路等级和特征 0.01竞品 0.01罐容0.022.4新加油站销量(收入)预测若要在一个给定的坐标点建
34、立一个新的加油站,也可使用本模型对该加油站的销售潜能进行预测。首先,在前述聚类结果的基础上训练随机森林和支持向量机(SVM)作为分类模型,对新加油站所属的类别进行判别;其次,根据判别结果将其划分到上一步聚类所得到的高销量、中销量、低销量类别之中;最后,以其所属类别的销量分类的中位数作为对该加油站的预期销售潜能。此外,对于每一类加油站,都可使用 Bootstrap方法构建其销量中位数的 99%置信区间。这样,新加油站可以使用分类模型给出其所属类别销量中位数的 99%置信区间作为新加油站销量的预测区间。-10-1123指数值销量分类(a)公共管理服务设施分组箱线图1230123指数值销量分类(b)
35、活动指数分组箱线图1230-11234指数值销量分类(c)交通道路分组箱线图1230-1123指数值销量分类(d)绿地广场分组箱线图123210-143657指数值销量分类(e)加油站综合面积分组箱线图1230-1123指数值销量分类(f)商业服务设施分组箱线图123图 8各因子在不同销量组别中的分布箱线图48油气与新能源 政策与市场Vol.35 No.4 Aug.2023各销量分类中汽油销量的预测区间见图 9,图中颜色部分表示中位数的置信区间即预测区间,红色字体标注中位数置信区间覆盖这一类样本的占比。2 00004 0006 000销量/L销量分组1230.220.300.090.090.8
36、20.300.400.280.50图 9各销量分类中汽油销量的预测区间2.5模型的延伸与验证为了验证模型的有效性,另选了 5 个城市对模型进行验证,分别是呼和浩特、巴彦淖尔、哈尔滨、太原和运城。模型建立和运行结果与包头模型基本一致,仅在最终的建议结果方面存在一定的差异。本文对 6 个城市加油站模型的结果进行了评估。对于超高销量(收入)甄别部分,按“甄别正确的加油站数量/总加油站数量”计算准确率,6 个城市 3 类商品的甄别准确率均达到 90%以上。对于新加油站销售预测部分,分别使用留一法交叉验证、5折交叉验证法及 10 折交叉验证法对分类模型的准确率进行评估,准确率均达到 85%以上。结果显示
37、,本研究能够合理准确地对加油站的销售水平进行评价和预测。3结论与应用本文提出了一种基于地理信息数据的加油站销售潜力预测模型。该模型基于加油站地理信息数据使用因子分析构建了指数,并作为后续分析的解释变量,同时反映加油站区域范围内的客户群体规模。为了对不同加油站的销售潜力进行评价,采用聚类分析将销售潜力非超高的加油站聚成几类,并使用类中位数作为对加油站销售潜力评价的标准。对于新建加油站则通过其所处区域的地理特征及加油站本身特征,使用分类模型将其分到聚类所得到的几类加油站中,并使用类中位数的置信区间作为销售潜力的区间预测,尽管对预测精度有所牺牲,但提高了预测的稳定性及可解释性。结果显示,本文提出的预
38、测模型能够对加油站的销售潜力进行合理评价和准确预测。从业人员能够根据预测结果进行运营决策,也能够将模型对销售潜力的预测作为新建加油站选址决策的量化依据。目前来看,实际经营中,将潜在销量作为加油站经营能力提升参考值的做法较多,且多个站点均取得了较为明显的效果,例如 2018 年应用该指标并优化的加油站单站日销量平均提升 0.6 t。在新站选址中,本文给出的方法可以作为一种客观的参考值,但目前还没有实际的数据进行佐证。本文是对加油站潜力数据测算的一种方法探索,还有进一步深化的空间:一是在实际应用中,将本方法进行工程化后,可以实现对线上数据的自动采集和实时动态更新,保证数据测算的准确性;二是可以在不
39、同区域考虑大样本的聚类分析,并加入对不同区域站点的异质性讨论,能够对实际的站点经营和站点选址实现精确化的测算;三是本方法探索中给出的中位数等参数,也可以根据市场和公司整体战略需求进行调整,以实现对实际经营的支撑。参考文献:1 张蕾,刘永杰,齐超.加油站潜在销售能力的理论测算和实证分析J.石油库与加油站,2018,27(1):36-41.2 PAN S Y,LIAO Q,LIANG Y T.Multivariable sales prediction for filling stations via GA improved BiLSTMJ.Petroleum Science,2022,19(5)
40、:2483-2496.3 SAHRAEI M A,DUMAN H,ODUR M Y,et al.Prediction of transportation energy demand:multivariate adaptive regression splinesJ.Energy,2021,224:120090.4 BIANCO V,MANCA O,NARDINI S.Electricity consumption forecasting in Italy using linear regression modelsJ.Energy,2009,34(9):1413-1421.5 HUANG L,
41、LIAO Q,QIU R,et al.Prediction-based analysis on power consumption gap under long-term emergency:a case in China under COVID-19J.Applied Energy,2021,283:116339.6 DEB C,EANG L S,YANG J,et al.Forecasting diurnal cooling energy load for institutional buildings using Artificial Neural NetworksJ.Energy an
42、d Buildings,2016,121:284-297.7 TULENSALO J,SEPPNEN J,ILIN A.An LSTM model for power grid loss predictionJ.Electric Power Systems Research,2020,189(Feb):106823.8 LAIB O,KHADIR M T,MIHAYLOVA L.Toward 49第 35 卷第 4 期2023 年 8 月张蕾等:加油站潜力测算的大数据分析方法与实证检验efficient energy systems based on natural gas consumpti
43、on prediction with LSTM recurrent Neural NetworksJ.Energy,2019,177(JUN):530-542.9 LI W,BECKER D M.Day-ahead electricity price prediction applying hybrid models of LSTM-based deep learning methods and feature selection algorithms under consideration of market couplingJ.Energy,2021,237:121543.10 李艳东,李
44、亚伟,李晓蓉.成品油配送量预测问题研究J.中国市场,2017(3):87-88,99.11 杨庆,黄德先.加油站成品油销量预测算法与样本数据设计J.计算机工程与应用,2007(13):210-213,219.12 张晨,邱彤.基于决策树集成模型的加油站销量预测J.计算机与应用化学,2019,36(6):615-619.13 卢晨辉,冯硕,易爱华,等.基于深度学习的加油站销量预测与营销策略应用研究J.郑州大学学报(工学版),2022,43(1):1-6.14 潘诗元,易万里,李翔宇.基于遗传算法和长短记忆神经网络组合模型的加油站销量预测J.化工自动化及仪表,2022,49(2):207-214.
45、15 薛冰,李京忠,肖骁,等.基于兴趣点(POI)大数据的人地关系研究综述:理论、方法与应用J.地理与地理信息科学,2019,35(6):51-60.16 杜兰,葛军莲,王宏志,等.基于POI网络信息的景区最优游客接待中心选址研究:以南京钟山景区智慧旅游为例J.华中师范大学学报(自然科学版),2014,48(4):613-619.17 帅春燕,许庚,何民,等.基于城市POI聚类的需求不确定情况下电动自行车换电柜选址J.重庆理工大学学报(自然科学版),2021,35(7):169-175.第一作者:张蕾,女,博士,高级工程师。现在中国石油天然气股份有限公司规划总院,从事市场营销研究工作。地址:北
46、京市海淀区志新西路 3 号,100083。E-mail:zhanglei_。修改回稿日期:2023-05-22编辑:夏希品(上接第 32 页)43 TESSIER J M,FLOROS C M,BOUZIDI L,et al.Exergy analysis of an adiabatic compressed air energy storage system using a cascade of phase change materialsJ.Energy,2016,106:528-534.44 LI R X,ZHANG Y,CHEN H,et al.Exploring thermodyna
47、mic potential of multiple phase change thermal energy storage for adiabatic compressed air energy storage systemJ.Journal of Energy Storage,2021,33:102054.45 POPOV D,FIKIIN K,STANKOV B,et al.Cryogenic heat exchangers for process cooling and renewable energy storage:A reviewJ.Applied Thermal Engineer
48、ing,2019,153:275-290.46 WEIKL M C,BRAUN K,WEISS J.Coil-wound heat exchangers for molten salt applicationsJ.Energy Procedia,2014,49:1054-1060.47 LI Q,FLAMANT G,YUAN X G,et al.Compact heat exchangers:a review and future applications for a new generation of high temperature solar receiversJ.Renewable a
49、nd Sustainable Energy Reviews,2011,15(9):4855-4875.48 BISWAL R.Conjugate heat transfer analysis in cryogenic microchannel heat exchangerD.Orissa:National Institute of Technology Rourkela,2015.49 吴玉庭,宋阁阁,张灿灿,等.超临界压缩空气储能系统蓄冷换热器优化设计J.储能科学与技术,2021,10(4):1374-1379.50 王俊杰,郭璐娜,季伟,等.组合式蓄冷器及液态空气储能系统:中国,CN213542913UP.2021-06-25.第一作者:何青,男,教授。主要从事压缩空气储能技术研究等相关工作。地址:北京市昌平区北农路 2 号,102206。E-mail:。修改回稿日期:2023-07-20编辑:夏希品
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100