收藏 分销(赏)

基于加性分位数GB算法的智能电能表数据不确定性预测.pdf

上传人:自信****多点 文档编号:583679 上传时间:2024-01-02 格式:PDF 页数:8 大小:5.03MB
下载 相关 举报
基于加性分位数GB算法的智能电能表数据不确定性预测.pdf_第1页
第1页 / 共8页
基于加性分位数GB算法的智能电能表数据不确定性预测.pdf_第2页
第2页 / 共8页
基于加性分位数GB算法的智能电能表数据不确定性预测.pdf_第3页
第3页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、与传统电力数据相比,智能电能表数据波动性更大,可预测性更低。能源行业需对智能电能表数据进行概率预测,以量化未来电力需求的不确定性,以便对发电和配电进行合理规划。文章提出了一种用梯度提升算法估计智能电能表数据未来分布的加性分位数回归模型。所提方法提出了电能表数据概率预测的分位数回归及分位数修正算法。基于分位数算法给出了综合考虑外部影响因素的加性分位数的GB算法,并研究了该基于梯度提升算法的智能电能表数据概率预测加性分位数模型的关键性能参数选择,从而建立起了高性能的智能电能表数据概率预测模型;通过算例分析证明了该方法在综合和单个用户智能电能表数据概率预测中的准确性和有效性,尤其是在单个用户电能表数

2、据概率预测方面具有远超其他算法的优越性能。关键词:概率预测;智能电能表;分位数回归;梯度增强D0I:10.19753/j.issn1001-1390.2023.07.024中图分类号:TM933Uncertainty prediction of smart meter data based on gradient(Marketing Service Center,State Grid Hebei Electric Power Company,Shijiazhuang 050000,China)Abstract:Compared with the traditional data of elec

3、tricity consumption,the data of smart meter is more volatile and lesspredictable.In order to realize the reasonable planning of power generation and distribution,the energy industry needs toquantify the uncertainty of power demand through the probability prediction of smart meter data.In this paper,

4、an additivequantile regression model is proposed to estimate the future distribution of smart meter data by using the gradient boosting(GB)algorithm.Firstly,the method gives the quantile regression and quantile correction algorithm for the probabilityprediction.Based on the quantile algorithm,the GB

5、 algorithm of the additive quantile considering the external factors isgiven,and the selection method of main parameters in additive quantile model based on the GB algorithm is studied,thusthe high-performance probability prediction model of smart meter data is established.Finally,compared with othe

6、rs,thecase study shows that the proposed method is more accurate and effective in the probability prediction of smart meter dataof integrated and single users,especially in the probability prediction of electricity meter data of single user.Keywords:probability prediction,smart meter,quantile regres

7、sion,gradient boosting0引言智能电能表作为能源互联网的核心终端装置,除具备电能计量功能外,还具有双向信息交互、用电信息储存、双向-多阶梯费率计量、用户侧远程控制等功能,是未来泛在电力物联网用户智能化终端的主要发展方向 。在我国重点建设泛在电力物联网的背景下,智能电能表作为关键设备必将得到广泛应用。与传统抄表方式不同,智能电能表采用分钟级别的采样间隔获取信息数据,从而实现海量用户实时数据获取2 ,以进行分析实现区域内用户行为和用电量的精准分析和预一1 6 0 一文献标识码:Aboosting algorithm of additive quantilesLi Bing,Li

8、 Chong,Han Guinan文章编号:1 0 0 1-1 3 9 0(2 0 2 3)0 7-0 1 6 0-0 8测,对实施合理发电计划、线路升级改造、发电设施规划以及电价制定均有重要作用。随着可再生能源渗透率增长,目前能源供给配比情况正发生巨大变化,同时由于用电量类别及性质呈多样化、复杂性的发展趋势,用电量的确定性预测结果中隐藏的风险不容忽视3 。智能电能表数据的短期概率性预测可提供某一置信度下用电量预测值的波动区间或用电量预测值的概率密度分布,能够有效地反映出蕴含在确定性预测结果中的不确定性成分,相较于用电量的确定性预测可提供更多的信息,利于揭示未第6 0 卷第7 期2023年7

9、月1 5日来用电量可能出现的不确定性风险。智能电能表通常以分钟的间隔记录和传输用电量信息,从而产生海量数据。家庭一级的电力用电量预测对评估需求响应计划4 及改善综合水平的预测尤为重要。智能电能表数据通常是对单个用户测量获取的,由于家庭用电行为存在巨大差异,智能电能表数据的波动性很大,因此与传统电力用电量数据相比,单个智能电能表数据具有波动性更高的特征5目前,机器学习在电能表数据概率预测上的得到了应用,然而以深度LSTM、深度置信网络等为代表的预测方法需要依赖于大量历史数据,且模型训练难度大,在训练数据量不充足的情况下,往往会出现预测模型普适性低、易过拟合等问题。针对上述问题,本文提出采用分位数

10、回归方法利用智能电能表数据进行单个用户和区域内用户用电量的概率预测。首先通过分位数回归算法初步提出了智能电能表数据概率预测方法,并给出了分位数交叉修正算法。在智能电能表数据概率预测分位数回归的基础上,给出了考虑外部影响因素的概率预测加性模型,并通过梯度提升算法最终建立了可综合考虑外部影响因素的智能电能表数据概率预测加性分位数回归模型。随后给出了评价智能电能表数据概率预测的性能指标一一连续排序概率得分,并通过算例证明了本文的电能表数据概率预测算法在综合和单个用户电能表数据概率预测中的正确性和有效性。1基于分位数回归的电能表数据概率预测1.1电能表数据概率预测建模为实现电能表数据的准确预测,预测模

11、型需综合考虑各种预测影响因素。针对不同的预测影响因素,在每个预测时刻采用不同建模方法对不同预测因素进行建模,可得时刻t+h的电能表数据均值预测值为:Yi+h=gh(x,)+8i+h(1)式中x,=(y,z+),,为时刻t的电能表数据;z,为时刻t已知的预测影响因素向量;y,为时刻t之前的过去电能表数据向量;gh为不同影响因素的模型函数,8,为模型误差,且满足ELs,=0、E L x,8 t+h=0。向量y,包含时刻t之前一段时间的电能表数据,包括时刻t之前1 2 个测量时刻以及前两天的平均等效半小时数据。依据向量y,可获得电能表数据的时间序列相关性以及电能表数据整体水平的变化规律。概率预测问题

12、可归结为条件分布估计问题,即:Fr,h(y l x,)=P(y+h yl x,)(2)产生概率预测的典型方法是对条件分布(如正态分布)的形式进行假设,并通过样本数据对参数进行估计。然而,实际情况下,条件分布的形式难以预测,因电测与仪表Electrical Measurement&Instrumentation此,本文采用一种比假设条件分布形式更具普适性的方法:计算一组概率Q的条件分布T-分位数T;。T;分位数指的是确保T;分位数回归曲线之下能够包含数据总量占比为T,的数据点,则根据式(2)可知,yt+的第n个分位数T,为:F-l(T,I x,)=infiy:F(yl x,)Tn)由式(

13、1)可得时刻t+h处的分位数回归模型为:Yi+h=gn.,(x,)+St+h.r,Feh.(0)=T(4)式中Fe+h,,表示概率分布函数,步长h和分位数取不同的值时函数gh,均不相同。与式(1)的模型相比,误差项的零均值假设被T=0的分位数假设取代。因此,预测时刻t+h的分位数为:(5)对于三元组,)XYY,其中为模式,为观察值,f()是的预测值。定义映射V:XYYO,+,若对任意的X,yY,当f()=y时,都有V,y,f()=0,则称V为损失函数。当预测准确无误时,损失函数值为零;当预测误差达到一定程度时,其损失函数值不为零。常用的损失函数有0 1损失函数、平方损失函数、Hinge损失函数

14、和Pinball损失函数。对于式(5)的分位数ql)可由Pinball损失函数计算6 :(6)当期望值满足YF,时,Pinball损失函数L,为:L,(y.g)=7(y-9)-(1-T)(y-q)yqyq1.2分位数回归模型加权修正为确保在时刻t+h处分布函数的有效性,分位数预测需满足单调性:(8)然而由于每个T-分位数是针对每个概率T进行独立建模的,所有分位数难以同时满足式(8),在分位数回归分析过程中往往会出现一簇分位数回归曲线相交的情况,从而形成分位数交叉问题7 。针对分位数交叉问题,本文引入分位数加权修正算法,利用不同回归曲线的加权组合对相交的回归曲线进行修正,具体步骤为:(1)确定要

15、修正的回归曲线。设分位数T 2;B、在xp之前,2。上述两种情况均可通过相同方法解决,因此仅讨论情况A。首先根据回归系数t检验的p值对回归结果进行评估,P值越大,则回归结果越差。随后调整回归结果差的分位数回归曲线在xp之后的回归方程。(2)确定组合权重系数和。Vol.60 No.7Jul.15,2023(3)(7)一 1 6 1 一第6 0 卷第7 期2023年7 月1 5日若确定要修正的曲线为y2,采用基于中分布函数样本分位数定义的方法,对其进行修正。选取与T2比较接近的T3值,且T2xp时,回归曲线yz2修正为:Yr=y+y,=(o+o3)+(+i3)x(11)因此,修正后的T2分位数回归

16、方程为:Yiz=o2+12x,lyn=(ol+os)+(+i3)x,x x p对于采用其他函数进行描述的分位数,仍可进行函数线性化表述,因此上述方法仍具有适用性。2加性分位数回归的GradientBoosting算法文中采用了分位数模型对不同影响因素进行建模,而实际情况下通常是多个因素共同作用对电能表数据产生影响。为综合不同影响因素影响作用,提高分位数回归模型的准确性,采用梯度提升(GradientBoosting,GB)算法的加性分位数回归模型。该模型与线性模型相比,具有更多的灵活性,比非线性黑箱模型的解释性更高,并且可自适应选择变量。2.1加性分位数回归加性假设下,式(5)中时刻t+h的条

17、件T分位数为:gh,(x,)=ao+ai(xt)+.+a,(xp)式中函数,为可参数化指定的函数或非参数化估计的平滑函数,x是向量x,的第k个分量。由于每个函数,均可能具有非线性形状,因此加性模型的灵活性使其可提供比经典线性模型更高的精度。此外,与完全复杂的模型(如神经网络)相比,由于每个函数为单变量的函数,加性模型具有明确的物理含义解释,可更直观对电能表数据规律预测的分位数含义进行解释。由于标准加性模型不能对输入变量间的交互作用进行建模,因此当输人变量存在交互作用时,该模型可能比完全复杂模型的准确度低一些。然而在实际应用中,由于输人变量一般仅存在高阶相互作用,而高阶相一 1 6 2 一电测与

18、仪 表Electrical Measurement&Instrumentation互作用往往较弱,因此忽略高阶相互作用的模型仍具有极高准确度。此外,通过添加双变量学习者将具有相互作用的变量视为整体,则加性模型可将交互作用包含在内。2.2关键性能参数确定(9)加性模型可通过梯度提升算法实现,该算法为一种Boosting算法,其思想是通过多个“弱学习者”(预测结果偏差较高、方差较小的预测模型)组合创建一个更加精准的学习者 。Boosting算法的优势为:(1)由于模型间的差异性,单个模型在决策时往往会出现不同错误,将多个模型结合可具有更好的预测结果,从而做(10)出更合理决策;(2)当数据

19、集较小时,采用有放回的方式随机抽取N个集合用于训练,可得到更好的结果;(3)当模型的决策边界过于复杂时,多个模型的集成结果可有效规避9。GB算法是从函数空间数值优化角度将Boosting算法解释为一种函数估计方法1 0 ,该方法将损失函数xXp看作模型的“靠谱程度”,损失函数值越大,则模型可信度越低,预测结果准确性越差。依据梯度下降原理实现损失函数在梯度方向上的迭代收敛,实现模型最优(12)化。基于GB算法的回归预测流程如图1 所示,首先基于训练集建立弱学习者,然后将模型残差作为优化学习目标输入,得到新的基模型,不断重复此过程,直到模残差达到指定范围。测试数据集训Xi弱学习者1练数据集转化X2

20、.y2H弱学习者2转化XmyH弱学习者n图1 GB算法模型示意图Fig.1 Schematic diagram of GB algorithm给定数据集D=(y+h,x)IT=1,根据式(1 3)建立(13)电能表数据概率预测的加性分位数回归模型。通过送代算法使数据集D上的损失函数L,最小化,可实现加性分位数模型的建立。若定义m=(m())=,为函数估计向量,j为迭代次数,则GB算法步骤为:(1)对函数的估计向量m0进行初始化;(2)建立基础学习者模型:基础学习者是简单的回归估计,依赖于初始输变量x,的单变量响应,且每个基础学习者模型的建立仅依赖于单一输人变量。考虑到每个基本学习者对每个类别变

21、量具有线性效应,两个基本学习者对每个连续变量具有线性和非线性效应。因此,允许GB算法过程自适应决定是否增加非线性或线性效应;Vol.60 No.7Jul.15,2023训练综合综合预测结果第6 0 卷第7 期2023年7 月1 5日(3)根据Pinball 损失函数的负梯度更新函数估计值。(a)函数估计ml损失函数的负梯度为:对Pinball损失函数L,而言,负梯度为:(J T,+h-mLi-1 x,)0二(L_-,+h-m-1(x,)0),(b)采用负梯度向量ul)作为输人变量的响应对步骤(2)中的基础学习者进行拟合。(c)选择最优基础学习者,即剩余平方和最小化的基础学习者,并用表示最优基础

22、学习者的拟合值。(d)通过将最优拟合基础学习者的拟合值添加到函数估计值中,更新当前的函数估计值:(16)式中0 u1 是收缩系数。(4)依次增加代次数j,若i达到最大迭代次数J,则停止,否则转到步骤(3)。2.3 基础学习者基础学习者是指使用标准指标变量进行预测的学习者,对于每个连续变量均可采用线性和非线性基础学习者进行建模,线性基础学习者可对连续变量的线性效果建模,非线性基础学习者可对P样条线性效果的非线性偏差进行建模。日周期变量需采用非线性基础学习者进行建模,该变量包含4 8 个数据,可采用周期P样条建模。P样条主要参数为:B样条基阶数、差分惩罚阶数、节点数和平滑参数。由于三次B样条基灵活

23、性极高且计算简单,因此采用三次B-样条基;差分惩的阶数为2,即偏离线性的情况将受到惩罚;当节点数达到一定规模后,该参数对预测准确性的影响将不变。平滑参数作为核心参数用于过拟合和欠拟合均衡。平滑参数与目标函数的拟合、惩罚分量权重有关,通过指定P样条估计的自由度df可确定平滑参数。P样条函数df数值一般较小,因此可将 df设为较小值(dfe3,4),并且在迭代中保持df不变。2.4模型性能参数选择GB算法的主要性能参数包括:收缩因素和迭代次数J。和J具有耦合作用,U取值不同,J的最优值也将不同,若减小的数值,则需要提高J12。两个参数均对回归模型的拟合度产生影响作用,需要找到二者的最优值,实现模型

24、性能的最优化。参数取较小值时可获得更好的结果,因此收缩因素取较小值以避免 GB过程的过度拟合。对于迭电测与仪 表Electrical Measurement&Instrumentation代次数J,在确定迭代次数范围(Je(1,,Jm a x l)后,可通过交叉验证得到参数J的最优值。使用改进留出检验算法进行参数J优化。留出法(14)将数据集划分为互斥集合,一个集合为训练集S,另一个为测试集T,在S上训练模型后,用T评估测试误差。经典留出法在验证集上获得的评估指标与原始数据顺(15)序有极大关联性。为消除顺序的影响,可采用“交叉验证”。本文采用K折交叉验证进行参数J的优化,该算t=1,

25、T法首先将数据集划分成K个大小相等的子集;然后依次遍历K个子集,第i次遍历将第i个子集作为验证集,其余所有子集作为训练集进行模型训练与评估;最后将K次的评估指标的平均值作为最终评估指标。3概率预测训练与评价3.1概率预测训练方法爱尔兰能源监管委员会(CER)的智能电能表试验期间收集的数据1 3 包括4 2 2 5个居民用户和2 2 1 0 个中小企业的电能表数据详细数据,因此可作为加性分位数建模的数据集。采用了数据集中无数据缺失的3639个民用户数据,时间跨度为2 0 0 9 年7 月1 4 日到2010年1 2 月3 1 日,时间间隔为3 0 min。文中考虑单个用户和区域综合电能表数据,即

26、(I)随机选择1 0 0 0 个智能电能表的需求总和作为综合用电数据;(II)随机智能电能表中的每个用户数据。采用前1 2 个月数据作为训练数据集对不同影响因素进行建模,其余数据作为测试数据集评估预测的准确性。CB算法的步骤、基本学习者参数和 CB算法的参数选择已在第2 节给出。由于没有天气数据,且出于用户信息保密,每个电能表均无具体位置信息。由于爱尔兰相对较小,爱尔兰各地区天气较为相似,因此本文采用都柏林地区相应时段的天气数据作为数据集的天气信息。为确保不同智能电能表预测精度指标的一致性,采用除以最大值的方式进行标准化,并采用平方根变换保证最终预测值的非负性。为在每个预测层位t+h生成概率预

27、测,首先计算一组概率分布的T-分位数T;=0.01,0.05,0.1,0.99,其中i=1,.,Q=21,然后采用加权算法对分位数进行修正,以解决分布数交叉问题;设置GB算法的自由度df=4,V=0.3,在集合 1,,Jmax中通过K折交叉验证获得GB算法最佳次数J,其中出于精度和计算量综合考虑,Jmax=200。确定GB算法主要性能参数及基础学习者参数后,可建立如图2 所示的整体算法框架。3.2评价方法为评估概率预测的准确性,采用连续排序概率得分(Continuous Ranked Probability Score,CRPS)对预测误差进行度量,CRPS定义为:一1 6 3 一Vol.60

28、 No.7Jul.15,2023第6 0 卷第7 期2023年7 月1 5日CRPS(F,h,Ytt)=J其中为指示函数。概率预测的目标是在满足可靠性的前提下尽可能提高预测的锐度。可靠性是预测分布和观测值在统计上的一致性程度,锐度是对预测分布集中度的评价,性能优越的预测是根据预测的可靠性实现预测分布锐度的最大化。因此,CRPS的等效定义为:CRPS(Fr,h,Yt+h)=2EruY-yth1EFY-Y2AbsolutedifferencesSpread其中Y和Y是分布为F的两个独立随机变量。式中CRPS分解为绝对误差量和分散标度量。绝对误差对应于已知观测值和F(预测值之间的平均绝对误差。分散标

29、度量是分布F锐度的度量。由式(1 8)可近似得到层次t+h上的CRPS为:MCRPS(t+h)=(1 y(-/NM)-(i)t=1Estimated absolutedifferencesNMEstimated spread其中y和y是来自预测分布F的两个独立样本,M是F)的随机样本数;N7 3 0 0(5个月的半小时数据),且采用M=105个随机样本近似期望。标准化数据原始分位数1修正弱学习者1原好数据数据清洗用电量概率预测结果图2 加性分位数算法整体框架Fig.2 Overall framework of additive quantile model4算例分析4.1算法算例验证为证明基于

30、GB算法对电能表数据不确定性预测的准确性和有效性,将该方法与无条件、考虑时间因素和正态分布形式的分位数模型进行了对比。无条件分位数(法1)不考虑外部影响因素仅计算所有历史观测值分布的T分位数;考虑时间因素的分位数(法2)将数据按时间分为4 8 个子数据集,并计算每个子数据集的分位数。该方法仅考虑一天中每个时一 1 6 4 一电测与仪表Electrical Measurement&Instrumentation(Fr.,(z)-(z Y)dz(17),L,(y+h,Fr(r)dT=(18)(19)修正原始分位数2弱学习者2修正原始分位数n弱学习者n综念参数优化方法分位数Vol.60 No

31、.7Jul.15,2023段的分布变化,不考虑其他影响因素;正态分布形式的加性模型(法3),假定各个因素的预测符合正态分布,加性分位数建立方法如文中所述。采用R语言的mboost库实现本文模型的建立,进行电能表数据分位数计算。记本文算法为法4。四种方法对区域内用户综合电能表数据概率预测可得图3、图4。图3 中子图分别为综合CRPS、绝对误差量CRPS以及分散标度量CRPS,法1 的CRPS标记为O,法2 的CRPS记为,法3 的CRPS记为,法4 的CRPS记为,图4 为不同方法的密度预测,图4(a)图4(d)分别对应法1 法4。由图3 可知法1 的性能最差;通过对日期因素的考虑,法2 的性能

32、改善显著,因此日期因素变量是电力需求不确定性的良好预测因素。由图5可看出法2 的预测分布具有随预测范围变化的分布,而法1 具有分布恒定的特点。图3 还表明,与法1、法2 相比,法3、法4 的前几个预测时刻的CRPS特别小。这是由于这两种方法采用的最近需求变量是前几个预测时刻的良好的预测因素。在前几个预测时刻之后,法4 的 CRPS与法2 的CRPS接近,因为在前几个预测时刻之后,最近需求不再是良好的预测因素,而日期变量成为单个用户高度波动电能表数据的主要预测因素。0.0450.040.0350.030.0250.020.015米0:005:0010:0015:00 20:00时间加性分位数GB

33、算法米一米(a)0.080.070.060.050.040.030:005:0010:0015:00 20:00时间(b)第6 0 卷第7 期2023年7 月1 5日0.040.0350.030.0250.020.0150.010.0050:005:0010:00 15:00 20:00时间(c)图3 单个用户电能表数据概率预测模型的CPRSFig.3CPRS of electricity meter data probabilityprediction model of single user0.50.40.30.20.100:007:0014:00 21:00时间(a)0.50.40.30

34、.20.100:007:0014:00 21:00时间(c)图4 单个用户电能表数据概率密度预测结果Fig.4 Prediction results of electricity meter dataprobability density of single user由图3(b)、图3(c)可知法3 的绝对误差量和分散标度量的CRPS均低于法4。然而其具有比法4 更高电测与仪 表Electrical Measurement&Instrumentation的CRPS,这表明正态分布的预测分布不能有效匹配电能表数据真实不确定性变化规律。通过比较图4 中法3、法4 的预测密度,可知法4 比法

35、3 更符合观测结果。因此本文提出的算法在预测单个用户的电能表数据时具有极高的预测密度准确性和灵活性。此外,文章还比较各算法在综合电能表数据预测方面的性能,得到图5、图6 的CRPS和密度预测。图5表明正态分布的精度有所提升,可达到与法4 近似的性能,这证明正态假设是综合电能表数据的较好逼近。从图6 可知法3 密度预测具有相对较好的覆盖范围,这是由于总需求比个人电能表数据平稳得多。0.1一0.080.060.50.040.40.020.300:000.20.100:007:0014:00 21:00时间(b)0.50.40.30.20.100:007:0014:00 21:00时间(d)Vol.

36、60 No.7Jul.15,20237:0014:00时间(a)0.10.080.060.040.0200:000.10.080.060.040.0200:00图5综合电能表数据概率预测模型的CPRSFig.5CPRS of comprehensive electricity meter dataprobability prediction model16521:007:0014:00时间(b)7:0014:00时间(c)21:0021:00第6 0 卷第7 期2023年7 月1 5日0.90.80.70.60.50.40.30.20.10:007:0014:00 21:00时间(a)0.90

37、.80.70.60.50.40.30.20.10:007:0014:00 21:00时间(c)图6 综合电能表数据概率密度预测结果Fig.6 Prediction results of comprehensive electricitymeter data probability density通过上述算例分析可知:所提出的方法在综合电能表数据预测方面,可取得与正态分布假设基本相同的性能;在单个用户电能表数据预测方面,该方法明显优于其他方法,可实现不确定性更高的单个用户电能表数据概率分布情况的有效和准确预测。4.2实际应用对比由于智能电能表数据是统计区域内用电量的重要数据来源,因此智能电能表数

38、据的不确定性预测方法可实现区域综合用电量概率密度的预测,为区域内调度规划及电力系统安全域评估提供可靠数据。为验证文中算法在实际场景下的应用效果及性能。采用河北某市供电公司记录的城区智能电能表数据集对比了加性分位数GB算法与其他预测方法(高斯过程回归方法、长短期记忆网络)在区域日短期用电量概率分布预测的性能,数据集包含该地区2 0 1 5年2018年的智能电能表数据,电能表数据的采样间隔1 5min。此外,为实现对气象因素的考虑,文中将该数据一 1 6 6 一电测与仪 表Electrical Measurement&Instrumentation0.90.80.70.60.50.40.3

39、0.20.10:007:0014:0021:00时间(b)0.90.80.70.60.50.40.30.20.10:007:0014:0021:00时间(d)Vol.60 No.7Jul.15,2023集对应时间段内当地气象数据也进行了考虑。将8 5%的数据作为训练集,其余数据作为测试集进行高斯过程回归方法(Gaussian Process Regression,GPR)、长短期记忆网络(Long Short Term Memory,LSTM)以及本文算法的模型训练后,进行区域内用电量概率密度预测,可得表1 所示的各算法在不同置信区间下的CPRS。此外,各算法的模型训练及用电量概率预测所用时间

40、如表2 所示。从表1 可看出,不同置信区间内文中算法的绝对误差量CPRS数据始终小于GPR算法和LSTM算法,这表明不同置信区间下本文算法的预测误差最小;文中算法与LSTM算法的分散标度量CPRS基本相当,两种算法的分散标度量CPRS均大于GPR算法,这表明两种算法的锐度更高,即算法预测得到的概率分布集中性更好;文中算法的综合CPRS数据最小,因此综合考虑预测误差和概率分布集中程度条件下,文中算法的综合预测性能最好,可保证在最窄区间宽度下实现预测结果的高覆盖率。从表2 可看出,本文算法的模型训练和结果预测时间略低于GPR,远低于LSTM。因此,从时间尺度而言,文中算法的计算速度性能最优。表1

41、不同置信区间下各算法的CPRSTab.1CPRS under different confidence intervals置信区间CPRS绝对误差量75%分散标度量综合CPRS绝对误差量85%分散标度量综合CPRS绝对误差量95%分散标度量综合CPRS表2 各算法所用时长Tab.21Duration of each algorithm阶段本文算法训练模型4 min 31 s概率预测1.73 s通过三种算法的CPRS和计算速度性能对比,可知本文提出的算法性能最好,模型训练时间最少,且能有效处理用电量中的不确定性因素,在不同置信区间内算法文中算法GPR算法LSTM算法0.103 20.173 10

42、.007 50.007 10.095 70.166 00.063 70.112 10.010 10.008 30.05 360.103 80.03810.06110.01430.01020.02380.0509算法GPR算法5 min 20 s5 h 31 min 13 s2.01 s6.11 s0.150 10.009 10.141 00.090 20.012.30.077 90.05710.01720.0399LSTM算法第6 0 卷第7 期2023年7 月1 5日的预测均具有较高锐度。各分位点组成的用电量预测曲线构成的区间可实现对实际值的高覆盖率,为电力调度和系统安全评估提供重要数据支持

43、。5结束语针对其他方法在电能表数据概率预测上数据规模依赖性强、模型训练难度大,常出现模型普适性低、易引发过拟合等问题,提出基于 GB算法,利用智能电能表数据建立加性分位数回归模型,以实现未来电能表数据不确定性的量化预测。该模型与其他方法相比,更具有灵活性和可解释性,同时也可实现变量的自适应选择。该方法首先建立了电能表数据概率预测的不同影响因素的分位数模型及分位数交叉修正算法,在此基础上提出了基于GB算法的加性分位数模型,并给出了该方法的性能参数优化策略。随后采用数据集CER,依据所提出的基于GB算法的加性分位数建模方法建立了电能表数据概率预测模型,并给出可量化评价各概率预测方法的连续排序概率得

44、分。最后通过比较不同算法的CPRS,证明了所提出方法的准确性和优越性。与其他方法相比,基于GB算法的加性分位数建模方法实现电能表数据的不确定性量化具有以下特点:(1)该方法采用分位数实现概率分布形式的描述,更具普适性,可的实现各种随机性程度高的概率分布的数学形式描述;(2))该方法采用基于GB算法的加性模型,与单一影响因素模型相比,更具有准确性,与神经网络、支持向量机等机器学习算法相比,其直观性更强,且计算量大幅降低,建模速度大幅提升;(3)该方法采用基于智能电能表以分钟为采用间隔的海量数据进行建模,在区域内电能表数据预测和单个用户电能表数据预测方面均具有良好性能,是适用于不用应用场景下的电能

45、表数据概率预测。参考文献1彭楚宁,罗冉冉,王晓东新一代智能电能表支撑泛在电力物联网技术研究J.电测与仪表,2 0 1 9,56(1 5):1 3 7-1 4 2.Peng Chuning,Luo Ranran,Wang Xiaodong.Research on a new gener-ation of smart meter-technology supports ubiquitous power internet ofthingsJ.Electrical Measurement&Instrumentation,2019,56(15):137-142.2李小兵,李宇飞,郑天,等用电信息

46、采集系统全事件采集运行效果分析J.电测与仪表,2 0 1 8,55(7):6 6-7 0,8 2.Li Xiaobing,Li Yufei,Zheng Tian,et al.Operation effect analysis offull event acquisition in power information collection systemJ.Elec-trical Measurement&Instrumentation,2018,55(7):66-70,82.3王玥,张宇帆,李昭昱,等即插即用能量组织日前用电量概率预测方法J:电网技术,2 0 1 9,4 3(9):3 0

47、55-3 0 6 0.Wang Yue,Zhang Yufan,Li Zhaoyu,et al.Day-ahead probability loadforecasting of energy tissues with plug-and-play functionJ.Power Sys-电测与仪 表Electrical Measurement&Instrumentationtem Technology,2019,43(9):3055-3060.4 S.Arora,J.W.Taylor.Forecasting electricity smart meter data usingcondit

48、ional kernel density estimationJ.Omega,2016,59:47-59.5马天男,王超,彭丽霖,等计及需求响应和深度结构多任务学习的电力系统短期用电量预测J.电测与仪表,2 0 1 9,56(1 6):50-60.Ma Tiannan,Wang Chao,Peng Lilin,et al.Day-ahead probability loadforecasting of energy tissues with plug-and-play functionJ.Power Sys-tem Technology,2019,56(16):50-60.6 Wang Y.,

49、Gan D.,Sun M.,et al.Probabilistic individual load fore-casting using pinball loss guided LSTMJ.Applied Energy,2019,235:10-20.7吴传菊,徐羽,王晓光,等分位数回归曲线相交问题的修正J.统计与决策,2 0 1 6,2 2(2):9-1 1.Wu Chuanju,Xu Yu,Wang Xiaoguang,et al.Correction of intersec-tion problem of quantile regression curve J.Statistics&Decision,2016,22(2):9-11.8 王世勋,潘鹏,陈灯,等一种自适应的多类Boosting分类算法J.计算机科学,2 0 1 7,4 4(7):1 8 5-1 9 0.Wang Shixun,Pan Peng,Chen Deng,et al.Adaptive Multiclass Boos-ting Classification Algorith

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签
资源标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服