收藏 分销(赏)

数字孪生平台下基于随机森林算法的电网风险预测研究.pdf

上传人:自信****多点 文档编号:717783 上传时间:2024-02-21 格式:PDF 页数:5 大小:2.29MB
下载 相关 举报
数字孪生平台下基于随机森林算法的电网风险预测研究.pdf_第1页
第1页 / 共5页
数字孪生平台下基于随机森林算法的电网风险预测研究.pdf_第2页
第2页 / 共5页
数字孪生平台下基于随机森林算法的电网风险预测研究.pdf_第3页
第3页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、Microcomputer Applications Vol.39,No.8,2023文章编号:10 0 7-7 57 X(2 0 2 3)0 8-0 153-0 5数字李生平台下基于随机森林算法的电网风险预测研究(广西电网有限责任公司南宁供电局,广西,南宁530 0 2 8)摘要:为了进一步提高光伏功率的预测精度,降低电网风险,基于传统随机森林模型提出一种峰值修正法,以解决正午时段预测失准的问题。采用随机森林模型对待测样本进行初步预测,并将待测样本的初步预测结果分为上午和下午两个时段分别进行修正。在对上午时段的光伏集群功率进行修正时,采用DGM(1,1)对实际值与初步预测结果之间的相位关系进

2、行调整,由此得到修正后的预测结果;在对下午时段的光伏集群功率进行修正时,采用已产生的当前最大出力点进行修正。对光伏集群功率进行准确预测能够降低大规模接入电网对电力系统的安全稳定所带来的冲击,是保障电力系统安全的重要技术手段。关键词:随机森林模型;电网风险预测;光伏集群;功率预测;误差分析中图分类号:TP393Based on Random Forest Algorithm under Digital Twin Platform(Nanning Power Supply Bureau of Guangxi Power Grid Co.,Ltd.,Nanning 530028,China)Abst

3、ract:In order to further improve the prediction accuracy of PV power and reduce the risk of power grid,based on the tradi-tional random forest model,a peak correction method is proposed to solve the problem of inaccurate prediction at noon.Therandom forest model is used to make a preliminary predict

4、ion of the test samples,and the preliminary prediction results of thetest samples are divided into two periods of morning and afternoon for revision,respectively.In correcting the photovoltaiccluster power in the morning period,DGM(1,1)is used to adjust the phase relationship between the actual valu

5、e and the pre-liminary prediction result,thus we can obtain the revised prediction result.When the photovoltaic cluster power in the after-noon period is corrected,the current maximum output point is used for correction.Accurate prediction of photovoltaic clusterpower can reduce the impact of large-

6、scale access to the grid on the security and stability of the power system,which is an im-portant technical means to ensure the security of the power system.Key words:random forest model;power grid risk prediction;photovoltaic cluster;prediction of power;error analysis0引言2010年,数字李生这一概念出现于美国国家航空航天局的技

7、术报告中,这一报告中指出“数字李生”是指集成多概率、多学科、多物理量能的仿真过程或系统。在此之后,“数字李生”这一概念就正式进入人们的视野,并得到了各界学者的关注。数字李生的关键技术主要包括云计算、仿真、边缘计算、人工智能、建模及物联网等11。目前,我国光伏功率超短期预测仍存在光伏电站系统所采集的数据准确性较低、预报结果的时空分辨性不高等问题。因此,本文基于随机森林算法提出一种解决正午时段预测失准问题的方法,并分为上下午两个时段进行分段修正。上午时段采用离散灰色预测模型对实际功率的上升趋势进行预测,下午时段采用最大出力点进行修正,以进一步提高光伏功率的预测精度。1模型构建方法1.1随机森林模型

8、的初步研究作者简介:符华(198 0 一),男,硕士,高级工程师,研究方向为数字化技术应用、数据分析及应用、网络安全。研究与设计符华文献标志码:AResearch on Power Grid Risk PredictionH(x)=arg max)Y式中,H()为所构建的随机森林模型,h;为已完成生长的第153微型电脑应用2 0 2 3年第39 卷第8 期FU Hua21世纪初,统计学家利奥布莱曼提出了一种数据挖掘方法,并将其命名为随机森林算法(RF)。随机森林是一种由多个决策树构建而成的集成学习智能体。决策树是一种基本的分类器,构建好的决策树呈树形结构,可以将其视作if-then规则的集合。

9、而随机森林则是将所有决策树集合起来构成的森林,通过对森林中的每个子部分的输出结果进行打分,进而对森林中各个特征的重要程度进行评估2 。随机森林智能体的生成过程如图1所示。从图1可以看出,随机森林智能体的生成过程主要包括4个步骤。为了提升随机森林模型的统计能力,可以通过增加分类树的数量以增加数据集的差异。从原始序列中抽取k个样本后得到序列(hi(X),h z(X),h s(X),此时构成的随机森林模型中共含决策树k棵,本文预测结果通过多数投票法得出,如式(1):(1)I(h;()=Y)LD:/G p2(D,)Microcomputer Applications Vol.39,No.8,2023i

10、棵决策树,Y为预测结果,I()为示性函数。图1随机森林智能体训练要点序列(hi(X),h(X),h(X)中的数据都是从原始数据集(X,Y)中进行抽样得到,因此可以得到余量函数:mg(X,Y)=au,I(h(X)=Y)-maxavsI(he(X)=j)(2)通过式(2)得到正确与错误分类之间的差值,因此得到的函数值越小,表明分类效果越差。随机森林模型在生成决策树树枝时,所依靠的量度为Gini指数,CART决策树依靠Gini指数对样本集进行分割,使其形成完整的决策树。如果对数据集D进行分割后所形成的种类为m,那么该数据集的Gini指数如式(3):随机森林模型的统计学优点图3随机森林模型的统计学优点

11、1.2预测修正模型中参数=p 的最小二乘估计见式(10)式由于随机森林模型在进行预测时可能会出现失准的问(12):题,因此为了解决这一问题,本文将待测日分为上午和下午两个部分进行峰值修正。具体方法如下。(1)上午上升区域功率修正由于上午出现峰值的时间在预测时间之后,因此在对上午功率进行修正时采用趋势预测法。太阳光在上午的辐射强度随时间推移不断增强,上午的光伏功率也因此呈现不断上升的趋势,所以无法准确得到某一时刻的实际出力峰值,随机森林模型的初始预测结果也无法根据实际出力峰值进行调整3。白化响应式与白化模型之间所引起的误差可以通过离散灰色模型DGM(1,1)避免,因此本文在对上午功率进行预测时采

12、用新陈代谢的离散灰色模型。离散灰色模型具体是指将最老的(o)(1)替换为最新信息(o)(k 十1),不断进行信息更新以对新的数据进行预测4。随着时间的变化,离散灰色模型也会不断发生改变。将式(5)设为原始序列:X(0)=(0)(1),(0)(2),(0)(n)则DGM(1,1)模型可以用式(6)表示:()(k+1)=(k)+p将(1)设为一次累减算子,则可以得到式(7)、式(8):)2()=(k)2(k 1),k=2,2(1)(k)=i=1式(9)为离散灰色模型的白化方程:dt2研究与设计开始M建模与数据预处理M设定子集属性数决策树训练判定结果汇总M结束J-R2(i),k=1,2,nd(1)d

13、t微型电脑应用2 0 2 3年第39 卷第8 期Gp=1-2p(3)式中,Gp为Gini指数,pi为i类数据在数据集中所出现的次数。将数据集依据所得出的Gini指数进行划分,若依靠特征A将数据集D进行划分,使其形成子集Di、D 2,那么此次依靠特征A进行划分的Gini指数如式(4):GD.AD.GDI(Di)+D依靠特征A进行划分的Gini指数值越大,则表明此次划分效果越差。使用随机森林模型进行决策的过程如图2所示。决策树分类结果1决策树分类结果2决策树分类结果K投票决定最优分类图2 随机森林模型原理随机森林模型的统计学优点如图3所示。仅需对决策树数目及分裂特征数进行调整能够对大规模数据进行准

14、确估计,且不会出现过拟合现象使用Bagging法抽取子数据集可以降低泛化误差Y=L(1)(n)最终得到式(5)所对应的数学模型,如式(13):2()=)(1)(k)=(-1)(1)-11-当t=4时,采用离散灰色模型对集群功率的时间序列进行预测,翻转时间序列后输入离散灰色模型进行预测,得(5)到(tz,Yi2),将其与横坐标之间的夹角设为9。单次预报的最大值点与预测起始点t,构成另一条直线,将两条直线平(6)移后的交点设为(t4,Y4),当两条直线的斜率一致时会获得最大精度。因此,使用随机森林算法对上午功率进行预测得(7)到预测值的修正公式如式(14)式(16):(8)tan(min(,0)Y

15、-1-Yi-3(9)tan 9154(4)D数据集DM随机化D2+=(BTB)-IBTY一2(1)(1)一2(1)(2)B=:L-(1)(n-1)(1)(2)72(1)(3):2(10)171:1(11)(12)(13)(14)(15)Microcomputer Applications Vol.39,No.8,2023研究与设计微型电脑应用2 0 2 3年第39 卷第8 期tan:Pimx-Pitpmax一ti式(14)式(16)中,P,为初始预测结果,P为进行修正后的结果,P,为某时刻实际出力值,Y,为实测功率,tpmax为预测值的趋势线中达到预测峰值所对应的时间。(2)下午下降区域功率修

16、正下午时最大出力点应景产生,因此可以根据该点进行修正。具体方法如下。若PrmaxPmax,则可以得到式(17):PimaxP=(1Prmax若PmaxPmax,则可以得到式(18):Pmx-PimxP:=(1+Pimax式(17)式(18)中,P;为初始预测结果,P为进行修正后的结果,Pimax为初始预测结果的最大值,Prmax为上一时刻实测结果的最大值。1.3基于改进随机森林的光伏集群功率超短期预测模型的建立(1)预测流程对随机森林模型进行改进后得到的预测流程5-7 如图4。开始+输入历史数据(补齐缺失数据)(随机森林模型)划分时段上午时段下午时段离散灰色模型预测趋势峰值计算变更趋势峰值修正

17、支是是否达到预测步数得到多步预测结果结束图4改进随机森林算法预测流程(2)评价指标的选取本文所选取的模型评价指标为准确率和RMSE,准确率的计算公式8 1如式(19)式(2 0):T1:=1-网RF(总体)100集对法(总体)集对法(累加)80604020H076(16)PmaxPP(P()-P(i2)X100%(19)PeapRF(累加)7778编号(a)准确率丫1式(19)式(2 0)中,r1:、r 为i点和平均预测计划曲线的准确率。均方根误差的计算公式如式(2 1):1P(i)-P(i)RMSEPeapn式中,P(i)为光伏功率的预测结果,P(i)为实际出力值,n为采样点的长度,i为预测

18、点编号。(17)2模型预测结果分析2.1初步预测结果(18)由于光伏集群中各个场站的位置并不集中,因此在对光伏集群进行预测时主要采用如图5所示的3种方法。个累加法整体法空间升尺度法图5光伏集群预测策略整个光伏集群中不存在历史实测天气等大面积覆盖的变量,仅存在如光伏集群所处位置在不同季节的太阳辐射强度及日出日落时间等时序特征。因此,选取不需要状态变量的随机森林模型及集对法,为了比较整体法与累加法的预测结果进行对比,本文选取2 0 2 0 年东北地区某光伏集群中编号为7 6 8 0 的5天作为测试数据进行测试,将待测日的前30天作为训练集,集群中共含2 0 个子电站,总功率为6 50MW,采样间隔

19、为15min,得到的测试结果如图6 所示。从图6 可以看出,随机森林模型总体法的准确率最高,集对法的准确率相对较低,造成这种现象的原因可能是集群功率的汇聚效应。相较于集对法而言,随机森林法的均方根有了明显的降低,因此随机森林模型的稳定性更好。因此,本文在对光伏集群功率进行预测时选用的策略方法为随机森林模型及整体法。2.2算例分析(1)初步预测结果分析以吉林省2 0 2 0 年某光伏集群6 月份数据为例,待测日的前6 0 天中的集群总功率数据数为57 6 0 个,将其中的57 6个数据作为测试集,其余均为训练集,得到的预测结果如图7所示。30集对法(累加)集对法(总体)RF(累加)网RF(总体)

20、25201510507980均值图6不同预测策略方法比较155r1i对各个场站分别进行预测,将最终的预测结果进行叠加从而得到整个光伏集群的功率预测值取集群总功率的历史值作为训练数据直接得到集群总功率预测值将集群按一定规则分为若干区域,选择最能代表所在区域功率的电站取权重叠加集群功率预测值7677(b)均方根(20)X100%(21)7879编号80均值Microcomputer Applications Vol.39,No.8,2023编号(a)准确率图7使用6 0 日历史数据预测结果从图7 可以看出,在树木数分别为10 0、2 0 0、30 0 时预测维度进行扩大后继续进行分析。结果的准确率

21、及均方根误差并不存在明显差异,说明树木数待测日的前30 天中的集群总功率数据数为2 8 8 0 个,将对数据预测结果的影响并不大,但造成这种结果的原因也可其中的2 8 8 个数据作为测试集,其余均为训练集,得到的预能是由于本次实验所使用的数据维度太小,因此需要对数据测结果如图8 所示。100100200V3008040H2001234567平均编号(a)准确率图8 使用30 日历史数据预测结果通过图8 可以看出,在对历史数据的使用维度进行更改后,树木数的改变对预测结果产生了一定影响,当历史数据的使用维度较小时,模型的预测结果也相对较好。因此,最终所选取的训练数据为待测日前30 天的数据集,树木

22、数为10 0。采用随机森林模型对2 0 2 0 年该集群7 12 月份的测试集进行超短期预测,得到的预测结果如表1和图9所示。表1月均指标预测结果准确率/%7月89.028月89.359月89.8210月90.8111月92.9212月94.27月均91.030.600.550.500.450.40/鲜0.350.30.0.250.200.150.100.05-0.0%图9各月均方根误差频次曲线研究与设计1001002003008060402001234均方根误差/%14.6114.8413.279.268.456.3811.1410月12月12采样点10%/15min微型电脑应用2 0 2

23、3年第39卷第8 期12100200mV300108642067平均451234567平均编号(b)均方根误差12斤1100200130010F%86421234567平均编号(b)均方根误差从图9可以看出,随机森林模型对10 12 月的预测准确率相对较高,分别为90.5%、93.2 2%和95.6 1%,而对于高功率的正午时刻预测准确度并不高。(2)初步预测结果修正对上午时段的预测结果进行改进,比较结果如图10所示。350r一实际值初始预测值300F改进预测值250MN/率200150100F50024681012141618采样点/15min(a)改进后结果比较95r八90F%/本8580

24、7525(b)改进后各步预测准确率图10上午时段改进结果从图10 可以看出,与初始预测值相比,改进后的预测结果与实际值更为接近,且准确率也更高。以7 月2 1日为例,156一初始预测值改进预测值3035编采样点/min4045Microcomputer Applications Vol.39,No.8,2023改进前上午日均准确率及均方根误差分别为9 0.7 6%和13.26%,改进后上午日均准确率及均方根误差分别为93.16%和10.44%。对下午时段的预测结果进行改进,结果对比如图11所示。500r400E200100F0246810121416编采样点/15min(a)改进后结果比较10

25、0r95H%/素90F85F80F75F7040(b)改进后各步预测准确率图11下午时段改进结果从图11可以看出,相较于初始预测值而言,改进后的预测值与实际值更为接近,且改进后的预测结果准确率有了明显提升,2 0 2 0 年7 月月均预测准确率由8 9.8 9%提升至91.76%,均方根误差由14.42%下降至11.2 1%。(3)方法比较将本文所用方法与持续法、秩次集对法及人工神经网络法进行比较,得到的结果如图12 和表2 所示。350实际集粉始预测傷300数避预测特续法250秩茨集对法,人空神经网络200150100500-5050246810121416编采样点/15min(a)上午时段

26、各预测方法比较500实际集400初始预测集进预测值持续法秩茨集对法,人空神经网络芸2 0 010000246810121416编采样点/15min(b)下午时段各预测方法比较图12 方法比较研究与设计表2 各预测方法的准确率及均方根误差对比准确率/%持续法83.17秩次集对法88.26人工神经网络90.04随机森林91.31一实际值初始预测值改进预测值/一初始预测值改进预测值50607080编采样点/15min微型电脑应用2 0 2 3年第39 卷第8 期均方根误差/%18.2713.7211.2611.98改进随机森林92.18从图12 可以看出,相较于其他3种方法而言,本文所提出的改进随机

27、森林模型具有较为明显的优越性。与持续法相比,改进随机森林模型的月均预测准确率提高了5.6 4%,均方根误差降低了10.0 2%;与秩次集对法相比,改进随机森林模型的月均预测准确率提高了1.7 7%,均方根误差降低了4.65%。3总结由于光伏集群功率的大面积接人所造成的大幅波动会引起电网的电压频率产生波动,进而各方面的生产活动造成极大的影响,因此对光伏功率进行准确预测作为并网的前期工作就显得十分重要。为了降低大规模接入电网对电力系统的安全稳定所带来的冲击、保障电力系统安全,本文基于传统随机森林模型提出了一种峰值修正法以解决正午时段预测失准的问题。采用随机森林模型对待测样本进行初步预测,并将待测样

28、本的初步预测结果分为上午和下午两个时901008.72段分别进行修正。算例分析表明,基于改进随机森林的光伏集群功率超短期预测与人工智能方法不同,采用峰值修正与双时段趋势修正相结合的思想,能够反映功率的趋势特性,且拟合能力更强。1刘明顺,龙志君,赵立进,等.基于模糊推理的电网风险评估及线路重要度辨识J。电力科学与技术学报,2017,32(3):131-138.2 张春兰,杨贵军,李贺丽,等.基于随机森林算法的冬小麦叶面积指数遥感反演研究J.中国农业科学,2018,51(5):855-867.3陈威洪.调控一体化模式下地区电网风险管控策略J.应用科技,2 0 18,45(2):49-54.4潘显俊

29、,张炜,赵田,等.分数阶离散灰色模型及其在备件需求预测中的应用J.兵工学报,2 0 17,34(8):8.5程启明,张强,程尹曼,等.基于密度峰值层次聚类的短期光伏功率预测模型J.高电压技术,2 0 17,43(4):1214-1222.6 吴坚,郑照红,薛家祥.深度置信网络光伏发电短时功率预测研究J.中国测试,2 0 18,44(5):6-11.7 李健丽,董莹莹,师越,等.基于随机森林模型的小麦白粉病遥感监测方法J.植物保护学报,2 0 18,45(2):395-396.8 CHEN Y M,YE X J,HUANG F.A novel method andfast algorithm for MR image reconstruction with sig-nificantly under-sampled dataLJJ.Inverse Problems&.Imaging,2010,4(2):223-240.参考文献(收稿日期:2 0 2 1-11-0 9)157

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服