收藏 分销(赏)

基于改进熵权法和SECEEMD的短期风电功率预测.pdf

上传人:自信****多点 文档编号:2259698 上传时间:2024-05-24 格式:PDF 页数:10 大小:1.61MB
下载 相关 举报
基于改进熵权法和SECEEMD的短期风电功率预测.pdf_第1页
第1页 / 共10页
基于改进熵权法和SECEEMD的短期风电功率预测.pdf_第2页
第2页 / 共10页
基于改进熵权法和SECEEMD的短期风电功率预测.pdf_第3页
第3页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、投稿网址:2023 年 第23 卷 第27 期2023,23(27):11688-10科 学 技 术 与 工 程Science Technology and EngineeringISSN 16711815CN 114688/T引用格式:王永生,张哲,刘利民,等.基于改进熵权法和 SECEEMD 的短期风电功率预测J.科学技术与工程,2023,23(27):11688-11697.Wang Yongsheng,Zhang Zhe,Liu Limin,et al.Short term wind power prediction based on improved entropy weight m

2、ethod and SECEEMDJ.Science Technology and Engineering,2023,23(27):11688-11697.自动化技术、计算机技术基于改进熵权法和 SECEEMD 的短期风电功率预测王永生1,2,张哲1,2,刘利民1,2,高静3,刘广文1,2,武煜昊1,2(1.内蒙古工业大学数据科学与应用学院,呼和浩特 010080;2.内蒙古自治区基于大数据的软件服务工程技术研究中心,呼和浩特 010080;3.内蒙古农业大学计算机与信息学院,呼和浩特 010018)摘 要 为实现短期风电功率的高精度预测,综合考虑风电功率数据波动性以及多维气象数据对风电功率预

3、测的影响,提出了一种基于改进熵权法和样本熵-互补集合经验模态分解(sample entropy complementary ensemble empirical mode decomposition,SECEEMD)的短期风电功率组合预测方法。首先,提出了一种综合相关性分析模型,结合多种特征选择方法对多维气象特征实现综合评价,准确筛选与风电功率相关性较高的气象特征,提高预测精度。其次,针对 CEEMD 存在的分解分量过多,模态混叠程度加剧的问题,提出了 SECEEMD 分解算法,在降低分量数量,降低模态混叠程度的同时,提高模型的训练速度。然后,分别建立数值气象预报-长短期记忆网络(numeri

4、cal weather prediction-long short term memory,NWP-LSTM)和 SECEEMD-BP(back propogation)预测模型,并通过贝叶斯优化算法优化长短期记忆神经网络和 BP 神经网络结构;最后,通过改进熵权法寻找到最优权重组合进行加权组合。实验以内蒙古碧柳河风电场的风电功率数据和气象数据为实验数据,经验证,本文所提预测模型,能较大程度提高预测精度,相较于一般预测模型,R2分别提高了 4%和 0.6%,平均绝对误差(mean absolute error,MAE)分别降低了 44%和 1.1%,证明本文所提风电功率预测方法具有更高的预测精

5、度和更快的训练速度,更加适合进行风电功率预测。关键词 风电功率预测;信号分解;相关性分析;贝叶斯优化算法中图法分类号 TP181;文献标志码 A收稿日期:2022-12-26;修订日期:2023-07-10基金项目:内蒙古自然科学基金(2019MS03014,2021LHMS06001);内蒙古自治区高等学校科学研究项目(NJZY21321);内蒙古水利发展基金(NSK202109);内蒙古自治区直属高校基本科研业务费项目(JY20220304);内蒙古自治区科技重大专项(2019ZD016)第一作者:王永生(1976),男,汉族,内蒙古丰镇人,博士,副教授,高级工程师。研究方向:大数据分析与

6、挖掘、机器学习与深度学习。E-mail:wangys 。通信作者:刘利民(1964),男,汉族,内蒙古察右中旗人,硕士,教授。研究方向:网络舆情分析与大数据处理、软件工程与项目管理。E-mail:。Short Term Wind Power Prediction Based on Improved EntropyWeight Method and SECEEMDWANG Yong-sheng1,2,ZHANG Zhe1,2,LIU Li-min1,2,GAO Jing3,LIU Guang-wen1,2,WU Yu-hao1,2(1.School of Data Science and App

7、lication,Inner Mongolia University of Technology,Hohhot 010080,China;2.Software Service Engineering Technology Research Center,Hohhot 010080,China;3.School of Computer and Information,Inner Mongolia Agricultural University,Hohhot 010018,China)AbstractIn order to achieve high-precision short-term win

8、d power prediction,a short-term wind power combination predictionmethod based on improved entropy weight method and SECEEMD(sample entropy complementary ensemble empirical mode decomposi-tion)was proposed,taking into account the volatility of wind power data and the impact of multi-dimensional meteo

9、rological data onwind power prediction.First of all,a comprehensive correlation analysis model was proposed,which combined multiple feature selec-tion methods to achieve comprehensive evaluation of multi-dimensional meteorological features,accurately screened meteorological fea-tures with high corre

10、lation with wind power,and improved prediction accuracy.Secondly,in view of the problem that CEEMD has toomany decomposition components and increases the degree of modal aliasing,the SECEEMD decomposition algorithm was proposed toreduce the number of components and the degree of modal aliasing,while

11、 improving the training speed of the model.Then,NWP-LSTM(numerical weather prediction-long short term memory)and SECEEMD-BP prediction models were established respectively,and投稿网址:2023,23(27)王永生,等:基于改进熵权法和 SECEEMD 的短期风电功率预测11689the structure of long short-term memory neural network and BP neural net

12、work were optimized by Bayesian optimization algorithm.Fi-nally,the optimal weight combination was found through the improved entropy weight method.The experiment takes the wind powerdata and meteorological data of Biliuhe wind farm in Inner Mongolia as the experimental data.It has been verified tha

13、t the predictionmodel proposed can greatly improve the prediction accuracy.Compared with the general prediction model,R2has increased by 4%and 0.6%respectively,and MAE has decreased by 44%and 1.1%respectively.The experiment proves that the wind powerprediction method proposed in this paper has highe

14、r prediction accuracy and faster training speed,and is more suitable for wind pow-er prediction.Keywords wind power prediction;signal decomposition;correlation analysis;Bayesian optimization algorithm 随着化石能源的逐渐枯竭和全球对于环境保护的愈加重视,风力发电逐渐代替火力发电,成为中国主要的发电方式。据相关统计,截至 2021 年底,中国的风电装机容量已经达到了 3.28 亿千瓦,成为全球风电装

15、机容量第一大国家1,成了全球规模最大的风电市场。然而过大的风力发电规模给风电场的管理以及电网调度带来了严重的影响。因此,对于实现高精度的风电功率预测迫在眉睫。受到风的波动性影响,风电功率数据处于严重的不平稳状态2。刘栋等3通过变分模态分解将原始数据分解,然后使用加权排列熵将分量进行重组,再通过麻雀算法对支持向量机进行优化,并通过优化后的支持向量机对风电功率进行预测。武新章等4通过互补集合经验模态分解(complemen-tary ensemble empirical mode decomposition,CEEM-DAN)算法对风电功率数据以及风速数据进行分析,平稳其中的波动性,然后结合注意力

16、机制以及时间卷积网络对风电功率进行预测。通过信号分解可以将不平稳的数据分解为平稳的分量,实现数据的平稳化。高精度的风电功率预测除了需要对平稳的风电功率数据之外,还需要多维气象特征的辅助。从风电产生的原理可以看出,通过使用多维气象数据对风电功率数据进行预测,能够实现较高精度的风电功率预测。杨国清等5利用皮尔逊相关系数对数值气象预报(numerical weather predic-tion,NWP)数据进行相关性分析,然后通过 Atten-tion-GRU(Attention-gate recurrent unit)对风速进行修正,最后通过 Stacking 框架,结合多种模型对风电功率进行预测

17、。康文豪等6通过 PCA(principalcomponent analysis)对气象数据实现降维,降低后续模型的训练复杂度,然后结合 MRFO(manta ray fora-ging optimization)算法和极端随机数对风电功率进行预测。栗然等7利用 PCA 对多维气象数据进行预处理,然后通过卷积网络进一步降维,最后使用长短期记忆网络(long short term memory,LSTM)对风电功率进行预测。杨芮等8通过 Pearson 相关系数分析气象特征与风电功率数据之间的相关性,然后通过结合卷积神经网络和 GRU 对风电功率进行预测。上述研究中,虽然通过信号分解算法将风电功

18、率数据平稳化,然而存在分量较多,模态混叠加剧的问题;通过特征优化方法对气象特征进行降维、优化,但单一特征优化方法存在一定的局限性,例如:主成分分析降低特征的可解释性,破坏了原始特征的完整性,影响后续预测模型的预测精度;皮尔逊相关系数仅能评价线性关系,且要求数据服从正态分布9。因此,为解决该问题,同时实现风电功率的高精度预测,现提出基于改进熵权法和样本熵-互补 集 合 经 验 模 态 分 解(sample entropyCEEMD,SECEEMD)的短期风电功率组合预测方法。首先,提出一种综合相关性评价模型,通过结合多种相关性分析方法,对 NWP 数据进行分析,避免单一方法的局限性,准确地选择出

19、相关程度较高的气象特征;然后,使用样本熵对 CEEMD 分解算法进行改进,分别建立 NWP-LSTM 和 SCEEMD-BP(back propogation)预测模型,并利用贝叶斯优化算法对其结构进行优化;最后,通过改进熵权法寻找最优权重,并对预测结果进行组合;最后通过内蒙古碧柳河风电场的实采数据证明本文所提预测方法的有效性以及合理性。1 风电功率预测组合方法风电功率预测不仅受到气象数据的影响,同时也受到自身趋势的影响,因此,从两个角度出发,以NWP 数据以及提出的综合相关性评价(comprehen-sive correlation evaluation,CCE)模型为基础,提出了NWP-C

20、CE-LSTM 预测模型;以历史风电功率数据和提出的 SECEEMD 分解算法为基础,提出了 SE-CEEMD-BP 预测模型。为提高模型的预测精度,使用贝叶斯寻优对两部分预测模型的模型结构进行寻优;为保证组合权重分配的客观性,使用结合贝叶斯寻优的熵权法对最优权重进行计算,并对两个预测模型的预测结果进行加权组合。1.1 NWP-CCE-LSTM 预测模型1.1.1 综合相关性评价模型气象特征对风电功率预测尤为重要,通过气象投稿网址:11690科 学 技 术 与 工 程Science Technology and Engineering2023,23(27)对风电功率进行预测,可以实现相较于使用

21、单一特征进行预测更高的预测性能。但过多的气象特征会导致后续的预测模型训练复杂程度上升,训练速度变慢,影响模型的预测性能,同时,不同气象特征对模型预测性能的影响不同,有影响模型预测精度的风险,因此,需要通过特征优化对气象特征进行处理。然而,现有风电功率预测的研究中,大多数的特征优化方式为单一特征优化方式,该方法存在一定的缺陷,对模型预测精度的提升较弱,无法实现高精度的风电功率预测。因此,提出一种 CCE 模型,通过结合多种相关性评价方法对不同气象特征进行评价,综合所有的评价结果对气象特征进行优化。为保证特征的可解释性和完整性,综合相关性评价方法选择了两种特征选择方法,分别为 Pearson相关系

22、数法和灰色关联分析法。Pearson 相关系数法是卡尔皮尔逊于是1897年提出的一种相关性评价方法,最为经典的相关性评价方法10。该方法通过计算数据之间的协方差和标准差来衡量数据之间的相关性。其计算公式为P=ni=1(xi-x-)(yi-y-)ni=1(xi-x-)2ni=1(yi-y-)2(1)式(1)中:i 为序列的长度;xi、yi分别为不同序列的第 i 个数据;x-、y-分别为不同序列的均值。灰色关联分析法是 Deng11于1989 年提出的针对灰色系统的相关性分析方法。针对了解不完全的系统,通过分析元素的差值,得出不同元素之间的相关性。邓氏灰色关联分析法的流程如下。(1)计算差值。ci

23、=ai-bi(2)(2)计算差值的最大值和最小值。Cmax=max(C),C=c1,c2,cn(3)Cmin=min(C),C=c1,c2,cn(4)(3)计算单一元素的灰色关联度。i=Cmin+pCmaxci+pCmax(5)(4)计算总体灰色关联度。=1nni=1i(6)式中:ci、ai、bi分别表示第 i 个差值和不同序列的第i 个元素;p 为分辨系数,其范围为0,1,其值越大,分辨能力越强,通常取 0.5。通过 Pearson 相关系数分析气象特征与风电功率数据之间的线性相关性12,通过灰色关联分析气象数据曲线与风电功率数据曲线之间的关联性13。同时,为了更加全面地对气象特征与风电功率

24、数据之间的相关性进行评价,提出一种趋势相关系数(trend correlaction coefficient,TCC),用来衡量气象数据发展趋势与风电功率数据发展趋势之间的相关性,其计算步骤如下。(1)计算不同序列的趋势变化值。Ca=at-at-1,t=2,3,n(7)Cb=bt-bt-1,t=2,3,n(8)(2)比较单一时刻趋势变化是否相同。t=1,CaCb 00,CaCb 0(9)(3)计算整体趋势相关系数。=1n-1n-1i=1i(10)式中:Ca、Cb分别表示序列 a 和序列 b 不同时刻的趋势变化值;at-1、at分别表示序列 a 第 t 时刻和第t-1 时刻的数据;t表示第 t

25、时刻两序列的趋势变化情况;表示两序列整体的趋势相似系数,其范围为0,1,其数值越大,表示两个序列之间的发展越相似。通过上述的三种相关性评价方法对气象特征和风电功率数据之间的相关性进行分析,然后计算均值作为最终的综合相关性系数,实现更为全面、准确地对进行特征选择,对后续预测模型精度较大的提高。CCE 模型的结构如图 1 所示。图 1 CCE 模型结构Fig.1 The model structure of CCE1.1.2 LSTM 神经网络LSTM 神经网络是目前常用于时间序列数据预测的深度学习模型。LSTM 神经网络的核心为三种“门”:遗忘门、输入门、输出门14。LSTM 为实现对数据时序性

26、的考虑,通过输入门和遗忘门对细胞状态进行更新,然后将在计算下一时刻的细胞状态时,考虑该时刻的细胞状态。其过程如下所示。(1)遗忘门对上一时刻的隐藏状态和该时刻的输入进行计算。ft=(Wfht-1,xt+bf)(11)(2)输入门对上一时刻的隐藏状态和该时刻的输入进行计算。投稿网址:2023,23(27)王永生,等:基于改进熵权法和 SECEEMD 的短期风电功率预测11691it=(Wiht-1,xt+bi)(12)C=tanh(WCht-1,xt+bC)(13)(3)更新该时刻的细胞状态。Ct=ftCt-1+itCt(14)式中:ft为第 t 时刻遗忘门的输出;为 Sigmoid 函数;Wf

27、为遗忘门的权重;ht-1为上一时刻的隐藏状态;xt为当前时刻的输入;bf为遗忘门的偏置权重;it为第 t 时刻输入门的输出;Wi为输入门的权重;bi为输入门的偏置权重;C为当前时刻要向细胞状态中添加的向量;WC为该部分神经网络的权重;bC为该部分神经网络的偏置权重;Ct为当前时刻状态;Ct-1为上一时刻状态。更新完细胞状态后,便可以对当前时刻的输出以及要向下一时刻传递的隐藏状态进行计算,其计算公式为ot=(Woht-1,xt+bo)(15)ht=ottanh(Ct)(16)式中:ot为第 t 时刻输出门的输出;Wo为输出门的权重;bo为输出门的偏置权重;为 Sigmoid 函数。通过门控机制,

28、LSTM 可以实现对数据集时序性的考虑。同时,LSTM 作为一种目前主流的深度学习模型,对多维数据的处理性能更优,因此,将LSTM 与提出的 CCE 模型结合,通过多维气象数据对风电功率进行预测。1.2 SECEEMD-BP 预测模型风电功率数据除了受到多维气象因素的影响外,还受到自身数据不平稳性的影响。由于风的波动性、随机性,导致风电功率数据的不平稳性15,使得后续预测模型的预测精度较低,因此,提出采用样本熵改进的 CEEMD 分解算法对风电功率数据进行分解,在将其平稳化的同时,降低分量数量,保证分量的时序稳定性。1.2.1 SECEEMD 分解算法针对非平稳的时序数据,对其使用时序分解便可

29、以将其平稳化16,使得可以更加容易地获取到时序数据的特征趋势,从而提高时序预测的精度。CEEMD 分解算法是目前信号分解领域较新的分解算法17,该分解算法虽然解决了 EMD 分解算法存在的模态混叠问题18和 EEMD 存在的对数据完整性造成影响的问题19,但随着数据量的增大,CEEMD 分解算法会出现分解出的分量过多,分解不完全,模态混叠程度加剧的情况。针对这一问题,对 CEEMD 分解算法进行了改进。样本熵作为一种衡量时序数据混乱性时序熵,其值越大,时序数据的混乱性、随机性越大,产生新模式的可能性越高。其计算方式如下所示。(1)将原始数据划分为窗口大小为 m 的时间窗口序列。Xi=xi,xi

30、+1,xi+m-1(17)(2)计算除自身外,与其他窗口的距离。d=max(xi-xj)(18)(3)计算每个窗口的距离中大于阈值的个数占总窗口个数的比重 Cmi。Cmi=dbn-m(19)(4)计算平均值 m。m=1n-mn-mi=1Cmi(20)(5)将 m+1,重复步骤(1)(4),得出另一个平均值 m+1。(6)计算样本熵。sampen=lnm-lnm+1(21)式中:xi和 xj属于不同时间窗口对应的数据;db为超过阈值的距离的个数。由于样本熵能够对时序数据的混乱性进行衡量,因此,为了降低分量产生新模式的概率,提高预测模型的预测精度,提出使用样本熵对 CEEMD 分解算法进行改进。该

31、改进算法通过样本熵对分量进行进一步筛选,剔除其中混乱程度较高的分量,保证分量的时序稳定性,其步骤如下所示。(1)向原始数据中添加 M 组正负相抵的白噪声。X+(t)=X(t)+c+(t)(22)X-(t)=X(t)+c-(t)(23)(2)对添加白噪声的数据进行 EMD 分解。(3)将多次分解后的分量求平均,得到 CEEMD分解的分量。imf1=1MMi=1(imf+i1+imf-i1)(24)式中:X+(t)为添加正噪声后的数据;X-(t)为添加负噪声后的数据;X(t)为原始数据;c+(t)为正噪声;c-(t)为负噪声;imf1为 CEEMD 分解出来的第一个分量,imf+i1为添加 1 次

32、正噪声后,分解出来的第一个分量,imf-i1为添加一次负噪声后,分解出来的第一个分量。(4)计算每个分量的样本熵。(5)通过设定的混乱性阈值,对高于该阈值的分量从原始数据中剔除,低于该阈值的分量保留,作为后续预测模型的输入特征。通过 SECEEMD 分解算法,将非平稳的风电功率数据平稳化,并且降低了分量数量,保证了分量投稿网址:11692科 学 技 术 与 工 程Science Technology and Engineering2023,23(27)的时序稳定性,在提高后续预测模型训练速度的同时,提高模型的预测精度。1.2.2 BP 神经网络BP 神经网络是最为经典的神经网络。在目前风电功率

33、预测领域中,很多研究将 BP 神经网络作为风电功率单特征预测的预测模型。BP 神经网络的核心为“前向预测,反向修正”,结构为三层网络结构,包括:输入层、隐藏层、输出层,每一层有多个神经元,每个神经元与下一层的每个神经元连接,并拥有一个权重。通过将输入与权重相乘,然后加上每一层的偏置权重,得到该层的输出,然后通过激活函数,输出到下一层,作为下一层的输入。BP 神经网络的反向修正是其最为重要的核心。通过反向修正,可以依据预测与真实值的误差对神经网络的权重进行更新,从而实现对真实值更加贴近的预测。其主要公式为E=12ni=1(yi-yi)2(25)ij=ij+Hj(1-Hj)xink=1jkek(2

34、6)jk=jk+Hjek(27)aj=aj+Hj(1-Hj)nk=1jkek(28)bk=bk+ek(29)式中:E 为预测值和真实值的误差;yi为预测值;yi为真实值;ij为输入层到隐藏层的权重;为学习率,即每次对权重更新幅度的大小;Hj为隐藏层的输出;jk为隐藏层到输出层的权重;ek为预测值与真实值的差值;ak为输入层到隐藏层的偏置权重;bk为隐藏层到输出层的偏置权重。通过上述公式,可以对 BP 神经网络每一层的权重进行更新,使预测值与真实值逐渐贴近,逐渐拟合。1.3 改进熵权法以及组合模型权重分配方式对于组合模型尤为重要,决定了组合模型最终的预测性能。为保证权重分配的客观性,结合贝叶斯寻

35、优算法对熵权法进行改进,通过改进的熵权法计算 NWP-CCE-LSTM 预测模型和SECEEMD-BP 预测模型的权重,并对其预测值进行组合。1.3.1 BO-EWM 权重分配熵权法(entropy weight method,EWM)是一种客观权重赋予办法,通过信息熵来对权重进行计算20。信息熵是一种衡量数据信息量的熵值,其数值越大,信息量越小,那么发生的概率越大。在目前的风电概率预测领域中,已有人使用熵权法作为组合模型的权重分配方式,例如:杨锡运等21通过熵权法计算了风电概率组合概率区间预测模型的权重。以 NWP-CCE-LSTM 预测模型为例,熵权法的步骤如下所示。(1)将预测值与验证值

36、的 MAE、MSE、MAPE 组为 N 3 的矩阵。ENWP=maeNWP1mseNWP1mapeNWP1maeNWP2mseNWP2mapeNWP2maeNWPnmseNWPnmapeNWPn(30)式(30)中:ENWP为通过 NWP 数据进行预测后的预测值的性能评价矩阵;maeNWP1为第一个预测值的mae 数值;mseNWP1为第一个预测值的 mse;mapeNWP1为第一个预测值的 mape。(2)计算单一指标占该指标全部数据的概率,以 NWP-CCE-LSTM 的 MAE 为例。pmaei=maeNWPinj=1maeNWPj(31)式(31)中:pmaei为第 i 个预测值的 m

37、ae 占全部 mae的概率。(3)计算单一指标的信息熵,以 NWP-CCE-LSTM 的 MAE 为例。emae=-1lnnNj=1pmaejln(pmaej)(32)式(32)中:emae为通过 NWP 预测的预测值的 mae 的信息熵;N 为预测数据的总量。(4)计算该预测模型总体信息熵。eNWP=13(emae+emse+emape)(33)式(33)中:eNWP为通过 NWP 预测的预测值的整体信息熵;emae为预测值的 emae的信息熵;emse为预测值的mse 的信息熵;emape为预测值的 mape 的信息熵。(5)计算信息效用值。dNWP=1-eNWP(34)式(34)中:dN

38、WP为通过 NWP 预测的预测值的信息效用值。(6)计算权重。WNWP=dNWP/(dNWP+dSECEEMD)(35)式(35)中:WNWP为通过 NWP 预测的预测值的权重;dSECEEMD为通过 SECEEMD 预测的预测值的信息效用值。通过上述步骤,便可计算两个预测模型的客观权重。但客观的权重分配无法使组合模型的预测精度达到最佳,因此,需要向对权重分配方案进行进一步寻优。投稿网址:2023,23(27)王永生,等:基于改进熵权法和 SECEEMD 的短期风电功率预测11693贝叶斯优化算法(Bayesian optimiazation,BO)是一种参数优化算法,可以对神经网络的结构进行

39、优化22。该算法的本质为通过给定的目标函数,通过采集函数来确定参数的范围,然后考虑上一次的信息,来更好地选择参数。相较于传统的网格搜索,贝叶斯优化算法迭代次数少,寻优速度快。因此,结合贝叶斯优化算法和熵权法,提出了基于贝叶斯优化的熵权法(Bayesian optimiazationentropy weight method,BO-EWM)权重分配算法。将EWM 算法计算的客观权重作为权重分配的下限,通过贝叶斯优化算法寻找最优权重组合。1.3.2 组合模型本文提出了一种基于改进熵权法和 SECEEMD的风电功率短期组合预测方法。该方法针对影响风电功率的多维气象因素和风电功率自身趋势,分别构建了

40、NWP-CCE-LSTM 预测模型和 SECEEMD-BP 预测模型,并使用 BO 算法对模型结构进行寻优,然后使用改进的熵权法对两个模型的权重进行计算,并依据最优权重组合,将两个模型的预测值组合为最终预测值。组合模型的整体结构如图 2所示。图 2 整体流程图Fig.2 The overall flow chart2 实例验证2.1 实验数据本文所使用的数据为内蒙古碧柳河风电场2019 年 1 月1 日至2019 年3 月1 日的实采数据,包含了风电功率数据以及多维气象数据,其中多维气象数据包括:风速、风向、温度、湿度、空气密度和气压。数据的采集频率为 15 min 采集 1 次,共 5 76

41、0条数据。本实例中将数据按照 4 1的比例将数据分为训练集和验证集。2.2 模型评价指标为合理、科学地对本文所提模型的预测性能进行评价,依照国家现行的关于风电功率预测系统的评价标准23,选择拟合优度(R2)、平均绝对误差(mean absolute error,MAE)24、均 方 误 差(meansquare error,MSE)、平均绝对百分比误差(mean ab-solute percentage error,MAPE)25。以及运行时间作为评价标准,其公式如下所示。平均绝对误差:MAE=1nni=1|yi-yi|(36)均方误差:MSE=1nni=1(yi-yi)2(37)平均绝对百分

42、比误差:MAPE=100%nni=1yi-yiyi(38)式中:n 为数据的个数;y为预测值;y 为验证值。2.3 数据预处理2.3.1 缺失值填补在神经网络的训练过程中,数据集的完整性对模型的性能也存在着一定的关系。时序数据会因为人为原因或一些不可抗的因素,如人为误删、数据采集传感器损坏等原因,导致数据丢失或数据缺投稿网址:11694科 学 技 术 与 工 程Science Technology and Engineering2023,23(27)失26,从而对数据集的完整性造成影响。针对缺失的数据,一般采用删除法、权重法、填补法等方式27进行处理。由于本实验所使用的数据集的损失率较低,因此

43、,本实验选择较为简单的均值填补方法对缺失值进行处理。2.3.2 标准化在多元特征预测中,由于不同的指标,其值的范围不同,因此,为统一其范围,需要进行标准化,将其数值统一在统一量纲分数内。无量纲化的方式有最大值-最小值方法、Z 方法等。本实验由于使用了灰色关联分析算法,而使用该算法对使用最大值-最小值方法进行无量纲化处理的数据进行分析时,可能会存在灰色关联度大于 1 的情况,因此,本实验选择使用 Z 方法。其公式为xi=xi-XmeanXstd(39)式(39)中:Xmean为数据集的平局值;Xstd为数据集的标准差。2.3.3 时间滑动窗口搭建时间滑动窗口(time sliding windo

44、w,TLW)是一种数据重构技术。风电输出功率由于受到风速、风向等不稳定、随机性强的气象因素的影响,导致其数值同样具有随机性,但仍具有一定的周期性。为考虑到历史风电功率在时间维度上的特征,提高预测精度,本实验使用时间滑动窗口对风电功率数据进行相空间重构。已知风电功率数据为 x1,x2,xn,时间滑动窗口大小为 m,则重构后的风电功率数据可以表示为 Xm(i)=xi,xi+1,xi+m。其重构过程如下式所示:x1,x2,xn x1x2x1+m-1x2x3x2+m-1xkxk-m+2xk+m-1(40)通过时间滑动窗口重构算法,对气象数据、功率数据以及分解算法分解出来的分量进行重构,以便于后续的神经

45、网络可以捕获到数据在时间维度上的特征。2.4 实验部分2.4.1 NWP-CCE-LSTM 预测在 NWP-CCE-LSTM 预测部分,对全部气象数据与风电功率数据进行相关性分析。经计算,全部气象数据与风电功率数据之间的 Pearson 相关系数、灰色关联度、趋势相关系数以及综合相关性系数如表 1 所示。表 1 不同相关性分析结果Table 1 The results of different correlation analysis参数Pearson 系数灰色关联度缺失相关性综合相关性风速0.120 190.685 510.340 680.382 13风向0.165 720.772 640.

46、271 220.403 19温度0.094 840.772 640.103 140.308 01湿度0.139 040.685 320.285 630.370 00气压-0.112 830.720 790.073 620.227 19空气密度-0.117 080.652 920.155 400.230 41 通过表 1 可以看出,经过 CCE 模型进行相关性评价后,风速、风向、温度和湿度相较于剩下的气象特征与风电功率数据的相关性更强,因此,将其作为选择的气象特征,与风电功率数据一同作为NWP-CCE-LSTM 预测模型的输入特征。为验证本文所提 NWP-CCE-LSTM 预测模型的优势,本实例

47、做了大量的对比实验,其实验结果如表 2 所示。表 2 特征优化对比实验结果Table 2 Comparative experimental results offeature optimization实验R2MAEMSEMAPE实验 10.912 220.215 000.100 561.183 01实验 20.922 510.200 600.097 690.911 55实验 30.928 700.189 610.091 310.891 55实验 40.936 330.172 310.088 040.832 38 其中,实验 1 为未进行特征优化,将全部气象特征和风电功率数据一起作为 LSTM

48、的输入特征,从中可以看出,其结果并不理想,拟合优度仅达到了91%,MAE 和 MSE 也高达 0.21 和 0.1,其 MAPE 值也超过了 1,说明该模型属于劣质模型;实验 2 为使用灰色关联度进行特征优化的结果,其 R2相较于实验 1 提高了 1%,MAE 和 MSE 均为轻微下降,约为0.01,MAPE 下降较多,下降了 0.27,但其预测精度依旧不是最理想;实验 3 为使用主成分分析法对特征进行优化,虽然主成分分析法对特征数据的完整性和可解释性造成了影响,但其作为目前主流的特征优化方法,其优化性能较为良好。经过主成分分析优化气象特征后,模型的预测精度接近 93%,提高较多,MAE、MS

49、E 和 MAPE 也有所下降,但由于对特征的完整性造成了影响,因此,该模型的预测精度仍有很大的提升空间;实验 4 为本文提出了NWP-CCE-LSTM 预测模型,经过 CCE 模型进行特征降维后,模型的预测性能有了很大的提升,R2达到了 93.6%,相较于实验 1、实验 2 和实验 3 分别提高了 2.4%、1.4%和 0.8%,MAE、MSE 和 MAPE 也有较大程度的下降,因此,证明了本文所提的 CCE 模型相较于目前主流的特征优化方法有较大的优势,投稿网址:2023,23(27)王永生,等:基于改进熵权法和 SECEEMD 的短期风电功率预测11695能够为模型预测性能的提高提供更大的

50、帮助。2.4.2 SECEEMD-BP 预测在 SECEEMD-BP 预测部分,首先使用 CEEMD分解算法将其分解为平稳分量,然后计算每个分量的样本熵,其结果如表 3 所示。表 3 所有分量的样本熵Table 3 Sample entropy of all components分量样本熵分量样本熵分量 10.030 87分量 70.032 32分量 20.063 12分量 80.011 59分量 30.098 34分量 90.007 42分量 40.153 96分量 100.002 11分量 50.121 14分量 110.000 68分量 60.062 70 通过表 3 可以看出,经过 C

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服