1、第 42 卷 第 3 期2023 年 3 月电 工 电 能 新 技 术Advanced Technology of Electrical Engineering and EnergyVol.42,No.3Mar.2023收稿日期:2022-03-07基金项目:国家重点研发计划项目(2020YFB0906000、2020YFB0906002)作者简介:莫浩杰(1998-),男,浙江籍,硕士研究生,研究方向为电网非侵入式监测、故障诊断;彭勇刚(1978-),男,湖北籍,教授,博士,研究方向为分布式发电、智能电网等(通信作者)。一种基于时频特征融合和极限学习机的非侵入式负荷识别方法莫浩杰1,彭勇刚1
2、,蔡田田2,邓清唐2,韦 巍1,智新振1(1.浙江大学电气工程学院,浙江 杭州 310012;2.南方电网数字电网研究院有限公司,广东 广州 510700)摘要:以往的负荷识别方法在提高识别精度和实际落地部署方面遇到了一些挑战,如传统经典方法的识别准确度相对较低,而先进深度学习方法又因其较复杂的模型而很难部署到嵌入式设备上。为解决上述问题,本文提出一种基于高频样本数据识别方法。首先采用快速傅里叶变换(FFT)和希尔伯特变换(HT)对样本进行时域和频域特征提取。然后基于极限学习机(ELM)提出了一种多特征融合学习策略来获取特征与负荷类型之间的映射关系,设计了一种窗口调整方法,以获得最优模型和最合
3、适的窗口长度。最后在两个高频公共数据集 BLUED 和 PLAID 上对该方法进行了实验评估。实验结果表明,所提方法具有识别性能较好、易于在嵌入式设备上落地部署的优点。关键词:特征融合;负荷识别;NILM;数字电网;时频特征DOI:10.12067/ATEEE2203014 文章编号:1003-3076(2023)03-0085-12 中图分类号:TM7141 引言 近年来,数字电网技术引起了研究者和政府部门的广泛关注。电能作为现代社会最重要的能源之一,数字电网技术的发展,无疑使之得到了更有效的管理和利用。而电力监测系统作为数字电网技术中的重要一环,其发展也将鼓励更好的需求预测,改善能源激励措
4、施。对于用电负荷进行感知、分析和管理是推进数字电网建设的重要一步1。Hart2最先提出了一种经济有效的电力监测方法 非侵入式负荷监测(Non-Intrusive Load Monitoring,NILM)。与侵入式方法相比,NILM 仅监测某一设施(如某户家庭)电力入口处总的电能数据,从而估计设施中单个设备的活动和功耗,大大节省了成本,提高了设备的使用价值。自 NILM 提出以来的几十年里,基于组合优化和模式识别的经典方法在解决 NILM 问题中发挥了重要作用。基于组合优化的方法将总功率测量值与单个设备功率信号的可能组合进行匹配,以最小化匹配误差作为优化目标,如文献3中使用的启发式算法求解基于
5、稳态电流的负荷分解模型,但其考虑的用电器较少,分解偏差也较大。文献4将时负荷识别问题可转化为 0-1 背包问题,并考虑了用电器有功相近的情况,但识别准确率不高。总体来说,此类算法的本质是多项式复杂程度的非确定性(Non-deterministic Polynomial,NP)完全问题,其优化效率较难提升。为解决这一问题,近年来一些学者提供了他们的研究成果,如文献5提出了一种启发式方法,通过放松 0-1 约束集来压缩 0-1 区间以解决组合布尔二次问题,其结果始终收敛于整体NP 完全组合问题的全局次优解。文献6提出了一种以估计矩阵为决策变量的组合优化模型,分两阶段优化算法匹配最优解,实现了负荷事
6、件在目标窗口中的全局优化,提高了准确率。基于模式识别的方法则从数据中学习设备的特征模式,从而实现对负荷的辨识与分解,其又可分为有监督式和无监督式两类。有监督算法根据总负荷数据和设备状态86 电 工 电 能 新 技 术第 42 卷 第 3 期信息标签训练模型,k 近邻(k-Nearest Neighbor,kNN)、决策树、支持向量机(Support Vector Machine,SVM)和人工神经网络(Artificial Neural Network,ANN)等都是 NILM 的常用监督模型。如在文献7中,作者利用有功功率和无功功率进行事件检测,然后基于高频电流数据和卷积神经网络(Convo
7、lutionalNeural Networks,CNN)进行负荷识别分类;文献8将有功功率和无功功率等数据输入决策树进行负荷识别分类,有效提高了负荷识别精度。无监督算法则不需要设备标签参与训练,主要包括 K-means、DBSCAN 等聚类方法和隐马尔可夫模型(HiddenMarkov Model,HMM)及其变种。文献9中 Kolter等将因子隐马尔可夫模型(Factorial Hidden MarkovModel,FHMM)引入到 NILM 问题中,取得了当时最优的监测性能。由于很多场景下很难获取到带标签的数据,无监督算法相较于有监督算法更符合各类场景的应用,但其准确率往往更低于有监督算法
8、。此外,REDD10和 BLUED11等开放数据集的增加,也极大地促进了学者们的研究。近年来,基于深度学习的负荷识别方法因其显著的识别性能而受到广泛关注。在文献12中,Kelly 和 Knottebelt 首次将深度神经网络(Deep Neural Networks,DNNs)应用于 NILM,取得了良好的效果。其后,长短期记忆网络(Long Short-Term Memory,LSTM)因其较好的时间序列信息提取能力,也被应用到 NILM 中。此后,越来越多基于深度学习方法的研究成果被发表出来。如在文献13中,M.Khodayar 采用 DTDL 方法进行能耗分解;文献14 采用 CoBiL
9、STM 改善了NILM 问题中上下文因素的非因果性和自适应性;文献15提出一种基于 seq2seq 和 Attention 机制的NILM 模型,有效提升了负荷分解的效果。这些方法确实地提高了 NILM 的性能,但也带来了一些其他问题。如由于其模型太深、太复杂、参数过多,很难在智能电表等嵌入式设备上落地部署。特征提取是 NILM 的重要组成部分。使用能够准确表达设备信息的特征将极大地提高 NILM 方法的性能。在 NILM 研究伊始,研究人员的工作主要集中在低频数据特征的利用,如均方根电流、均方根电压、有功功率(P)、无功功率(Q)等。其原因是低频数据采集成本低,数据处理方便。文献16,17的
10、研究,它们仅专注于基于时域低频信息构建设备的特征,当多个具有相似时域特征的设备接入同一供电线路时,这些方法容易得到错误的结果。近年来,随着信号处理技术的发展,高频数据因其包含更多有价值的设备信息而越来越受到研究人员的关注,其中最常被使用的特征是频域特征。文献18提出了使用 4 kHz 高频数据集频域特征的 FIT-PS混合 LSTM 模型,其对 18 种不同器具的分类准确率高达 90%。此外,文献19首次将离散小波变换(Discrete Wavelet Transform,DWT)与多层前馈神经网络相结合,其负荷识别准确率在每次试验中均在92%以上。虽然高频数据的时域特征以往较少被应用,但最近
11、一些研究者提供了他们的成功经验。在文献20中,Thi-Thu-Huong Le 等人提出了一种基于希尔伯特变换(Hilbert huang Transform,HT)和LSTM 的方法来解决负荷识别问题。该方法在时域瞬态特征方面取得了较好的效果,每个数据集的平均准确识别率达到 92%。然而上述研究大多只关注高频数据的单个域特征(时域或频域),双域特征的混合性能却很少被考虑。近期,一些研究者提供了其使用双域特征的成功案例,在文献21,22中,作者同时考虑时域和频域特征对负荷识别性能的影响,并取得了相较于使用单域特征更好的性能。本文的目标是利用高频数据解决 NILM 中的负荷识别问题,使设计的方法
12、在取得较好识别效果的同时具有较小的计算量和资源占用,更容易做嵌入式部署。因此提出一种基于时频特征融合和极限学习机的非侵入式负荷识别方法。其优势如下:(1)在特征提取方面,利用快速傅里叶变换(Fast Fourier Transform,FFT)和 HT 算法定义时频特征作为负荷识别模型的输入。双域特征包含了更多的设备信息,可以显著提高模型的准确性。(2)为获得各特征与负荷类型之间的映射关系,提出了一种极限学习机(Extreme Learning Ma-chine,ELM)与高频双域特征相结合的多特征融合学习策略。它在具有较高识别性能的同时,也更易于落地部署在嵌入式设备上。本文提出的方法在 BL
13、UED 和 PLAID23数据集上均进行了测试。实验结果表明,与现有方法相比,该方法能够准确地识别负荷类型,且因为其简单的模型结构,较易于落地部署。2 总体框架 本文提出了一种新的 NILM 负荷识别方法。该方法根据高频电流采样输入有效地识别各种负荷类型,方法的框架如图 1 所示。莫浩杰,彭勇刚,蔡田田,等.一种基于时频特征融合和极限学习机的非侵入式负荷识别方法J.电工电能新技术,2023,42(3):85-96.87 图 1 所提模型的总体框架Fig.1 General framework of proposed method在训练阶段,使用包含历史电流数据的训练数据集来训练负荷识别模型。步
14、骤 1 应用事件检测方法得到设备开/关的时刻点(下文均称变点),本文不关注事件检测方法,仅使用滤波后瞬时幅值的阈值来检测变化点。步骤 2 使用时间窗口对变点附近的电流数据进行采样。步骤 3 是特征提取,利用FFT 和 HT 算法得到时域和频域特征,并将其应用于步骤 4 基于 ELM 和双域特征融合的学习策略中,同时在训练过程中对步骤 2 中窗口的长度进行动态调整,通过模型可信度评估机制,得到最优的采样窗口和训练模型。在测试阶段基于训练阶段得到的固定窗口和训练后模型,通过测试数据集的输入,即可按照图 1 所示的步骤获得负荷识别结果。3 时频特征提取 特征输入对数据驱动方法的效果有着本质的影响。现
15、有高频方法大多只使用原始电流信号或单域特征信号,它们可能无法充分地表达负荷特性。本文使用 FFT 提取频域特征频域振幅(Frequency Am-plitude,FA)和频域相位(Frequency Phase,FP),使用 HT 提取时域瞬态特征瞬时振幅(InstantaneousAmplitude,IA)、瞬时相位(Instantaneous Phase,IP)和瞬时频率(Instantaneous Frequency,IF),用于负荷识别模型的输入,以求更好地识别性能。3.1 FFT 频域特征提取 对于电流序列集合 i(n)=i(1),i(N),FFT 算法将时域电流信号转换到频域。FF
16、T 是离散傅里叶变换(Discrete Fourier Transform,DFT)的快速算法,它 将 DFT 的 计 算 量 从 O(N2)减 少 到O(Nlog2N)。DFT 算法如下所示:F(k)=N-1n=0i(n)e-j2nk/N k=1,N-1(1)式中,F(k)为 i(n)的频域信号。其后根据 F(k)计算 FA 和 FP 分别为:FA(k)=Re2F(k)+Im2F(k)(2)FP(k)=arctanImF(k)ReF(k)(3)图 2 为某一变点附近的 FFT 特征提取结果。图 2 某一变点附近的 FFT 特征提取结果Fig.2 FFT results around a ch
17、ange point3.2 HT 时域特征提取 采用 HT 算法来获取电流信号的时域瞬态分量。对于任意连续时间序列 x(t),则有:HTx(t)=1-x(u)t-udu(4)根据得到的 HT,x(t)的解析信号可以表示为:x(t)=x(t)+jHTx(t)(5)则 IA 和 IP 的计算分别为:IA(t)=x2(t)+HT2x(t)(6)IP(t)=arctanHTx(t)x(t)(7)根据算得的 IP,可计算 IF 为:IF(t)=12dIP(t)dt(8)对于离散电流序列 i(n),可以通过 FFT 算法分三步计算其解析信号:基于前向 FFT 算法计算i(n)的频谱;去除得到的频谱信号的负
18、频域;使用逆 FFT 算法从单边频谱中计算得时域解析信号。图 3 描述了基于解析信号得到的某一变点附近序列 i(n)的 IA、IP 和 IF 结果。88 电 工 电 能 新 技 术第 42 卷 第 3 期图 3 某一变点附近的 HT 特征提取结果Fig.3 HT results around a change point3.3 时频域特征分析 根据上述 FFT 和 HT 特征提取方法,可以得到图 4 不同用电器的 FA、FP、IA、IF 和 IP 特征数据对比Fig.4 Comparison of FA,FP,IA,IF and IP data of different appliances不
19、同种类设备的时域瞬态和频域特征,以空调、热水器和手提电脑三种常用电器为例,其在负荷投切变点附近的 FA、FP、IA、IF 和 IP 特征数据对比如图 4所示。从图 4 中可以看出,简单类型的负荷如纯阻性的热水器,其负荷特征比较明显,各特征与其他不同类型负荷同特征间的差异较大,较易与其他负荷区分开。可以证明 FFT 和 HT 算法能够有效地提取该负荷投切特征。但如空调和手提电脑这类复杂类型的负荷,其某些特征类型如 FP 和 IP 等具有较大的相似性,从单一或少量特征中较难区别负荷类型。又因为一个设施中可能存在多个相同类型的不同用电设备,为更好地区别负荷投切类型,本文对上述各类特征进行了时频域特征
20、融合。4 特征融合学习策略 为了克服现有方法精度不高、较难嵌入式部署实现的缺点,设计了一种基于 ELM 和双域特征融合的学习策略。4.1 极限学习机 ELM ELM 最早由 G.B.Huang 等人提出24,由于其易于使用、学习速度快、泛化性能高等优点,在许多研究中得到了广泛的应用。ELM 的网络结构如图 5 所示。与反向传播(Back-Propagation,BP)算法25相比,ELM 算法的莫浩杰,彭勇刚,蔡田田,等.一种基于时频特征融合和极限学习机的非侵入式负荷识别方法J.电工电能新技术,2023,42(3):85-96.89 输入层和隐含层之间的权值和偏差是随机生成的,不需要迭代调整,
21、而隐含层与输出层之间的权值则可以直接通过矩阵计算得到,无需复杂训练过程。图 5 ELM 结构图Fig.5 Network structure of ELM输出节点 om与输入节点 xi之间的数学表达式可定义为:om=Jj=1jg(jxi+bj)(9)式中,j为输入层与第 j 个隐藏节点之间的权值矩阵;bj为隐含层的偏差向量;g()为激活函数;j为第 j 个隐藏节点与输出层之间的权值矩阵;J 为隐藏节点的个数。在 ELM 中,只要随机初始化了 j和 bj,就可以得到隐含层输出矩阵 H。其后 ELM 的训练过程即可转换为求解如下线性变换的过程:H=T(10)式中,为隐含层与输出层间的权值矩阵;T
22、为输出层矩阵。式(10)可依据矩阵的广义逆求解,如下所示:=HT(11)式中,H为矩阵 H 的广义逆矩阵。4.2 多特征融合学习 本节提出一种多特征融合学习方法,如图 6 所示。基于第 3 节获得的 5 种特征和负荷类型标签,根据式(11)训练每种特征的 ELM 模型。由于每种特征对于负荷类型的表达效果不同,训练后的 ELM将有不同的负荷类型概率输出。为综合考虑各种特征对负荷识别结果的影响,在 ELM 层输出和最终识别结果之间采用全连接神经网络(Full Connect Neu-ral network,FCN)连接,使用 BP 算法学习 FCN 中的权值和偏差。模型最终输出为设备的类型标签,在
23、损失计算和准确率评估时,其被转换为独热向量。所提多特征融合模型所用的 ELM 本身仅为两层的前馈神经网络,模型较浅参数也较少,存储空间图 6 所提多特征融合学习框架Fig.6 Framework of proposed multi-featurefusion learning资源占用较少,又具有随机特性,使得模型中很大一部分参数在经过随机初始化后可直接存放于 ROM空间,无需占用 RAM 运存。又因为 ELM 的训练仅为求解线性变换的过程,所提融合学习模型训练的计算量仅来自于 ELM 训练时的矩阵伪逆求解与后面的 FCN 训练,相比于其他深度神经网络模型要小很多。以上两点,使得所提基于 ELM
24、 的多特征融合学习方法较易部署在智能电表等嵌入式设备上。以复旦微电子集团的智能电表专用 MCU-FM33A0 xx系列芯片为例,支持 512 KB FLASH 程序存储器和64 KB RAM,主频可达 40 MHz。在后续实验中得到所述多特征融合学习模型大小约为 5 KB,又因为ELM 的随机特性,在经过 float16 量化后,模型的只读数据量大小约为 350 KB,这两部分可直接存放于MCU 的内置 FLASH 存储空间;而模型学习训练所用的读写数据量所占 RAM 仅为约 30 KB,其他模型识别前的数据处理与时频域特征提取步骤所占RAM 约为 6 KB,MCU 的内存余量充足,且 40
25、M 的主频也使其算力足以完成此数据量下的模型训练与时频域数据处理工作。综上所述,可知所提方法模型较易部署到 MCU-FM33A0 xx 系列芯片上且无需使用外部存储空间。4.3 窗口调整方法 在训练模型时,采样序列的长度对模型的准确度有显著影响。为了得到最可靠的模型,本节设计了一种窗口调整方法,在训练过程中统筹考虑所有样本和用电器,动态地选择最合适的窗口长度。如图 7 所示,最初以较短的采样窗口在变点附近进行采样,通过第一步的训练,得到临时的训练后模型输出到决策阶段。如果模型被认定是可信的,则停止优化并输出模型;如果被认定为不可信,优化将继续并以更长的采样窗口进入到下一个训练步骤。需要注意的是
26、,窗口的最大长度由允许的最大识别时间决定。90 电 工 电 能 新 技 术第 42 卷 第 3 期图 7 窗口调整方法结构Fig.7 Structure of window adjustment method图 8 描述了模型准确率随窗口长度增加的变化趋势。当时间窗口长度较短时,随着窗口长度的增加,会携带入更多的动态特征信息,从而提高训练后模型的准确率。而当时间窗口长度较长时,随着窗口长度的增加,可能携带入更多曾经读取过的稳态信息,使模型准确率趋于平稳甚至下降。为了建立模型的可信度评价机制,预设的准确率阈值 被用于此处以节省训练时间。如果模型在训练时的准确率达到阈值,则该模型被认为是可信的,即
27、完成窗口调整,输出模型。若在允许最大时间之外,准确率仍低于阈值,优化将在最后一步选择历史准确率最高的模型作为输出。图 8 准确率随采样长度增长的变化曲线Fig.8 Sampling length tuning curve during windowdynamic optimization5 实验仿真与讨论 本文在公共数据集 BLUED 和 PLAID 上进行了实验,对所提方法进行了评估,并与现有的方法进行了比较。所有实验均在如下计算机环境下进行:AMD Ryzen 7 5800H with Radeon Graphics CPU3.20 GHz;RAM:16 GB;Windows10 Prof
28、essional64-Bit;Python 3.7.9。5.1 测试用数据集 高频数据集 BLUED 由 K.Anderson 等人提出用于 NILM 研究。它包含两个阶段(A 和 B)的 12 kHz电流和电压在 8 天内的数据样本。它收集了几十种设备的开关事件,并清楚地标明了它们的时间戳,该数据集适用于本文所提出的负荷识别方法。为了与现有方法比较,一些具有代表性的负荷被筛选出来(表 1),并对负荷的类型进行了标签化。在实验中,仅采集变点附近的1 200个样本。表 1 BLUED 数据集中筛选的设备及其标签Tab.1 Appliances selected and their labels
29、in BLUED dataset设备标签电脑及显示器(CM)0电吹风(HD)1电灯(Lights)2空调(AC)3厨房辅助切碎机(KAD)4冰箱(Fridge)5另一个数据集 PLAID 由 R.Medico 等人提出,它包括 30 kHz 的电流和电压数据样本,来自美国宾夕法尼亚州匹兹堡的 56 个家庭的 11 种不同的设备类型,负荷类型见表 2。在实验中,电流数据被下采样至 12 kHz,并仅采集变点附近的1 200个样本。表 2 PLAID 数据集中筛选的设备及其标签Tab.2 Appliances selected and their labels in PLAID dataset设备
30、标签设备标签空调(AC)0风扇(Fan)6节能灯(CFL)1白炽灯(ILB)7手提电脑(Laptop)2微波炉(MO)8冰箱(Fridge)3吸尘器(Vacuum)9电吹风(HD)4洗衣机(WM)10热水器(Heater)55.2 评估指标 本文采用以下几种指标来评估所提方法的负荷识别效果。混淆矩阵可以直观地描述负荷识别的结果。以设备 1 为例,其混淆矩阵如图 9 所示。其中,TP1(真阳性)为设备 1 被正确预测为设备 1 的实例数;FN1(假阴性)为设备 1 被错误预测为其他设备的实例数;FP1(假阳性)为其他设备被错误预测为设备 1的实例数;TN1(真阴性)为其他设备被预测为其他设备的实
31、例数。接收器工作特性(Receiver Operating-character-istic Curve,ROC)曲线是另一个直观描述负荷识别结果的指标。其横轴为假阳性率(False PositiveRate,FPR)如式(12)所示,纵轴为真阳性率(True莫浩杰,彭勇刚,蔡田田,等.一种基于时频特征融合和极限学习机的非侵入式负荷识别方法J.电工电能新技术,2023,42(3):85-96.91 图 9 设备 1 的混淆矩阵Fig.9 The confusion matrix of appliance 1 casePositive Rate,TPR)如式(13)所示。ROC 曲线之下面积(Ar
32、ea Under Curve,AUC)越大,表示识别效果越好。对于本文的多分类任务,使用两种方法绘制其 ROC 曲线:(1)微观平均法(micro-average);(2)宏观平均法(macro-average)。FPR=FPTN+FP(12)TPR=TPTP+FN(13)为了更全面地评价所提方法的性能,实验中还采用了 Accuracy、Precision、Recall 和 F1 作为评估指标,如下所示:Accuracy=TP+TNTP+TN+FP+FN(14)Precision=TPTP+FP(15)Recall=TPTP+FN(16)F1=2PrecisionRecallPrecision
33、+Recall(17)5.3 仿真结果 本节根据表 1 和表 2 选择的设备类型,以第 3节获取的 5 种时频域特征作为输入,设备类型标签的独热向量作为输出,在两个公共数据集 BLUED和 PLAID 上对所提模型进行了仿真测试。5 5.3 3.1 1 在在 B BL LU UE ED D 数数据据集集上上的的负负荷荷识识别别结结果果 所提方法在 BLUED 数据集上训练和测试阶段的混淆矩阵如图 10 所示。据此计算出训练阶段和测试阶段的准确率分别为 98.84%和 98.06%。根据混淆矩阵绘制出测试阶段的 ROC 曲线,如图 11所示。同时表 3 详细展示了所提方法在 BLUED 数据集上
34、的性能指标。结果表明,本文所提方法在BLUED 数据集上的总体识别效果较好,特别是对于一些简单的负载类型,如电灯和电吹风,其 F1 分别达到了 1.00 和 0.99。但对于 F1 仅有 0.90 的计算机、显示器等开关电源类负荷的识别,仍存在一些不足。图 10 BLUED 数据集上训练和测试阶段的混淆矩阵Fig.10 Confusion matrix of training and testingphase on BLUED dataset图 11 BLUED 数据集上测试阶段的 ROC 曲线Fig.11 ROC of testing phase on BLUED dataset表 3 所提
35、方法在 BLUED 数据集上的实验性能Tab.3 Performance on BLUED dataset设备AccuracyPrecisionRecallF1CM0.980.990.820.90HD1.001.001.001.00Lights0.990.981.000.99AC0.991.000.970.99KAD1.001.000.900.95Fridge0.990.960.980.97平均值0.990.990.950.975 5.3 3.2 2 在在 P PL LA AI ID D 数数据据集集上上的的负负荷荷识识别别结结果果 所提方法在 PLAID 数据集上训练和测试阶段的混淆矩阵如图
36、 12 所示。据此计算出训练和测试阶段的准确率分别为 95.62%和 94.09%。由于与 BLUED数据集相比,PLAID 数据集实例数更少且具有更多的92 电 工 电 能 新 技 术第 42 卷 第 3 期负荷类型,因此所提方法在 PLAID 上的准确率低于BLUED。根据混淆矩阵,绘制出测试阶段的 ROC,如图13 所示。表4 详细展示了所提方法在PLAID 数据集上的性能指标。结果表明,该方法在 PLAID 数据集上总体识别性能较好,但与在 BLUED 中类似,对于开关电源类型的负荷识别效果仍有欠缺。图 12 PLAID 数据集上训练和测试阶段的混淆矩阵Fig.12 Confusion
37、 matrix of training and testing phase on PLAID dataset图 13 PLAID 数据集上测试阶段的 ROC 曲线Fig.13 ROC of testing phase on PLAID dataset表 4 所提方法在 PLAID 数据集上的实验性能Tab.4 Performance on PLAID dataset设备AccuracyPrecisionRecallF1AC0.990.950.950.95CFL0.990.911.000.95Laptop0.960.770.850.81Fridge0.991.000.850.92HD1.001.
38、001.001.00Heater1.001.001.001.00Fan0.970.810.850.83ILB1.001.001.001.00MO0.990.951.000.98Vacuum1.001.001.001.00WM0.981.000.850.92平均值0.990.950.940.945.4 与采用低频数据的性能比较 为验证高频双域特征相较于低频特征包含更多有价值的信息,能够克服低频数据的特征局限,将所提学习模型分别在 BLUED 和 PLAID 数据集上采用有功功率和无功功率低频数据进行实验。由于BLUED 和 PLAID 数据集只包含高频数据,使用的低频数据由高频数据换算得到,最终
39、得到负荷识别性能结果见表 5、表 6。表 5 采用低频数据在 BLUED 数据集上的实验性能Tab.5 Performance on BLUED dataset using lowfrequency data设备AccuracyPrecisionRecallF1CM0.910.920.800.83HD0.970.950.930.95Lights0.960.960.970.96AC0.950.970.910.91KAD0.970.970.880.90Fridge0.940.930.900.92平均值0.950.950.900.91对比表 3 和表 5 以及表 4 和表 6 所示的识别结果,可见使
40、用高频双域特征相较于使用低频数据而言各项指标都较优,具有更好的负荷识别性能。尽管高频数据的时域和频域分析处理需要更多的计算 莫浩杰,彭勇刚,蔡田田,等.一种基于时频特征融合和极限学习机的非侵入式负荷识别方法J.电工电能新技术,2023,42(3):85-96.93 表 6 采用低频数据在 PLAID 数据集上的实验性能Tab.6 Performance on PLAID dataset usinglow frequency data设备AccuracyPrecisionRecallF1AC0.890.850.880.90CFL0.900.900.910.91Laptop0.860.710.81
41、0.79Fridge0.890.930.790.88HD0.880.920.910.90Heater0.910.950.920.90Fan0.850.800.790.80ILB0.980.990.960.96MO0.930.910.960.94Vacuum0.980.990.960.97WM0.910.960.800.88平均值0.910.900.880.89和内存资源,但从图 8 可知,每次事件检测完最优窗口采样数据大约为 500 个采样点用于负荷识别,如此数据量的时频域分析处理对于当下一般嵌入式MCU 而言均不成问题,而使用高频双域特征所带来的识别性能增加却是较为可观的。5.5 与现有方法
42、的性能比较 为比较所提方法与现有方法在两个公开数据集的性能优劣,衬托高频双域特征和 ELM 的结合使用对负荷识别性能提升的影响,展示所提轻量化模型同样拥有不俗的负荷识别性能,本节选取了一些其他研究人员在两个公开数据集 BLUED 和 PLAID 上测试过的深度学习或机器学习方法,与所提方法进行了比较。5 5.5 5.1 1 在在 B BL LU UE ED D 数数据据集集上上的的比比较较结结果果 各方法在 BLUED 数据集上的识别效果对比见表 7。可见,本文所提方法的各性能指标均优于所列现有方法。其准确度与对比方法中性能最好的VCE+FWO26方法持平,而在其他指标上较对比方法均有 0.0
43、10.10 的性能提升。对比所提方法,某些对比方法在 BLUED 数据集上效果较差的原因主要为:DenseNet-12127方法仅使用低频数据,未有效地进行特征提取;Cross-da-ta+SVM28和 Fast-shapelets29虽然进行了一定的特征提取或数据处理,但使用的学习模型或策略性能较差,未能较好地完成特征映射。5 5.5 5.2 2 在在 P PL LA AI ID D 数数据据集集上上的的比比较较结结果果 各方法在 PLAID 数据集的识别效果对比见表 8。可见,本文所提方法的各性能指标优于大部分所列现有方法。对比之前性能最高的同样使用时频特征融合的 Two-stream C
44、onvolution Network22方法,所提方法的识别准确率略有逊色,主要原因是该方法同时考虑了时频域序列特征和频域频谱图像特征,且使用了较复杂的时序和图像模型进行特征融合。相较于该方法,所提方法的识别性能虽稍有逊色,但在嵌入式部署上却更具优势,将在 5.5.3 节对其做具体分析。表 7 所提方法与现有方法在 BLUED 上的性能对比Tab.7 Comparison performance of proposed method with other methods on BLUED dataset方法所用特征AccuracyPrecisionRecallF1DenseNet-12127有
45、功、无功功率-0.900.810.84VCE+FWO26有功、无功、视在功率0.980.890.900.89Cross-data+SVM28有功、无功功率的变换量与极大极小值差0.80-Fast-shapelets29有功、无功功率-0.700.780.72HT-LSTM20电流时域瞬时振幅、相位、频率0.880.940.940.94所提方法电流频域幅值、相位及时域瞬时振幅、相位、频率0.980.990.950.97表 8 所提方法与现有方法在 PLAID 上的性能对比Tab.8 Comparison performance of proposed method with other meth
46、ods on PLAID dataset方法所用特征AccuracyPrecisionRecallF1VI-NN ensemble30电压电流图像0.89-Siamese ANNs31电压电流图像-0.90FFT+BDT32电流频域幅值、相位0.930.920.930.92VI image-CNN33电压电流图像0.88-0.88HT-LSTM20电流时域瞬时振幅、相位、频率0.900.950.950.95Two-stream ConvolutionNetwork22电流时域有效值序列及频域频谱图像0.99-0.98所提方法电流频域幅值、相位及时域瞬时振幅、相位、频率0.950.950.940
47、.9494 电 工 电 能 新 技 术第 42 卷 第 3 期 而其他对比方法相对于所提方法在 PLAID 数据集上效果较差的原因主要为:VI-NN ensemble30、Siamese ANNs31和 VI image-CNN33方法仅使用高频电压电流图像数据进行实验,特征提取较为单一,导致识别效果稍差。5 5.5 5.3 3 在在嵌嵌入入式式落落地地部部署署上上的的优优势势比比较较 为清晰展示本文所提方法在嵌入式落地部署上的优势,将所提方法与几个性能较好的对比方法进行了比较,统筹考虑对比方法的识别性能、计算量乘-加操作(Multiply-ACCumulate operations,MACC
48、s)与存储空间资源占用(ROM 与 RAM 总和),仿真环境下得到的对比结果见表 9。表 9 所提方法与现有方法的嵌入式部署优势对比Tab.9 Comparison embedded deployment advantages of proposed method with other methods方法负荷识别准确率与 F1 值模型计算量MACCs/M数据处理与特征提取计算运行内存占用/KB方法模型及其读写数据存储空间资源占用/KBVCE+FWO260.98/0.8962520FFT+BDT320.93/0.9223450VI image-CNN330.88/0.88253560HT-LST
49、M200.90/0.950.342 590Two-stream CNN220.99/0.983283 370所提方法0.98/0.970.16385 由实验结果可知,所提方法的负荷识别性能在计算量和资源占用与之相近的对比方法中相对较好,而对比同样使用时频特征融合的 Two-streamConvolution Network22方法虽识别性能稍有逊色,但在计算量和资源占用上却小得多,可见其在嵌入式落地部署上的优势。5.6 讨论 本文提出的方法能够准确地做出负荷识别,且易于落地部署在智能电表等嵌入式设备上,具体原因如下:(1)所提方法同时考虑了家电设备的时域和频域特征,可以有效地获得不同负荷类型的
50、特征差异,提升了识别不同用电器的准确性。(2)提出的基于 ELM 和双域特征融合的学习模型映射了多特征与负荷类型之间的关系,同时学习了不同特征对识别结果的权重。该方法对比其他深度学习方法的结构更简单,更易于部署在嵌入式设备上。同时实验结果也表明,该方法相较于对比方法具有较高的识别准确率。(3)窗口调整方法的使用使得模型在训练过程中得到了最优的窗口采样长度,虽然牺牲了一些训练时间,但大大提高了在负荷识别的准确率。尽管所提方法拥有较好的负荷识别性能且较易落地部署,但实验同样显示它虽然对大多数负荷类型具有较强的识别能力,但对于一些具有复杂电气特性负荷类型的识别能力,如开关电源,仍有待改进;同时其在实