1、计算机与现代化JISUANJI YU XIANDAIHUA2023年第3期总第331期文章编号:1006-2475(2023)03-0060-06收稿日期:2021-09-27;修回日期:2021-12-05基金项目:国家自然科学基金面上项目(61772246)作者简介:张芸(1983),女,陕西西安人,高级工程师,硕士,研究方向:计算机技术,E-mail:;白开峰(1979),男,山西运城人,高级工程师,硕士,研究方向:电子信息,E-mail:;王星(1978),男,四川遂宁人,高级工程师,硕士,研究方向:信息系统工程,E-mail:;仓甜(1983),女,陕西西安人,高级工程师,硕士,研究
2、方向:网络安全,E-mail:;周通(1987),男,陕西西安人,工程师,本科,研究方向:计算机科学,E-mail:;段锦文(1978),女,陕西长安人,高级工程师,本科,研究方向:通信工程,E-mail:;苏晗(1990),女,陕西宝鸡人,工程师,硕士,研究方向:软件工程,E-mail:。0引言伴随着经济模式的演化以及技术产业的升级,近年来国内外各类窃电情况频发,并且严重侵犯了用电用户财产、危害到供电系统运行以及人身安全。因此,通过各类有效的技术模型对用电行为进行用电异常可能性的监测判断,对治理各类用电异常事件,维护国家电网运行安全具有重要意义。在电力损耗研究领域中,损耗被分为非技术性损耗(
3、Non-Technical Losses,NTL)以及技术性损耗(Technical Losses,TL)。通过非法篡改线路等方式引发的电力能源损耗是本文重点描述的各类检测算法的应用场景。据不完全统计,我国每年存在15万起左右窃电事件并造成超过200亿元人民币的经济损失1。而愈发隐蔽和复杂化的恶意窃电方式给防范和监测工作带来巨大挑战2。无独有偶,国外的各类窃电事件所造成的经济损失也金额庞大。比如美国每年的窃电事件造成经济损失40亿美金3。而在巴基斯坦,恶意窃电甚至使整个国家陷入电力供应短缺的困境4。这类恶意的异常用电行为不仅给电网公司和国家带来了巨大的经济损失,且对电网运行安全造成了极大的隐患
4、,如电网施工事故、局部区域的供电瘫痪、电气设备设施的异常损坏、电气火灾5等。由于窃电事件常发生于人口居住密集的城中村、城乡结合等区域,所以可能引发的一系列连锁反应将造成重大的安全性和经济性事件。得益于智能化电力设备的推广和应用,针对异常用电行为的监测手段已由人工抽检的方式逐渐过渡到基于数据挖掘的离群点检测、机器学习、深度学习以及混合模式。智能电网环境下窃电行为检测张芸,白开峰,王星,仓甜,周通,段锦文,苏晗(国网陕西省电力公司西安供电公司,陕西 西安 712042)摘要:用户恶意窃电造成的用电侧非技术性损失一直是全球各国电力公司期望解决的问题之一。随着人工智能算法的快速发展和智能电表的普及,通
5、过对窃电行为建模和检测将有效减少这类情况的发生。本文首先介绍用电行为数据收集、处理、采样手段。其次,就面向用电异常行为挖掘的离群点检测、机器学习方法和深度学习方法,分析对比各类算法的特点,对已有工作进行总结。最后,通过讨论智能化手段在窃电检测研究中出现的问题和未来研究工作为该领域的研究人员提供一些借鉴。关键词:智能化电网;窃电行为检测;机器学习;深度学习中图分类号:TP311文献标志码:ADOI:10.3969/j.issn.1006-2475.2023.03.011Review of Electricity Theft Detection in Smart Grid EnvironmentZ
6、HANG Yun,BAI Kai-feng,WANG Xing,CANG Tian,ZHOU Tong,DUAN Jin-wen,SU Han(State Grid Xi an Electric Power Supply Company,Xi an 712042,China)Abstract:The non-technical loss(NTL)on the power consumption side caused by malicious power theft by users has alwaysbeen one of the problems that power companies
7、 around the world expect to solve.With the rapid development of artificial intelligence algorithms and the popularization of smart meters,modeling and detection of electricity theft will effectively reduce the occurrence of such situations.Firstly,this article introduces the methods of collecting,pr
8、ocessing,and sampling electricity consumption behavior data.Secondly,it analyzes and compares the characteristics of various algorithms and summarizes existingwork on outlier detection,machine learning methods,and deep learning methods for mining abnormal electricity behavior.Finally,by discussing t
9、he problems of intelligent methods in the research of electricity theft detection and future research works,itprovides some reference for researchers in this field.Key words:smart grid;electricity theft detection;machine learning;deep learning2023年第3期本文主要就用电行为数据特征和预处理手段以及窃电行为建模检测方法3个方面展开详细描述,并在文章的最后
10、简述该项工作未来的发展方向。1用电数据采样及处理手段经过多年的应用和发展,信息采集系统作为保障我国电网公司运行安全的关键系统,它由电网智能调度管理系统、电网营销系统、故障信息管理系统、电网通信管理系统、智能电表系统、电网运维管理系统6-7组成,主要涉及电流电压监控数据、系统日志数据、用户数据、电力设备数据等。鉴于电网的巨大规模、持续化长期运营、繁杂环节、复杂运行条件等因素,由此产生了海量的电力运行数据。因此,通过充分学习数据特征,并采用机器学习和深度学习方法对历史数据和实时数据的分析和挖掘,实现监测预防用户窃电成为可能。1.1数据特征及采集经过大量的调研,本文将目前的电力运行数据分为3类:电网
11、运行日志数据、营销系统数据以及企业管理数据。以上数据的特征可概括为以下4点:1)数据规模庞大。由于目前自动化采集和计量设备在电力管理领域的应用以及电网的实时运行,可以说每一秒产生的电力数据量都是巨大的。2)数据分散。由于我国电网公司各部门各层级之间分工明确,但是涉及多平台、多部门、多层级、多系统。因此数据的先期收集并不容易,需要跨部门跨系统的通力合作和一致协调。这对解决用电异常行为检测提出了更高的要求。3)用电异常数据密度低。目前电网运行总体平稳、正常,因此要在大规模的异常数据中筛选出有效的用电异常数据显得尤为困难。4)数据形式、情况多样。由于用电异常行为检测研究过程中所需数据来源于多系统、多
12、部门、多环节和多设备,因此数据形式不仅多样,而且存在缺失、重复、错误的数据问题。在我国,针对窃电行为的检测研究工作主要是由国家电网公司以及各省市公司联合各高校和科研院所合作展开的,从电力、电气工程以及计算机科学的角度入手进行针对性的区域用电异常行为研究。因此,研究所涉数据集主要来源于国家电网公司(SGCC)。在国际上,如印度、美国、加拿大等国家,由于研究中所需的电力运行和营销数据涉及国家安全和个人隐私问题,获取这些数据并不容易。因此,研究人员会使用公开的数据集,比如获得广泛应用的来自爱尔兰电力和可持续能源管理局于2012年1月发布的能源消费数据8,它包含了2009年和2010年超过5000家的
13、爱尔兰本地家庭用户和小型商业用户所安装的来自于智能电表536天的用电消费信息,其数据采集周期是30 min一个点位。众所周知,深度学习模型的训练工作大多依赖于足够的训练数据集,因此在实际数据有限的情况下,研究者们也会通过一些有效的手段获得更多的模拟数据。Kong等人 9 便采用了通过将一维Wasserstein生成对抗网络得到的模拟数据应用于低电压用电异常行为检测的工作中。文献 10 基于筛选后数据也模拟了短时间跨度用户用电记录并用于后续的模型训练和测试。1.2数据处理及采样无论是公开数据集还是源于电网公司的用户实际用电消费原始数据,都存在相当一部分数量的“脏数据”,即数据缺失、数据错误、数据
14、为空或是数据不平衡。数据缺失、错误问题会出现在数据清洗前后。一般可通过设置筛选规则,实现数据的检验工作。然而完成数据清洗之后,该情况可能依然存在,包括空值数据。因此,为了使得预测方法或模型更好地实现对用户用电行为数据的特征表示,常需要分析比较采用线性插值、拉格朗日插值、最邻近插值等数据补全方法的结果,并根据实际情况确定适合的数据补全方案。对于零值数据,需要研究人员根据实际情况,决定数据采纳、数据模拟或是不处理等方式,最大程度降低对建模或是特征学习过程中的影响。此外,数据集不平衡即正负样本比例失调导致的数据倾斜问题也会对建模过程中的特征学习造成影响。因此,在采样过程中,会考虑采用欠采样和过采样的
15、方式使数据及内部达到相对平衡11-13。2类方法均有优缺点,欠采样简单,但易丢失关键信息,而过采样处理易引发过拟合问题。所以,在实际应用场景中,需要综合考量真实数据情况,并制定适合的采样方案和机制。文献 14 设计了一种基于K-means算法 改 进 的 K-SMOTE(Synthetic Minority Oversampling Technique)方法,实现对用电异常数据的插值,以达到平衡整个数据集的目的。2窃电行为检测算法目前,常见的窃电行为检测算法主要是基于人工抽检和基于数据挖掘的方法。人工抽检方法是在小范围数据内,通过熟悉片区用电情况的专业人员或简单的数据判读方式,检出疑似窃电用户
16、,并派遣网格协查员实地考察验证,所耗人力、财力成本高,已不太适用于智能化电网的发展需求。基于数据挖掘的检测算法主要涉及基于离群点检测算法、传统的机器学习、深度学习、混合模型。本章将重点就这部分的内容进行详细介绍。2.1基于离群点检测的窃电行为检测方法离群点检测在数据挖掘领域扮演着重要的角色,如图1所示的局部离群因子表示,其核心思想是从所有被检对象中寻找与绝大多数对象显著不同的若干个体。由于其相对稳定的表现,发展至今,技术成熟,并且在各工作领域得到广泛推广,应用包括网络安全、体育竞技、金融风险评估等工作。目前,应用程度较高的方法可大致归为4类:统计方法检测、临近度检测、密度检测和聚类检测。张芸,
17、等:智能电网环境下窃电行为检测61计算机与现代化2023年第3期图1局部离群因子表示基于统计模型的能源盗窃行为检测方法主要通过对数据集可能遵循的统计规则进行假设验证,并建立对应的模型,通过寻找与模型拟合程度低的个体筛选出异常点。文献 15 在引入了分类变量和检测系数后,设计了基于线性回归的算法实现对能源盗窃的评估。通过该模型可检测到被恶意篡改的智能电表。此类方法存在异常点的显著不同,当出现用电异常行为事实存在,但历史数据未覆盖情况下或是显著性不明显时,该方法易失效。基于矩阵分解的检测方法是根据线性代数理论建立的基于用电异常行为的数据分解手段。文献16 中采用分布式QR求解用电用户诚信系数,用1
18、表示用户诚实,系数大于1则标记为可疑。上述方法一般适用于对小规模用电数据中的可疑用电异常对象的筛查,无法满足电力大数据背景下的工作需求,并且这类方法一般需要涉及部分用户隐私,不符合数据安全和个人隐私信息保护的新要求。基于密度和基于聚类的离群点检测方法也常被应用于电能盗窃巡检工作中。前者主要通过计算被检对象的局部密度并与其临近点做比较分析,检出异常点,包括使用局部离群因子(LOF)等方法,其在不同密度区域的用电数据检测中表现良好。后者则通过K-means、临近传播算法等距离表示被检对象间的相似度实现对整体数据的簇分类,从而寻找到用电异常用户,受数据集内分布影响较大。因此,Zheng等人17将两者
19、结合提出了一种基于密度聚类的窃电行为检测方法,在分别与K-means聚类、高斯混合模型以及基于密度的带噪声应用空间聚类(DBSCAN)比较后,验证了其有效性。综合熵和密度聚类的窃电检测方法如图2所示,主要通过获取用户用电曲线集合和非技术性损失数据、电量相关性强弱的衡量指标和每条用电曲线的形状异常指标,并通过K-均值聚类划分用电曲线类别,得到用户的电量异常排名和形状异常排名,并根据其算术平均值得到综合异常排名,进而完成对用电异常模式的检测,提高了各种窃电模式下检测的准确率,实现了用电异常行为的非监督式检测,增大适用范围。图2综合熵和密度聚类的窃电检测方法流程图由于上述方法属于无监督学习,其优点在
20、于不需要带标签数据集即可展开工作,可被应用于前期的数据分析工作中,而缺点是对参数依赖程度高,制定合适的参数方案将直接影响模型预测的效果。此外,基于离群点的窃电行为的鲁棒性较差,当数据发生变化时,已训练获得的模型无法复用,需要重新选取参数和模型训练。2.2基于机器学习的窃电行为检测方法基于传统的机器学习方法已被验证在窃电行为检测工作中具有良好的效果,其普遍的异常分类流程如图3所示。图3异常分类流程文献6主要针对短期用电异常(Short-termFraud Detection,SF),基于机器学习的方法,提出了一套SF-SVM方法,通过计算区域电网耗电量与用户侧电表耗电量差值,判断用户的用电异常可
21、疑程度。实验表明,该方法在低误警率情况下效果良好。随着检测技术地日益进步,为了精确地检测、定位和掌握输配电各环节的实时情况,最大程度降低误报率,Jindal等人18通过混合使用决策树和支持向量机的方式实现了对用户侧能耗消费数据的分级处理和分析。文献 19 首先根据包括平均耗电量等5项属性通过C均值模糊聚类锁定相似用电行为用户群体,并计算欧几里得距离筛选出疑似窃电用户。该方法虽然实验效果良好,但是该方法依赖于长期的历史用电数据,在检测上存在延迟。针对上述问题,康宁宁等人20通过对用户耗电特性曲线做模糊C均值聚类圈定可以范围,并使用经过粒子群算法优化的支持向量机算法进行用电异常判断。从一定程度上也
22、克服了样本匮乏的问题。梁跃21则通过分层最近邻采样算法,依据比例和距离采样,提升了在不平衡数据集分类的准确率;对数据集进行了预处理及特征提取和评估,删除重复时间序列信息,突出特征间的高阶关系性关系,提升分类结果的准确性。Qu等人14根据获取的原始数据情况对采样过程A获取用电曲线以及区域观察表M天数据计算区域的非技术性损失与所有用电曲线之间的最大信息系数使用基于快速搜索密度峰值的聚类方法计算各曲线的形状异常指标计算2个异常排名的算数平均值,计算综合异常排名使用K-均值聚类将每个用户对应的M个电量和M个形状异常指标,给出异常排名基于有序森林筛选高可靠数据,计算最优的聚类簇数抽取用户负荷数据数据预处
23、理抽取用户典型负荷曲线平衡数据集采用WSCVI确定最佳聚类数使用FCM算法对用户负荷曲线进行分类用户日负荷特征曲线分析用户用电行为按比例和距离进行采样,获得类间平衡数据集构建协同森林异常检测模型分析用户用电行为622023年第3期张芸,等:智能电网环境下窃电行为检测进行了改进,并提出了一种改进随机森林的方法,并与支持向量机和反向传播神经网络进行对比实验,ACC和AUC系数分别达到了94.53%和95.13%,证明了其良好的精度和稳定性。2.3基于深度学习的窃电行为检测方法近年来,随着智能化电网的发展,为了满足电力海量数据挖掘的需求,一系列深度学习模型被广泛应用到用电异常行为检测工作中。上海交通
24、大学的曹峥等人22于2011年就将BP神经网络应用到了反窃电系统的研究工作中去,并引入了用电异常嫌疑系数作为反窃电评价指标。文献 14 面向配电系统状态评估问题提出了使用人工神经网络(ANN)与负载曲线结合的检测方法,并在英国通用配电系统(UKGDS)模型的95总线区段上,验证了基于人工神经网络的伪测量模型对状态估计质量的影响。文献 23 为捕捉用电数据的周期性,提出了一种由深度组件和宽度组件组成的宽神度卷积神经网络。其中深度组件用于识别二维用电数据中用电异常行为的非周期性和正常用电的周期性,宽度组件则被用来捕捉一维用电数据中的全局特征。文献 24 提出了一种基于卷积神经网络(CNN)和长短期
25、记忆网络(LSTM)的组合窃电检测模型。流程如图4所示,其中CNN网络用于对用电数据的特征提取和分类,而LSTM的引入则被用来处理时间序列数据。图4基于CNN-LSTM的窃电行为检测流程文献 25 采用自动编码器进行扩充数量较少类型的样本,减少了数据样本的不平衡程度。在不平衡数据样本处理的基础上,运用残差神经网络提取周期性特征,运用长短期记忆网络时序性特征,将Res-Net模型和LSTM模型结合,提高了用电异常检测模型的特征提取能力,进一步提高了窃电检测方法的性能。Nabil 等 人26提 出 了 一 种 依 赖 于 AMI(Adavanced Metering Infrastructure)
26、的深度卷积模型,此外他们还利用了随机检索方法在学习阶段进行超参数微调,并在爱尔兰电力和可持续能源管理局发布的数据上进行了实验验证,证明该模型优于绝大多数原有基础模型。如表1所示,从多维度因素,包括模型训练时间成本、人工参与程度、数据维度、数据分布要求、普适性、应用场景,对深度学习、机器学习、离群点3大类方法进行了性能比较和分析。基于深度学习和机器学习的方法在人工参与度、数据维度上具有更高的要求,而离群点算法在这2个方面的需求较低。但是由于后者是统计学习方法演化而来的,在数据的分布上有明确要求,因此相比较前两者,其普适性稍弱,但结果的可解释性和准确率较高。表1深度学习、机器学习方法、离群点方法比
27、较属性模型训练时间成本人工参与程度数据维度数据分布要求普适性应用场景深度学习模 型 训 练 时 间长,且与训练集的 大 小 成 正 比关系数 据 集 要 手 动添加标签,人工参与程度最高数 据 维 度 要 求有 明 确 的 含 义和标签异 常 数 据 在 总体 数 据 样 本 中所占的比例很低特 征 标 签 比 较完善的数据集异常点检测,上下文异常检测机器学习模 型 训 练 时 间较多,与数据的规模密切相关对 数 据 需 要 进行预处理,人工参与程度较高基 于 监 督 的 机器学习方法,要求 数 据 维 度 必须 有 明 确 的 含义和标签无 标 签 或 者 类别不均衡无 监 督 的 机 器学
28、 习 应 用 最 为广泛异常点检测,上下文异常检测离群点时间较短基于统计规律进 行 数 据 处理,人工参与程度低数据维度含义可以不明确1)要 求 异 常数据跟样本中大多数数据的差异性较大;2)要 求 样 本点符合统计分布模型对样本点统计分布特性具有一定的规律,适用面有一定限制异常点检测,组异常检测2.4基于混合模型的用电异常行为检测方法鉴于目前异常用电行为的特征多样性,综合考虑深度学习、机器学习以及离群点 3 大类方法的优缺点,越来越多的工作都考虑多方法结合共同应用于检测工作中,尤其是将深度学习方法和机器学习相结合的方法受到了越来越多的关注。Uuah 等人27于 2020 年对文献 26 所提
29、到的方法做出了新的改进,模型构造如图5所示,针对用电消费数据集不平衡问题提出了一种由CNN卷积神经网络、门控循环组件(GRU)和粒子群优化组成的混合神经网络(HDD),并在国家电网提供的数据集做了对比验证实验,结果好于逻辑回归、支持向量机和长短期记忆网络以及GRU等基准技术。同样为了解决数据不平衡、过拟合问题,并易于处理高维度的海量时间序列用电消费数据,文献 28优化RestNet-LSTM用电数据数据预处理训练集测试集CNN-LSTM超参数RestNet-LSTM超参数优化CNN-LSTM评估63计算机与现代化2023年第3期提出了一种结合LSTM检测技术基于蝙蝠优化算法的随机欠采增强技术实
30、现参数优化的混合模型方法。图5CNN模型构造为了降低中低压网络中的非技术性损耗,庄池杰等人29提出了一套由特征提取、主成分分析、网格处理、计算局部离群因子等模块组成的无监督学习模型。如图6所示,基于无监督学习模型,通过选取多用户的数据特征,并对每个用户的用电数据映射至二维平面,筛选出低密度区域点位。经过在某省包含6200户18个月的用电消费数据上的验证,得出排序结果靠前异常用户多为存在高可能性用电异常嫌疑的用电户。图6基于无监督学习的检测模型针对用户用电数据不规律问题,文献 30 利用卷积神经网络(RNN)和随机森林(RF)算法的混合搭配的方式。其中CNN主要用来学习基于不同时间序列的AMI数
31、据,并通过DROPOUT层降低过拟合风险;随机森林则被用来判断被检对象是否存在用电异常问题。3窃电行为检测算法评价方式在使用机器学习或深度学习或者是混合方法中,常用的评价窃电行为检测方法有效性通常涉及2类指标。第1类评价体系是通过仿真实验,计算模型在验证 数 据 集 上 的 均 方 根 误 差(RMSE)和 均 方 误 差(MAE)指数作为模型的性能指标,数值越高,表明模型效果越好。RMSE=1ni=1n(yi-y?i)2MAE=i=1n|yi-y?in如表2所示,第2类是基于混淆矩阵理论计算的准确率(Precision)、召回率(Recall)指标31,数值越高,表明模型效果越好,被广泛应用
32、于基于机器学习和深度学习异常检测的方法中。由于准确率和召回率的取值区间为 0,1,无法严格表示模型的有效性,因此有时还会引入ACC、F1值以及ROC曲线用于评估模型的误检率和检测效果。如图7所示,蓝色曲线表示异常用电行为检测结果相对较好;红色曲线表示异常用电行为检测结果相对较差;黑色曲线表示随机猜测。ROC曲线越靠近左上方,说明异常检测模型的效果越好,误检率越低。表2混淆矩阵用户实际异常用户实际正常用户检测结果为异常True Positive(TP)False Positive(FP)检测结果为正常False Negative(FN)True Negative(TN)precision=TPT
33、P+FPrecall=TPTP+FN图7ROC曲线的表示4结束语近年来,非技术性电量损失给全球的电网企业带来了严峻的挑战。本文主要对目前智能化电网背景下,为实现对恶意窃电这类非技术性损失事件的检测的目的具有代表性的基于离群点、传统机器学习、深度学习以及混合模型方法。包括主流的2套评价体系做了全面的介绍。随着智能化物联电表的全面推广应用,用电异常行为检测的工作受到了越来越多研究人员的关注,并且取得了一系列显著的成果,但本文认为仍存在一些问题需要在未来的工作中实现突破:1)目前的用电数据量呈指数上升,窃电数据密度将进一步下降,需要在海量数据、模型质量和模型计算量之间寻求平衡。因此,从模型训练过程的
34、角度入手,本文认为通过提升模型对异常用电行为特征的注意力和学习能力并且降低对训练数据集规模的依赖是行之有效的方法之一。2)在预处理过程中,对于存在严重缺失的用电数据,做出合适的滤除或者利用方法避免对特征学习的干扰是一个值得研究的问题。同时也是出于电网数据安全的考虑,对于可能带来的数据集缺乏的问题,探索有效的数据增强方案,实现高质量的用电行为数据仿真是克服原始数据异常或缺失的有效手段之一。负荷数据预处理输入系统输出用电特征提取用电异常度疑似概率排序属性集主成分分析计算局部离群因子LOF110False Positive RateTrue Positive Rateconv1conv2pool1p
35、ool2Fully conectedoutputinputdata642023年第3期3)针对窃电行为检测方法的指标相对单一,需要建立起电力研究领域内的针对性模型指标。本文认为可以借鉴自然语言处理等领域的解决方案,在初期结合固定数据集建立起多类型评估方法,之后,综合多种类评估方法,逐渐总结出一套统一且高效的评估体系是目前可行性较高的路线之一。用户用能形势的随机性、多样性、复杂性、多场景性对未来的窃电行为检测方法提出了更高的要求。检测方法将更趋向于混合模型的探索,包括大数据技术、云计算技术等,并且出现跨模态多信息融合的检测手段,将语音、图像、语言、地理位置等信息纳入到检测过程中,实现窃电行为检测
36、方法效率和准确率的全面提升。参考文献:1 刘增明.供电企业防窃电方法和对策的研究 D.北京:华北电力大学,2013.2 王全兴,李思韬.基于采集系统的反窃电技术分析及防范措施 J.电测与仪表,2016,53(7):78-83.3 屈国栋.菏泽市反窃电现状分析与对策研究 D.济南:山东大学,2018.4GHAJAR R F,KHALIFE J.Cost/benefit analysis of anAMR system to reduce electricity theft and maximize revenues for lectricit du Liban J.Applied Energy,
37、2003,76(1-3):25-37.5 吴迪,王学伟,窦健,等.基于大数据的防窃电模型与方法 J.北京化工大学学报(自然科学版),2018,45(6):79-86.6 程占伟.基于机器学习的电力能耗异常检测与预测研究D.重庆:重庆邮电大学,2020.7 王珏昕,孟宇,殷树刚,等用电信息采集系统反窃电功能现状及发展趋势 J.电网技术,2008(S2):177-178.8Irish Social Science Data Archive.Accessed:Nov.2017EB/OL.20121-09-27.http:/www.ucd.ie/issda/data/commissionforener
38、gyregulationcer.9 KONG X Y,ZHAO X,LIU C,et al.Electricity theft detection in low-voltage stations based on similarity measureand DT-KSVM J.International Journal of Electrical Power&Energy Systems,2021,125.DOI:10.1016/j.ijepes.2020.106544.10肖端翔.基于机器学习混合模型的用电数据异常检测研究 D.武汉:华中师范大学,2020.11闫欣.综合过采样和欠采样的不平
39、衡数据集的学习研究D.吉林:东北电力大学,2016.12 金旭,王磊,孙国梓,等.一种基于质心空间的不均衡数据欠采样方法 J.计算机科学,2019,46(2):50-55.13 杨杰明,闫欣,曲朝阳,等.基于数据密度分布的欠采样方法研究 J.计算机应用研究,2016,33(10):2997-3000.14QU Z W,LI H W,WANG Y J,et al.Detection of electricity theft behavior based on improved synthetic minorityoversampling technique and random forest c
40、lassifierJ.Energies,2020,13(8):1-20.15 YIP S C,WONG K,HEW W P,et al.Detection of energytheft and defective smart meters in smart grids using linearregressionJ.International Journal of Electrical Power&Energy,2017,91:230-240.16 SALINAS S,LI M,LI P L.Privacy-preserving energytheft detection in smart g
41、rids J.IEEE Journal on SelectedAreas in Communications,2013,31(9):257-267.17 ZHENG K,WANG Y,CHEN Q X,et al.Electricity theftdetecting based on density-clustering methodC/2017IEEE Innovative Smart Grid Technologies-Asia(ISGT-Asia).2017:1-6.18 JINDAL A,DUA A,KAUR K,et al.Decision tree andSVM-based dat
42、a analytics for theft detection in smart gridJ.IEEE Transactions on Industrial Informatics,2016,12(3):1005-1016.19ANGELOS E W S,SAAVEDRAO R,CORTS O A C.Detection and identification of abnormalities in customer consumptions in power distribution systems J.IEEE Transactions on Power Delivery,2011,26(4
43、):2436-2442.20康宁宁,李川,曾虎,等.采用FCM聚类与改进SVR模型的窃电行为检测 J.电子测量与仪器学报,2017,31(12):2023-2029.21梁跃.基于机器学习的电力用户用电异常检测技术研究D.北京:北京邮电大学,2019.22 曹峥,杨镜非,刘晓娜.BP神经网络在反窃电系统中的研究与应用 J.水电能源科学,2011,29(9):199-202.23 ZHENG Z B,YAO Y T,NIU X D,et al.Wide and deepconvolutional neural networks for electricity-theft detectionto
44、secure smart grids J.IEEE Transactions on IndustrialInformatics 2017,14(4):1606-1615.24 MANITSAS E,SINGH R,PAL B C,et al.Distributionsystem state estimation using an artificial neural networkapproach for pseudo measurement modelingJ.IEEETransactions on power systems,2012,27(4):1888-1896.25姜波.基于深度学习的
45、非侵入式住宅用电负荷分解方法D.合肥:合肥工业大学,2017.26 NABIL M,ISMAQIL M,MAHMOUD M,et al.Deep recurrent electricity theft detection in AMI networks with random tuning of hyper-parametersC/2018 24th International Conference on Pattern Recognition(ICPR).2018:740-745.27 ULLAH A,JAVAID N,OMAJI S,et al.CNN and GRUbased deep
46、neural network for electricity theft detection tosecure smart gridC/2020 International Wireless Communications and Mobile Computing(IWCMC).2020:1598-1602.28 ADIL M,JAVAID N,ULLAH I.LSTM and bat-basedRUSBoost approach for electricity theft detectionJ.Applied Sciences,2020,10(12):4378.29 庄池杰,张斌,胡军,等.基
47、于无监督学习的电力用户异常用电模式检测 J.中国电机工程学报,2016,36(2):379-387.30 LI S,HAN Y,YAO X,et al.Electricity theft detection inpower grids with deep learning and random forests J.Journal of Electrical and Computer Engineering,2019,2019(2):1-12.31 STEHMAN S V.Selecting and interpreting measures of thematic classification accuracy J.Remote Sensing of Environment,1997,62(1):77-89.张芸,等:智能电网环境下窃电行为检测65