1、Telecom Power Technology 21 Aug.10,2023,Vol.40 No.15 2023 年 8 月 10 日第 40 卷第 15 期设计应用技术DOI:10.19399/ki.tpt.2023.15.007基于大数据技术的用户用电采集数据分析系统设计申文娟(国网陕西省电力有限公司吴起县供电分公司,陕西 延安 717600)摘要:在电力体制改革的背景下,电力企业普遍面临利润下降的压力,因此需要通过对用户用电数据进行充分的挖掘和分析来提升运营的经济效益。针对以上问题,提出了一种基于关系数据库管理系统(Relational Database Management Syst
2、em,RDBMS)和 HBASE+MapReduce 的大数据分析架构,该架构能够满足实际应用需求,并提供准确的在线分析结果。该系统是一种集成多个组件的系统,可以监测电网设备状态、负荷、线损等关键指标,对电力企业中的大数据应用具有一定的借鉴意义。关键词:用电采集数据分析系统;电力信息;大数据分析Design of User Power Acquisition Data Analysis System Based on Big Data TechnologySHEN Wenjuan(Wuqi County Power Supply Branch of State Grid Shaanxi Ele
3、ctric Power Co.,Ltd.,Yanan 717600,China)Abstract:Under the background of power system reform,power enterprises are generally faced with the pressure of falling profits,so it is necessary to fully mine and analyze the users electricity consumption data to improve the economic benefits of operation.Ai
4、ming at the above problems,a big data analysis architecture based on Relational Database Management System(RDBMS)and HBASE+MapReduce is proposed,which can meet the practical application requirements and provide accurate online analysis results.The system is a multi-component integrated system,which
5、can monitor key indicators such as power grid equipment status,load and line loss,and has certain reference significance for big data application in power enterprises.Keywords:electricity collection data analysis system;electric power information;big data analysis0 引 言随着全球人口的不断增加和现代社会对电力需求的迅速增长,传统的用
6、电分析系统已无法满足快速发展的社会经济需求,需要企业加快改进和创新用电智能监测系统。基于大数据技术对用户用电采集数据分析系统进行研究,通过建立异常指标库,进一步加强对配电网点运行效果和质量的监测与控制。该系统是一个集成多种技术的实时信息采集和分析系统,具备信息采集、费控管理、远程抄表、负荷监控以及线损分析等多项优势1。利用移动网络、光纤专网等先进通信手段,该系统能够实现系统主站与现场终端之间的高效通信,从而有效监测电网中设备的运行状态、负荷情况、供电状况、电能质量以及线损等重要指标,并对客户的日常用电情况进行深入分析。该系统不仅能满足快速发展的经济社会对电力的需求,还能提供更可靠、高效的电力
7、服务。1 用户用电采集数据分析系统的功能需求分析用户用电采集数据分析系统是一个具备多项功能的系统,用于监测、分析用户的用电行为和配电网的运行情况。其功能需求主要包括以下几个方面。(1)数据采集与整合。系统需要实时采集用户用电数据和配电网的相关信息,包括电力设备状态、负荷情况、供电状况、电能质量以及线损等2。同时,系统还需整合其他系统,如电力部门营销系统、电力管理系统(Power Management System,PMS)、地理信息系统(Geographic Information System,GIS)等,以获取更全面的数据。(2)在线监测与实时分析。系统要具备实时监测和分析能力,能够对采集
8、到的数据进行实时处理和分析。通过监测用户的用电行为和配电网的运行情况,能够及时发现异常,并提供相应的预警和报警功能,以便操作者及时采取相应的补救措施。(3)线损分析与减少。系统要能够进行线损分析,对配电网中的线损情况进行监测和评估。通过分析相应的线损数据,明确线损原因和位置,提供减少线损的措施和建议,提高配电网的运行效率,节约能源。用户用电采集数据分析系统的功能需求主要包括数据采集与整合、在线监测与实时分析以及线损分析与减少等,这些功能的实现有助于提高电力系统的管理效率、优化用电资源配置,并为用户提供更可靠、高效的电力服务。收稿日期:2023-05-27作者简介:申文娟(1994),女,陕西延
9、安人,硕士研究生,助理工程师,主要研究方向为电力营销。2023 年 8 月 10 日第 40 卷第 15 期Aug.10,2023,Vol.40 No.15Telecom Power Technology 22 2 用户用电采集数据分析系统的详细设计2.1 大数据分析架构设计大数据分析架构设计是用户用电采集数据分析系统中的重要组成部分,提供了一个可扩展、高效的架构,用于处理大量的用户用电数据并进行深度分析。该架构具备数据采集与存储、数据预处理与清洗、数据存储与管理、分布式计算与处理、数据分析与挖掘以及可视化与报告等关键功能3。通过采用流式处理平台、分布式存储系统以及分布式计算框架等技术,能够实
10、现实时数据流的处理、批量数据的存储、数据预处理与清洗、分布式计算和并行处理以及机器学习和统计分析等,为用户用电采集数据分析系统提供可靠的数据支持和决策依据,并将分析结果以可视化报告的形式呈现给用户,从而提高电力系统的服务质量。大数据分析架构如图 1 所示。2.2 大数据应用场景分析流程设计以市场开拓与业扩报装空间辅助决策分析为研究方向,融合大数据的分析思路,设计相应的分析流程。首先,收集新增用户的用电地址、电压等级以及负荷特点等信息。其次,通过 GIS 技术确定科学合理的供电点位置,并确定相关的厂站、开闭站和线路4。最后,结合线路和厂站统计的电量数据和各维度负荷统计数据,以及 PMS 电网模型
11、信息、减容、报停和营销业务系统销户等流程,利用大数据分析方法对新增供电点的供电厂站归属、负荷质量和用电量等进行综合评估。通过这样的分析流程,可以更全面地了解新增供电点的用电使用情况,为市场开拓和业扩报装提供辅助决策依据。大数据应用场景分析设计流程如图 2所示。大数据决策树法是一种常见的数据挖掘分类方法,通过将图形与数据挖掘结果相结合,以更形象、精准的方式呈现给用户,广泛应用于分析配网线路和增减容用户的短期负荷、中期负荷及电量增长趋势。决策树是一种分类算法,包括一些常见的算法,如 C4.5 算法和迭代树三代(Iterative Dichotomiser3,ID3)算法。其中,C4.5 算法是对
12、ID3 算法的改进,引入信息增益比作为主要标准来选择分裂属性,而不是简单的使用信息增益,主要解决了 ID3 算法在运行时只能处理选择多取值和离散型数据的问题。通过信息增益比能够全面评估属性对分类的贡献度,用于指导决策树的构建过程。除此之外,C4.5 算法还能处理连续型数据,这是 ID3 算法无法实现的。作为 ID3 算法的后续版本,其采用了一种分层的方法来处理连续型数据5。通过将连续型数据划分为多个区间,结合数据属性对这些区间进行排序,然后计算信息增益和局部阈值,通过顺序查找法找到最适合的实际分割阈值。C4.5 算法所采用的分层方法能够有效处理连续型数据,在构建决策树时更加准确和灵活,在扩大决
13、策树应用范围用户(4)知识展现(2)数据存储(1)数据准备(3)数据计算与分析流计算(Srorm、S4)交互式分析(AQI,on Hadoop 技术)数据挖掘(Mahout,Weka)批计算分布式服务大数据处理分析系统数据可视化离线(Mapreduce、Hive)新的 Mapreduce 框架(yarn)实时分布式高纬数据库HBase分布式文件系统 HDFS数据导入(ETL、提取、转换、加在)、数据分发数据源(营销业务系统、用电信息采集、PMS、GIS)分布式内存数据库关系型数据库实时(Spark)图 1 大数据分析架构 2023 年 8 月 10 日第 40 卷第 15 期 23 Telec
14、om Power TechnologyAug.10,2023,Vol.40 No.15 申文娟:基于大数据技术的用户用电 采集数据分析系统设计的同时,也提高了算法的适用性。2.3 数据库设计2.3.1 数据特点数据库设计中的数据特点是指用户用电采集数据的特征和属性。在用户用电采集数据分析系统的详细设计中,需要考虑以下数据特点,以维持系统的高效运行和准确的数据分析能力。(1)数据来源多样性。用户用电采集数据可能来自不同的数据源,包括电力部门营销系统、PMS系统、GIS 系统等。这些数据源可能以不同的格式和结构进行存储,因此在数据库设计中需要考虑如何整合和统一这些数据来源。(2)数据量大和更新速度
15、快。随着用户数量和用电数据的增加,用户用电采集系统可能会产生大量的数据,且数据更新速度较快。数据库设计需要考虑如何有效地处理和存储大量数据,提供高效的数据访问和查询功能。2.3.2 关系数据库及非关系数据库的设计关系数据库和非关系数据库是 2 种常见的数据库设计方式。关系数据库采用表格的形式组织数据,使用结构化查询语言(Structured Query Language,SQL)进行数据管理和查询,能够有效保证数据的一致性和完整性。非关系数据库则采用其他数据模型,如键值存储数据库、文档数据库以及图形数据库等,用于存储和管理数据。关系数据库的设计基于关系模型的概念将数据组织到表格中,每个表格包含
16、若干列和行,通过主键和外键建立表与表之间的连接和组合。关系数据库的设计强调数据的结构化和规范化,以保证数据的一致性和完整性。常见的关系数据库管理系统包括MySQL、Oracle 以及 SQL Server 等。非关系数据库设计则更加灵活,不拘泥于表格的形式,通常使用不同的数据模型和存储方式,适用于不同类型的数据和应用场景。例如:键值对数据库适合存储简单的键值对数据;文档型数据库适合存储半结构化数据;图形数据库适合存储图形数据等。非关系数据库的设计注重数据的灵活性和扩展性,常见的非关系数据库管理系统包括MongoDB、Redis以及Neo4j等。关系数据库设计适用于需要严格结构化和关联性的数据,
17、适合复杂的查询和事务处理。而非关系数据库设计则更适用于数据结构灵活、数据量大、需要高性能以高可扩展性的场景。根据具体的应用需求和数据特点,选择适合的数据库设计方式可以更好地满足系统的个性化要求。3 用户用电采集数据分析系统的实现用户用电采集数据分析系统的实现涉及多个关键步骤,每一步都对系统的功能和性能起着重要作用,主要包括数据采集、数据存储和管理、数据处理和分析以及用户界面和报告功能的设计与开发。(1)数据采集。数据采集是用户用电采集数据分析系统的基础,通过安装适当的电力测量设备或智能电表,系统可以实时监测用户的用电情况。这些设备可以记录用电负荷、电能质量、供电状态等重要数据。数据采集可以通过
18、物联网技术和传感器网络等多种方式实现,确保数据采集的准确性和及时性,为后续的数据分析奠定坚实的基础。(2)数据存储和管理。数据存储和管理是用户用电采集数据分析系统的核心,系统需要选择合适的数据库进行数据的存储和管理。关系型数据库(如MySQL、Oracle)适用于结构化数据的存储,而非关数据平台用电信息采集系统数据准备知识集成电力营销系统PMSGIS数据选择数据预处理数据抽取数据归集算法库聚类算法关联规则算法回归分析算法专家打分法分析模型获取业扩报装/新装信息设定分析流程辅助分析决策分析结果呈现黑名单知识库将分析结果与业务集成图 2 大数据应用场景分析设计流程(下转第 27 页)2023 年
19、8 月 10 日第 40 卷第 15 期 27 Telecom Power TechnologyAug.10,2023,Vol.40 No.15 郭小波:智能电网用户数据 采集系统的设计主站层或数据管理平台,实现数据的远程传输和集中监测。3.3 应用于信息发布与双向互动通过专用的数据采集设备和通信渠道,智能电网用户数据采集系统能够帮助电力系统运营商向用户发布各类信息,包括电力供应情况、用电峰谷时段、电价调整通知等,旨在及时传达关键信息,提高用户对电力供应的认知和参与度。该系统的采集模式还采用了适合信息发布与双向互动的通信渠道。采集设备使用该通信渠道与用户终端或数据管理平台进行双向通信,从而实现
20、信息发布和接收用户反馈。4 结 语在智能电网中应用用户数据采集系统,不仅能降低工作人员的工作失误率,还能提升电力数据采集、处理、分析的精准度,进一步缩减人力成本。同时,采用数据采集系统进行智能电网数据采集和处理,能有效提升数据采集的广度,增加数据分析的深度,降低风险发生概率。文章对智能电网用户数据采集系统进行重点设计,通过具体分析,明确了该系统应该具备的功能,指出该系统是智能电网构成不可或缺的部分,同时是确保电力系统稳定运行的核心部分,为电力系统的优化提供帮助。参考文献:1 王德庆.智能电网数据隐私保护与异常检测关键技术研究 D.南京:南京邮电大学,2022.2 肖 伟.电力用户用电信息采集系
21、统在智能电网中的应用研究 J.电子世界,2020(11):208-209.3 王梓嫣.电力用户用电信息采集系统的研究与应用 D.长春:长春工业大学,2020.4 张 颖,王忠臣.微探电力用户用电信息采集系统在智能电网中的应用 J.数字通信世界,2019(8):189.5 杨 艳.电力用户用电信息采集系统及其应用研究 J.现代工业经济和信息化,2016,6(18):94-95.系型数据库(如 MongoDB、Redis)则适用于半结构化或非结构化数据的存储。数据库的设计需要考虑数据的结构、索引的优化以及存储容量和性能等因素,以确保数据的高效存储和快速检索。(3)数据处理和分析。数据处理和分析是用
22、户用电采集数据分析系统的关键环节。通过运用数据挖掘、机器学习和统计分析等方法,系统可以对采集到的数据进行处理和分析,进而发现潜在的用电趋势、异常行为或优化潜力等。常用的数据分析方法包括决策树法、聚类分析法以及回归分析法等。数据处理和分析的结果可以为电力部门和企业提供重要的决策支持和业务优化建议。4 结 论基于大数据技术的用户用电采集数据分析系统整合了用电信息采集系统、营销业务系统、同期线损系统以及 PMS 等关键组件,打破数据孤岛,实现对电网运行设备的状态、负荷、线损以及供电情况等的实时监测。为电力企业提供更加快速、精确的数据分析和决策支持,促进企业经济效益的提升。该系统的成功运行将为电力企业的大数据应用提供相应的技术参考,为行业的发展做出贡献。参考文献:1 樊淑炎,额尔敦.大数据技术在电力企业中的应用分析 J.智能城市,2021,7(19):99-100.2 刘 敏,周路强,刘 杨,等.大数据和人工智能技术在反窃电监控方面的应用研究 J.电子元器件与信息技术,2020,4(10):46-47.3 祖 莹.基于用电信息采集数据的电能质量分析方法 D.西安:西安理工大学,2020.4 赖 哲.应用大数据技术的反窃电分析 J.电子测试,2019(16):50-51.5 李 磊.基于 SSH 的电能采集系统的设计与实现 D.西安:西安电子科技大学,2019.(上接第 23 页)