收藏 分销(赏)

基于改进决策树的新能源电气设备故障辨识研究.pdf

上传人:自信****多点 文档编号:582850 上传时间:2024-01-02 格式:PDF 页数:3 大小:2.22MB
下载 相关 举报
基于改进决策树的新能源电气设备故障辨识研究.pdf_第1页
第1页 / 共3页
基于改进决策树的新能源电气设备故障辨识研究.pdf_第2页
第2页 / 共3页
基于改进决策树的新能源电气设备故障辨识研究.pdf_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

1、基于改进决策树的新能源电气设备故障辨识。测试结果表明,使用改进决策树算法辨识电气设备故障时,故障辨识的平均用时为10.8s,并且准确度也可以达到97.53%。关键词:改进决策树;新能源;电气设备;故障辨识近年来,我国在建立设备故障辨识体系资金投入较大。尤其是对于稳定性要求较高的设备,这就需要在设备运行的过程中细致地掌握每一个设备的运行情况,做到能够对设备情况及时进行掌握,从而将设备出现问题的情况降到最低,保证设备安全稳定运行。但对所有电气设备都进行故障识别,又无疑是一个相当耗时费力的事情,于是对新能源电气设备都进行故障识别便成为目前所必须处理的关键性课题。要能够对全部的电气设备均实现集中的检测

2、与管理,并且对出现的问题进行及时发现与处理,从而能够极大地提高工作人员对电气设备装置问题检测的效率,就需要加强对清洁能源装置故障辨识关键技术的研发。而分类就是故障辨识的一个非常重要的手段,截至目前我们各国已经开发了很多方法来实现分类,包括基于支持向量机计算、BP 神经网络和决策树等。近年来,分类器在电气设备故障辨识领域也得到了发展,但是单颗决策树在进行故障辨识过程中,精准度不高且容易出现拟合过度的现象,因此就需要对决策树算法进行改进之后,再基于改进决策树研究出一种新型的新能源电气设备故障辨识方法。1 决策树算法决策树算法是属于监督学习的分类问题中常见的算法,具体涉及属性和关键值之间的映射关系。

3、决策树算法在应用过程中的基本思想是一种自上而下算法,其选择对每个节点具有最佳分类效果的属性,并循环该过程,直到决策树能够精确分类和划分每个测试样本。为了解决过度平衡等问题,有必要执行优化过程,如在实际应用中修剪决策树、减小决策树的大小,并提高其预测精度。因此,决策树算法的关键问题主要涉及两个方面:第一,为分区选择适当的分类属性;第二是有效的修剪。决策树最常见方法包括获取信息、获取信息因子、基尼系数和基尼指数。选择样本分区时,希望决策树节点中包含的样本尽可能属于同一类别,所以节点的“纯度”应尽可能高。“信息熵”是测量一组样品纯度的常用指标。如果假设当前样本集合 D 中第 k 类样本所占的比例为:

4、Pk(k=1,2,|),样本集合 D 的信息熵定义为:,当 Ent(D)的值越小表示集合 D 的纯度越高。假设样本集合 D有属性 a,则属性 a 对集合 D 的信息增益定义为:,式中:V表示集合 D 中属性 a 的样本数;v 表示第 v 个分支结点;Dv表示第 v 个节点包含 D 中所有在属性 a 上取值为 av的样本。信息增益值越高,通过分类和划分属性 A 获得的“纯度”越高。因此,信息增益是共享和选择决策树中属性的有效方法。然而,获取信息也有其自身的差距和差距,这往往会分裂样本集。因此,在某些情况下,无意义属性被用作数据分类的基础。2023.7 下 EPEM 171电力安全Power Se

5、curity例如,如果以学生数量作为属性对学生进行分类,则每个分支仅包含一个样本,其信息增益值远大于基于性别的属性分类的信息增益值。当然,根据学生人数对学生进行分类并不重要,而且这种决策树不具备有效概括预测新样本的能力。决策树的基本修剪策略包括“预剪枝”和“后剪枝”。预剪枝是构建决策树的过程,其中在分离之前估计每个节点。如果该节点的拆分不能提高决策树的泛化能力,则必须停止拆分,并将该节点标记为叶节点;后剪枝是使用训练集生成出生成完整决策树的过程,然后根据设定的标准从上到下检查叶子以外的节点。如果节点的对应子流被叶节点替换,则决策树的泛化能力提高,并且与原始树相比,验证集的切割决策树分类效率不降

6、低,则子流被建立为决策叶节点。循环此步骤,直到修剪节点导致决策树分类效率降低,然后停止修剪。与预修饰相比,修剪策略在修剪后保留了更多的分支,并提供了更好的研究视野,从而提高了预测精度。然而,修剪策略是在决策树生成完成后实施的,所有非决策节点都会逐个检查,大大增加了IT 工作和培训时间。2 提取原始故障信号数据特征数据特征提取的目的就是选择出对分类有着较大影响的信号数据特征,从而提高故障信号数据分类的效率。通常情况下,通过信息增益来对给定的属性进行有效度量,来有效划分训练样本的能力,信号增益越多就表明故障信号数据特征的区分能力越强。熵也可对训练样本的纯度加以精确刻画,如果训练属性中同时具有 V

7、个不同的数值,则训练集合D 中相对于 V 不同状态分类下产生的熵,也都能够被定义为:,其中:qo代表着子集合中某一个属性数值样本所占的具体比值。那么,目标属性 S 对于集合 D 的信息增益情况就如下:,其中:B(S)代表着目标属性 S 所在的值域范围;DB则代表着目标属性 S 在集合 D 中的数值,也就相当于 b的子集。信息增益比较倾向于信息比较多的时候取值,当取值的信息比较多时,通过此特性就可以获得纯度比较大的信息子集,而在分割之后所获取的信息熵就比较小了。为了可以更有效解决这个缺点,在这里给出了信息增益率的一般定义,而信息增益率主要是通过信息增益与分割数据的量来共同确定的,具体如下式,其中

8、:GR 代表着信息增益率;G 代表着信息增益;Sf 代表着分类信息的数量1:3 基于 c4.5算法建立改进决策树在建立改进决策树时需要使用 C4.5算法,C4.5算法在对某个节点上存在的分枝属性进行选择时,对于离散性的描述需要按照该属性自身的数量来决定,而对于连续性的描述则需要对 C4.5算法进行下述离散化处理:寻找该属性的最小数值(min)与最大数值(max);设置最小数值与最大数值中,n 等分的分割点为 Lu,具体规则如下:,分别计算min,Lu 与 Lu,max 的 Gain 数值并完成对比;选择 Gain 数值中最大的数值为 Lj,将其作为连续性属性的端点,将属性数值设置在 min,L

9、j 和 Lj,max区间内2。3.1 决策树剪枝与预测模型建立当改良决策树建立完成后,还需要对决策树进行剪枝管理,剪枝方式通常分为前修剪和后修剪。前修剪技术是当改良决策树的参数达到所需要管理的某个程度,或者达到了预定深度的节点数量后,其所包含的最大样本数将会比最小样本数与当前系数变化量间的给定数值小很多,在这个状况下才会停止生长;而后修剪技术则是等改良决策树发育到特定水平之后,才对其实施专门的剪枝管理。要让改良决策树不再能够包含叶子的节点,估计的精度也不降低,也只能通过二者相结合的方法来进行生长管理。若把改进决策树的预期误差看作剪枝处理后产生的代价,用叶片的节点数量来比作其复杂的程度,那么改进

10、后决策树 Y 所形成的代价,其复杂程度 T(Y)就可能被确定为如下:T(Y)=T(Y)+|Y|,其中;Y 代表着所有包含着的规则;T(Y)代表着在测试集合上进程预测所产生的误差;|Y|代表着叶的节点数量;则代表着复杂程度的参数值3。要想使误差与复杂程度达到最小化,就需要选择合适的。计算中间节点y和子树 Yy形成172 EPEM 2023.7 下电力安全Power Security代价的复杂程度,来判断中间节点y中的子树Yy是否需要被剪枝处理。那么中间节点y中子树 Yy形成代价的复杂程度就如下:T(Yy)=T(Yy)+|Yy|。当中间节点形成代价的复杂程度比子树形成代价的复杂程度大的时候,就需要

11、对子树进行保留。即当的时候,就需要对子树进行保留;反之当的时候,就需要将子树进行剪枝处理。没有剪枝的改进决策树,在训练样本时有着很高的预测精准度,但得到的结果会因为叶子样本的变化而产生比较大的波动,导致故障辨识的稳定性比较差。单棵决策树所给出的预测值,要比多棵决策树所给出的平均预测值多,因此在完成剪枝处理后,就需要根据预测值方差来建立预测模型,从而提高新能源电气设备故障辨识的准确性。3.2 应用测试与分析为了测试此次提出新能源电气设备故障辨识方法的可靠程度和实际使用效果,选择某新能源的电气设备作为测试对象。本次试验将两种传统电气故障辨识方法(支持向量机与 BP 神经网络)与使用改进决策树算法后

12、的故辨识方法进行对比。图1 不同故障检测方法数据结果对比图由图1可以看出,使用支持向量机对电气设备进行故障辨识时,检测次数增加到10次时,故障辨识所用时间在92120s;使用 BP 神经网络对电气设备进行故障辨识时,故障辨识所用时间在4065s;而使用改进决策树算法对电气设备进行故障辨识时,故障辨识所用时间在520s。通过上述数据进行计算可以得到,使用支持向量机对电气设备进行故障辨识时,故障辨识平均用时为106.4s;使用 BP 神经网络对电气设备进行故障辨识时,故障辨识平均用时为55.8s;而使用改进决策树算法对电气设备进行故障辨识时,故障辨识平均用时只需要10.8s。明显可以看出,在对新能

13、源电气设备进行故障辨识时本文方法所用时间更短。在对故障辨识所用时间进行对比之后,还需要对三种故障辨识方法的准确度进行对比。表1 不同故障辨识方法准确度对比/%检测次数支持向量机Bp 神经网络改进决策树故障次数准确率故障次数准确率故障次数准确率20136515751995221568.181777.2722100191263.161473.681910025187220802496231669.571878.262296.65241770.831979.172395.8325176819762496201365157520100231565.221773.912295.65221463.6416

14、72.732194.45由表1可以看出,使用支持向量机经过十轮测试之后,可以辨识出故障的准确程度在63%72%;使用 BP 神经网络经过十轮测试之后,可以辨识出故障的准确程度在72%80%;而使用改进决策树算法经过十轮测试之后,可以辨识出故障的准确程度始终维持在95%以上。根据计算可知,两种传统方法在进行故障辨识时,平均的准确率分别为67.582%以及76.842%。而使用改进决策树算法在进行故障辨识时,平均准确率可以达到97.53%。明显可以看出,在对新能源电气设备进行故障辨识时,改进决策树算法与两种传统方法相比后,不仅故障辨识的时间更短,并且辨识的准确度也更高。此次所研究的方法还会存在些许的不足之处,今后在改进的过程中可以将重点放在人工智能上,从而在发生故障的第一时间就可以将故障信息传输至终端设备上,能够让工作人员在第一时间就对出现的问题进行有效解决,从而使新能源电气设备的运行更加稳定与安全。参考文献1吴海洋,缪巍巍,等.基于改进决策树的电力通信设备状态预测算法研究J.计算机与数字工程,2021,1.2 孙海洋,宋飞,等.基于改进型单相-dq法的电网故障快速辨识技术研究 J.机电信息,2021,18.3张英,徐龙舞,等.基于智能算法的DGA变压器故障诊断研究及决策树验证 J.电力大数据,2021,12.

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签
资源标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      联系我们       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号  |  icp.png浙ICP备2021020529号-1 浙B2-2024(办理中)  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服