收藏 分销(赏)

大坝渗流安全监测数据异常检测的改进DSAE模型.pdf

上传人:自信****多点 文档编号:921694 上传时间:2024-04-07 格式:PDF 页数:11 大小:5.40MB
下载 相关 举报
大坝渗流安全监测数据异常检测的改进DSAE模型.pdf_第1页
第1页 / 共11页
大坝渗流安全监测数据异常检测的改进DSAE模型.pdf_第2页
第2页 / 共11页
大坝渗流安全监测数据异常检测的改进DSAE模型.pdf_第3页
第3页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 42 卷第 10 期 水 力 发 电 学 报 Vol.42,No.10 2023 年 10 月 Journal of Hydroelectric Engineering Oct.2023 收稿日期:收稿日期:2023-04-22 接受日期:接受日期:2023-06-13 基金项目:基金项目:国家自然科学基金雅砻江联合基金(U1965207)作者简介:作者简介:余红玲(1994),女,博士生.E-mail: 通信作者:通信作者:王晓玲(1968),女,教授.E-mail: 大坝渗流安全监测数据异常检测的改进 DSAE 模型 余红玲1,王晓玲1,程正飞2,喻葭临2,吴国华1,郑鸣蔚1(1.天津

2、大学 水利工程仿真与安全国家重点实验室,天津 300072;2.水电水利规划设计总院,北京 100120)摘摘 要:要:针对现有大坝渗流安全监测数据异常检测方法存在检测效率和精度较低的不足,以及在异常阈值拟定过程中大多未能综合考虑监测数据随机性和模糊性的问题,提出大坝渗流安全监测数据异常检测的改进深度稀疏自编码器(deep sparse autoencoder,DSAE)模型。在以奇异谱分析方法提取监测数据残差分量的基础上,采用基于混沌初始化和非线性飞行速率改进的天鹰优化(improved Aquila optimization,IAO)算法对 DSAE 的超参数进行优化,建立 IAO-DSA

3、E 模型,实现对监测数据残差分量的高精度重构;然后,在异常阈值的拟定过程中,将逆向云算法中的期望和熵值分别替代传统 3 法中的均值和标准差,以综合考虑监测数据的随机性和模糊性对异常阈值拟定的影响,提高异常检测结果的可靠性。工程案例研究表明,相比于基于统计模型法和 3 法的异常检测方法,根据所提方法处理后的渗流安全监测数据建立的预测模型,预测精度的平均提高幅度分别为 5.56%和 6.99%,验证了所提方法的有效性。关键词:关键词:渗流安全;异常检测;深度稀疏自编码器(DSAE);逆向云;改进天鹰优化(IAO)算法;奇异谱分析 中图分类号:中图分类号:TV698.1+2 文献标志码:文献标志码:

4、A DOI:10.11660/slfdxb.20231012 论文引用格式:论文引用格式:余红玲,王晓玲,程正飞,等.大坝渗流安全监测数据异常检测的改进 DSAE 模型J.水力发电学报,2023,42(10):128-138.YU Hongling,WANG Xiaoling,CHENG Zhengfei,et al.Improved DSAE model for anomaly detection of dam seepage safety monitoring data J.Journal of Hydroelectric Engineering,2023,42(10):128-138.(

5、in Chinese)Improved DSAE model for anomaly detection of dam seepage safety monitoring data YU Hongling1,WANG Xiaoling1,CHENG Zhengfei2,YU Jialin2,WU Guohua1,ZHENG Mingwei1(1.State Key Laboratory of Hydraulic Engineering Simulation and Safety,Tianjin University,Tianjin 300072,China;2.China Renewable

6、Energy Engineering Institute,Beijing 100120,China)Abstract:Dam seepage safety monitoring suffers a drawback of low detection efficiency and low accuracy by previous abnormal detection methods,and a problem that most of them fail to consider comprehensively the randomness and fuzziness of monitoring

7、data in formulating the abnormal threshold values.This paper presents an improved deep sparse autoencoder(DSAE)method for the anomaly detection of dam seepage safety monitoring data.This method optimizes the hyperparameters of DSAE by using the improved Aquila optimization(IAO)algorithm based on cha

8、otic initialization and nonlinear flight rate,and extracting residual component of monitoring data by the singular spectrum analysis method.The new IAO-DSAE method so obtained can realize a high-precision reconstruction of the residual 余红玲,等:大坝渗流安全监测数据异常检测的改进 DSAE 模型 129 components of monitoring dat

9、a.To improve the reliability of anomaly detection,we modify the process of anomaly threshold formulation by adopting the expectation and entropy of the reverse cloud algorithm in replacement of the mean and standard deviation used in the traditional 3 method,so as to achieve a comprehensive consider

10、ation of the influence of randomness and fuzziness of monitoring data on the formulation.An engineering case study shows that compared with the anomaly detection methods based on statistical model method and 3 method,the prediction based on the seepage safety monitoring data that are processed by ou

11、r new method can raise the accuracy by 5.56%and 6.99%,respectively,verifying the applicability and effectiveness of the new method.Keywords:seepage safety;anomaly detection;deep sparse autoencoder(DSAE);reverse cloud;improved Aquila optimization(IAO)algorithm;singular spectrum analysis 0 引言引言 大坝渗流安全

12、监测数据是分析和评价大坝渗流性态的重要基础。然而,人为原因、外界干扰和设备故障等因素1-2导致大坝渗流安全监测数据中不可避免地存在一定量的异常值。这些异常值对于大坝渗流性态的分析和评价具有较大影响。因此,对大坝渗流安全监测数据中的异常值进行检测,保证大坝渗流安全监测数据的准确性和可靠性,对于大坝渗流性态的分析和评价具有重要意义。传统的大坝安全监测数据异常检测方法主要有过程线法、统计概率法和数学模型法等。然而,传统的异常检测方法对专家经验水平的依赖性较强,耗时耗力、效率较低,且容易出现“判多为少”和“判有为无”的情况3。随着人工智能技术的迅速发展,许多机器学习算法也逐渐应用于大坝安全监测数据的异

13、常检测研究中。例如,张晓4、Song 等5和刘燚等6采用聚类方法对监测数据中的异常值进行了检测;Yang 等7提出了基于改进局部离群因子的混凝土坝变形异常值检测方法;张海龙等8和赵新华等9基于孤立森林法对大坝监测数据进行了异常检测;Pyayt 等10、Fisher 等11和 Salazar 等12基于一类支持向量机对大坝监测数据中的异常值进行了识别;Li 等13、Hellgren 等14和 Chen 等15通过建立预测模型,对大坝监测数据的异常值进行了检测;王丽蓉等16、Shao 等17和 Zheng 等18基于图像学习技术开展了大坝监测数据的异常检测研究;曹翔宇19、Shu 等20和 Oze

14、lim 等21基于自动编码器对大坝监测数据进行了异常检测。自动编码器是一种无监督网络模型,可以从输入数据中学习其深层表示,从而利用网络的重构误差实现数据的异常检测22。基于自动编码器的异常检测方法原理简单、易于实现。然而,现有研究大多基于经验试算确定模型超参数,容易影响模型对数据的重构精度,且大多采用 3 准则确定异常阈值,未能综合考虑渗流安全监测数据的随机性和模糊性,导致异常检测结果的可靠性较低。智能优化算法是确定模型超参数的有效选择,其中天鹰优化器(Aquila optimizer,AO)是Abualigah 等23于 2021 年提出的一种新型智能优化算法,具有较强的全局搜索能力和较快的

15、收敛速度。然而,AO 算法采用简单的随机方式对种群初始化,难以保证初始化种群分布的均匀性和多样性,并且在开发阶段容易陷入局部最优。相关研究表明24-26,通过混沌映射产生的混沌序列具有规律性、遍历性、随机性等特点,能够增强种群的均匀性和多样性。而非线性飞行速率更新策略对增强算法局部搜索能力具有重要作用。因此,本研究提出基于混沌初始化和非线性飞行速率更新策略改进的 AO(improved Aquila optimization,IAO)算法,对深度稀疏自编码器(deep sparse autoencoder,DSAE)的超参数进行自适应调优,从而提高 DSAE的数据重构精度。此外,逆向云算法是云

16、模型中云的一种生成算法,其本质是一个参数估计过程,即利用统计学方法对数据样本进行参数估计,从而得到云的数字特征。逆向云算法具有云模型能够综合考虑数据中随机性和模糊性的优势,从而为确定可靠的异常阈值提供了一种新的思路。综上所述,针对现有大坝渗流安全监测数据异常检测方法检测效率和精度较低,且在异常阈值拟定过程中大多未能综合考虑监测数据随机性和模糊性的问题,提出一种大坝渗流安全监测数据异常130 水力发电学报 检测的改进 DSAE 模型。其中,采用基于 IAO 算法优化的 DSAE 模型对渗流安全监测数据残差分量进行高精度重构,并基于逆向云算法拟定异常阈值,从而提高大坝渗流安全监测数据异常检测的准确

17、性和可靠性。1 基于基于 IAO-DSAE 的大坝渗流安全监测数据重构方法的大坝渗流安全监测数据重构方法 大坝渗流安全监测的原始数据通常呈现出非线性非平稳特点,若直接对其进行异常检测则难以保证检测效果1。由于原始监测数据的残差分量能够保留环境和结构变化导致的异常数据特征,故采用分解方法分离出原始监测数据的趋势分量,再基于剩下的残差分量进行异常检测能够有效保证异常检测效果。奇异谱分析(singular spectral analysis,SSA)是一种非参数分解方法,能有效提取时间序列数据中的趋势性分量和残差分量27。SSA 主要包括嵌入、奇异值分解、分组和对角平均四个步骤,其具体实现过程可参考

18、相关文献28-29。本文在采用奇异谱分析提取大坝渗流安全监测数据的残差分量之后,再采用基于 IAO 算法优化的 DSAE 对其进行数据重构,以提高异常检测结果的准确性和可靠性。1.1 深度稀疏自编码器模型深度稀疏自编码器模型 1.1.1 稀疏自编码器稀疏自编码器 自动编码器是一种由编码器和解码器组成的无监督机器学习算法,其基本思想是分别采用编码器和解码器对输入数据进行降维和重构,通过训练降低重构数据和输入数据之间的重构误差,从而学习数据的内部特征表示30。通过重构数据,自动编码器从数据中学习复杂的高维特征,具有增强正常数据与异常数据可分性的优势31。自动编码器是一个具有对称结构的三层前馈神经网

19、络,其结构如图 1 所示。编码过程和解码过程可表示为:11()()hf xsxbW(1)T22()()yg hshbW(2)式中:x 为输入数据,即通过 SSA 提取的大坝渗流安全监测数据的残差分量;h 为编码后的数据;y为大坝渗流安全监测数据残差分量的重构数据;W 和1b分别为输入层到隐藏层的权重矩阵和偏置;TW和2b分别为隐藏层到输出层的权重矩阵和偏置;1s和2s均为非线性函数,通常可选择 sigmoid 函数。自动编码器的学习目标是使得重构数据和输入数据尽可能的接近,即最小化重构误差的值,则自动编码器的损失函数可表示为:211(,)()liiiL x yxyl(3)式中:l为大坝渗流安全

20、监测数据残差分量的训练样本个数;(,)L x y为大坝渗流安全监测数据残差分量的重构误差。图图 1 自动编码器结构示意图自动编码器结构示意图 Fig.1 Schematic of the autoencoder 由于自动编码器需要更新的参数较多,训练时间较长32,Olshausen等33提出了稀疏自编码器(spare autoencoder,SAE)。SAE通过向自动编码器中添加稀疏性限制的方法实现对数据特征的稀疏提取,可减少整个模型需要更新的参数数量,提高特征提取的效率,增强自动编码器的性能34。为了实现自动编码器隐藏层的稀疏性限制,SAE将在自动编码器的损失函数中添加一个惩罚 因子,通常选

21、取如下式所示的相对熵(|)LjK 作 为该惩罚因子:(1)(|)lg(1)lg(1)LjjjK(4)式中:为期望稀疏性参数;j为隐藏层神经元j的平均稀疏激活度。j的计算公式如下:11()ljjiiaxl(5)式中:ix为大坝渗流安全监测数据残差分量的第i(1,2,)il个训练样本;()jia x为输入为ix时隐 余红玲,等:大坝渗流安全监测数据异常检测的改进 DSAE 模型 131 藏层神经元j的激活值。在自动编码器的损失函数中添加稀疏性限制条件后,SAE的损失函数可表示为:SAEAE1(,)(,)(|)mLjjLx yLx yK(6)式中:SAE(,)Lx y为SAE的损失函数;AE(,)L

22、x y为 式(3)所示的自动编码器的损失函数;为稀疏性限制条件的权重系数;m为隐藏层神经元的数目。1.1.2 深度稀疏自编码器深度稀疏自编码器 稀疏自编码器属于浅层网络,难以提取数据的深层特征。针对该问题,通过建立深度稀疏自编码器(deep spare autoencoder,DSAE),以前一层稀疏自编码器的隐藏层输出作为后一层的输入,从而实现深层特征的提取,如图2所示。DSAE的训练分为预训练和微调两个阶段。在预训练过程中,由于DSAE属于深度神经网络模型,传统训练方法会导致出现“梯度消失”问题,故可采用逐层训练每个稀疏自编码器的方法30。预训练完成后,再采用BP算法对DSAE进行微调:首

23、先,根据正向传播过程,求出大坝渗流安全监测数据残差分量输入数据的重构数据;然后,根据误差反向传播过程,采用梯度下降算法对权值和偏置进行反向更新30,以进一步优化模型参数。图图 2 深度稀疏自编码器结构示意图深度稀疏自编码器结构示意图 Fig.2 Schematic of deep sparse autoencoder 1.2 改进的天鹰优化算法改进的天鹰优化算法 针对传统天鹰优化算法采用简单的随机方式对种群初始化,难以保证初始化种群分布的均匀性和多样性,且在开发阶段容易陷入局部最优的问题,基于混沌理论中的Tent混沌映射和非线性飞行速率更新策略对传统天鹰优化算法进行改进,进而提出改进的天鹰优化

24、(IAO)算法。Tent混沌映射是一个二维混沌映射,具有均匀的分布函数和良好的相关性。Tent混沌映射通过将传统的正态分布序列转换为混沌序列,能够增强种群间不同个体之间的联系,增加初始种群整体的随机性,从而提升算法前期的全局搜索能力。采用 Tent混沌映射生成混沌序列初始化天鹰位置,i jx的 过程如下:首先,由Tent混沌映射生成混沌序列:,1,12 0212(1)12i ji ji ji ji jxxxxx(7)式中:1,2,iN,N为种群中天鹰的总数;1,j 2,D,D为待优化超参数的维数;,i jx为0,1内 的随机值。然后,将式(7)中的混沌序列映射到解的搜索空间,得到混沌初始化种群

25、:new,1,1()i jji jjjxLBxUBLB(8)式中:jLB和jUB分别为第j维待优化参数取值的 下界和上界。天鹰优化算法的全局搜索能力较强,但其局部开发能力较弱,容易陷入局部最优解而导致寻优精度降低。虽然天鹰优化算法在开发阶段中引入了随机性较强的莱维(Levy)飞行策略,增强了算法跳出局部最优的能力,但是莱维飞行策略在迭代后期容易出现搜索距离过大而导致难以发现全局最优 位置的问题。天鹰飞行速率2G是天鹰优化算法在 缩小开发阶段中的一个重要参数,对于提高算法优 化性能具有重要意义。然而,天鹰飞行速率2G随 着迭代次数的增加而呈现线性下降的变化趋势。相关研究35-37表明,智能优化算

26、法中的非线性参数对于增强算法全局、局部搜索能力或提高收敛速度具有重要作用。因此,采用非线性飞行速率更新策略 对天鹰飞行速率2G进行改进,以弥补算法后期局 部搜索能力较弱而使群体陷入早熟的缺陷。改进后 的天鹰飞行速率可表示为2G,表达式如下:221sin2tGT(9)式中:t为当前迭代次数;T为最大迭代次数。如图3所示,随着迭代次数的增加,2G的变 化率随之减小,从而增强了天鹰优化算法的局部搜索能力。种群混沌初始化增强了天鹰优化算法的全局搜索能力,而非线性飞行速率更新策略又增强了天132 水力发电学报 鹰优化算法的局部搜索能力,因此将两者结合起来可以增强天鹰优化算法的整体寻优能力。(a)G2 (

27、b)G2 图图 3 G2和和 G2的迭代变化曲线的迭代变化曲线 Fig.3 Iterative curves of G2 and G2 2 基于逆向云的大坝渗流安全监测数据异常阈值确定方法基于逆向云的大坝渗流安全监测数据异常阈值确定方法 云模型是一种兼具模糊性和随机性的数学模型,通过云模型可以实现定性概念与定量数值间的 相互转化38。期望xE、熵nE和超熵eH是云模型的 三个基本数字特征。将大坝渗流安全监测数据残差 分量的重构误差作为云滴样本,则xE表示残差分量重构误差的均值;nE度量了xE的模糊性和随机 性,该值越大,残差分量重构误差分布的数值范围 就越大,即残差分量重构误差的离散程度越大;

28、eH表示nE的熵,用于描述云层的厚度39。逆向云发生器是云的一种生成算法,通过将一 定数量的精确数据转换为以云数字特征(,xnEE)eH表示的定性概念,实现定量数值到定性概念的 转换40。假设大坝渗流安全监测数据残差分量的重构 误差样本为(1,2,)ix in,则根据逆向云发生器生成云数字特征(,)xneEEH的数学表达式如下:11nxiiExn(10)112nnixiExEn(11)2222111ennixiHSESxEn(12)相关研究41通过计算云滴群对定性概念的贡 献度,发现区间3,3xnxnEEEE内的云滴对定 性概念的贡献度达到99.73%,而在该区间之外的云滴贡献率仅为0.27%

29、,可忽略不计。因此,本文 以3xnEE为界划分异常阈值,具体为:当大坝渗流安全监测数据残差分量重构值 3,3ixnxnyEEEE时,其对应的原始渗流安 全监测样本值为正常值。当大坝渗流安全监测数据残差分量重构值,3ixnyEE 或3,ixnyEE时,其对应 的原始渗流安全监测样本值为异常值。3 大坝渗流安全监测数据异常检测的改进大坝渗流安全监测数据异常检测的改进 DSAE 模型实现流程模型实现流程 所提大坝渗流安全监测数据异常检测模型的实现流程如图4所示。首先,为了有效消除监测数据中趋势性规律对异常检测的影响,采用奇异谱分析(SSA)方法对大坝渗流安全监测数据进行分解,提取其残差分量进行分析;

30、然后,采用DSAE对残差分量进行数据重构,并提出IAO算法,对DSAE的超参数进行优化,以提高残差分量的重构精度;进一步,引入云模型理论中的逆向云算法确定异常阈值,综合考虑监测数据的随机性和模糊性,从而提高异常检测结果的准确性和可靠性。4 案例研究案例研究 我国西南地区LD水电站的拦河大坝为黏土心墙堆石坝,坝顶高程1385.50 m,最大坝高79.5 m。在大坝的坝体、坝基、坝后及两岸布置了大量监测仪器,以便监控大坝的安全运行。本文选取该工程坝后渗流量及坝后长观孔6#水位的监测数据为研究对象,验证所提渗流安全监测数据异常检测模型的有效性。研究数据如图5所示,监测时段为2015年到2021年底,

31、测值频率为一周一次。从图5可以看出,在2015年初2021年底期间内,该土石坝上游水位除了在2018年1月3日2019年1月3日期间内水位有一个大幅度的下余红玲,等:大坝渗流安全监测数据异常检测的改进 DSAE 模型 133 降外,其余时间基本都保持一个相对平稳的状态;相比于上游水位,下游水位具有较为明显的周期性变化规律;坝后渗流量整体上呈现出较为明显的下降趋势;坝后长观孔水位的前期变化不稳定,在2021年1月3日后具有较为明显的下降趋势。通过与环境量(本案例中指上下游水位)和相邻部位同类型监测仪器的测值进行对比,可初步判定出渗流量和坝后长观孔水位的部分异常点,如图5中红圈所示。为进一步保证异

32、常检测结果的合理性和可靠性,本文采用所提渗流安全监测数据异常检测方法对渗流量和坝后长观孔水位的异常值进行检测和识别。图图 4 所提模型的流程所提模型的流程 Fig.4 Flowchart of the model presented in this study 图图 5 研究数据研究数据 Fig.5 Research data 4.1 渗流安全监测数据残差分量提取渗流安全监测数据残差分量提取 为了避免渗流安全监测数据中的趋势性变化规律对异常检测结果产生不利影响,采用奇异谱分析方法提取渗流量和长观孔水位的残差分量作为异常检测的数据基础,提取结果如图6所示。图图 6 残差分量提取结果残差分量提取结

33、果 Fig.6 Residual components extracted 4.2 残差分量重构和异常检测结果分析残差分量重构和异常检测结果分析 基于所提取的残差分量数据,采用所提基于IAO算法改进的DSAE对提取出的残差分量进行数据重构。其中,以残差分量前70%的数据作为训134 水力发电学报 练集,所有的数据作为测试集。为确定DSAE拟优化超参数的数量,首先需要确定隐含层层数。相关研究表明,适度增加深度网络模型的隐含层层数可有效提高重构精度,但随着层数的增加将导致计算复杂度的增加,也会明显降低网络的计算效率42。本文在综合考虑重构精度和计算效率的情况下,将隐含层层数设置为2层。因此,各监测

34、项目将有6个待优化的超参数,包括隐含层1和隐含层2的节点数、稀疏参数和稀疏参数。其中,隐含层1和隐含层2的节点数的取值范围设置为0,100间的整数,各隐含层的稀疏参数和稀疏参数的取值范围设置为0,1。在参数优化过程中,天鹰种群数量设置为20,最大迭代次数设置为50,适应度函数为最小化重构后数据与重构前数据的平均均方误差,超参数优化结果如表1所示。表表 1 参数优化结果参数优化结果 Table 1 Summary of parameters optimized 超参数 渗流量 长观孔水位 隐含层 1 的节点数 92 75 隐含层 2 的节点数 92 28 隐含层 1 的 0.2666 0.508

35、3 隐含层 1 的 0.6970 0.2673 隐含层 2 的 0.2722 0.2342 隐含层 2 的 0.3490 0.2028 渗流量和长观孔水位的残差分量重构完成后,采用逆向云算法对重构误差划分异常阈值,当重构误差超过异常阈值时,其对应的原始监测值则被识别为异常值。渗流量和长观孔水位的残差分量重构结果和异常检测结果如图7所示。(a)渗流量 (b)长观孔水位 图图 7 残差分量重构结果和异常检测结果残差分量重构结果和异常检测结果 Fig.7 Reconstructed residual components and their anomalies detected 从图7可以看出,本文

36、所提基于IAO-DSAE的残差分量重构值与残差分量原始值均较为接近,说明IAO-DSAE的重构精度较高。与图5中上游水位数据的变化趋势相比可发现,图7中所识别出的渗流量和长观孔水位的异常值均未出现在水位骤升骤降的地方,即表示这些异常值并非由水位骤升骤降产生的,而属于观测误差,后续可以进行剔除处理。4.3 对比分析与讨论对比分析与讨论 4.3.1 残差分量提取的必要性分析残差分量提取的必要性分析 为了验证本文采用奇异谱分析提取渗流安全监测数据残差分量的必要性,在不提取残差分量的情况下,直接对原始监测值进行异常检测,计算结果如图8所示。从图8可以看出,渗流量和长观孔水位的重构误差均在2021年后期

37、呈现较快的增长速度而超过异常阈值,则其对应的原始监测值均被识别为异常值,如图8中绿色圆圈部分所示。然而,通过观察渗流量和长观孔水位的原始监测值可知,这两个监测项目在2021年后期呈现出明显的下降趋势,绿色圆圈部分所示监测数据并非异常值。与图8相比,图7中是在剔除监测数据趋势性分量之后,基于提取的残差分量进行异常检测的结果,其结果较为客观合理。因此,保留原始监测数据的趋势性规律并不利于监测数据中异常值检测的实施,而采用奇异谱分析方法剔除原始监测数据中的趋势性分量,再对残差分量进行数据重构和异常阈值划分是很有必要的。余红玲,等:大坝渗流安全监测数据异常检测的改进 DSAE 模型 135 (a)渗流

38、量 (b)长观孔水位 图图 8 未提取残差分量情况下的异常检测结果未提取残差分量情况下的异常检测结果 Fig.8 Abnormal detection results without extracting residual components 4.3.2 不同阈值拟定方法对比不同阈值拟定方法对比 将所提基于逆向云的异常阈值拟定方法与基于传统3法的异常阈值拟定方法进行对比分析,如图9所示。(a)渗流量 (b)长观孔水位 图图 9 不同异常阈值拟定方法下的异常检测结果不同异常阈值拟定方法下的异常检测结果 Fig.9 Abnormal detection results by different

39、abnormal threshold formulation methods 从图9可以看出,当采用3法拟定异常阈值时,识别出的异常值均较少,存在较为明显的漏检问题。由于实测数据的异常值标签未知,但异常值对后续分析建模有影响,因此可用回归模型的预测效果量化异常值识别的有效性。本文将水位分量、温度分量和时效分量作为自变量,将渗流量和坝后长观孔水位分别作为因变量,基于最小二乘支持向量机(least squares support vector machine,LSSVM)建立回归预测模型。其中,LSSVM的训练集为异常检测后经过插值处理的前250个数据,测试集为剩余115个数据,超参数通过所提IA

40、O算法优化获得。将预测值与测试值的中位数绝对偏差(median absolute difference,MAD)、平均绝对误差(mean absolute error,MAE)和均方根误差(root mean squared error,RMSE)作为回归模型的预测性能指标。渗流量和长观孔水位的预测模型的预测性能指标计算结果如图10所示。从图10可以看出,相比于3法阈值,采用逆向云阈值检测后的监测数据建立的预测模型具有更低的MAD、MAE和RMSE值,模型预测精度更高。对于渗流量,基于逆向云阈值的预测模型在MAD、MAE和RMSE上分别提高了7.81%、7.08%和6.08%,平均提高幅度为6

41、.99%;对于长观孔水位,基于逆向云阈值的预测模型在MAD、MAE和RMSE上分别提高了0.39%、0.11%和0.14%,平均提高幅度为0.22%。因此,相比于3法,采用逆向云算法拟定异常阈值对渗流安全监测数据的异常检测效果较好。136 水力发电学报 (a)渗流量 (b)长观孔水位 图图 10 各预测模型的预测性能指标计算结果各预测模型的预测性能指标计算结果 Fig.10 Calculations of the prediction performance indicators by different prediction models 4.3.3 不同异常检测方法对比不同异常检测方法对比

42、 将基于逐步回归法的统计模型法与所提异常检测方法进行对比分析。其中,大坝渗流量和坝后长观孔水位统计模型的影响因子均包括水位分量、温度分量和时效分量等43,由此建立的统计模型如下:0uudd1 1121lnmiiiYaa Ha HbTdd(13)式中:Y为大坝渗流量,L/s,或坝后长观孔水位,m;uiH为前i天的平均上游水位,m,这里取i=1 7,8 14,15 21;dH为下游水位,m;1T为温度分量,可用正弦函数表示,取sin(2365)it、cos(2365)it(i=1,2),t为监测日至始测日累积天数;ln为时效分量,100t;uia、da、1b、1d、2d为各分量的回归系数,0a为一

43、常数。基于统计模型法的异常检测结果如图11所示。从图11可以看出,基于统计模型法的渗流安全监测数据异常检测效果不佳,仅能检测出少数异常值,且存在错检情况,如图中绿色圆圈处表示。此外,根据无异常检测的监测数据、基于统计模型法检测后插值处理的监测数据和基于所提方法异常检测后插值处理的监测数据分别建立渗流量和长观孔水位的预测模型,预测模型采用IAO算法优化的LSSVM,各预测模型的预测性能指标计算结果如图12所示。(a)渗流量 (b)长观孔水位 图图 11 基于统计模型法的异常值检测结果基于统计模型法的异常值检测结果 Fig.11 Abnormal detection results by stat

44、istical model method (a)渗流量 (b)长观孔水位 图图 12 基于不同异常检测方法所建预测模型的预测性能基于不同异常检测方法所建预测模型的预测性能 Fig.12 Performance of prediction models based on different anomaly detection methods 余红玲,等:大坝渗流安全监测数据异常检测的改进 DSAE 模型 137 从图12可以看出,相比于无异常检测情况和基于统计模型法的异常检测方法,基于所提异常检测方法处理后的监测数据建立的预测模型具有更低的MAD、MAE和RMSE值,模型预测精度更高。进一步计算

45、可得,相比于无异常检测情况和基于统计模型法的异常检测方法,基于所提异常检测方法处理后的监测数据建立的渗流量预测模型,其精度平均提高幅度分别为9.11%和5.56%;而对于长观孔水位而言,基于所提异常检测方法处理后的监测数据建立的预测模型,其精度平均提高幅度分别为1.18%和1.07%。因此,所提渗流安全监测数据异常检测方法较为合理和有效。5 结论结论 针对现有大坝渗流安全监测数据异常检测方法存在检测效率和精度较低的不足,以及在异常阈值拟定过程中大多未能综合考虑监测数据随机性和模糊性的问题,提出了大坝渗流安全监测数据异常检测的改进DSAE模型,并通过案例研究和对比分析,验证了所提方法的有效性。主

46、要结论如下:(1)采用基于IAO-DSAE的大坝渗流安全监测数据重构方法对大坝渗流安全监测数据的残差分量进行重构,实现了DSAE超参数的自适应获取,具有较高的数据重构精度。(2)所提基于逆向云的大坝渗流安全监测数据异常阈值确定方法,将逆向云算法中的期望和熵值分别替代传统3法中的均值和标准差,充分考虑了监测数据随机性和模糊性,拟定的异常阈值更加可靠。(3)对比分析表明,采用奇异谱分析方法提取大坝渗流安全监测数据中的残差分量具有必要性,有利于消除数据趋势性对异常检测的不良影响;相比于传统的3法,采用逆向云拟定的异常阈值更加可靠,根据逆向云阈值检测后的监测数据建立的预测模型,其预测精度的平均提高幅度

47、最高可达6.99%;此外,相比于无异常检测情况和基于统计模型法的异常检测方法,根据所提异常检测方法处理后的监测数据建立的预测模型,具有更高的预测精度,其预测精度的平均提高幅度最高分别可达9.11%和5.56%。参考文献(参考文献(References)1 蒋齐嘉,蒋中明,唐栋,等.基于 SSA-DBSCAN 的边坡安全监测数据粗差探测方法J.长江科学院院报,2022,39(4):85-90,98.JING Qijia,JING Zhongming,TANG Dong,et al.Gross error detection of slope safety monitoring data base

48、d on SSA-DBSCAN J.Journal of Yangtze River Scientific Research Institute,2022,39(4):85-90,98.(in Chinese)2 郑霞忠,陈国梁,邹韬.考虑时间序列关联的大坝监测异常数据清洗J.水力发电,2020,46(4):111-114,125.ZHENG Xiazhong,CHEN Guoliang,ZOU Tao.Cleaning of abnormal dam monitoring data considering time series association J.Water Power,2020,

49、46(4):111-114,125.(in Chinese)3 李啸啸,蒋敏,吴震宇,等.大坝安全监测数据粗差识别方法的比较与改进J.中国农村水利水电,2011(3):102-105,112.LI Xiaoxiao,JIANG Min,WU Zhenyu,et al.Comparison between the methods for outliers identifying from the dam safety monitoring data and the improvement of them J.China Rural Water and Hydropower,2011(3):102

50、-105,112.(in Chinese)4 张晓.基于聚类集成的大坝异常数据检测研究D.郑州:郑州大学,2021.ZHANG Xiao.Research on dam abnormal data detection based on clustering ensemble D.Zhengzhou:Zhengzhou University,2021.(in Chinese)5 SONG J,ZHANG S,TONG F,et al.Outlier detection based on multivariable panel data and K-Means clustering for dam

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服