收藏 分销(赏)

海上风电结构安全监测数据异常识别.pdf

上传人:自信****多点 文档编号:626772 上传时间:2024-01-18 格式:PDF 页数:4 大小:3.49MB
下载 相关 举报
海上风电结构安全监测数据异常识别.pdf_第1页
第1页 / 共4页
海上风电结构安全监测数据异常识别.pdf_第2页
第2页 / 共4页
海上风电结构安全监测数据异常识别.pdf_第3页
第3页 / 共4页
亲,该文档总共4页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、 年第 期 水电与新能源 第 卷.:././.收稿日期:作者简介:杨万伦男工程师主要从事结构安全监测设计及数据分析工作海上风电结构安全监测数据异常识别杨万伦彭 潜李逸聪(上海勘测设计研究院有限公司上海)摘要:海上风电结构安全监测数据的可靠性和完整性是分析海上建筑物结构安全评估其运行状态的基础也是开发预警模型的前提 对原始监测数据进行异常值识别和过滤提高数据有效性具有重要的意义 通过比较 种基于距离和密度的算法在监测数据异常识别中的准确率和误差发现 聚类算法在识别海上风电结构安全监测数据的异常值中表现更优 剔除异常值后的监测数据质量较好既能反映正常观测期间的变化规律也可为后续开发预警模型提供数据

2、支撑关键词:海上风电监测数据异常识别聚类算法中图分类号:文献标志码:文章编号:()(.):.:我国海上风能资源丰富自上海东海大桥海上风电场建成以来江苏、浙江、福建、广东等地区已建成或在建诸多风电场 针对海上风电投资成本大施工难度高维护条件差等特点海上风电场的运行安全得到极大重视为了解其整个生命周期的安全性和稳定性同时降低运维成本在线安全监测技术显得尤为重要 目前海上风电场对于支撑结构的安全监测主要包括不均匀沉降、土压力、应力应变、倾斜振动等观测其观测数据采集频次较高且易受电压、船舶撞击等瞬时因素影响出现异常值的概率较大 随着时间的延长监测自动化数据不断累积如何从大数据中提取出有效、可靠的数据成

3、为了风电场运维的难点 可见对海上风电场运行观测数据中异常值的识别和剔除的研究具有十分重要的意义为海上风电场运行期监测开发预警模型提供可靠支撑目前常用的异常值识别方法有基于距离和密度的方法和基于模型的方法 被广泛应用于大数据的异常值检测 本文通过基于距离的算法拉依达准则与聚类算法 的对比分析探讨基于距离、密度的方法在海上风电结构安全监测数据异常识别中的优劣得到可靠的算法模型有效进行海上风电结构安全监测数据清洗为后续开发预警模型做铺垫杨万伦等:海上风电结构安全监测数据异常识别 年 月 拉依达算法拉依达准则是基于距离的异常值识别方法先假设一组数据独立且连续按一定计算方法确定一个区间认为凡超过这个区间

4、的误差就不属于随机误差而是粗大误差含有该误差的数据应予以剔除 主要步骤如下各步骤流程见图)假设进行等精度测量独立得到连续时间序列测值 为沉降数据)计算采样数据的算术平均值 并按贝塞尔公式计算出标准偏差:()/()对采样集进行识别若采集数据中某个测量值 的剩余误差()满足:则认为 为异常值应予剔除图 拉依达算法流程 四分位数算法四分位数算法是基于距离的异常值识别方法 主要步骤如下:)四分位数是把所有沉降数据由小到大排列并等分成四等份)处于三个分割点位置的数值其中 位置上的值 为下四分位数 位置上的值 为中四分位数位置上的值 上四分位数)四分位距 .()区间 为正常值区间之外为异常值各步骤流程见图

5、 聚类算法 算法是基于密度的算法首先确定两个参 数:、为定义密度的邻域半径图 四分位数算法流程 为定义核心点时的邻域至少包含的点的个数即阈值 将数据点分为 类:核心点:一个对象在其半径 内含有点数量大于 则该对象为核心点边界点:一个对象在其半径 内含有点数量小于但该对象落在核心点的邻域内则该对象为边界点噪音点:一个对象既不是核心点也不是边界点则该对象为噪音点 核心点对应稠密区域内部点边界点对应稠密区域边缘的点而噪音点对应稀疏区域中的点 算法处理流程如下:)从数据集中任意选取一个数据对象点)如果对于参数 和 为核心点则找出所有从 密度可达的数据点形成一个簇)如果 为边缘点选取另一个数据为对象点)

6、重复)、)步直到所有点被处理各步骤流程见图 图 算法流程 实例分析为探讨三种方法的优劣以某海上风电场海上升压站不均匀沉降监测数据为例进行分析 选取同一高水 电 与 新 能 源 年第 期程 个静力水准仪的采集数据作为样本数据共 个样本数据分别为 、观测时间为 年 月 年 月每个样本集共 个数据 原始数据如图、图 所示图 样本集图 样本集 通过 个样本数据对比可知不均匀沉降数据呈锯齿状波动变化幅度不大 在 年 月中旬左右 个样本数据全部出现异常现象分析原因可能是在数据的采集过程中受电压等外界因素干扰导致传感器采集数据异常结合该海上升压站同一高程人工不均匀沉降的测值综合分析 个样本集特征假定样本集

7、沉降值小于.时的数据为异常数据共 个异常数据 假定数据样本集 沉降值小于 .时的数据为异常数据共 个异常数据分别用 种算法对测点 、进行异常识别 种算法识别效果见图 图 图 中()、()、()三幅子图为分别利用拉依达算法四分位数算法和 聚类算法对测点 数据集进行异常识别的结果图 中为利用三种算法对测点 数据集记性异常识别的结果详细数据分析统计结果见表 可以看出拉依达算法虽误差低但识别率明显低于其它 种算法仅为 左右 四分位数算法与 聚类算法的异常值识别率均超过 但四分位数算法的误差较大 综合考虑识别率及误差 个因素可以得到基于密度的异常识别算法 的精度和可靠性最高识别后的样本集可明显排除异常值

8、的干扰能更准确地表现出观测期间的沉降变化规律目前该算法已成功应用于大丰、东台等多个海上风电安全监测数据分析中既有效避免人为因素的影响又提高了数据清洗效率满足了工程实际应用需求 结 语以某海上升压站不均匀沉降自动化数据为例对比拉依达算法、四分位数算法、聚类算法识别海上风电结构安全监测数据异常值的能力可知:)基于密度的 聚类算法识别率高、误差小精度和可靠性能够满足海上风电结构安全监测数据异常值识别)剔除异常值后的数据质量较好且海上风电自动化监测数据采集频率较高剔除异常值后剩余数据亦能反映出正常观测期间变化规律可为后续开发预警模型提供数据支撑杨万伦等:海上风电结构安全监测数据异常识别 年 月图 样本集 异常识别结果图 样本集 异常识别结果表 各算法识别结果统计样本异常值识别方法识别异常数识别出真实异常数错误识别数识别率/误差/拉依达算法.四分位数算法.聚类算法.拉依达算法.四分位数算法.聚类算法.参考文献:韩宁宁.海上风电施工方案及难点问题探讨.工程经济 ():张海龙 范振东 陈敏.孤立森林算法在大坝监测数据异常识别中的应用.人民黄河 ():孙梅玉.基于距离和密度的时间序列异常检测方法研究.计算机工程与应用 ():.():李丽敏 温宗周 王真 等.基于自学习 和 的地下水位异常值检测和平滑处理方法.西安工程大学学报 ():

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服