收藏 分销(赏)

基于随机森林算法的环焊缝质量不合格性分析预测.pdf

上传人:自信****多点 文档编号:649911 上传时间:2024-01-23 格式:PDF 页数:5 大小:2.99MB
下载 相关 举报
基于随机森林算法的环焊缝质量不合格性分析预测.pdf_第1页
第1页 / 共5页
基于随机森林算法的环焊缝质量不合格性分析预测.pdf_第2页
第2页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、五油管材与仪器 64PETROLEUM TUBULAR GOODS&INSTRUMENTS2023年10 月完整性技术基于随机森林算法的环焊缝质量不合格性分析预测*刘亮12,李娟,贺建建,杨新超,吴张中,戴联双4,李海润,孟祥海(1.国家管网集团工程技术创新有限公司天津30 0 450;2.南京大学计算机科学与技术系江苏南京2 10 0 33;3.国家管网集团科学技术研究总院分公司河北廊坊0 6 50 0 0;4.国家管网集团生产部北京10 0 0 97)摘要:油气长输管道环焊缝一直以来是管道的薄弱环节,容易发生失效。根据环焊缝开挖数据,对大量环焊缝相关数据进行了预处理,并采用机器学习中的随机

2、森林方法对主要因素进行了分析,建立了环焊缝质量不合格性预测模型,并通过不同算法模型进行了验证。结果表明,构建的模型可以实现环焊缝质量不合格预测。对环焊缝的数据分析和机器学习模型的构建,可以提高环焊缝开挖准确率,节省开挖费用,为后续开挖和修复工作提供技术支持。关键词:环焊缝;随机森林算法;机器学习;数据资产;智能管道中图法分类号:TE973D0I:10.19459/ki.61-1500/te.2023.05.013Analysis and Prediction of Girth Weld Defects Based onLIU Liang,LI Juan,HE Jian,YANG Xinchao

3、,WU Zhangzhong,DAI Lianshuang,LI Hairun,MENG Xianghai(1.PipeChina Engineering Technology Innovation Co.Ltd.,Tianjin 300450,China;2.Nanjing University Department of Computer Science and Technology,Nanjing,Jiangsu 210033,China;3.PipeChina Research Institute,Langfang,Hebei 065000,China;4.PipeChina Prod

4、uction Department,Beijing 100097,China)Abstract:Girth weld of long-distance oil and gas pipeline has always been the weak link of the pipeline and is easy to fail.According to thegirth weld excavation data,this paper preprocesses a large number of girth weld related data,analyzes the main factors by

5、 using random for-est algorithm,constructs the unqualified girth weld quality prediction model,and verifies the model through different algorithm models.Theresults show that the model can predict the unqualified girth weld quality.Through the data analysis of girth weld and the construction of ma-ch

6、ine learning model,the accuracy of girth weld excavation can be improved,the cost of excavation can be saved,and the technical supportcan be provided for the subsequent excavation and repair work.Key words:girth weld;random forest algorithm;machine learning;data asset;intelligent pipeline0引言由于建设时期技术

7、水平限制和现场焊接施工质量控制等问题,环焊缝一直是管道最薄弱的环节,加之容易受土体移动等附加载荷的影响,环焊缝开裂事故时有发生。近年来,随着管道行业的大发展,大量新建管道建设投产。虽然新建管道普遍采用高强钢焊接工艺,管道的制管和施工质量相比2 0 世纪7 0 年代的老管道有了文献标识码:ARandom Forest Algorithm文章编号:2 0 9 6-0 0 7 7(2 0 2 3)0 5-0 0 6 4-0 4很大提升,但部分管道存在冬季施工中未按照工艺要求进行管体预热和保温以及强力组对等问题,导致环焊缝焊接缺陷问题的凸显,影响管道安全运行。目前X80高强钢的使用,也对环焊缝的研究提

8、出了更高的要求。目前部分学者对管道环焊缝开展了研究,帅健等对高钢级管道环焊缝主要特征及安全性评价开展了研究。隋永莉对高钢级环焊缝的焊接工艺进行了探讨?2 。沙胜义等在高钢级管道环焊缝安全评价方面开初投稿收稿日期2 0 2 2-0 4-0 5;修改稿收稿日期:2 0 2 3-0 4-0 4*基金项目:国家管网北方管道有限责任公司科技研究项目“基于内检测的管道环焊缝综合评价与修复技术研究”(编号:2 0 190 30 1)第一作者简介:刘亮,男,198 2 年生,高级工程师,2 0 0 9年毕业于北京师范大学自然资源专业地理信息系统方向,现从事管道工程设计和完整性管理方向的研究工作。E-mail:

9、l i u l i a n g p i p e c h i n a.c o m.c n2023年第9 卷第5期展了相关研究,对环焊缝的低强匹配、断裂韧性、冲击功分散性等问题进行了探讨3。陈一诺等主要基于内检测数据对管体的缺陷情况进行了研究4。杨锋平等对油气管道环焊缝失效案例进行了收集和分析,并通过全尺寸试验研究了影响环焊缝性能的主要因素5。其他学者利用随机森林等其他机器学习方法开展了数据分析研究,吴孝情等利用随机森林算法开发了滑坡危险性评价模型6 。国外对环焊缝缺陷分析预测方面的内容较少,国内学者主要对管体的缺陷进行了分析,未基于大数据对环焊缝缺陷进行预测分析,所采集的数据也不够全面。基于此,

10、本文收集分析了4万余道环焊缝质量排查过程中的管道基础数据、建设期施工数据、检测数据、开挖基本信息、适用性评价数据和修复数据,构建了环焊缝缺陷不合格性预测分析模型,为有效指导环焊缝排查工作,提升环焊缝开挖准确度和有效性提供技术支持。1随机森林算法简介随机森林算法于2 0 0 1年由Breiman提出,是以决策树为基础的一种更高级的算法,像决策树一样,随机森林既可以用于回归也可以用于分类。随机森林从本质上属于机器学习中的集成学习,即通过建立模型组合来解决单一预测的问题。随机森林采用Bootstrap抽样技术从全部数据集中抽取N个训练集,每个训练集的大小约为数据集的2/3;然后依据抽取的数据为每个训

11、练集建立决策树,生成由n棵决策树组成的森林。决策树生长过程中,从全部M个特征中随机选取m个特征(mM),在m个特征中根据Gini系数最小原则选出最优属性进行节点分支;最后由n棵决策树根据预测结果采用投票的方式决定预测样本的类别。为了灵活控制所输人文件的内容和格式,便于优化算法所需的参数,以及后续其他方法的接人,本文采用python语言进行模型的开发。2环焊缝缺陷影响因素分析为了保证管道的安全,相关管道企业开展了油气管道环焊缝缺陷排查与治理工作,也有相关专家学者对环焊缝缺陷的影响因素及治理措施开展了研究7-9。环焊缝缺陷的影响因素众多,包括焊接施工因素,以及管体材料因素、管道特征因素等10-14

12、,通过采集相关因素的数据,采用聚类、分类等数据预处理方法进行处理15-18 ,然后可以通过机器学习方法对因素进行综合分析,选出影响环焊缝质量的主要影响因素。刘亮等:基于随机森林算法的环焊缝质量不合格性分析预测2.1楼数据采集为保证研究结果的准确性,需要对与环焊缝相关的数据进行广泛的采集,避免以偏概全。采集的数据主要包括管材数据、焊接数据、内检测数据、无损检测数据、开挖数据、地理环境数据、气象数据等。前期通过数据对齐,对环焊缝的基础数据进行了收集,在后续的开挖检测过程中,通过多种方式对其他数据进行了采集和补充。2.2楼数据预处理由于数据阈值定义的不规范性、人为填报的多样性,会导致数据不完整,含有

13、大量的噪声数据,因此需要对缺失值、异常值、逻辑错误值、非标准化值进行处理。对采集的环焊缝相关数据进行分析,大部分为分类数据,在输人模型之前,需要对数据进行规范化处理。环焊缝相关数据专业化程度高、复杂性也高,而且分析结果对精度、可靠性要求高,因此需要掌握焊接、无损检测、材料、内检测、数据分析等多种专业知识,才能较好地完成数据预处理工作,在后续的数据分析中才能得到符合或超越人们以往已有知识的认知,才能创造价值。针对施工日期数据进行拆分处理,施工日期一般为年月日,为了便于分析气温等因素对环焊缝缺陷的影响,将施工日期抽取为年份和月份,如2 0 10 12 0 8 可以分为2 0 10 年和12 月份两

14、类数据。针对地形、壁厚等缺失值,由于相邻区域的地形地貌是相似的,采用最近邻方法进行补充;由于同一段钢管或相邻钢管壁厚基本是一致的,因此采用最近邻方法进行补充,如10 16 mm直径的管道,壁厚一般为17.5mm。对采集的环焊缝相关数据进行分析,大部分为分类数据,在输人机器学习模型之前,需要对数据进行处理。为了保证数据可适用于回归,分类,聚类等多种模型,因此对数据进行one-hot编码,通过编码将离散特征映射到欧式空间,便于进行特征之间距离的计算或相似度的计算。表1以焊接方式为例,进行one-hot 编码。表1焊接方式编码内容手工焊手工焊1半自动焊0全自动焊0经过对环焊缝开挖样本数据分析,发现开

15、挖结果为不合格的焊口为少数,也即正样本数量较少,正负比例相差较大,分类不平衡。为保证模型的准确性,提高对少数样本的分类性能,本文采用过采样的方式对数据进行处理。65半自动焊全自动焊01001662.3模型构建本文依据环焊缝影响因素与数据特征,通过卡方检验方法,计算主要数据特征与结果的相关性,见表2。表2 特征相关性序号因素1施工月份2复评等级3下游管节长度4壁厚5施工单位6地形7是否变壁厚8角度9焊口类型由表2 可知,施工月份所占权重较高,这是由于现场施工情况复杂,在以前的施工条件下,不能稳定地保持五油管材与仪器焊接的温度、湿度等指标,因此容易产生焊接缺陷。射线底片复评等级同样有较高的权重,射

16、线检测质量符合要求则可以较为准确地反映环焊缝的缺陷情况,一般、I V级的底片,环焊缝不合格的情况较多。管节长度的影响主要是一般存在短节的地方组装应力较大,焊接权重0.1870.1340.1090.0880.0640.0800.0480.037 70.025焊接因素焊接方式焊接类型2023年10 月效果不太理想,而且后续由于应力的持续作用,会使缺陷扩展。为保障模型的准确性,因此选用以上主要影响因素进行分析。为构建环焊缝合格性预测模型,将样本数据随机分为两组:7 0%用于训练模型和30%用于验证模型精度。在构建模型中,选取主要的随机森林参数有:决策树的数目、树的最大深度以及节点变量数。为优化模型参

17、数,通过网格搜索法设置一定的值与步长,遍历所有组合情况根据模型精度寻找最佳参数。最后得到的最优参数为:决策树的数目30 0、树的最大深度10、节点变量数2。模型构建过程如图1所示。施工因素环境因素施工单位地形检测单位气候训练样本少数类样本立合成少数类样本立过采样后样本多数类样本训练样本集训练集1袋外样本1决策树12.4林模型验证与比较为保证模型的实用性,需要对模型的泛化能力进行判断,针对分类模型通常采用ROC-AUC作为评价指标。ROC 曲线全称为受试者工作特征曲线(receiver op-erating characteristic curve),是根据一系列不同的二分类训练集2袋外样本2决

18、策树2测试样本集加权投票图1模型构建过程方式(分界值或决定阈值),以真阳性率(敏感性)为纵坐标,假阳性率(1特异性)为横坐标绘制的曲线。AUC(A r e a U n d e r Cu r v e)被定义为ROC曲线下的面积。因为本文主要研究环焊缝是否合格,为二分类问题,因此测试集中对模型进行内部验证,得到随机森林、训练集几袋外样本n决策树n2023年第9 卷第5期决策树的AUC,如图2 所示。随机森林的AUC值为0.99,模型泛化能力较好。1.00.80.60.40.20.00.0图2 模型受试者工作特征曲线下面积为了对模型的性能进行验证,开展了不同机器学习模型预测性能比较,将最近邻模型、支

19、持向量机、决策树、朴素贝叶斯、随机森林模型在测试集中进行内部验证,结果见表3。表3不同模型比较序号模型名称1最近邻模型2支持向量机3决策树4朴素贝叶斯5随机森林表3中,随机森林模型的准确率为8 9.1%,准确率最高,表明构建的随机森林模型性能最优。2.5模型预测本文选择某管道特定环焊缝缺陷开展了预测,选取的参数见表4。表4某环焊缝预测特征参数名称参数内容是否变壁厚口否焊口类型连头口焊接类型半自动焊年份2011月份11施工单位*二建施工机组长未知钢级X70前文建立的预测模型为二分类模型,当预测结果大于50%时认为环焊缝质量为不合格,当预测结果小于50%时认为环焊缝质量为合格。基于所建立的模型,以

20、某条管道的某个环焊缝为例,采集该环焊缝相关的数据,录入模型所需参数,通过模型计算,预测结果为68%,因此认为该环焊缝质量为不合格,经现场实际开挖验证,该环焊缝射线检测为IV级,结果为不合格,与模型的预测结果一致,该环焊缝为质量不合格焊口,需进刘亮等:基于随机森林算法的环焊缝质量不合格性分析预测行修复。由模型分析结果及统计数据可知,其中施工月份、焊口类型、管道壁厚、施工单位、缺陷时钟方位会对环焊缝的不合格有较为显著的影响,后续进一步完善管道应力及开挖数据,通过数据治理可以进一步提高预测准确率。将模型与环焊缝相关信息平台集成,可以实现对单道或者多道环焊缝缺陷不合格性的预测。3结束语随机森林算法(A

21、UC=0.99)决策树算法(AUC=0.87)0.20.40.60.8假正例率参数名称内检测异常严重程度弯头弯管角度下游管节类型下游管节长度管径壁厚监理单位缺陷时钟方位67本文通过对实际长输油气管道环焊缝开挖数据进1.0行处理、分析,运用随机森林模型对环焊缝缺陷影响因素进行了重要性分析,并开展了预测研究,在实际的开挖工作中进行了相关验证。主要得出以下结论。1)由于人为原因或认知不全面,会导致数据采集结果的多样性,需要结合专业知识进行数据预处理。因为影响环焊缝缺陷的因素众多,且有部分关键影响因素不易收集,模型可能存在一定的误差,需要持续优化。2)通过对环焊缝影响因素进行建模分析,可以得出准确率随

22、机森林算法预测准确率较高,具有良好的适用性。针0.877对特定环焊缝缺陷的预测及开挖验证,可以进一步验证0.878模型,并为后续模型优化提供参考。0.707总之,大量的环焊缝开挖数据是一笔宝贵的数据资0.864产,通过业务知识、经验与数学方法的结合可以分析出0.891用于指导实际工作的规律。在后续的工作中,需要科研与业务人员进一步分析环焊缝的机理模型,进一步完善影响因素,同时各管道企业应提高数据自动化采集的水平,避免关键数据缺失,为相关研究奠定基础,为智慧管网的建设提供支撑。参考文献1帅健,王旭,张银辉,等.高钢级管道环焊缝主要特征及安参数内容全性评价J.油气储运,2 0 2 0,39(6):

23、6 2 3-6 31.严重2隋永莉,王鹏宇.中俄东线天然气管道黑河一长岭段环焊0缝焊接工艺J.油气储运,2 0 2 0,39(9):9 6 1-9 7 0.直管3沙胜义,冯庆善,燕冰川,等.高钢级管道环焊缝安全评价11研究进展J/0L.油气储运:1-6.(2 0 2 0-0 5-0 7)2 0 2 3711-07-01.http:/ 0 18,37(9):9 7 5-9 7 9.5杨锋平,程飞,张鸿博,等.油气管道环焊缝失效案例与全尺寸试验分析J.石油管材与仪器,2 0 2 2,8(4):8 0-8 4.6吴孝情,赖成光,陈晓宏,等.基于随机森林权重的滑坡危险性评价:以东江流域为例J.自然灾害

24、学报,2 0 17,2 6(5):119-129.7洗国栋,吕游.油气管道环焊缝缺陷排查及处置措施研究J.石油管材与仪器,2 0 2 0,6(2):42-45.(下转第7 3 页)2023年第9 卷第5期率为0.0 51,随着服役时间的增长,失效概率逐渐增大,但在第5年后,由于产气量下降和工作制度等的改变,导致部分根节点失效概率减小,井筒完整性失效概率增大的幅度减缓。生产中,应当加强对腐蚀、环空带压和压裂施工等因素的监管,以实现气井安全、经济生产。3)由于本文中基于故障树贝叶斯模型的失效概率评价方法计算精度较大程度取决于根节点的失效概率,在实际应用过程中,需要可靠的现场数据做支撑,并结合专家经

25、验进一步提高评价结果与现场实际的相符性。参考文献1周长所,耿亚楠,雷杨,等.渤中19-6 复杂断块构造地应力分布规律试验研究J.石油化工应用,2 0 2 0,39(1):8 4-8 9.2 LOIZZO M,LECAMPION B,MOGILEVSKAYA S.The role ofgeological barriers in achieving robust well integrityJ.Ener-gy Procedia,2017,114:5193 5205.3 KIRAN R,TEODORIU C,DADMOHAMMADI Y,et al.Iden-tification and eval

26、uation of well integrity and causes of failureof well integrity barriers(a review)J.Journal of NaturalGas Science and Engineering,2017,45:511-526.4周松民,李军伟,李瑾,等.基于权重分析法的海洋弃置井井筒完整性评价方法建立J.钻采工艺,2 0 19,42(2):10-13.5张智,杨昆,刘和兴,等注水井井筒完整性设计方法J.石油钻采工艺,2 0 2 0,42(1):7 6-8 5.6时维才,姚峰,金勇,等.二氧化碳驱注采井管柱失效原因分析及防护对策J

27、.石油管材与仪器,2 0 2 1,7(6):7 4-7 8.7 YOUSUF N,OLAYIWOLA O,GUO B Y,et al.A comprehen-sive review on the loss of wellbore integrity due to cement fail-ure and available remedial methods J.Journal of PetroleumScience and Engineering,2021,207:109123.8李新宏,朱红卫,陈国明,等.海底油气管道泄漏事故风险+“侯冠中等:某海上气田井筒完整性失效概率计算分析的贝叶斯动态模

28、型J.中国安全科学学报,2 0 15,2 5(4):75 80.9张智,赵苑瑾,吴优,等.页岩气井井下安全阀完整性研究J.石油管材与仪器,2 0 2 0,6(4):56-6 2.10袁晓兵,陈国明,范红艳,等.基于贝叶斯网络的水下采油树系统剩余寿命预测J.中国海上油气,2 0 2 0,32(4):171-178.11李中,吴建树,闫伟,等.基于贝叶斯网络的深水探井井筒完整性失效风险评估J.中国海上油气,2 0 2 0,32(5):120-128.12刘毅播,闫怡飞,宋运存,等.储气库套管柱环空压力影响因素动态评价J.石油管材与仪器,2 0 2 2,8(5):51-56.13 NORSOK.We

29、ll integrity in drilling and well operations:NORSOK D-010:2021 S.No r w a y:No r s k So k k e lsKonkuranseposisjon,2021.14张绍槐.井筒完整性的定义、功能、应用及进展J.石油钻采工艺,2 0 18,40(1):1-8.15韦红术,闫晴,曹波波,等.基于FTA定性的简易水下井口设计可靠性分析J.石油矿场机械,2 0 2 2,51(2):8-14.16 FORD E P,MOEINIKIA F,LOHNE H P,et al.Leakage cal-culator for plu

30、gged and abandoned wells C /SPE BergenOne Day Seminar,Bergen,Norway:SPE,2017:SPE-185890-MS.17骆正山,赵乐新,王小完.基于动态贝叶斯网络的海底管道点蚀疲劳损伤失效模型研究J.表面技术,2 0 2 0,49(1):269-275.18王海朋,段富海.复杂不确定系统可靠性分析的贝叶斯网络方法J.兵工学报,2 0 2 0,41(1):17 1-18 2.19陈坤,陈序,魏鑫,等.基于贝叶斯网络的页岩气井喷风险分析J.安全与环境学报,2 0 19,19(6):18 7 6-18 8 3.(编辑:屈忆欣).73(

31、上接第 6 7 页)8戴联双,考青鹏,杨辉,等.高强度钢管道环焊缝隐患治理措施研究J.石油管材与仪器,2 0 2 0,6(2):32-37.9帅健,张银辉.高钢级管道环焊缝的应变集中特性研究J.石油管材与仪器,2 0 2 0,6(2):8-14.10】沙胜义.输油管道环焊缝缺陷疲劳寿命评估J.管道技术与设备,2 0 17(2):2 8-32.11任俊杰,马卫锋,惠文颖,等.高钢级管道环焊缝断裂行为研究现状及探讨J.石油工程建设,2 0 19,45(1):1-5.12】杨锋平,许彦,曹国飞,等.X80管线钢环焊缝力学性能及缺陷成因分析J.压力容器,2 0 2 0,37(1):6 8-7 3.13

32、】包志刚,马夜,李超,等.焊材匹配对低温弯管焊缝组织和低温冲击韧性的影响J.焊管,2 0 2 0,43(12):7-11.14张振永.高钢级大口径天然气管道环焊缝安全提升设计关键J.油气储运,2 0 2 0,39(7):7 40-7 48.15苏怀,张劲军.天然气管网大数据分析方法及发展建议J.油气储运,2 0 2 0,39(10):10 8 1-10 9 5.16于听雷,张学珍,郑景云.中亚地区过去2 0 0 0 年气候变化研究的数据挖掘J.第四纪研究,2 0 2 1,41(2):56 4-57 8.17 SONG T M,SONG J.Prediction of risk factors of cyberbul-lying-related words in Korea:application of data mining u-sing social big data J.Telematics and Informatics,2021,58:101524.18 HE B,YIN L J.Prediction modelling of cold chain logisticsdemand based on data mining algorithm J.MathematicalProblems in Engineering,2021,2021:3421478.(编辑:姜婷)

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服