1、第30卷 第5期 2023年10月 Vol.30 No.5 Oct.,2023 收稿日期:2023-06-27 改回日期:2023-08-17 作者简介:刘国荣(1978),男,工程师,主要从事油田地面工艺、天然气的集输与处理。E-mail: 62 世界石油工业World Petroleum IndustryE 能源工程Energy Engineering文章编号:1006-0030(2023)05-0062-007 DOI:10.20114/j.issn.1006-0030.20230627001 基于两轮内检测数据挖掘的管道完整性评价技术 刘国荣(中国石油华北油田分公司第四采油厂,河北 廊
2、坊 065000)摘要:随着智慧油田和智慧管道的发展,深入整合和挖掘管道基础数据已成为大势所趋。针对两轮内检测数据对齐和剩余寿命计算中存在的问题,利用Kullback-Leibler(KL)散度实现分段管节各项分布特征的对齐,基于误差来源和正态分布,利用非活性缺陷点的特征,对内检测中存在的系统误差进行消除,选择90%分位数的腐蚀速率作为预测剩余寿命的基础,得到差异化的全线腐蚀速率,通过实例分析制定更加合理的维护响应计划,形成一套基于数据挖掘的管道完整性评价技术。结果表明,通过KL散度的数据对齐后,阀门、三通和绝缘接头的对齐比例为100%,其余特征的对齐比例均在90%以上;误差消除后,两轮内检测
3、的非活性缺陷深度差值服从均值为0,标准差一定的正态分布;通过开挖验证证实方法的维修点大部分实际腐蚀深度大于30%,属于计划响应的范围,其余方法增加了不必要的维修点。研究结果可为管道完整性管理水平的提升提供实际参考。关键词:管道完整性;内检测;数据挖掘;数据对齐;正态分布;管道检测 中图分类号:TE973.6 文献标识码:A Pipeline integrity evaluation technology based on two-round internal detection data mining LIU Guorong(No.4 Oil Production Plant of Petro
4、China Huabei Oilfield Company,Langfang,Hebei 065000,China)Abstract:With the development of smart oil fields and smart pipelines,it has become a general trend to integrate and dig the basic data of pipelines.In view of the problems existing in the alignment of the data and the calculation of the rema
5、ining life of the two rounds of internal detection,the Kullback-Leibler(KL)divergence was used to realize the alignment of the distribution features of the subsection pipe section.Based on the source of error and the normal distribution,the characteristics of inactive defect points were used to elim
6、inate the systematic errors existing in the internal detection.The corrosion rate of 90%quantile was selected as the basis for predicting the remaining life.Through case analysis,a more reasonable maintenance response plan was developed,and a set of pipeline integrity evaluation technology based on
7、data mining was formed.The results show that the alignment ratio of valve,tee and insulation joint is 100%after the alignment of KL divergence data,and the alignment ratio of other features is above 90%.After the error is eliminated,the difference of the depth of inactive defects in the two rounds f
8、ollows a normal distribution with a mean value of zero and a certain standard deviation.It is verified by excavation that the actual corro-sion depth of most maintenance points of the proposed method is greater than 30%,which belongs to the range of planned re-sponse.The other methods add unnecessar
9、y maintenance points.The research results can provide practical reference for the im-provement of pipeline integrity management level.Keywords:pipeline integrity;internal detection;data mining;data alignment;normal distribution;pipeline inspection随着油气资源的不断开发和社会经济的飞速发展,中国油气管道逐渐形成横贯东西、纵跨南北、覆盖海外的“一张网”格
10、局12。在管道运行的过程中,腐蚀缺陷是制约管道完整性管理水平的重要因素,11.22中石化东黄输油管道爆炸、6.10中缅天然气管道泄露等事故造成大量的人员伤亡和财产损失34,直接原因均与部分区域的腐蚀减薄和应力集中有关。因此,科学掌握管道腐蚀趋势和风险水平,制定合理的检验时间和维修策略显得尤为重要。第30卷 第5期 2023年10月 刘国荣:基于两轮内检测数据挖掘的管道完整性评价技术 63 对于管道完整性评价的流程和方法,GB/T 420332022油气管道完整性评价技术规范、GB321672015 油气输送管道完整性管理规范 均推荐优先选内检测数据的适应性评价方法。规范中对于如何进行数据对齐和
11、数据清洗只给出了一般性的规定,没有具体的实施方法和指导意见,虽然诸多学者从现状分析、参数对比、里程误差分析、对比方法总结等方面进行了研究58,但现场仍以人工对齐和复核为主,尚未提出一种高效的数据自动对齐算法,导致对齐效率差、误差率高;对于剩余寿命和再检测时间的计算通常以所有检测点中的最大腐蚀速率为基础,这就导致了很多实施开挖的计划检 修 点 远 没 有 达 到 应 检 修 的 时 机。考 虑 到Kullback-Leibler(KL)散度可用于衡量2个概率分布之间的距离,目前已被广泛用于测井数据识别9、天然气管道泄露识别10等领域,其本质就是对比2类数据间的相似性。因此,当两轮内检测对应数据特
12、征的KL散度最小时,即可认为内检测数据得到了对齐。本文利用KL散度实现两轮内检测的数据对齐,通过正态分布对内检测的数据误差进行统计和分析,得到管道腐蚀速率和剩余寿命的概率分布情况,进而制定更加合理的沿线不同腐蚀区域的维护响应计划。1 管道基本情况 某原油管道全长43.5 km,管径D219 mm8 mm,输送量110104 t/a。管道投产于2012年,分别在2016年和2022年进行了两轮漏磁内检测。第1轮采用Rosen公司提供的漏磁内检测设备,配合几何变形检测球实现管径异常、金属损失、夹杂物及叠片异常等特征的检测;第2轮采用Intertek公司的三轴高清漏磁检测设备,配合惯性测绘模块实现管
13、道轴向、径向和环向3个方向的各类特征检测,并测绘管道路由、定位管道特征及相关附件。两轮内检测的检测公司、识别标准、缺陷量化精度、缺陷特征定义和识别能力等方面均有不同,数据对齐和挖掘的难度较大(见表1)。2 基于KL散度的数据对齐算法 首先,利用数据库中的标准化转换规则引擎对 表1 两轮内检测的数据统计信息 Tab.1 Data statistics of two rounds of testing 特征类型 检测次序 2015年5月 2021年7月检测里程/m 43 401 43 571 变形最大报告深度/mm 9.2%t 25.3%t 变形最小报告深度/mm 0.5%t 2.7%t 金属损失
14、最大报告深度/mm 8.5%t 30.2%t 金属损失最小报告深度/mm 0.7%t 2.5%t 外部缺陷集中分布钟点方向 13 13 内部缺陷集中分布钟点方向 47 57 注:表中的t为壁厚。不同检测公司提供的数据格式进行处理,解析两者字段间的相似性,根据分类标准和编码规则寻找与之匹配的数据类型,实现标准化处理。其次,根据特征类型的分布规律和属性,提取特定特征,如里程、三通、弯头、阀门、数量、特征尺寸、缺陷分布规律等信息,对每一项特征分布再根据管节长度分段。最后,采用KL散度计算每个分段中各项特征的分布相似度,通过贪心算法不断迭代,调整分段及对应特征的关系,直到KL散度达到收敛状态,再利用P
15、earson相关系数衡量两轮内检测样本的相关性,验证对齐结果准确性。当2个随机分布相同时,KL散度为零;当2个随机分布差异较大时,KL散度也会增大11。公式为()()KL()|,()log()P xDP QH P QP xQ x=(1)式中:DKL为散度值;P(x)为第1轮内检测数据的真实分布;Q(x)为参照第1轮内检测,第2轮内检测数据的近似拟合分布;H(P,Q)为交叉熵。考虑到式(1)中的log函数为凸函数,根据Jensen不等式定理12,将式(1)转化为()()()()()()KL()|()log()log log,()x Xx Xx XP xDP QP xP xQ xQ xP xP x
16、H P QH P=+=(2)式中:H(P)为第1轮内检测数据的信息熵;x为任意内检测数据;X为内检测数据集合。通过不断调整Q(x),使2种概率分布尽可能接近,DKL尽可能小,完成数据对齐操作(见图1)。根据上述步骤,对两轮内检测的数据实施对齐(见表2)。两轮内检测的里程基本一致,与管道未 Vol.30 No.5 Oct.,2023 64 世界石油工业World Petroleum IndustryE 能源工程 Energy Engineering 进行改线和换管的实际情况相符。对于管道基本特征,阀门、三通和绝缘接头的对齐比例为100%。第1轮有16个弯头未对齐,第2轮有4个弯头未对齐,第2轮比
17、第1轮减少了12个,原因是部分弯头存在漏标或误标现象;第1轮有8个焊缝未对齐,第2轮有19个焊缝未对齐,原因是两轮内检测阀门附近的管段特征标注不一致。图1 KL散度原理图 Fig.1 KL divergence schematic diagram 对于管道缺陷特征,除变形特征外,不同缺陷类型的对齐比例均在90%以上。其中,外部金属损失的新增缺陷较多,这与沿线土壤含水率较高、电阻率较低及防腐层老化剥离等有关。输出对齐后两轮内检测数据的分段Pearson评价系数曲线,2个样本的相关系数在0.912 91.000 0之间,部分管段的相关系数为1,说明对齐效果稳定,证明了应用KL散度方法的科学性和有效
18、性。3 基于概率分布的内检测误差消除 由于管道进行内检测的步骤和过程相对复杂,因此,在实施中会产生不同类型误差。根据统计学原理,误差可分为系统误差和偶然误差。系统误差与检测环境、内检测设备和管道运行状态有关,如高精度内检测器通常对管壁中的杂质含量较为敏感,杂质会影响壁厚检测结果,进而影响检测精度;内检测器对运行速度具有一定要求,行进速度不一致时,也会造成漏检或误检13。偶然误差是指在相同的测试条件下,进行了多次检测,数值和符号无任何规律,误差呈现随机性。考虑到系统误差具有累积性和渐进性,误差会随检测次数的增加越来越大,因此,有必要对系统误差进行消除。关于误差消除,可以通过开挖验证的方式进行人工
19、数据修复,但对于长距离输送管道而言,开挖样本有限,无法获取实际的误差情况。根据内检测缺陷类型的分类原则,将缺陷分别为活性缺陷、非活性缺陷、新增缺陷和其他缺陷。对于活性缺陷和新增缺陷,无法区分是腐蚀时间累积效应还是误差造成的壁厚减薄;对于非活性缺陷,属于管道固有缺陷,不随时间的延长出现尺寸扩展,此时如果2次内检测只存在偶然误差,那前后2次的深度差值应服从均值为0,标准差一定的正态分布。对表2中75处非活性缺陷(外部制造损失和内部制造损失)的深度数据,分析两轮深度差值的概率分布情况(见图2)。拟合后,深度差值服从均值0.44%,标准差7.79%的正态分布,说明数据存在系统误差和偶然误差。表2 两轮
20、内检测特征对齐结果 Tab.2 Results of feature alignment in two rounds of internal detection 特征类型 检测次序 对齐数量/个 对齐比例/%2015年5月 2021年7月 检测里程/m 43 401 43 571/阀门 7 7 7 100 三通 15 15 15 100 绝缘接头 3 3 3 100 弯头 214 202 198 94.39 焊缝 412 423 404 95.51 外部金属损失 75 127 71 94.66 内部金属损失 321 365 311 96.88 外部制造缺陷 65 65 65 100 内部制造缺
21、陷 10 10 10 100 变形 27 26 24 88.88 第30卷 第5期 2023年10月 刘国荣:基于两轮内检测数据挖掘的管道完整性评价技术 65 图2 两轮内检测深度差值的概率分布 Fig.2 Probability distribution of detection depth difference between two rounds 对两轮内检测的非活性缺陷深度按照对齐里程进行非线性拟合(见图3)。根据拟合方程y=19.21+7.39x0.62x2+0.02x3,修正非活性缺陷深度数据。经分析,系统误差主要存在第1轮内检测数据中,以21 038 m处的36号制造缺陷为例,第
22、1轮内检测的缺陷深度为7.77%,代入方程后得到修正的缺陷深度为10.06%,与第2轮内检测的实际缺陷深度9.98%相比,两者数据接近,说明了非活性缺陷具有非增长特性。再次统计修正后两轮内检测深度差值的概率分布情况(见图4)。深度差值服从均值0.02%,标准差1.17%的正态分布,修正后缺陷深度差值的范围和标准差更小,说明数据分布从离散向集中转变,系统误差基本消除。图3 非活性缺陷深度数据拟合结果 Fig.3 Fitting results of inactive defect depth data 图4 修正后两轮内检测深度差值的概率分布 Fig.4 The probability dist
23、ribution of the difference in detection depth between the two rounds after correction 4 管道腐蚀速率计算 依据上述内检测数据修正方法,对其余已对齐的活性缺陷和新增缺陷的深度数据进行修正,共计490处。修正后的这部分腐蚀缺陷主要产生偶然误差和少量的系统误差,此时检测效果与内检测器的性能有关。通过查看内检测器手册,其在测试母材区域一般金属损失和点蚀深度上的精度为10%(80%置信度),在测试焊缝和热影响区域一般金属损失和点蚀深度上的精度为12%(80%置信度)。以17 502 m的一处金属内部损失为例,第1轮内
24、检测深度为7%,第2轮内检测深度为15%,故根据置信度和正态分布原理,以均值为对称中心,1.28个标准差单位应包括80%的面积,则单一腐蚀缺陷的标准差为7.81%(见图5)。图5 修正后17 502 m处金属损失缺陷深度的概率分布 Fig.5 Probability distribution of metal loss defect depth at 17 502 m after correction Vol.30 No.5 Oct.,2023 66 世界石油工业World Petroleum IndustryE 能源工程 Energy Engineering 结合正态分布叠加性的特点,腐蚀速
25、率为 ()()()()222211222121 rNNdGtTTNNtT=+(3)式中:Gr为腐蚀速率,mm/a;d为两轮内检测的深度差,mm;T为两轮检测的时间差,a;t为壁厚,mm;N()为正态分布函数;1、12,2、22分别为第1轮和第2轮内检测某缺陷深度百分比的均值和标准差。此时,对17 502 m的金属内部损失进行腐蚀速率计算(见图6)。图6a是根据变量的累积概率对应指定分布绘制的散点图14,可以直观地反映样本是否符合某一分布,说明腐蚀速率符合正态分布,样本数据点在理论分布的对角线上。图6 修正后17 502 m处金属损失腐蚀速率的概率分布 Fig.6 Probability dis
26、tribution of metal loss corrosion rate at 17 502 m after correction 取图6b中90%分位数对应的腐蚀速率作为该点的腐蚀速率,即0.33 mm/a,虽然比均值腐蚀速率偏大,但通过计算管道沿线每个金属损失点的腐蚀速率,可以保持较适宜的保守性,提高剩余寿命预测的准确性(见图7)。管道全线90%分位数的腐蚀速率主要分布在0.210.56 mm/a,少量腐蚀速率较大的离群点超过了1 mm/a。图7 不同方法下的全线腐蚀速率 Fig.7 Full line corrosion rate under different methods 最后
27、,计算每个点的剩余寿命,根据再检测周期确定维护响应计划,公式为 02,iir iDDRG=(4)式中:Ri为第i点的剩余寿命,a;D0为最大允许操作压力下的管道最大深度,mm;D2,i为第i点在第2轮内检测的深度,mm;Gr,i为第i点的腐蚀速率,mm/a。5 不同方法下维护策略对比 将本文方法计算得到的剩余寿命定为方法1,将以两轮内检测中的最大腐蚀速率定为方法2,将GB/T 420332022附录F中的方法定为方法3。对于方法2,通过统计相关数据得到第1轮内检测某点缺陷的长、宽、深尺寸分别为32 mm、215 mm、3.2%t mm(t为壁厚);第2轮内检测该点缺陷的长、宽、深尺寸分别为57
28、 mm、223 mm、47.6%t mm(t为壁厚),则最大腐蚀速率为0.65 mm/a。对于方法3,得到管道所有腐蚀点腐蚀速率的平均值为0.31 mm/a,标准差为0.22 mm/a,则腐蚀速率边界值为0.31+0.22=0.53 mm/a,第30卷 第5期 2023年10月 刘国荣:基于两轮内检测数据挖掘的管道完整性评价技术 67 对于某点自身腐蚀速率小于或等于边界值时,以边界值计算管道剩余寿命;反之,以某点自身腐蚀速率计算管道剩余寿命(见图7)。常规下以5a作为再检测的周期,分别对剩余寿命小于5a的缺陷点制定维护策略(见图8)。以第2轮内检测结束时间为起点,第1年计划响应即为2021年7
29、月2022年7月,依次类推。第1年时,3种方法的计划维修数量基本相同,之后随着年限的增长,方法2和方法3的计划维修数量均大于方法1,且这种差距越来越大,这是由于方法2的腐蚀速率为固化值,对于小于最大腐蚀速率的点没有进行差异性考虑,导致计划维修数量的大幅增加;方法3虽然在一定程度上降低了保守性,但同样面临大量的腐蚀速率均质化的问题。3种方法5a内计划维修点的数量分别为163、228和206个。图8 不同方法的计划维修数量 Fig.8 Number of planned repairs by different methods 为了验证本文方法的准确性,采用开挖验证的方式统计2021年7月2023
30、年3月期间实际维修点的腐蚀深度值(见表3)。其中,方法1的维修点大部分实际腐蚀深度大于30%,根据ASMEB31G 2009和GB/T 420332022中关于缺陷响应准则的规定,属于计划响应的范畴;方法2和方法3产生了大量腐蚀深度小于30%的维修点,这2种方法未考虑内检测过程存在系统误差及不同缺陷生长具有差异性有关,导致不必要的检修点增多。3种方法腐蚀深度小于30%的维修点数量分别为3、22和11,说明本文方法制定的计划响应策略更加合理。表3 实际维修点的腐蚀深度数据统计结果 Tab.3 Statistical results of corrosion depth data at actua
31、l maintenance points 腐蚀深度/%010 1020 2030 30 方法1 0 1 2 29 方法2 5 7 10 26 方法3 3 6 2 25 6 结论(1)利用KL散度实现了不同检测公司、不同检测标准条件下两轮内检测数据的对齐,阀门、三通和绝缘接头的对齐比例为100%,其余特征的对齐比例均在90%以上。(2)根据误差来源和正态分布,对内检测中存在的系统误差进行消除,取90%分位数的腐蚀速率作为预测剩余寿命的基础,得到差异化的全线腐蚀速率。(3)综合对比了本文方法、常规方法和GB/T 420332022中的方法,通过开挖验证证实了本文方法的维修点大部分实际腐蚀深度大于3
32、0%,属于计划响应的范围,其余方法增加了不必要的维修点。参考文献:1 吴明,谢飞,陈旭,等.埋地油气管道腐蚀失效研究进展及思考J.油气储运,2022,41(6):712-722.WU M,XIE F,CHEN X,et al.Research progress and thinking on corrosion failure of buried oil and gas pipelinesJ.Oil&Gas Storage and Transportation,2022,41(6):712-722.2 管恩东.基于IGSA-RFR的多相流集输管道内腐蚀速率预测模型J.油气储运,2022,41(
33、12):1448-1454.GUAN E D.Prediction model for internal corrosion rate of multiphase flow gathering pipeline based on IGSA-RFRJ.Oil&Gas Storage and Transportation,2022,41(12):1448-1454.3 狄莎莎,许铭,吕建国,等.基于蝴蝶结模型分析“1122”东黄输油管道泄漏爆炸事故J.工业安全与环保,2016,42(12):18-20,72.DI S S,XU M,LYU J G,et al.Analysis of the“112
34、2”leakage explosion accident of the Donghuang oil pipeline based on bow-tie modelJ.Industrial Safety and Vol.30 No.5 Oct.,2023 68 世界石油工业World Petroleum IndustryE 能源工程 Energy Engineering Environmental Protection,2016,42(12):18-20,72.4 刘嘉玥,黄嘉伟,董绍华.基于贝叶斯-蝴蝶结的输气管道环焊缝失效风险识别与分析模型J.天然气与石油,2022,40(5):132-13
35、8.LIU J Y,HUANG J W,DONG S H.Identification and analysis of failure risk of gas transmission pipeline girth welds based on Bayesian-bow-tie modelJ.Natural Gas and Oil,2022,40(5):132-138.5 刘欢.考虑内外检测数据对齐的管道完整性评价技术研究J.石油工程建设,2022,48(5):44-48.LIU H.Research on pipeline-integrity evaluation technology co
36、nsidering alignment of internal and external inspection dataJ.Petroleum Engineering Construction,2022,48(5):44-48.6 杨静,李明,王剑波,等.基于内检测的管道全生命周期管理实践J.当代石油石化,2022,30(1):43-46,54.YANG J,LI M,WANG J B,et al.Pipeline life-cycle management practice based on in-line inspectionJ.Petroleum&Petrochemical Today,
37、2022,30(1):43-46,54.7 王波,吕超,明连勋,等.基于不同内检测数据的对齐与分析研究J.管道技术与设备,2019(5):24-27.WANG B,LYU C,MING L X,et al.Research of alignment and analysis based on different MFL dataJ.Pipeline Technique and Equipment,2019(5):24-27.8 刘承磊,姜晓红,张翰钊,等.基于模糊综合评价的管道内检测数据质量评估J.油气田地面工程,2023,42(5):69-77.LIU C L,JIANG X H,ZHANG
38、 H Z,et al.Pipeline internal inspection data quality evaluation based on fuzzy comprehensive evaluation methodJ.Oil-Gas Field Surface Engineering,2023,42(5):69-77.9 邓力珲,曹丽,张俊杰.基于t分布随机近邻嵌入的测井数据降维方法研究J.合肥工业大学学报(自然科学版),2022,45(4):549-553,569.DENG L H,CAO L,ZHANG J J.Research on dimensionality reduction
39、 method of logging data based on t-distributed stochastic neighbor embeddingJ.Journal of Hefei University of Technology(Natural Science),2022,45(4):549-553,569.10 孙洁娣,彭志涛,温江涛,等.基于总体局域均值分解及稀疏表示分类的天然气管道泄漏孔径识别J.中国机械工程,2017,28(10):1202-1209.SUN J D,PENG Z T,WEN J T,et al.Natural gas pipeline leakage ape
40、rture identification based on ELMD and SRCJ.China Mechanical Engineering,2017,28(10):1202-1209.11 孙凤霄,孙仁诚.基于KL散度的波形对齐算法J.信息技术与信息化,2021(5):103-105.SUN F X,SUN R C.Waveform alignment algorithm based on KL divergenceJ.Information Technology and Informatization,2021(5):103-105.12 卢国祥.Jensen不等式的一种新改进及应用J
41、.数学的实践与认识,2020,50(17):223-230.LU G X.A new refinement of Jensens inequality and its applicationsJ.Mathematics in Practice and Theory,2020,50(17):223-230.13 任飞.管道内检测数据对比分析研究D.北京:中国石油大学(北京),2016.REN F.Comparative analysis and research of detection data in pipeline D.Beijing:China University of Petroleum(Beijing),2016.14 武东,费鹤良,汤银才.PP图及其在可靠性中的应用J.上海师范大学学报(自然科学版),2004(2):13-17.WU D,FEI H L,TANG Y C.PP plot and its applications to the reliabilityJ.Journal of Shanghai Normal University(Natural Sciences Edition),2004(2):13-17.(编辑:李丽君)