收藏 分销(赏)

基于机器学习模型的斜井坍塌压力预测方法.pdf

上传人:自信****多点 文档编号:2348970 上传时间:2024-05-28 格式:PDF 页数:13 大小:3.90MB
下载 相关 举报
基于机器学习模型的斜井坍塌压力预测方法.pdf_第1页
第1页 / 共13页
基于机器学习模型的斜井坍塌压力预测方法.pdf_第2页
第2页 / 共13页
基于机器学习模型的斜井坍塌压力预测方法.pdf_第3页
第3页 / 共13页
亲,该文档总共13页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 43 卷第 9 期2023 年 9 月 119 天然气工业Natural Gas Industry引文:马天寿,张东洋,杨赟,等.基于机器学习模型的斜井坍塌压力预测方法J.天然气工业,2023,43(9):119-131.MA Tianshou,ZHANG Dongyang,YANG Yun,et al.Machine learning model based collapse pressure prediction method for inclined wellsJ.Natural Gas Industry,2023,43(9):119-131.基于机器学习模型的斜井坍塌压力预测方法马

2、天寿1张东洋1杨 赟2陈颖杰31.油气藏地质及开发工程全国重点实验室 西南石油大学2.中国石油川庆钻探工程有限公司钻采工程技术研究院3.中国石油西南油气田公司致密油气勘探开发项目部摘要:坍塌压力是优化钻井液密度、维持井壁稳定的重要基础参数,对保障油气井安全高效钻井具有重要作用。为了解决传统坍塌压力预测方法存在的计算过程繁琐、预测精度较低等问题,采用随机森林、多项式回归等 4 种机器学习模型,建立了斜井坍塌压力机器学习预测方法,利用参数随机采样和传统解析模型生成了训练样本,优选了最佳模型,优化了训练样本数量、神经网络结构和模型超参数,并以 Z-1 井为例验证了该预测方法的可靠性和准确性。研究结果

3、表明:优化的多层感知机模型预测性能最好,在验证集和测试集均表现出较好的预测能力;该模型能准确预测不同井段的坍塌压力剖面,与测井解释结果相比,Z-1 井直井段、斜井段和水平段坍塌压力预测的平均绝对误差小于 0.007 3 g/cm3、均方根误差小于 0.013 8 g/cm3、平均绝对百分比误差小于 0.771 1%、决定系数大于 0.950 5;该模型能够准确预测任意深度斜井的坍塌压力,Z-1 井在 3 个深度处的坍塌压力半球投影图预测最大相对误差小于 1.97%、决定系数大于 0.987 6。结论认为,该方法能够准确预测给定参数范围内任意斜井的坍塌压力,并能捕捉坍塌压力随井斜和方位的变化规律

4、,对于保持斜井和水平井井壁稳定保障油气安全高效开发具有重要技术支撑作用。关键词:井壁稳定;坍塌压力;机器学习;斜井;多层感知机;预测方法DOI:10.3787/j.issn.1000-0976.2023.09.012Machine learning model based collapse pressure prediction method for inclined wellsMA Tianshou1,ZHANG Dongyang1,YANG Yun2,CHEN Yingjie3(1.National Key Laboratory of Oil and&Reservoir Geology a

5、nd Exploitation/Southwest Petroleum University,Chengdu,Sichuan 610500,China;2.Drilling&Production Technology Research Institute,CNPC Chuanqing Drilling Engineering Co.,Ltd.,Chengdu,Sichuan 610051,China;3.Tight Oil and Gas Project Division,PetroChina Southwest Oil&Gasfield Company,Chengdu,Sichuan 610

6、056,China)Natural Gas Industry,vol.43,No.9,p.119-131,9/25/2023.(ISSN 1000-0976;In Chinese)Abstract:Collapse pressure is an important basic parameter for optimizing drilling fluid density and maintaining wellbore stability,and plays an important role in ensuring the safe and efficient drilling of oil

7、 and gas wells.The traditional collapse pressure prediction methods have a complicated calculation process and low prediction accuracy.In order to solve these problems,this paper establishes a machine learning prediction method of collapse pressure for inclined wells by using four machine learning m

8、odels such as random forest and polynomial regression.Then,the training samples are generated by using random parameter sampling and the traditional analytic model.In addition,an optimal model is selected,and the number of training samples,the structure of neural networks,and the hyperparameters of

9、the model are optimized.Finally,the reliability and accuracy of this prediction method is verified by taking Well Z-1 as an example.And the following research results are obtained.First,the optimized multilayer perceptron model has the best prediction performance,and presents a better prediction cap

10、acity in the verification set and test set.Second,compared with the logging interpretation results,the collapse pressure in the vertical,inclined and horizontal intervals of Well Z-1 predicted by this model has an average absolute error lower than 0.007 3 g/cm3,an root mean square error lower than 0

11、.013 8 g/cm3,an average absolute percentage error lower than 0.771 1%,and a coefficient of determination higher than 0.950 5,indicating that this model can accurately predict the collapse pressure profiles of different well intervals.Third,the maximum relative error of the hemispherical projection o

12、f the collapse pressure at three depths of Well Z-1 is lower than-1.97%and the determination coefficient is higher than 0.987 6,indicating that this model can accurately predict the collapse pressure of an inclined well at any depth.In conclusion,this method can accurately predict the collapse press

13、ure of any inclined well within an given parameter range,and can capture the change laws of collapse pressure with well inclination and orientation,which provides an important support for maintaining the wellbore stability of inclined and horizontal wells and ensuring the safe and efficient developm

14、ent of oil and gas.Keywords:Wellbore stability;Collapse pressure;Machine learning;Inclined well;Multilayer perceptron;Prediction method基金项目:四川省杰出青年科技人才项目“深层页岩水平井井壁稳定流固化热耦合弹塑性有限元模拟”(编号:2020JDJQ0055)。作者简介:马天寿,1987 年生,研究员,博士,本刊编委;主要从事油气井工程方面的科研与教学工作。地址:(610500)四川省成都市新都区新都大道 8 号。ORCID:0000-0002-8754-915

15、6。E-mail:2023 年第 43 卷 120 天 然 气 工 业0引言坍塌压力是优化钻井液密度、优化井身结构、维持井壁稳定、确保钻井安全的重要基础参数,对于安全高效钻井至关重要1-2。当井筒压力低于坍塌压力时,井壁可能发生压剪破坏,造成井壁崩落、掉块和井眼扩大,严重时甚至发生井壁坍塌复杂事故3-4。为了防止井壁坍塌,一般需要使钻井液密度高于坍塌压力当量密度,但过高的钻井液密度会导致机械钻速降低、粘卡风险增加、诱导性井漏风险增加等问题5-6。因此,坍塌压力的准确预测对于安全高效钻井具有十分重要的作用和现实意义。对于坍塌压力的预测,国内外学者主要通过测井解释预测坍塌压力,其关键之一在于坍塌压

16、力计算模型。国内外学者基于线弹性力学理论,建立了任意斜井井周应力分布模型,结合不同类型的岩石强度准则,建立了多种斜井坍塌压力计算模型7-8,但这类模型计算过程比较复杂,现场工程师很难掌握,计算精度仍有待提高。近年来,随着机器学习的不断兴起和发展,机器学习提供了一种解决这些问题的新手段。国内外学者试图利用机器学习解决石油工程专业领域的一些经典问题,如岩石力学参数预测、地应力预测、孔隙压力预测、岩性识别等9-14。针对井壁稳定预测问题,吴超等15利用径向基函数神经网络建立了波阻抗与直井地层三压力之间的映射关系,根据波阻抗数据随钻预测钻头前方地层的井壁稳定性,有助于及时优化钻井液密度。Behesht

17、ian 等16基于多层极限学习机和最小二乘支持向量机,以测井数据作为输入参数,构建了直井安全钻井液密度窗口预测模型,并通过伊朗南帕斯气田 3 口井的数据验证了模型。Tewari 等17提出了一种利用地面录井数据预测斜井安全钻井液密度的方法,通过 Bagging 和随机森林算法来模拟传感器测量变量与钻井液密度窗口之间的关系,使用挪威已钻井数据进行训练和测试,并与人工神经网络、支持向量回归机法进行了对比,验证了该方法的准确性。Javad 等18以测井数据为输入参数,采用支持向量回归机建立了直井安全钻井液密度窗口预测模型,并使用相同区块 3 口井的数据进行了训练和测试。Gowida 等19以测井数据

18、为输入参数,利用人工神经网络建立了直井安全钻井液密度窗口预测模型,并使用中东地区的数据集对模型进行了验证。Phan 等20利用孔弹性解析模型生成任意斜井坍塌和破裂压力数据集,采用人工神经网络模型进行训练,使用训练后的模型预测了随时间变化的钻井液密度窗口和下半球投影图,计算效率与解析模型相比提高了 1 000 倍。综上所述,传统斜井坍塌压力预测需要进行复杂的斜井井壁应力和强度计算,现场工程师很难掌握,而且存在计算过程繁琐、预测精度较低等不足。使用机器学习模型预测坍塌压力可避免中间参数的计算,简化计算过程,但现有研究的训练和验证数据集样本数量有限,仅能保证同井或钻进方位相近邻井坍塌压力的预测精度,

19、存在泛化能力不足的问题,尤其是在精准预测坍塌压力随井斜角和方位角变化方面仍然存在不足。为此,通过参数随机采样的方式生成斜井坍塌压力计算所需的基础参数,利用斜井坍塌压力模型计算并构建机器学习所需的数据集,将预处理后的数据喂入随机森林、多项式回归、支持向量回归、多层感知机等 4 种典型的机器学习模型,对比不同机器学习方法的预测结果优选出最佳模型,对优选模型的结构和超参数进行优化,并使用优化后的模型进行坍塌压力预测来验证模型。本文的研究对于准确预测坍塌压力、简化坍塌压力计算过程、推广机器学习在石油工程领域的应用具有重要的作用和意义。1斜井坍塌压力计算模型1.1斜井井壁应力分布模型假设地层岩石为多孔弹

20、性介质,根据 Bradley 给出的井周应力分布模型,取径向距离 r=R,可以得到井壁应力分布模型21:(1)其中第 9 期 121 马天寿等:基于机器学习模型的斜井坍塌压力预测方法式中 rr、zz分别表示井壁径向、切向和轴向应力,MPa;z、r、rz分别表示井壁 3 个剪应力,MPa;pm表示井筒压力,MPa;pp表示孔隙压力,MPa;表示井壁渗透系数,无因次,介于 0 1;表示孔隙度;v表示垂向应力,MPa;H表示最大水平地应力,MPa;h表示最小水平地应力,MPa;表示井斜角,();表示方位角,();表示最大水平主应力方位角,();表示井周角,();K1表示渗流效应系数,无因次;s表示岩

21、石静态泊松比,无因次;表示 Biot 系数,无因次。根据材料力学理论,可得井壁的 3 个主应力:(2)式中 i、j、k表示井壁 3 个主应力,MPa。对 3 个主应力 i、j、k进行排序,即可得井壁最大、中间和最小主应力 1、2和 3。1.2坍塌压力计算模型井壁坍塌一般是由于地层发生剪切破坏所致,常用 Mohr-Coulomb、Drucker-Prager 和 Mogi-Coulomb等强度准则判断是否发生剪切破坏。本文采用 Mohr-Coulomb 准则,若考虑有效应力原理,则该准则可表示为:(3)式中 1和 3分别表示最大和最小主应力,MPa;c表示岩石内聚力,MPa;表示岩石内摩擦角,(

22、)。此时,可以定义一个函数 fc来求解井周地层是否发生剪切破坏:(4)函数 fc的物理意义表示地层岩石抵抗井壁剪切应力的能力22。若 fc 0,将发生剪切破坏;若 fc=0,井壁处于极限平衡状态;若 fc 0,则不会发生剪切破坏。假设井筒压力为未知参数,联立式(1)(4)进行求解,可得到井壁坍塌的临界井筒压力,即为坍塌压力。2坍塌压力的机器学习预测方法2.1数据集构建通过参数随机采样结合坍塌压力解析模型构建机器学习训练所需的数据集。首先,根据各区块已钻井的数据结合专家经验设定参数可能存在的范围;然后,在此范围内进行多次均匀随机采样生成参数样本数据,具体采样次数根据机器学习模型达到最高预测精度时

23、的样本数量决定;最后,将参数样本数据带入坍塌压力解析模型中计算得到坍塌压力数据。机器学习模型通过该数据集训练能学习到任意参数条件下的坍塌压力,从而实现任意斜井或水平井坍塌压力的准确预测。需要注意的是,虽然通过该过程生成的数据集比较大,但仍未包含所有可能存在的参数组合情况,尤其是任意深度下坍塌压力随井斜方位角的变化规律,因此不能通过搜索算法在数据集中找到任意参数所对应的坍塌压力值。参数采样范围如表 1 所示,为了符合工程实际,对孔隙压力、最大水平地应力和最小水平地应力设定约束条件20:pp h H。图 1 为随机采样 1.0106次情况下部分参数的柱状分布图,其中,图 1-a 为未设定约束条件下

24、垂深的柱状分布图,图 1-b、c、d为设定约束条件下孔隙压力、最大和最小水平地应表1参数采样范围表参数最小值最大值垂深/m1 0006 000井斜角/()090方位角/()0360垂向地应力/MPa10180最大水平地应力/MPa10180最小水平地应力/MPa10H孔隙压力/MPa9h最大水平主应力方位角/()0360泊松比0.10.5内聚力/MPa150内摩擦角/()160Biot 系数0.512023 年第 43 卷 122 天 然 气 工 业力的柱状分布图。不难看出,在未设定约束条件下,随机采样得到的垂深服从均匀分布,其余未设定约束的参数与之相似;而设定约束条件 pp h H情况下,随

25、机采样得到的孔隙压力、最大和最小水平地应力不再服从均匀分布,且分布带宽表现为 pp h H,这说明随机采样过程受到了约束条件的限制。2.2数据预处理为了消除输入参数之间的维度差异,需要对输入参数进行归一化处理23,将输入参数约束在 0,1范围内。对于机器学习而言,这将有助于加快模型在优化过程中梯度下降的速度,提升模型的预测精度。需要说明的是,坍塌压力作为目标数据不需要进行归一化,但为了使模型能够快速收敛,将坍塌压力单位换算为当量密度。归一化采用下式进行处理:(5)式中 X*表示归一化后的数据;X 表示原始数据;X max和 X min分别表示数据的最大值和最小值。2.3机器学习模型机器学习模型

26、中适用于回归问题的主要包括回归树、线性回归、支持向量机和神经网络等 4 大类,考虑到坍塌压力与输入参数之间的非线性映射关系,从这 4 类方法中选择了适用于非线性回归的随机森林、多项式回归、支持向量回归和多层感知机 4 种模型进行坍塌压力预测,进而优选出适合的机器学习模型。2.3.1随机森林随机森林是一种基于决策树的集成学习模型,其建模流程如图 2 所示,从样本数据中随机抽样生成子数据集,根据子数据集构建子决策树,集成所有子决策树的预测值作为最终的输出结果。随机森林模型的计算公式可表示为24-25:(6)式中 i表示第 i 组输入向量的预测结果,i=1,2,3,n;n 表示输入样本的数量;T 表

27、示子决策树的数量;xt表示第 t 棵子决策树的输入向量;t表示第 t 棵子决图1部分参数随机采样分布图第 9 期 123 马天寿等:基于机器学习模型的斜井坍塌压力预测方法策树的同分布随机向量;ht(xt,t)表示第 t 棵子决策树的输出向量。随机森林模型的关键在于特征随机选取和子决策树的构建。图 3 所示为特征随机选取过程,子决策树从所有特征中随机选取一定的特征,并从随机选取的特征中选取最优特征。具有不同特征的子决策树丰富了系统的多样性,提升了模型的预测性能。2.3.2多项式回归多项式回归模型是一种典型的线性回归方法,通过加入特征的高次方,增加模型的自由度,从而捕获数据中的非线性变化,拟合出适

28、当的函数曲线,如图 4 所示。图2随机森林建模流程图图3特征随机选取过程示意图子决策树根据平方误差最小化准则选择最优的切分变量 j 和切分点 s,划分区域并决定相应的输出值,该准则可表示为26:(7)其中,式中 c1、c2表示划分后两个区域内的固定输出值;R1、R2表示 j 和 s 将特征空间切分的两个区域;yi表示第 i 组输入向量对应的真实值;x 表示输入向量;xR1和 xR2分别表示 R1、R2区域的输入向量;j 表示最优切分变量;s 表示最优切分点。图4多项式回归拟合示意图多项式回归通过损失函数最小化构建回归方程,该方程可表示为27:(8)式中 i表示第 i 组输入向量的权重矩阵;bi

29、表示第 i组输入向量的偏置向量;k 表示多项式阶教;xi表示第 i 组输入向量。损失函数可表示为:(9)式中 Lpoly表示多项式回归的损失函数。2.3.3支持向量回归支持向量回归可以将非线性问题转化为高维空间中的线性问题28,如图 5 所示,在拟合曲线附近形成一个区间 ,,落在该区间外的预测值才会计算其损失函数值,通过损失函数最小化求解最优输出图5支持向量回归模型示意图2023 年第 43 卷 124 天 然 气 工 业值。给定一个训练集 D=(x1,y1),(x2,y2),(xn,yn),通过训练得到一个回归模型 i=i(xi)+bi,使预测值i与真实值yi尽可能接近,(xi)为非线性映射

30、函数。根据损失函数最小化原则求解优化问题:(10)式中 Ci表示第 i 组输入向量的惩罚因子;LSVR表示支持向量回归的损失函数。通过引入松弛变量i和i*来纠正不规则因子29,此时可得:(11)(12)式中 i和 i*表示不规则因子,其数值越小则回归函数的误差越小、精度越高;i表示不敏感损失因子(允许的最大误差),i 0;(xi)表示非线性映射函数。利用对偶原理,引入拉格朗日惩罚算子求解凸二次规划问题,可得支持向量回归模型预测值的表达式为29:(13)式中 i和 i*表示拉格朗日乘数;K(xi,x)表示核函数。2.3.4多层感知机多层感知机(MLP)是一种全连接前馈神经网络30,图 6 为一个

31、具有多个隐藏层的 MLP 模型,输入数据通过隐藏层计算后,由输出层神经元进行输出。图中输入层的输入变量 x1、x2、,xn分别为垂深、井斜角、方位角等基础输入参数,输出层的输出变量 i表示破裂压力。隐藏层通过函数 yi=ixi+bi 来求解普通线性函数,并通过引入激活函数来求解非线性函数。MLP 模型计算过程如图 7 所示。将基于输入向量和权重的加权求和应用于激活函数 f,其结果作为后续隐藏层或输出层的输入变量。在 MLP 模型中,通过将激活函数从输出层向输入层反向微分来执行反向传播,以减少最终输出层预测值与真实值之间的误差。常用激活函数包括 ReLU、sigmoid、tanh,可分别表示为3

32、1:(14)(15)(16)式 中 ReLU(x)表 示 ReLU 激 活 函 数;sigmoid(x)表 示sigmoid 激活函数;tanh(x)表示 tanh 激活函数。图6MLP 模型结构示意图图7MLP 模型计算过程示意图2.4模型评价指标为了评价模型预测性能,采用平均绝对误差、平均绝对百分比误差、均方根误差和决定系数 4 个评价指标对模型预测结果进行分析和评估,这些评价指标可表示为32:(17)(18)(19)(20)第 9 期 125 马天寿等:基于机器学习模型的斜井坍塌压力预测方法式中 EMAE表示平均绝对误差,g/cm3;EMAPE表示平均绝对百分比误差;ERMSE表示均方根

33、误差,g/cm3;R2表示决定系数;yi表示坍塌压力当量密度真实值,g/cm3;i表示坍塌压力当量密度预测值,g/cm3;y表示坍塌压力当量密度真实值的平均值,g/cm3。一般情况下,EMAE、EMAPE和 ERMSE越接近于 0,R2越接近 1,则模型的预测误差越小、预测精度越高。3机器学习模型的优选及优化3.1机器学习模型优选不同机器学习模型的适用性存在一定差异,为了验证随机森林、多项式回归、支持向量回归和多层感知机(MLP)4 种模型的预测效果,将 4 种模型在相同数据集下进行坍塌压力预测,数据集包括垂深、井斜角、方位角、垂向地应力、最大水平地应力、最小水平地应力、孔隙压力、最大水平主应

34、力方位角、泊松比、内聚力、内摩擦角、Biot 系数以及坍塌压力。训练样本数量为 1106,并从其中随机划分 20%数据作为验证集,测试样本数量为 5104,验证集的作用是检验模型的训练效果,测试集的作用是检验模型的预测精度和泛化能力。预测结果如图 8 所示:随机森林模型在训练集的误差较小,而在验证集和测试集的误差较大,说明出现了过拟合现象;多项式回归模型在训练集、验证集和测试集的误差均较大,说明其无法准确建立坍塌压力与参数之间的非线性映射关系;支持向量回归模型的预测效果优于随机森林和多项式回归模型,但预测精度仍然较低,并且在测试集的预测精度较差,说明该模型的泛化能力较差;MLP 模型在训练集、

35、验证集和测试集的误差均最小、决定系数最大,说明 MLP 模型优于其他 3 种模型,因此,推荐采用 MLP 模型进行坍塌压力预测。3.2MLP 模型优化3.2.1MLP 模型结构优化MLP 模型的神经网络结构对预测性能具有显著影响,选择合适的隐藏层和神经元数量可以使模型具有更好的综合性能。为此,利用交叉验证方法,比较了隐藏层 1 4 个、神经元数量 50 400 情况下,MLP 模型的预测效果,结果如图 9 所示。需要注意的是,此处所述的交叉验证方法是考察不同隐藏层和神经元数量组合下 MLP 模型预测结果的方法,即在隐藏层数量相同时,神经元数量由 50 增加至 400 时MLP 模型的预测结果以

36、及在神经元数量相同时,隐藏层数量由 1 增加至 4 时 MLP 模型的预测结果。不难看出:当隐藏层数量相同时,随着每层神经元数量的增加,MLP 模型预测结果的决定系数整体上逐渐增加,在神经元数量超过 350 后决定系数缓慢增加;平均绝对误差、均方根误差和平均绝对百分比误差随神经元数量的增加整体上表现为逐渐降低的趋势,在神经元数量超过 350 后缓慢下降;当每层中神经元数量相同时,随着隐藏层数量的增加,MLP 模型预测结果的决定系数整体上逐渐增加,平均绝对误差、均方根误差和平均绝对百分比误差表现为逐渐减少,当隐藏层数量超过 3 层后,模型的预测性能趋于稳定,模型的预测误差比较接近。考虑到模型的预

37、测性能以及计算效率,推荐采用 3 个隐藏层、每层 350 个神经元的神经网络结构。3.2.2MLP 模型超参数优化除了神经网络结构参数,模型超参数也会影响MLP 模型的预测精度和综合性能。为了进一步提升MLP 模型的预测精度,对 MLP 模型的学习率、迭代次数和批尺寸 3 个超参数进行优化。考虑到参数较多且存在交互作用,若使用交叉验证,工作量会变得很大,因此,使用正交试验设计进行超参数优选12:以学习率、迭代次数和批尺寸 3 个超参数为因子,每个因子分别选取 5 个水平值进行正交试验设计,其中,学习率分为 0.001、0.005、0.010、0.015 和 0.020,批尺寸分为 500、1

38、000、1 500、2 000 和 2 500,迭代次数分别为 200、300、400、500 和 600。正交试验图8不同机器学习方法预测结果评估图2023 年第 43 卷 126 天 然 气 工 业设计是研究多因素多水平的一种设计方法,根据正交性从全面试验中挑选出部分有代表性的点进行试验,这些数据点具备了“均匀分散、齐整可比”的特点,是一种高效率、快速、经济的实验设计方案。正交试验设计方案及对应的评价指标如表 2 和图 10 所示。结合表 2 和图 10 不难发现:随着迭代次数的增加,模型的平均绝对误差、均方根误差和平均绝对百分比误差表现为先降低后增加,决定系数表现为先增加后降低;随着批尺

39、寸的增加,模型的平均绝对误差和决定系数表现为先降低后增加,均方根误差和平均绝对百分比误差表现为先增加后降低再增加;随着学习率的增加,平均绝对误差、均方根误差和平均绝对百分比误差表现为先增加后降低再增加,决定系数表现为逐渐降低,从 0.010 增加到 0.015 时出现小幅度增加。可见超参数对于 MLP 模型坍塌压力当量密度的预测具有较明显的影响,其中学习率的影响较大,批尺寸的影响较小。不同超参数组合下,MLP模型预测坍塌压力的误差存在一定差异,EMAE介于 0.010 0.044 g/cm3、ERMSE介于 0.015 0.025 g/cm3、EMAPE介于 0.538%2.419%、R2介于

40、 0.980 0.992,其中,第 4 组超参数条件下坍塌压力的预测误差最低、决定系数最高,其对应指标分别为 EMAE=0.010 g/cm3、ERMSE=0.015 g/cm3、EMAPE=0.538%、R2=0.992。因此,MLP 模型的最优超参数组合为:学习率 0.001、批尺寸 2 000、迭代次数 500。3.2.3训练集样本数量优选训练集样本数量也会影响MLP模型的预测性能,因此将训练集样本数量由 1105增加至 2106,分别对 MLP 模型进行训练,并在相同的测试集下进行测试,分析不同样本数量的训练集对模型预测结果的影响,相应的评价指标如图 11 所示。不难看出:当训练集样本

41、数量为 1105时,MLP 模型的预测误差较大,随着训练集样本数量的增加,预测误差逐渐降低,预测精度随样本数量的增加逐渐提高;当样本数量超过 1.2106后,模型的性能趋于稳定。因此,考虑到模型的预测精度和计算效率,推荐训练集的样本数量为 1.2106。图9隐藏层和神经元数量对模型评价指标的影响曲线图第 9 期 127 马天寿等:基于机器学习模型的斜井坍塌压力预测方法图10超参数正交试验方案及模型预测结果图表2超参数正交试验设计及模型预测结果表迭代次数批尺寸 学习率EMAE/(gcm3)ERMSE/(gcm3)EMAPER2迭代次数批尺寸学习率EMAE/(gcm3)ERMSE/(g cm3)E

42、MAPER22005000.0010.0140.0160.777%0.9916005000.0150.0210.0201.159%0.9873001 0000.0010.0150.0180.797%0.9905001 0000.0150.0310.0221.714%0.9844001 5000.0010.0120.0160.589%0.9924002 0000.0150.0210.0201.161%0.9885002 0000.0010.0100.0150.538%0.9923002 5000.0150.0300.0191.617%0.9886002 5000.0010.0140.0160.7

43、55%0.9912001 5000.0150.0420.0252.299%0.9806002 0000.0050.0240.0191.325%0.9892001 0000.0200.0340.0211.835%0.9865001 5000.0050.0200.0181.077%0.9893002 0000.0200.0340.0221.875%0.9854001 0000.0050.0210.0181.155%0.9904005000.0200.0300.0221.638%0.9853005000.0050.0340.0211.837%0.9865002 5000.0200.0300.0211

44、.625%0.9852002 5000.0050.0290.0201.605%0.9876001 5000.0200.0350.0221.897%0.9852002 0000.0100.0350.0221.887%0.9853001 5000.0100.0340.0211.861%0.9864002 5000.0100.0290.0211.557%0.9865005000.0100.0210.0201.143%0.9876001 0000.0100.0440.0252.419%0.9802023 年第 43 卷 128 天 然 气 工 业4井壁稳定实例分析为进一步检验模型的预测效果,利用四川某

45、区块一口水平井(Z-1 井)的测井解释结果对模型进行验证。将直井段、斜井段和水平段的坍塌压力预测结果与坍塌压力真实结果进行了对比,对比结果如图13 所示。表 4 为不同井段 MLP 模型预测结果的评价指标。结合表 4 和图 13 不难看出:MLP 模型预测的图11样本数量对模型预测结果的影响趋势图3.3MLP 模型的训练及验证采用上述网络结构和超参数组合对模型进行训练和验证,MLP 模型由 3 个隐藏层、每层 350 个神经元组成,训练集样本数量为 1.2106,验证集和测试集的样本数量分别为 5104和 2105,模型的学习率为 0.001、批尺寸为 2 000、迭代次数为 500。MLP

46、模型在训练、验证和测试集上的性能如表 3 所示。可以看出:优化后的 MLP 模型在训练集、验证集和测试集的误差指标 EMAE、ERMSE、EMAPE均比优化前显著降低,其对应的决定系数分别为 0.999 7、0.995 0、0.999 4。优化后模型在训练集和验证集的良好预测性能表明:MLP 模型能够建立输入参数与坍塌压力之间的非线性映射关系;优化后模型在测试集的良好预测性能表明:MLP 模型具有较强的泛化能力,能够实现坍塌压力的准确预测。表3模型预测性能评价表数据集样本数量EMAE/(gcm3)ERMSE/(gcm3)EMAPER2训练集1.21060.005 90.014 10.321%0

47、.999 7验证集51040.010 40.038 70.566%0.995 0测试集21050.009 90.028 30.539%0.999 4图 12 是 MLP 模型与解析模型的计算时间对比图(MLP 模型的计算时间是指模型进行预测所需的时间,不包含构建数据集以及模型参数优化和进行训练所花费的时间),可以看出:随着样本数量的增加,解析模型所需的计算时间和 MLP 模型进行预测所需的时间都呈现一种近似于线性的增长趋势。对于相同的样本数量,解析模型进行坍塌压力计算所需的时间为 MLP 模型预测所需时间的 10 倍左右,因此,MLP 模型相较于解析模型具有更好的计算效率。图12模型计算时间对

48、比图图13Z-1井坍塌压力预测结果与真实值对比图注:浅红色区为直井段、浅绿色区为斜井段、浅黄色区为水平井段。第 9 期 129 马天寿等:基于机器学习模型的斜井坍塌压力预测方法坍塌压力与测井解释结果吻合较好;直井段和斜井段坍塌压力的预测误差略微高于水平井段,但整体误差较小,能够满足现场井壁坍塌压力预测的实际需求。为了进一步验证模型预测任意斜井坍塌压力的性能,取 Z-1 井直井段处 3 250 m、斜井段处 3 700 m和水平段处 4 600 m 3 个深度进行坍塌压力半球投影图预测。图 14 为 MLP 模型预测的坍塌压力半球投图14不同深度处坍塌压力及其相对误差半球投影图表4Z-1井不同井

49、段坍塌压力预测结果评价指标表井段井深/mEMAE/(g cm3)ERMSE/(g cm3)EMAPER2直井段 3 2113 3750.007 30.013 80.771 1%0.950 5斜井段 3 3753 8070.007 00.007 30.622 4%0.972 9水平段 3 8074 7110.003 60.004 40.372 3%0.997 62023 年第 43 卷 130 天 然 气 工 业影图及其与解析模型间的相对误差,表 5 为 3 个深度处预测结果的评价指标统计表。不难看出:3 个深度处的坍塌压力下半球投影图分布大致相近,但坍塌压力当量密度差异较大;直井和小角度定向井

50、坍塌压力较低,坍塌压力随井斜角的增加整体呈增大趋势,最大水平地应力方向的坍塌压力明显低于最小水平地应力方向;深度 3 250 m 处的最大相对误差为1.97%、R2=0.994 9,深度 3 700 m 处的最大相对误差为1.59%、R2=0.989 1,深度 4 600 m 处的最大相对误差为1.74%、R2=0.987 6,说明 MLP模型具有较强的泛化能力,能够实现对于斜井任意深度点不同井斜方位下坍塌压力的准确预测。表5不同深度点斜井坍塌压力预测结果评价指标表深度/m EMAE/(gcm3)ERMSE/(g cm3)EMAPER23 2500.002 70.011 00.275 2%0.

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服