1、钻井技术与装备基于 算法的机械钻速预测研究汤 明 王汉昌 何世明 张光福 孔令豪(西南石油大学油气藏地质及开发工程国家重点实验室)汤明 王汉昌 何世明 等.基于 算法的机械钻速预测研究.石油机械 ():.():.摘要:钻井过程中 机械钻速是衡量钻井效率的一个重要指标 准确预测机械钻速对提高钻井效率、降低成本具有重要作用 常用的钻速方程预测模型存在建模困难、求解困难等问题 为此 提出一种基于主成分分析算法()优化 神经网络的机械钻速预测新模型 基于 模型预测机械钻速 并将预测结果与、和 等模型的预测结果进行横向对比 结果表明 的拟合优度()分别提高 、和 均方根误差分别降低、和 平均绝对百分比误
2、差分别降低 、和 预测结果表明 新模型的精度更高、收敛速度更快 模型还可实时评价影响机械钻速因素的合理性 为提高机械钻速提供指导意见 研究结果可为实际钻进过程中提高机械钻速提供更科学的参考依据关键词:机械钻速预测 参数优化 小波滤波 主成分分析 神经网络中图分类号:文献标识码:/():().().()()().:年 第 卷 第 期石 油 机 械 基金项目:国家自然科学基金青年基金项目“基于水化进程的泥岩地层井壁坍塌机理研究”()国家自然科学基金面上项目“基于多场耦合理论的页岩气水平井井壁失稳机理研究”()引 言机械钻速()是反映钻井效率的重要指标 为优化钻井相关作业 降低钻井成本 需要准确预测
3、机械钻速 到达实时优化的目的 精确建立机械钻速与影响因素之间的模型 对预测机械钻速、优化工程参数具有重大意义钻速预测模型分为:基于钻速方程的预测模型 基于物理过程 针对不同参数与钻速的关系建立数学模型预测钻速 例如 建立钻压、可钻性、转速、钻头磨损系数以及进尺与机械钻速之间的量化关系 等在传统钻速方程基础上引入机械参数、水力参数和流变参数等 个量优化钻速方程 基于分形理 论 修 正 钻 速 方 程 提 高 预 测 精 度 .等通过引入岩石力学参数、压力和水力参数 修正钻速预测模型 等基于岩石可钻性 建立岩石单轴抗压强度、密度、硬度、孔隙度与机械钻速的数学模型.等基于切削齿和岩石的相互作用 建立
4、了机械钻速与切削齿数量、切削面积和钻头直径之间的关系 为钻头选型提供了参考思路 等使用岩石动态抗压强度代替静态抗压强度提高牙轮钻头钻速预测模型的精度 基于机器学习的钻速预测模型 基于现场大数据 等利用模糊类的机器学习算法 建立了 油田不同层位的钻速回归模型 但该模型的普适性和泛化性较弱 仅仅适用于 油田 为提高模型预测精度和泛化性 等归纳了神经网络()、支持向量机()、支持矢量回归()、极端机器学习()和梯度增强决策树()等算法在钻井工程中的适用性 提高了不同情况下对应模型的泛化能力和可靠性上述用于预测机械钻速的钻速方程模型存在建模困难、求解困难和对井场大数据利用率低下等问题 基于机器学习的钻
5、速预测模型存在模型输入层参数过多 寻找隐藏层最优的节点数困难、计算成本高、预测结果稳定性差且无法实现实时反馈参数合理性等问题 为实现钻速准确高效预测 本文提出一种基于主成分分析()优化的 ()神经网络机械钻速预测新模型 该模型以现场数据为基础 首先采用小波滤波法对数据进行降噪处理 其次采用 提取数据集主成分 降低输入层参数个数 缩小隐藏层节点数的寻找范围 并将主成分作为模型输入参数 预测机械钻速 最后 基于预测结果实时反馈参数合理性并加以调整 以期为提高机械钻速提供科学的指导意见 基于主成分分析的 神经网络基于主成分分析法 对 神经网络输入层参数进行降维 有利于缩小隐藏层最优节点数的寻找范围
6、降低计算成本 优化模型计算过程 提高模型预测结果的稳定性 主成分分析法()主成分分析属于降维算法 目的是将多个变量指标类型转化成少数几个主成分 且这些主成分是原始变量的最大线性无关组合 因此能代表原始数据的绝大部分信息 主成分分析原理是将离散的数据点(信息)尽可能地集中在一个方向(本质为找出数据中心 旋转坐标轴)并以该方向的信息作为描述系统内离散数据点的主要特征 以二维情况为例 原始变量为、由二维正态分布可知 样本点分布在一个平面椭圆内 若长轴方向取 短轴方向取 效果相当于将原坐标轴按照一定角度进行旋转 使更多的样本点都分布在坐标轴方向 如图 所示图 主成分几何关系图 由图 可以看出 坐标旋转
7、后有如下性质:新坐标、非相关 平面样本点的波动可以归结为 轴上的波动 而 轴上波动较小 称、为、的主成分 若椭圆长径远大于短径 则短径上的综合变量 可忽略不计 可只考虑长径()方向的波动 因此二维平面可降维成一维线性 故 即为、的主成分 基于数学角度 找出主成分即为找出样本数据集较大特征值对应的特征向量 神经网络 神经网络的原理是通过修正实际值和预测 石 油 机 械 年 第 卷 第 期值之间的误差 通过反向调节机制改变神经网络的权值和阈值 使预测值不断接近实际值 如果误差较大 则重新选择连接权值进行计算 直到误差满足要求 该方法解决了隐藏层不易确定的问题 具有较强的实用价值 模型机械钻速受到众
8、多因素综合影响 利用 方法可有效降低多影响因子间的冗余程度 从而获得机械钻速与影响因子间的本质关系 然后将数据集主成分作为 神经网络的输入参数 进行机械钻速预测 优化 神经网络算法步骤如图 所示图 基于 优化的 神经网络机械钻速预测模型流程图 基于 的机械钻速预测建模基于 的机械钻速预测建模步骤具体为:首先对钻井大数据进行预处理 清洗掉数据中的异常值、错误值等 其次对后处理数据进行主成分分析 降维输入层参数 缩小隐藏层神经元最优节点数的寻找范围 最后以数据集主成分作为 神经网络的输入参数 机械钻速作为输出参数 进行机械钻速的预测研究 钻井数据预处理井场中通过数字电路传输录、测井等数据 由于高频
9、数字电频的影响 信号中会出现大量带有尖峰或突变的异常“噪声”为提高原始数据中信息利用率 需除去噪声干扰成分 小波滤波法同时具备“局部化、窗口大小随频率变换”的优点 可对高频部分“高时间分辨率、低频率”影响产生的白噪声进行有效去除 将分析信号()作为小波变换 即有:()()()式中:()为经过小波变换后的去噪数据()为尺度因子 作用是实现基本小波()的伸缩变换 为平移因子 作用是实现基本小波在时间轴上的平移变换 主成分分析现场数据种类繁多冗杂 数据之间大多为非线性关系 为便于计算和现场简化应用 采用主成分分析对数据降维 简化计算 方法的计算步骤如下步骤:标准化处理 假设有 个样本 个指标 则可以
10、构成大小为 的样本矩阵:()()对式()按列计算均值再求标准差 得到数据集标准阵:()式中:为变量 的均值 ()()式中:为变量 的标准差对数据进行标准化处理:()式中:为变量 的标准化数据故原始样本矩阵经标准化后变为:()()步骤:计算标准化样本的协方差矩阵并求对应的特征值和特征向量 ()()()()式中:为变量标准化后的协方差 为数据集的协方差矩阵 年 第 卷 第 期汤 明 等:基于 算法的机械钻速预测研究 计算特征值:由于 是半正定矩阵 且矩阵的轨迹为 ()计算特征向量:()式中:为协方差矩阵的特征值 为协方差矩阵的特征向量步骤:计算主成分贡献率及累计贡献率 ()()()()式中:为主成
11、分贡献率 为主成分累计贡献率步骤:分析主成分代表意义 在实际应用中 主成分的选取原则为 选取累计贡献率超过的特征值对应的第一、第二、第 ()个主成分第 个主成分为:()()机械钻速预测建模 机械钻速预测模型框架结构如图 所示 机械钻速预测模型建模过程共分为 个部分:第一个部分为数据预处理部分 作用是收集整合现场实测数据并对数据进行降噪 提高数据可信度 第二部分为数据主成分分析部分 其目的是完成数据集的主成分分析 简化数据结构 第三部分为 神经网络的结构确定与训练部分 该部分的输入变量为第二部分中计算所得数据集主成分 输出变量为机械钻速 第四部分为预测误差分析和效果评价 若预测误差精度达到精度要
12、求 则输出预测结果、保存训练网络 并将 模型与传统的 模型进行横向对比 反之则调整网络结构 直到达到精度要求并进行模型的横向对比图 机械钻速预测模型框架结构图 实例分析大多数机械钻速类研究均以单井钻速作为预测 泛化性差 因此为增强模型泛化性 需扩大训练数据的范围 本次建模预测选用某区块 口井(井)的二开一趟钻数据作为训练集数据数据量为 组 参数预处理本次实例数据来自四川盆地川中地区 井区对完钻井中的录井、测井数据加以分析 筛选出钻压、扭矩、转速、排量、密度、切削深度、弹性模量、机械钻速等 组数据 表 列举了 井部分训练数据表 井部分训练集参数 井深/钻压/扭矩/()转速/()排量/()密度/(
13、)切削深度/弹性模量/机械钻速/()钻井现场环境复杂多变 使得数字电路中存在白噪声的干扰 现利用滤波法对数据进行降噪处理 以 井部分数据集处理结果为例 如图 所示在图 中 不同参数原始数据曲线包含许多尖峰状的异常值 应用滤波法降噪后 数据曲线光滑且轮廓清晰 数据曲线中的尖峰状异常值被有效消除 石 油 机 械 年 第 卷 第 期图 滤波法降噪处理效果前后对比 井区影响钻速的主成分将滤波后的数据进行主成分分析 其相关系数矩阵的特征值、对应的特征向量以及贡献率和主成分如表 所示表 相关系数矩阵特征向量 特征向量原始变量钻压()扭矩()转速()排量()密度()切削深度()弹性模量()特征值 贡献率/累
14、计贡献率/从表 可以看出 前 个主成分的累计贡献率达 因此可以考虑只取前面的 个主成分代表原始数据特征 数据集主成分如表 所示表 数据集主成分 样本主成分 数据集主成分及其载荷为:()()()第一主成分 在钻压、扭矩、转速上有中等成分的正载荷 而在切削深度上有中等程度的负载荷 其余变量上载荷都较小 可称第一主成分为机械参数成分第二主成分 在弹性模量上有较大程度的正 年 第 卷 第 期汤 明 等:基于 算法的机械钻速预测研究 载荷 在密度上有较大程度的负载荷 其余变量上载荷都较小 可称第二主成分为地层因素成分第三主成分 在排量上有较大程度的正载荷在弹性模量上有中等程度的负载荷 其余变量上载荷都较
15、小 可称第三主成分为水力参数成分第四主成分 在密度上有中等程度的正载荷在弹性模量上有较大程度的负载荷 在扭矩、排量、密度上有中等程度的负载荷 其余变量上载荷都较小 可称第四主成分为密度因素成分 机械钻速预测及误差分析 模型的数据集按照训练集、验证集 的方式送入模型训练 设置误差精度为 迭代次数为 学习速率为 测试集和训练集精度如图 所示图 模型验证图集 神经网络精度受隐藏层数和隐藏层节点数影响 故提高网络预测精度方法有 种:增加隐藏层数 优选隐藏层节点数 增加隐藏层可提高计算精度 但随着隐藏层的增加 网络训练时间和过拟合概率将会大大增加 因此本文采用优选隐藏层节点数的方式提高网络预测精度 隐藏
16、层神经元个数受到输入层参数的影响 以 和 分别作为隐藏节点数上、下限 做出不同输入参数数量下的隐藏层神经元节点数和节点数对应的误差曲线图 如图、图 所示 从图 可知 输入层参数范围为 隐藏层神经元范围为 可见隐藏层神经个数优选范围较大 但是通过主成分降维后 不仅可保留大部分原始数据的有效信息 还可有效缩小最优节点数的寻找范围 由图 和图 可知:隐藏层节点数为 对应误差最小仅为 输入参数个数为 代表原始变量 的信息 对应隐藏层神经元范围为 输入参数个数为 代表原始变量 的信息 对应隐藏层神经元范围为 综合考虑网络误差和原始变量信息反映程度选择输入层参数个数为 隐藏层节点数为 其中 法为:()法为
17、:()()式中:为隐藏层神经元个数 为输入层神经元个数 适用于单层网络的隐藏层节点数确定图 输入参数个数与节点数关系 图 节点数与误差关系图 图 为机械钻速预测结果横向对比 图 为不同模型误差频率分布 从图 和图 可以看出 模型的预测结果相较于、和 的预测结果 真实值和预测值间的符合度更高变化趋势更接近 并且模型预测产生的误差更小其中 模型误差在 以内的频数占比为 由此可见该模型预测结果的误差大多数都在 以下 而、和 在 以内的误差频数占比为 、和 表明计算精度相较于 明显降低 在 石 油 机 械 年 第 卷 第 期内的误差频数占比分别为 、和 相较于 其误差频数占比分别增大、和 由此可见 模
18、型误差范围更小、预测精度更高、适用性更强图 机械钻速预测结果横向对比 图 不同模型误差频数占比分布图 为验证 模型相较于、和 模型的优越性 在预测结果和误差统计的基础上 选取拟合优度()、均方根误差、平均绝对百分比误差和迭代次数作为评价模型的指标横向对比各模型的优势 结果如表 所示在表 中 模型的迭代次数与 年 第 卷 第 期汤 明 等:基于 算法的机械钻速预测研究 相同 但其均方根差和平均绝对百分比误差较 模型分别降低 和 拟合优度提高 表明在算力接近的情况下 的预测精度高于 相较于 模型 的均方根差、平均绝对百分比误差和迭代次数分别降低 、和 拟合优度提高 相较于 模型 分别降低 、和 拟
19、合优度提高 以上分析表明 本文提出的 机械钻速预测模型预测精度高 迭代速度快 便于应用表 不同模型评价指标 模型指 标拟合优度均方根误差平均绝对百分比误差迭代次数 影响机械钻速的参数实时评价基于机械钻速预测结果 开展影响机械钻速的参数实时评价 如表 中所示的、和 这 点位于水平段()可以看出机械钻速变化较大 点到 点 机械参数成分加强 水力参数成分减弱 其他成分变动较小 机械钻速降低 点到 点 机械参数成分减弱 水力参数成分加强 其他成分变动较小 机械钻速升高 由此可见 水平段中水力参数成分是导致机械钻速变化的主要原因 增大水力参数有利于提高机械钻速表 不同钻速下的主成分 位置机械钻速/()结
20、 论()以 井区为例 采用主成分分析法 选取 个主成分 可涵盖 的原始数据特征 能有效降低数据集的维度 节省大量的计算时间 提高数据集使用效率()基于 神经网络 建立机械钻速预测模型 与、和 等智能算法相比:均 方 根 误 差 分 别 降 低 、和 平均绝对百分比误差分别降低 、和 拟合优度分别提高 、和 表明 模型预测精度高、迭代速度快()在实际钻井过程中 基于 算法的预测结果 反演任意井深下主成分中的工程参数对机械钻速的影响 并以此为依据调整工程参数可有效提高机械钻速 提升钻井效率参 考 文 献 .():.:.():.().:.():./.:.:.():.:石 油 机 械 年 第 卷 第
21、期 .:.:.:.:.:谢中华.统计分析与应用:个案例分析.北京:北京航空航天大学出版社:.:.:温正 孙华克.智能算法.北京:清华大学出版社:.:柳建楠 刘文峰 王伯雄 等.应用于超声测距的小波变换滤波算法.清华大学学报(自然科学版)():.()():栾孟杰.基于小波阈值法和 自适应滤波法的舰船去噪方法 .舰船科学技术 ():.():李琪 屈峰涛 何璟彬 等.基于 的钻井机械钻速预测模型.西安石油大学学报(自然科学版)():.()():王学民.对主成分分析中综合得分方法的质疑.统计与决策 ():.():王学民.主成分分析和因子分析应用中值得注意的问题.统计与决策 ():.():张俊虎 刘赟玥
22、 王玲玲 等.基于属性核特征选择与隐含层节点数动态确定的 神经网络模型.青岛科技大学学报(自然科学版)():.()():孙弋清.基于进退法的神经网络隐含层节点数的确定方法 .现 代 商 贸 工 业 ():.():蔡荣辉 崔雨轩 薛培静.三层 神经网络隐层节点数确定方法探究 .电脑与信息技术 ():.():张德贤.前向神经网络合理隐含层结点个数估计.计算机工程与应用 ():.():夏克文 李昌彪 沈钧毅.前向神经网络隐含层节点数的一种优化算法.计算机科学 ():.(下转第 页)年 第 卷 第 期汤 明 等:基于 算法的机械钻速预测研究 :()./.:.().():./.():黄哲.面向油气钻井振
23、动测量的空间三轴加速度传感器阵列研究 .电子测量技术 ():.():.().:.().:.:.刘伟 周英操 王瑛 等.井下振动测量、分析原理研究.石油钻采工艺 ():.():唐翰文 张涛 李玉梅 等.基于优化 的近钻头黏滑振动等级评估方法.系统仿真学报 ():.():第一作者简介:黄 哲 工程师 生于 年 年毕业于中国石油大学(北京)获博士学位 现从事微小井眼轨迹测控、井下装备研制、优化参数钻井、智能钻井、软件开发等领域研究工作 地址:()山东省东营市:收稿日期:(本文编辑 刘 锋)(上接第 页).():田国钰 黄海洋.神经网络中隐含层的确定.信息技术 ():.():王嵘冰 徐红艳 李波 等.神经网络隐含层节点数确定方法研究.计算机技术与发展 ():.():.():.:王小川 史峰 郁磊 等.神经网络 个案例分析.北京:北京航空航天大学出版社.第一作者简介:汤 明 副教授 生于 年 年毕业于西南石油大学油气井工程专业 获博士学位 现从事油气井控、井壁稳定和钻井工艺等方面的研究和教学工作 地址:()四川省成都市:通信作者:何世明:收稿日期:(本文编辑 刘 锋)石 油 机 械 年 第 卷 第 期