1、第 卷第期 年月铀矿冶 收稿日期:基金项目:中核集团集中研发项目(),总装和科工局项目()第一作者简介:贾皓(),男,江苏沛县人,硕士,助理工程师,主要从事地浸采铀与人工举升工艺研究。通信作者简介:廖文胜(),男,江西赣州人,博士,正高级工程师,主要从事地浸采铀与化学方面研究。基于人工智能算法的地浸采区产量预测贾皓,廖文胜,杜志明,王亚安,王立民,(核工业北京化工冶金研究院,北京 ;中核矿业科技集团有限公司,北京 )摘要:在地浸采铀生产后期,金属产量持续下降,其铀浓度也受浸采工艺影响而不断变化,抽液量与浓度的乘积不能准确反映金属产量。通过对某矿床 采区生产数据进行归纳与分析,采用人工神经网络模
2、型对该采区金属日产量进行预测,并使用多元线性回归模型与之比较。结果表明二者均具有良好的精确度和泛化能力,其中人工神经网络模型效果更优,对金属日产量预测平均误差仅为 ,预测结果离群值较少且误差分布均衡。与简单计算金属日产量相比,使用人工神经网络模型预测采区产量,在精度上显著提高,能够为制定生产计划与增产提供理论指导。关键词:地浸铀矿;产量预测;人工神经网络;多元回归中图分类号:;文献标志码:文章编号:()犇 犗 犐:随着地浸采铀工艺的日趋成熟,地浸勘探领域智能化逐渐完善,通过与大数据、人工智能算法的深度融合,大幅提高了勘探工作效率与质量;地浸与水冶过程也基本实现了实时监控与数据集成调度,但对于在
3、生产过程中采集的数据仍然存在只收集不处理,或仅对数据直观判断的情况。对于海量数据,未进行深层挖掘与分析建模,不仅无法根据已有的生产参数安排未来生产计划,也无法精准把握矿区的生产趋势 。在铀矿采区开发的中后期,随着金属浸采率不断增加,其浸出液铀浓度与水量通常呈下降趋势,通过洗井、注液过滤、增强抽注循环等方式虽能够在短期内增加金属产量;但囿于资源总量,整体上金属产量仍呈降低趋势,导致开采成本显著增加。实际生产中的井场,在集控室与水冶车间对抽注液量、压力、金属浓度等参数的实时监控与采集,不仅能够对生产异常即时诊断,更有利于形成广泛全面的生产数据库。根据长周期下的生产参数建立数据模型,从而准确预测金属
4、产量,可为采区未来生产制度的调整与矿区的整体经济性评价提供参考。预测算法研究现状 智能算法应用领域目前,铀矿采区金属日产量预测主要通过平均铀浓度与日抽液量乘积求取,误差较大。基于人工智能算法的采区产量预测在铀矿领域研究较少,而在石油天然气、煤炭、稀土等领域应用较为成熟。薛永超等使用深度森林算法对油井产量做出预测,获得 左右的预测精度,该方法在传统的随机森林算法上做出了极大改进,但在精度上仍然存在优化空间。蔡光琪等基于原煤剥离量等自变量提出了改进的切比雪夫神经网络,该方式较传统 神经网络运算资源小且精度更高;但未考虑储量因素,具有一定局限性。马承杰考虑到传统数值模拟方式的缺陷,从储层物性出发,使
5、用长短期记忆神经网络与循环神经网络建立 数据模型,该模型性能优越,能够更好地捕捉时序关系差异;但在长期预测上精度仍有局限性,需进一步优化输入参数。地浸产量预测适用算法分析当前人工智能算法主要用于解决分类和回归问题;而本研究中的地浸产量预测问题,属于数据拟合回归范畴,因此诸如、决策树、等众多分类算法并不适用,应当从回归预测算法中选取合适算法进行。常见的回归算法有人工神经网络()、卷积神经网络、神经网络、逻辑回归、多元线性回归等。矿区内抽注液井数量多,现场针对单井能够获取的参数较为单一(仅有流量、金属浓度),数据维度过低,不利于高精度数值模型的建立。因此,笔者从数据集成角度考虑,以整个采区金属日产
6、量为研究对象,增加注液压力、注氧压力、浸采率等输入参数,从资源总量与浸采工艺数据入手,建立金属产量预测模型。本研究中可用的数据既有相关生产参数,也有相对应的每日金属量数据,可以采用有监督学习的算法。多元线性回归建模速度快、算力需求小、模型可解释性强,常被用于煤炭价格、地下水水位、煤矿井下瓦斯体积分数等具体指标数据的预测 ,与本研究中的数据类型较为契合。人工神经网络属于黑箱模型,可以充分逼近各类非线性关系,还具有并行分布处理与自适应未知参数的特点,该方法在页岩油藏产量与地下水涌水量等地质参数预测方面都有成功运用的先例 。因此本研究拟采用多元线性回归和人工神经网络算法建立模型。生产参数概况以北方某
7、矿床 采区进行分析,该采区铀金属储量为 ,截至 年月浸采率约 。该采区共包含 口抽液井与 口注液井(目前关停抽液井口),矿体平均厚度为 (厚度 ),平 均 铀 品 位 为 (品 位 ),平均平米铀量为 。该采区自 年 月开始投入生产,其金属日产量在 年中旬达到高峰(约 ),随后下降至约 。从井场集控室采集了对金属日产量存在相关性的变量(表)。该采区信息化程度较高,可获取抽液、注液与储量等众多参数。针对单日金属量的预测,需要使用每日采集一次或单日采集多次取平均值的参数。因此,舍弃取样频率较低的参数,如浸出液、离子浓度与电位等,以抽注液参数与金属浓度为主要研究变量。表采区生产参数汇总犜 犪 犫 犾
8、 犲犛 狌 犿 犿 犪 狉 狔狅 犳狆 狉 狅 犱 狌 犮 狋 犻 狅 狀狆 犪 狉 犪 犿 犲 狋 犲 狉 狊 犻 狀犿 犻 狀 犻 狀 犵犪 狉 犲 犪变量变化范围瞬时抽液量(犙)()瞬时注液量(犙)()累计总抽液量(犙)()日注液量(犙)()日抽液量(犙)()注液压力(犘)注氧压力(犘)平均浸采率(犚)剩余可采金属量(犚)金属平均浓度()()金属平均浓度为该采区各抽孔每日采样浓度的加权平均值,考虑到每日采样时刻的差异与单日内浓度波动,本研究通过表中的 个变量建立金属日产量预测模型,通过多元线性回归与人工神经网络方式实现产量预测。铀产量预测模型构建 基于多元线性回归方法的预测模型 多元线性
9、回归基本原理多元回归分析是指通过对多个自变量与个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时称为多元线性回归分析,公式为犳(狓)狓狓狀狓狀犫。()式()形式简单,易于建模且可解释性强。和犫通过均方误差最小化来确定,该方式又称“最小二乘法”,即找到条直线,使样本到直线上的欧氏距离之和最小,均方误差计算公式为(,犫)犿犻(犳(狓犻)狔犻)。()多元线性回归模型搭建以 个生产参数为自变量,金属日产量为因变量进行模型搭建。首先对所有自变量计算方差膨胀系数(,犞 犐 犉),犞 犐 犉是回归系数估计量的方差与假设自变量无线性相关时方差的比值,表示多元线性回归模型中的共线
10、性程度。其计算方法见式(),犚表示判定系数,是衡量模型拟合度的参量。犞 犐 犉(犚)。()第期贾皓,等:基于人工智能算法的地浸采区产量预测犞 犐 犉值越接近于,多重共线性越轻;反之越重。通常,对于犞 犐 犉 的自变量选择放弃;但考虑到本模型流量参数选取较多(存在一定的多重共线性),因此对犞 犐 犉适当放宽,对于犞 犐 犉 的自变量选择舍弃。各自变量的犞 犐 犉值见表,平均浸采率与瞬时注液量参数的犞 犐 犉,选择舍弃。表各生产参数犞 犐 犉与标准化系数计算结果犜 犪 犫 犾 犲犆 犪 犾 犮 狌 犾 犪 狋 犻 狅 狀狉 犲 狊 狌 犾 狋 狊狅 犳犞 犐 犉犪 狀 犱狊 狋 犪 狀 犱 犪 狉
11、 犱 犻 狕 犪 狋 犻 狅 狀犮 狅 犲 犳 犳 犻 犮 犻 犲 狀 狋 狅 犳 犲 犪 犮 犺狆 狉 狅 犱 狌 犮 狋 犻 狅 狀狆 犪 狉 犪 犿 犲 狋 犲 狉变量名称犞 犐 犉标准化后系数瞬时抽液量(犙)瞬时注液量(犙)累计总抽液量(犙)日注液量(犙)日抽液量(犙)注液压力(犘)注氧压力(犘)平均浸采率(犚)剩余可采金属量(犚)金属平均浓度()完成变量预处理工作,即可进行多元线性回归建模,模型表达见式(),其中犳(狓)表示该采区金属日产量。该模型由于自变量较多,判定系数(犚)会随自变量数量的增加而增加,通常引入调整后的犚 来衡量模型效果。该参数能对添加的非显著变量给出调和,也就是说
12、降低变量数量过多对模型拟合度的无效提升,该模型中犚 ,说明模型拟合效果良好。犳(狓)犙 犙 犙 犘 犘 犙 犪 犚 。()由于各变量数值在数量级上差异较大,故式中变量系数不能反映各自变量对于金属日产量的影响程度,需要对自变量系数进行标准化处理,得到标准化后的系数(表)。可以看出,金属平均浓度起决定性作用,与常规计算方法相对应;日抽液量与日注液量的影响程度较大,表明流场循环情况对于金属日产量也具有重要影响。从多元线性回归模型效果(图)来看,在前期单日产量增长阶段,模型预测值与真实产量拟合良好;但在生产后期,预测值整体偏大且具有不稳定性。这是由于各自变量权重不变导致其某一部分适应性下降。单日金属产
13、量预测值平均误差约为 ;自 年 月至 年 月的总产 量 预 测 误 差 为 ,相 对 误 差 为 ,整体预测效果可靠。图多元线性回归模型训练效果犉 犻 犵 犜 狉 犪 犻 狀 犻 狀 犵犲 犳 犳 犲 犮 狋 狅 犳犿 狌 犾 狋 犻 狆 犾 犲 犾 犻 狀 犲 犪 狉 狉 犲 犵 狉 犲 狊 狊 犻 狅 狀犿 狅 犱 犲 犾 铀产量的人工神经网络预测模型 人工神经网络基本原理近年来,有关神经网络在各学科领域的运用方兴未艾 。神经网络是由具有适应性的简单单元组成的广泛并行连接网络,能够模拟生物神经系统对外界情况做出交互反应,图为单个神经元示意图。权值;犫偏置;激活函数。图单个神经元计算原理犉
14、犻 犵 犆 犪 犾 犮 狌 犾 犪 狋 犻 狅 狀狆 狉 犻 狀 犮 犻 狆 犾 犲狅 犳 狊 犻 狀 犵 犾 犲狀 犲 狌 狉 狅 狀根据激活函数选取的不同,人工神经网络既铀矿冶第 卷可以解决分类问题,也可用来进行回归拟合,其模型结构见图。原始数据输入之前通常进行标准化处理以消除数据尺度间的差异,标准化计算公式为狓犻狓犻 (狓,狓狀)(狓,狓狀)(狓,狓狀)犻,狀。()图人工神经网络结构示意图犉 犻 犵 犛 狋 狉 狌 犮 狋 狌 狉 犲犱 犻 犪 犵 狉 犪 犿狅 犳犪 狉 狋 犻 犳 犻 犮 犻 犪 犾 狀 犲 狌 狉 犪 犾 狀 犲 狋 狑 狅 狉 犽多个隐藏层的设置能够识别出训练数据
15、的突出特征;激活函数能够给输出层中经过线性计算的系统添加非线性特征。其中 函数能够使神经网络模型更快速地收敛,避免过饱和现象,有效抵抗梯度消失问题,函数的公式为犳(狓)(,狓)。()在人工神经网络建立中,通常需要调节模型参数,性能最优的参数组合就是所求目标。贝叶斯优化算法基于现有的参数预测结果来建立替代函数(概率模型),通过替代函数得到目标函数最优解,可用来调节模型超参数。人工神经网络模型搭建搭建的人工神经网络产量预测模型,输入数据包含该采区 年 月至 年 月的生产数据,共 组。由于该模型不包含时间序列相关变量,部分日期无生产数据不影响模型精度。考虑到验证模型的泛化迁移能力,年月至 年月的生产
16、数据不纳入模型训练与测试。以表中的 个自变量为数据输入层,在输入之前通过标准化处理以消除不同参数间的差异。考虑到样本的均匀覆盖,在近年的 组生产数据中,按照 的比例随机选取训练集与测试集。使用训练集搭建模型,使用测试集对模型进行初步检验。该模型结构除了输入层与输出层外,还包含个隐藏层,通过贝叶斯优化算法调节得到最优模型参数。该模型第个隐藏层包含 个隐藏神经元,第个隐藏层包含 个隐藏神经元,最大迭代次数 次,初始学习率为 。基于以上参数即可得到人工神经网络产量预测模型。表使用贝叶斯优化后的超参数取值犜 犪 犫 犾 犲犜 犺 犲狏 犪 犾 狌 犲狅 犳 狊 狌 狆 犲 狉狆 犪 狉 犪 犿 犲 狋
17、 犲 狉 狊犪 犳 狋 犲 狉犅 犪 狔 犲 狊 犻 犪 狀狅 狆 狋 犻 犿 犻 狕 犪 狋 犻 狅 狀参数名称调整范围最优参数值第隐藏层节点数 第隐藏层节点数 最大迭代次数 初始学习率 从基于 组训练测试数据的模型效果(图)看出,实际金属日产量与人工神经网络模型的预测值变化趋势基本相同;在前期到达产量峰值前,实际金属日产量跳动较大,而人工神经网络模型预测值变化较平缓。这可能是由于生产前期金属浓度增长较快,地下流场不稳定且变化较快,反应速率持续增加;也可能是因每日的金属浓度记录时间不同造成的。对于产量下降阶段,人工神经网络模型的预测值较为精准,单日金属产量平均误差仅有 ;比多元线性回归模型更
18、为精确。从整体来看,人工神经网络模型对这年总产量的预测误差为 ,相对误差为 ;这也表明该模型预测精准,效果良好。图人工神经网络模型训练效果犉 犻 犵 犜 狉 犪 犻 狀 犻 狀 犵犲 犳 犳 犲 犮 狋 狅 犳犪 狉 狋 犻 犳 犻 犮 犻 犪 犾 狀 犲 狌 狉 犪 犾 狀 犲 狋 狑 狅 狉 犽犿 狅 犱 犲 犾实例运用与分析基于以上个预测模型,使用该矿床 采第期贾皓,等:基于人工智能算法的地浸采区产量预测区的 年月至 年月的数据进行泛化能力检验。多元线性回归模型检验多元线性回归模型针对验证数据集的预测与误差分布见图。可以看出,在这段时间前期,金属日产量在 波动;在生产中后期,金属日产量缓
19、慢下降。多元线性回归模型的预测趋势与预期相符;但数据波动较为严重,预测值变化趋势为降低增加降低,预测结果均衡性较差,但相对误差大多在之内。从期间金属总产量来看,整体预测较为可靠,相对误差为 。图多元线性回归预测检验与误差分布犉 犻 犵 犘 狉 犲 犱 犻 犮 狋 犻 狅 狀狋 犲 狊 狋 犪 狀 犱犲 狉 狉 狅 狉犱 犻 狊 狋 狉 犻 犫 狌 狋 犻 狅 狀狅 犳犿 狌 犾 狋 犻 狆 犾 犲 犾 犻 狀 犲 犪 狉 狉 犲 犵 狉 犲 狊 狊 犻 狅 狀 人工神经网络模型检验人工神经网络的预测结果与误差分布见图。可以看出,该模型整体趋势拟合效果良好,对跳动较大的产量数据拟合效果一般;绝大
20、多数预测值均分布在以内,且无明显变化趋势。该模型泛化能力较多元线性回归模型有了很大提高,从预 测 期 间 金 属 总 量 来 看,相 对 误 差 仅 为 ,说明该模型不仅能够准确预测金属日产量,也能精准确定某段时间的金属总产量。图人工神经网络模型预测检验与误差分布犉 犻 犵 犘 狉 犲 犱 犻 犮 狋 犻 狅 狀狋 犲 狊 狋 犪 狀 犱犲 狉 狉 狅 狉犱 犻 狊 狋 狉 犻 犫 狌 狋 犻 狅 狀狅 犳犪 狉 狋 犻 犳 犻 犮 犻 犪 犾 狀 犲 狌 狉 犪 犾 狀 犲 狋 狑 狅 狉 犽犿 狅 犱 犲 犾铀矿冶第 卷 预测效果对比种方式预测效果对比见表。可以看出,多元线性回归模型和人工
21、神经网络模型的预测效果较简单金属日产量计算方法有了较大提高。通常使用金属浓度与当日抽液量相乘求解金属日产量,虽然计算误差大多分布在内;但由于计算值普遍偏小,因此预测值并不均衡,在日产量与总产量的预测上表现一般。多元线性回归模型的性能介于计算值与人工神经网络模型之间,其预测误差较小;但存在一定比例的离群值(相对误差大于)。人工神经网络模型表现优异,其金属日产量与总产量误差均小于;虽然预测趋势较实际日产量更为平缓;但拟合效果最好,的预测值相对误差均在以内,且离群值较少,说明该模型预测精准且泛化能力良好。表种预测方法的预测效果对比犜 犪 犫 犾 犲犆 狅 犿 狆 犪 狉 犻 狊 狅 狀狅 犳狆 狉
22、犲 犱 犻 犮 狋 犻 狅 狀犲 犳 犳 犲 犮 狋 狊狅 犳 狋 犺 狉 犲 犲狆 狉 犲 犱 犻 犮 狋 犻 狅 狀犿 犲 狋 犺 狅 犱 狊模型名称日产量平均误差总产量误差误差占比误差占比误差大于 占比多元线性回归 人工神经网络 简单计算 结论针对地浸铀矿采区金属日产量预测问题,搭建了多元线性回归模型和人工神经网络模型,种模型较传统的金属日产量计算方法均有了较大提升。)通过对生产参数的分析,将变量精简后建立的多元线性回归模型能够对 采区的金属产量做出较为精确的预测,预测结果准确可靠,具有一定的泛化能力。从多元线性回归预测模型公式可以直观看出各生产参数与金属日产量的相关性与影响权重,可为生
23、产制度的调整与增产提供指导。)人工神经网络模型较多元线性模型在精度上进一步提高,对于近 个月采区预测的日产量平均误 差 仅 为 ,总 产 量 预 测 误 差 为 ,相对误差分布集中于 以内,模型预测效果优异。参考文献:张明林,刘洋,吴建勇,等中国铀矿地质勘查信息化建设现状及“十四五”发展思路世界核地质科学,():袁志华,孙占学,周义朋,等绿色铀矿山研究进展有色金属(冶炼部分),():陈军利,倪玉辉,于宝民绿色铀矿山建设标准构建思路铀矿冶,():关键,侯江,邢妍数 字 地浸 铀 矿山 顶 层 设计 研 究铀矿冶,():廖文胜,王立民地浸采铀过程中抽注液量影响因素分析铀矿冶,():薛永超,袁志乾,
24、金青爽,等基于深度森林算法的油井产量预测科学技术与工程,():蔡光琪,彭洪阁,周毅勇,等基于改进的切比雪夫神经网络的露天煤矿产量预测中国矿业,():马承杰基于循环神 经 网络 的 油藏 产 量 预测 方 法内蒙古石油化工,():刘威,陈文昊,姜宇翔,等基于多元线性回归模型对煤 炭 问 题 的 研 究 智 慧 中 国,():李啸基 于 多 元 线 性 回 归 对 地 下 水 水 位 的 预测 以山西定襄县平原区为例海河水利,():汝彦冬基于多元线性回归模型煤矿瓦斯体积分数预测哈尔滨商业大学学报(自然科学版),():周玉辉,龚杰,盛广龙,等基于人工神经网络的页岩油藏产量预测定量表征模型 大庆石油地
25、质与 开 发:何国富,张奇华,柳耀琦,等基于人工神经网络的地下水封洞库涌水量预测水利与建筑工程学报,():鲁中歧,肖文生,崔俊国,等基于参数优化神经网第期贾皓,等:基于人工智能算法的地浸采区产量预测络的海底油气管道腐蚀泄漏预测科学技术与工程,():盛茂,李根生,田守?,等人工智能在油气压裂增产中的 研究现 状 与 展望钻采工 艺,():贾杨官地矿区采动地裂缝影响因素分析和发育规模预测太原:太原理工大学,():犘 狉 狅 犱 狌 犮 狋 犻 狅 狀犘 狉 犲 犱 犻 犮 狋 犻 狅 狀狅 犳 犐 狀 狊 犻 狋 狌犔 犲 犪 犮 犺 犻 狀 犵犕 犻 狀 犻 狀 犵犃 狉 犲 犪犅 犪 狊 犲 犱狅 狀犃 狉 狋 犻 犳 犻 犮 犻 犪 犾 犐 狀 狋 犲 犾 犾 犻 犵 犲 狀 犮 犲犃 犾 犵 狅 狉 犻 狋 犺 犿 ,(,;,)犃 犫 狊 狋 狉 犪 犮 狋:,犓 犲 狔狑 狅 狉 犱 狊:;铀矿冶第 卷