收藏 分销(赏)

基于HA-RF-SHAP的露天煤矿粉尘浓度预测模型.pdf

上传人:自信****多点 文档编号:2585739 上传时间:2024-06-01 格式:PDF 页数:10 大小:6.76MB
下载 相关 举报
基于HA-RF-SHAP的露天煤矿粉尘浓度预测模型.pdf_第1页
第1页 / 共10页
基于HA-RF-SHAP的露天煤矿粉尘浓度预测模型.pdf_第2页
第2页 / 共10页
基于HA-RF-SHAP的露天煤矿粉尘浓度预测模型.pdf_第3页
第3页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 卷第 期 年 月西安科技大学学报 金磊,杨晓伟,张浩,等 基于 的露天煤矿粉尘浓度预测模型 西安科技大学学报,():,():收稿日期:基金项目:国家自然科学基金项目()通信作者:金磊,男,江苏徐州人,工程师,:基于 的露天煤矿粉尘浓度预测模型金磊,杨晓伟,张浩,杜勇志,李新鹏,戴春田,周伟(国能宝日希勒能源有限公司,内蒙古 呼伦贝尔 ;中国矿业大学 煤炭精细勘探与智能开发全国重点实验室,江苏 徐州 )摘要:为了有效预测和控制煤矿粉尘浓度,保障煤矿工人健康及环境安全,以宝日希勒露天煤矿现场粉尘监测数据为基础,使用随机森林对粉尘浓度进行预测,提出了 种启发式智能优化算法优化随机森林超参数的方法

2、,通过 、和皮尔逊相关系数 对模型进行评价,采用 可解释模型分析影响露天煤矿粉尘浓度的因素。结果表明:、的最优模型分别为 、和 ;超参数调整使模型整体 指标提升约为 ,提升约为 ,提升约 ;的预测表现最好,训练集与测试集共同作用时,为 ,为 ,为 ,其次是 、;单因素作用时,湿度对于该矿粉尘浓度影响最大,双因素同时影响下湿度和气压对粉尘浓度变化影响最大。研究提供了一个有效的粉尘浓度预测方法,可准确预测粉尘浓度并确定粉尘最影响因素,对矿山粉尘管控具有重要参考价值。关键词:露天煤矿;粉尘浓度预测;启发式算法;模型可解释性中图分类号:文献标志码:文章编号:():开放科学(资源服务)标识码():,(,

3、;,):,第 期金磊,等:基于 的露天煤矿粉尘浓度预测模型 ,;,;,;,:;引言露天开采是中国主要的煤炭开采方式之一,但是在开采过程中各个生产环节均伴随着粉尘的产生 。大量的粉尘不仅污染环境,还会对工人的健康造成危害,而预测粉尘浓度是有效预防这些危害的重要手段。因此,有效预测露天煤矿粉尘浓度具有非常重要的现实意义。随着计算机技术的发展,基于机器学习的粉尘浓度预测研究逐渐成为主流 。等通过 模型预测露天煤矿粉尘浓度,发现影响因素重要性顺序为:湿度 温度 噪声 风速 风向 ;等融合了注意力机制与长短期记忆网络,建立了露天矿 浓度预测模型,该模型具有稳定且精度较高的特点 ;王雅宁建立了用于露天矿粉

4、尘浓度预测的随机森林 马尔科夫模型,该模型的预测精度较高 ;等引入气象参数与生产强度,建立了露天煤矿粉尘浓度预报模型,该模型可有效指导矿山生产设计 ;张易容通过 、模型,选取时间与气象因子,建立了哈尔乌素露天煤矿 浓度预测模型,结果表明 精度较高 ;等通过 模型对露天煤矿粉尘浓度进行预测,将浓度进行严重与不严重分级,结果表明 浓度可能是矿区周边环境污染的前兆 ;等基于露天矿场监测的粉尘浓度数据和气象环境数据,建立了基于 神经网络的粉尘浓度预测模型 ;周旭等通过非线性自回归模型对矿井粉尘浓度进行预测 ;赵耀忠等通过 种机器学习算法,建立了多因素环境影响下的粉尘浓度监测模型 ;霍文等建立了环境因素

5、影响下的粉尘质量浓度预测模型 。上述学者均从不同角度建立了粉尘预测模型,但对于模型的组合优化以及模型可解释性研究较少,而露天煤矿粉尘浓度影响因素众多,合理地探究粉尘浓度影响因素尤为重要。随机森林作为一种经典的机器学习方法 ,因其可以有效处理多维特征以及适用于非线性问题而备受关注。同时,随机森林在处理大量特征时,能够给出特征的重要性排名,这对解释模型具有重要意义。近年来,()被引入到随机森林中,可以直观地展示各个特征对预测结果的贡献程度,因此对使用随机森林来预测露天煤矿粉尘浓度具有一定的研究意义 。文中旨在使用随机森林模型预测露天煤矿粉尘浓度,利用 方法对模型进行解释。基于宝日希勒露天煤矿实时监

6、测数据,分析了多个影响因素与粉尘浓度的关系。在模型训练时,通过种启发式算法对于随即森林超参数进行优化,并且使用了交叉验证方法,以优化模型的预测能力。通过 分析了输入特征的重要性排序,分析了输入特征相互作用下对于模型的预测结果。模型与方法 随机森林随机森林回归算法()是一种集成学习方法,通过同时训练多个决策树来进行回归分析。该算法在构建每个决策树时,都会随机选取一部分解释变量和样本进行训练,可以使每个树都拥有一定的独立性和随机性,从而避免过拟合和提高模型准确性。在结果预测时,随机森林将所有决策树的平均预测值作为最终预测值。当然,由于每个决策树的具体结构和随机性不同,因此会存在决策树之间的矛盾和互

7、补关系,随机森林可以通过平均期望和方差的方法来对这些矛盾和互补进行综合分析,从而更加准确地进行预测,随机森林原理示意如图 所示。随机森林是常用的回归算法,其在不同领域均取得良好的预测效果,具有以下的优点。)训练可以高度并行化,对于大数据时代的大样本训练速度有优势。)由于可以随机选择决策树节点划分特征,这样在样本特征维度很高的时候,仍然能高效的训练模型。)在训练后,可以给出各个特征对于输出的重要性。)由于采用了随机采样,训练出的模型的方差小,泛化能力强。)对部分特征缺失不敏感。?图 随机森林原理 启发式算法 布谷鸟算法布谷鸟算法(,)是一种基于鸟群觅食行为而提出的启发式优化算法。该算法通过模拟布

8、谷鸟个体之间的通讯和协同来寻求最优解,并在此过程中不断优化目标函数。算法中原布谷鸟使整个群体朝着历史最优解方向移动;迁徙布谷鸟通过内部搜索寻找更好的位置;寻食布谷鸟则通过外部搜索来扩大搜索范围。该算法具备计算复杂度低、收敛稳定等特点,在优化问题中有良好的表现。鲸鱼优化算法鲸鱼优化算法(,)是一种基于鲸鱼统一行为模式而提出的启发式优化算法。其核心思想是模拟鲸鱼的协同捕食行为,通过迭代寻找最优解。在优化过程中,算法分别模拟了鲸鱼个体搜索和群体协同行为。鲸鱼个体搜索策略可划分为类:螺旋游动和直线游动;群体协同行为则通过更新目标函数和控制参数不断调整搜索空间。该算法具有全局搜索能力强、鲁棒性、收敛速度

9、快等优点。哈里斯鹰优化算法哈里斯鹰优化算法(,)是一种基于生物协同策略而提出的启发式优化算法,模仿雌性和雄性哈里斯鹰在捕食过程中的竞争和协同行为。在优化过程中,随机分布的哈里斯鹰通过追逐各自感兴趣的捕猎目标,通过协同和竞争来得到更佳的搜索解。该算法具有收敛速度快、全局搜索能力强等优点。灰狼优化算法灰狼优化算法(,)是一种基于模拟灰狼社群行为而提出的启发式优化算法。算法将灰狼个体分为 、个等级,以模拟群体中不同等级个体之间的竞争和协作。在每次迭代中,狼根据历史最优解自我更新,狼参照 狼和其他 狼的位置更新自身;狼通过探索非主流位置来增加全局搜索的随机性。该算法具有较好的全局搜索能力和优化效果。种

10、启发式算法优化随机森林超参数的原理示意如图 所示。?图 启发式算法优化超参数原理 模型可解释性 是一种可解释性机器学习技术,它基于 值的思想,用来对特征对预测结果的贡献进行量化和可视化 。它通过计算特征的影响程度并提供重要性排序列表。同时以可视化形式展 西 安科技大学学报 年第 卷第 期金磊,等:基于 的露天煤矿粉尘浓度预测模型现特征与输出之间的关系,帮助理解模型的决策过程。的核心原理是基于 值,它是一个经典的合作博弈理论方法。在博弈论中,值用来衡量每个参与者对于最终结果所作出的贡献。在机器学习中,我们可以把模型看做一个博弈模型,特征则成为参与者。计算每个特征的 值,以此量化每个特征对于目标变

11、量的预测贡献度。值的计算公式为()!()!()()()式中 为一个合作博弈的收益函数,在机器学习中即为模型的输出;为参与者的数量,即特征的数量;为参与者的任意组合。值是在 值基础上发展而来的,的计算方法基于一个基准值,通常是数据集上的平均值或者中位数。对于每个样本,将其特征值分成 部分:已知和未知的特征。已知部分用来计算此时此刻特征的 值,未知部分则用于计算其他特征的 值。最后,将所有特征的 值相加,得到每个特征对应的 值。其计算公式根据不同的模型类型会有所不同。模型采用的随机森林算法,计算 值时使用 ,计算公式为(),(,(,)()式中 为特征的索引;为特征的数量;为参与计算的特征的集合;为

12、样本输入;为在不包括 这个特征的情况下,其他特征的取值;为加入 这个特征后的完整输入向量;(,)为没有 这个特征的条件下,模型对样本 的输出;(,)为包含 这个特征的情况下,模型对样本 的输出。是一种强大的可解释性机器学习技术,可以帮助我们理解模型的决策方式和特征的重要性,对于模型调优和解释结果具有重要作用。粉尘浓度数据概括研究地点为神华宝日希勒能源有限公司露天煤矿,矿田位于陈巴尔虎旗煤田宝日希勒露天煤矿西南部 。?图 监测点位置 模型粉尘浓度数据从宝日希勒露天煤矿现场收集,每 采集 次,共采集了 个月内矿区粉尘数据,共计 组,每个数据样本包括 个输入特征和 个输出特征,输入特征分别为噪声、温

13、度、湿度、风速、风向、气压,其中噪声指现场作业环境的声音大小,当现场作业强度较大时,噪声较大。输出特征分别为 、,参数统计信息见表 ,组内相关性分析热如图 所示,粉尘参数频数分布如图 所示。表 特征描述统计 噪声 温度 湿度 风速()风向气压 平均 众数 标准差 方差 最小值 最大值 观测数?图 组内相关性热图 结果与讨论 评价指标评价指标是衡量模型预测能力的重要工具,对于优化模型、提高预测精度至关重要 。在科学研究和实践应用中,正确选择评价指标有助于理解模型性能、进行模型比较和确定最优模型。使用 、和 作为模型评价指标。()是回归任务中的性能度量指标 ,表示真实值与预测值之差的平方根的平均值

14、。计算公式为 ()槡()式中 为样本数量;为粉尘浓度真实值;为粉尘浓度预测值;珋 为粉尘浓度真实值均值;珋 为粉尘浓度预测值均值。?图 粉尘参数频数分布 ()是回归任务中的性能度量指标,表示真实值与预测值之差的绝对值的平均值。计算公式为 ()皮 尔 逊 系 数 ()是衡量 个变量之间线性相关程度的统计量,取值范围为 到。具有较强正相关关系的变量,值接近 ,具有较强负相关关系的变量,值接近 ,无关或线性相关程度很小的变量,值接近 。计算公式为 西 安科技大学学报 年第 卷 模型效果对比采用 倍交叉验证以获得最优参数,在迭代过程中,随机森林的参数变化见表 。由于算法的随机性,实施微调以达到后续数值

15、,模型最佳超参数见表 。(珋)(珋)(珋)槡 (珋)槡()第 期金磊,等:基于 的露天煤矿粉尘浓度预测模型表 随机森林超参数取值范围 表 机器学习模型最佳超参数 、种指标的初始模型与使用 种启发式算法优化后的模型训练集与测试集评价指标,分别见表 ,表 ,表 。通常情况下,采用测试集的指标来评价模型效果的好坏,从表可以看出,种启发式算法对于随机森林模型均起到了良好的效果,对于 指标提升约为 ,对于 提升约为 ,对于 提升约 。对于 ,模型表现出了最优的效果,达 到 了 ,其 次 分 别 为 ()()()()。对于 ,模型表现出 最优 值(),其次分别为 ()()()()。对于 ,值为 的 模型表

16、现最好,其次分别为 ()()()()。、最优模型的所有数据集的表现,如图 所示。种指标的预测效果均取得了很好的效果,其中 的表现最好,在训练集与测试集共同时 为 ,为 ,为 ,采用了 种启发式算法优化随机森林表 模型指标 指标训练集指标 测试集指标?图 最优模型训练集与测试集表现?表 模型指标 指标训练集指标 测试集指标 表 模型指标 指标训练集指标 测试集指标 超参数,用于预测露天煤矿粉尘浓度。研究数据取自宝日希勒现场监测数据,而中国露天煤矿 位于北方高寒区 ,这意味着在气象条件上该矿与其他矿区表现相近。对于矿区粉尘浓度的收集,矿区大多采用监测点监测,这些数据与文中研究的数据近似。模型经过充

17、分的训练、验证和调优,以及数据收集准备的工作,使得模型具有普适性,并且有能力在其他露天煤矿环境下进行准确的粉尘浓度预测。综上所述,这一方法取得了显著的效果,并在实践中具备有效性与实用性。基于 的可解释性分析机器学习模型通常为“黑箱”模型,模型只能得到最终的结果,输入特征对于预测结果影响无法得知。而 模型就可以使我们知道这些已知条件到底对最终预测结果起到哪些影响,且不同的特征变量会对预测结果产生不同程度的影响。露天矿粉尘浓度影响因素众多,因此有必要分析众多影响因素对于粉尘浓度的影响特点。的摘要,如图 所示。根据选取的各类影响因子对 、和 浓度的影响重要性进行排序。分别表示噪声、温度、湿度、风速、

18、风向、气压。对于 、和 种预测指标,湿度和噪声均排在第 、第 ,说明这 个?图 摘要 西 安科技大学学报 年第 卷?第 期金磊,等:基于 的露天煤矿粉尘浓度预测模型因素对于露天矿粉尘影响程度最大,其次是温度和气压,对于 指标,气压的影响略高于温度,排名最后的是风速和风向。在机器学习模型中,不同特征之间可能存在相互作用的情况,即一个特征的取值会影响另一个特征的重要性或影响模型预测结果 。交互作用图是一种可视化方式,用于展示个特征之间的交互作用对模型预测结果的影响。交互作用的意义是,当这 个特征共同出现时,它们对模型输出的影响不仅仅是它们单独出现时的影响之和,而是会产生一种新的影响。、的影响因素相

19、互作用时对模型产生的影响,如图 所示。?图 模型相互作用影响 从图可以看出,湿度这一输入特征与其他的因素相互作用,对于模型预测结果均产生了不同程度的影响,由此可见,湿度对于模型的影响很大,其次为气压。其他因素的相互作用均表现了一定程度的影响,结果表明有必要探究两两因素间相互作用对于模型的性能影响。结论)有良好的鲁棒性,能够处理大规模粉尘检测数据。、的最优模型分别为 、和 。优 化 后 模 型 指标提升约为 ,提升约为 ,提升约 。)模型对于 的预测效果最优,为 ,为 ,为 ;其次是 ,为 ,为 ,为 ;的 为 ,为 ,为 。)单因素影响下,粉尘浓度影响最大的特征是湿度,其次是温度和气压;双因素

20、影响下,湿度和气压对粉尘浓度变化影响最大。)基于现场实际监测数据构建的 粉尘浓度预测模型可有效预测露天煤矿粉尘浓度,确定粉尘浓度最影响因素,对指导矿山现场粉尘管控、保障工人健康具有重要意义。参考文献():肖双双,马亚洁,李卫炎,等 我国露天矿粉尘防治理论技术近 研究进展与展望 金属矿山,():,():范英宏,陆兆华,程建龙,等 中国煤矿区主要生态环境问题及生态重建技术 生态学报,():,():李浩荡,佘长超,周永利,等 我国露天煤矿开采技术综述及展望 煤炭科学技术,():,():肖双双,马亚洁,李卫炎,等 基于 知识图谱分析的露天矿粉尘浓度预测研究进展与展望 西安科技大学学报,():,():,

21、:,:,():王雅宁 基于随机森林 马尔科夫模型的露天矿粉尘浓度预测研究 北京:中国矿业大学,:,:张易容 基于循环神经网络的哈尔乌素露天煤矿粉尘浓度预测 北京:中国矿业大学,:,:,():,:周旭,王艺博,朱毅,等 基于非线性自回归模型的矿井粉尘浓度预测 华北理工大学学报(自然科学版),():,(),():赵耀忠,严俊龙,任吉凯,等 基于机器学习的露天煤矿粉尘浓度预测 煤炭工程,():,():霍文,栾博钰,周伟,等 基于环境因素的露天煤矿粉尘质量浓度预测 辽宁工程技术大学学报(自然科学版),():,(),():彭豪杰,周杨,胡校飞,等 基于深度学习与随机森林的 浓度预测模型 遥感学报,():

22、,():魏梦飒,李强,许成娣,等 基于改进随机森林算法区域短期售电量预测方法 电子设计工程,():,():,陈道坤,周海,华红梅,等 神经网络和随机森林预测土壤有机质模型研究 安徽农学通报,():,():徐守权,唐国文,黄舞标,等 神经网络、随机森林和决策树预测急性脑梗死患者静脉溶栓后发生早期神经功能恶化的效能比较 实用心脑肺血管病杂志,():,西 安科技大学学报 年第 卷第 期金磊,等:基于 的露天煤矿粉尘浓度预测模型 ,():蔡怡晴,费正玉,梁诗雪 基于 的 板柱节点抗冲切承载力预测与影响因素分析 混凝土,():,():刘光伟,张靖,白润才,等 宝日希勒露天矿端帮高位煤层靠帮回采技术研究

23、重庆大学学报,():,():韩琳,李永峰,巫长悦,等 基于遥感生态指数的宝日希勒露天矿区生态修复效果评估 中国矿业,():,():高永涛,朱强,吴顺川,等 基于 模型的岩爆预测研究 华中科技大学学报(自然科学版),():,(),():薛双青,贺东东 基于 和双边滤波的医学超声图像去噪算法 西安科技大学学报,():,():冀汶莉,郗刘涛,柴敬 采场覆岩光纤监测数据 填补方法 西安科技大学学报,():,():赵源上,林伟芳 基于皮尔逊相关系数融合密度峰值和熵权法典型场景研究 中国电力,():,():郭亮,郭子雪,贾洪涛,等 基于皮尔逊相关系数与 的居民窃电识别 河北大学学报(自然科学版),():,(),():蒋海昆,王锦红 适用于机器学习的地震序列类型判定特征重要性讨论 地震研究,():,():赵健,刘彦辰,朱冰,等 基于 框架的越野车辆路面识别算法研究 力学学报,():,():(责任编辑:刘洁)

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服