收藏 分销(赏)

基于PCA-RF模型的冲击地压预测.pdf

上传人:自信****多点 文档编号:575263 上传时间:2024-01-02 格式:PDF 页数:7 大小:3.35MB
下载 相关 举报
基于PCA-RF模型的冲击地压预测.pdf_第1页
第1页 / 共7页
基于PCA-RF模型的冲击地压预测.pdf_第2页
第2页 / 共7页
基于PCA-RF模型的冲击地压预测.pdf_第3页
第3页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第39 卷第4期2023年8 月Journal of Harbin University of Commerce(Natural Sciences Edition)哈尔滨商业大学学报(自然科学版)Vol.39 No.4Aug.2023基于PCARF模型的冲击地压预测郭浩,杨超宇(安徽理工大学经济与管理学院,安徽淮南2 32 0 0 0)摘要:为了提高冲击地压危害预测的准确性,基于主成分分析法和随机森林算法,构建了由主成分分析方法优化的随机森林模型,分析静态冲击地压数据并处理异常值,通过数据标准化处理、计算相关系数矩阵及累计方差贡献率,提取出5个主要特征.利用优化的随机森林模型训练冲击地压数据集

2、,使模型参数不断得到优化.以混淆矩阵中的准确率作为评估指标,将优化的随机森林模型与单一随机森林模型进行比较分析.实验结果表明,优化的随机森林模型比单一随机森林模型具备更好的效果,其准确率达到了88.9%,高于单一的随机森林模型,进而得出结论,即优化的随机森林模型能有效地对冲击地压危害进行预测,通过随机森林优化模型,一定程度上有效缩减冲击地压危害预测的时间.关键词:主成分分析;随机森林;冲击地压;混淆矩阵;机器学习;分类预测中图分类号:TD324文献标识码:A文章编号:16 7 2-0 9 46(2 0 2 3)0 4-0 413-0 6Prediction of rock burst base

3、d on PCA-RF modelGUO Hao,YANG Chaoyu(School of Economics and Management,Anhui University of Science&Technology,Huainan 232000,China)Abstract:In order to improve the accuracy of rockburst hazard prediction,based on theprincipal component analysis method and random forest algorithm,a random forest mod

4、eloptimized by the principal component analysis method was constructed.The static rockburstdata was analyzed and the abnormal values were processed.Five main features wereextracted through data standardization,calculation of correlation coefficient matrix andcumulative variance contribution rate.The

5、 optimized random forest model was used to trainthe rockburst data set,so that the model parameters are continuously optimized.Taking theaccuracy rate in the confusion matrix as the evaluation index,the optimized random forestmodel is compared with the single random forest model.The experimental res

6、ults show thatthe optimized random forest model has a better effect than the single random forest model,收稿日期:2 0 2 2-10-0 4.基金项目:国家自然科学基金(No.61873004,多源传感器环境下基于异构特征信息融合的行为识别)作者简介:郭浩(1999),男,硕士生,研究方向:冲击地压分类预测;杨超宇(198 1-),男,安徽理工大学教授,博士,研究方向:计算机信息技术应用.414.and its accuracy rate reached 88.9%,which was h

7、igher than the single random forestmodel.The results showed that the optimized random forest model could effectively predictthe rockburst hazards.Through the random forest optimization model,the time for predictingrockburst hazards was effectively reduced to a certain extent.Key words:principal comp

8、onent analysis;random forest;rockburst;confusion matrix;machine learning;classification prediction冲击地压16,又称为“冲击矿压”,在煤矿开采过程中,由于工作面的条件发生改变,导致巷道严重变形,煤岩受到破坏而引起的动力灾害1。目前,我国大部分矿务局均曾出现冲击地压事件,2 0 0 4 2 0 14年,大约出现35起,30 0 名工人身亡和10 0 0 余名职工伤亡2.2 0 2 0 年2 月2 2 日,山东能源集团龙煤矿4人不幸遇难,煤矿治理成为解决冲击地压问题的关键.冲击地压受到多种因素影响,如

9、围岩应力,切向应力,弹性能以及煤体本身因素等,姜福兴3基于应力等因素对冲击危险性进行分析和评估.在多因素影响冲击地压的条件下,提出多种机器学习模型用来预测冲击地压.预测冲击地压的模型有SVM、K NN、RF、XG B、G B、NB6),以及神经网络算法,如BP神经网络7,深度神经网络8 等等.国内外研究中,陶杰41利用模糊预测模型对冲击地压进行预测.李明亮用KNN、SVM、RF、LD A等六个机器学习模型9对岩爆等级进行预测,发现LDA模型能起到和实际等级相同的预测效果.谢学斌基于GA-XGB模型对冲击地压进行分类预测研究10.毕娟使用一种R型因子分析Fisher判别的预测模型,目的是提高预测

10、准确性.BOKE基于优化朴素贝叶斯模型对冲击地压进行分类预测12.学者都使用相应的模型对冲击地压进行了相应的冲击地压预测,但有些模型采用的数据集存在差异,其预测标准可能存在不同.本文基于优化的随机森林模型(PCA-RF)实现冲击地压的预测分类,对冲击地压数据预处理,选取出六个参数和标签值,利用主成分分析法对冲击地压数据集进行特征降维,构建优化的随机森林模型,对实验结果比较分析,将混淆矩阵及准确率作为模型评估指标.实验表明,PCA-RF模型准确率为8 8.9%,RF模型的准确率为7 7.8%,证实了哈尔滨商业大学学报(自然科学版)PCARF模型比RF模型拥有更好的预测效果,从而实现对冲击地压危害

11、的有效预测.1随机森林优化模型1.1随机森林算法RF算法5是基于Bagging思想的集成学习理论和随机子空间的一种多分类模型,是Bagging算法的改进版.RF使用了CART决策树为弱学习器,CART作为RF使用的弱学习器,CART分类树用基尼系数确定最佳特征,并确定该特征的最佳二值切分点,Gini(D)值越小,数据集D的纯度越高.基尼系数见式(1).Gini(D)=P(1-P)=1-P(1)其中:y为类别数,p(k)为一个样本被归类进第k类的概率,但RF计算也存在着缺陷,在噪声较大的类型或回归问题上很轻易发生过拟合现象,并且针对有各种取值属性的数据,取值分布较多的属性会对随机森林形成更大的影

12、响,所以随机森林在这些数据结果上出现的属性权值是不可信的.这也是单一的RF算法存在的缺陷.而PCA(Pr i n c i p a l C o m p o n e n tAnalysis)算法可以解决这一问题.1.2基于主成分分析算法优化为克服单一RF算法的弊端,基于PCA14算法对其进行优化并组合,使得优化后模型训练时间缩短,正确率比单一模型正确率更高.优化步骤如下:1)对数据进行去中心化,从而防止数据的差值太大而对实验产生影响;2)对数据样本进行标准化,标准化公式如式(2)所示,为总体数据平均值,N为样本总数,为标准差,通过此步骤消除数据之间量级不同带来的影响;3)计算样本相关系数矩阵D,通

13、过相关系数矩阵来获得变量与变量之第39卷第4期间的关系.相关系数矩阵如式(3)所示,其中:X是样本矩阵X(np)中第i列的所有元素,X。是样本矩阵X(np)中第j列的所有元素,x;为第i列的平均值,x,为第j列的平均值;i=j=1,2p.运算相关系数矩阵后,计算级别变量特征值入和特征向量t,并在求算出入值后再依大小顺序排列.这里还涉及计算的方差贡献率和累计方差贡献率,在当累计的方差贡献率达到了某一个百分比值后,其中的一些比较重要的变量就大体上就能够用来代表了整个数据集中的信息容量.最后一步是根据方差贡献率进行特征的选择并进行降维。Z=X-nn(xci-x,)?1(xgj-x,)2c=D=(dg

14、)pxp以上公式建立在X(n p)(p 值为6)原始矩阵转换Y(np)矩阵的基础上.通过主成分分析提取样本数据主成分,并且对数据进行预处理,消除了不同取值的数据对RF模型的影响,进而利用RF模型进行冲击地压的分类,这样组合的模型能够达到训练时间缩短,收敛速度提高,从另外一方面又提高了分类准确率的目的.因此将主成分分析与随机森林结合在一起,优劣互补,能够很好解决冲击地压预测分类问题.1.3模型结构与流程基于PCA-RF算法的模型,如图1所示,该模型主要涉及三个部分,即样本数据处理、数据特征降维、模型的训练及预测.首先通过对数据进行异常值处理,剔除样本偏差大的数据,尽可能使得样本数据更加平均,选取

15、合适的特征和标签,对标签进行分类并替换为数字标签,如原数据的标签为None、Li g h t、M o d e r a t e、St r o n g,需将原始标签替换为数字标签,依次为0、1、2、3.其次通过预处理过后的数据进行标准化,求得相关系数矩阵并计算方差贡献率,通过方差贡献率选取符合条件的几个成分,从而实现数据特征降维的目的.最后利用RF模型进行训练和预测,其中测试训练时,需设定模型循环迭代的次数,对模型产生的实验结果进行分郭浩,等:基于PCA-RF模型的冲击地压预测选取特征一提取标签(2)冲击地压数据图1PCA-RF算法模型Figure 1 The PCA-RF model(3)2数据

16、分析及预处理2.1数据来源通过相关文献10,13的查找及收集,共采集100条数据,数据特征分别为W。(弹性能指数)、Q。(单轴抗压强度)、,(单轴抗拉强度)、。(最大切向应力)、SCF(应力系数)、BCF(脆性系数).以数字代替原有标签,从无到强烈分别是None0、Light-1、M o d e r a t e-2、St r o n g-3.见表1.本文数据将冲击地压等级划分为四类,分别为无、轻度、中度、强冲击地压.四类占比依次为2 4.2 4%、2 6.26%29.29%、2 0.2%.如表2 所示,当围岩无任何现象发生时,为无冲击地压;当围岩出现破裂并伴随微弱声音则为轻度冲击地压;围岩破裂

17、程度更高伴随岩体松散则为中度冲击地压;围岩出现严重变形则为强冲击地压.2.2数据整体分析在图2 中,纵坐标依次分别为。Q,、SC F、BCF、We t,横坐标依次为None、Li g h t、M o d e r a t e、Strong四种强度.图中纵坐标为。和BCF数据比较集中,异常点较少.其余四类均出现超出上边缘的异常点,其中 SCF中 Strong类型和We中None类型异常点较多.415.析和评估。数据标准化计算相关系数主成分计算计算方差贡献率PCA对数据降维数据异常值处理冲击地压数据RF建模数据训练测试模型模型评估循环送代PCA-RF模型预测416.编号1234:99100轻度(Li

18、ght)中度(Moderate)强(Strong)哈尔滨商业大学学报(自然科学版)表1冲击地压数据Table 1Rock burst dataSCF54.213455.41768923650130:51.5132.057.2852Table 2Standard classification of rock burst等级无(None)第39卷BCFWet9.090.47.30.318.30.3860.38:6.333.7表2 冲击地压等级标准划分表特点无现象发生围岩出现破裂现象,有微弱的声音围岩出现更为严重的变形和破裂现象,伴随岩体的松散围岩严重变形,对巷道产生极大的影响,伴随强烈的爆破声和轰

19、鸣声数字标签原始标签157.0824.119.328.43521.675:0.3920.860.1414.0522224.6321.30ModerateModerateModerateModerate:ModerateNone15.0F2002001501506100500NoneLight Moderate StrongRockburst intensity32一0NoneLight Moderate StrongRockburst intensity2.3数据预处理对其异常值进行取中位数处理,并对整体数据进行标准化,标准化公式参考式(2),之后计算相关系数矩阵,相关系数矩阵如表3所示.在表

20、3中,SCF(应力系数)变量与。(最大切向应力)存在高度的相关性,其次就是BCF(脆性系数)与(单轴抗拉强度),相关性仅次于前者,12.510.061007.55.0502.5NoneLight Moderate StrongRockburst intensity50403020主王100ENoneLight Moderate StrongRockburst intensity图2各标签对应的箱线图Figure 2Boxplot for each label因此存在一定程度上的信息重叠,需对该预处理过后的数据集进行降维.采用PCA方法对数据进行降维,对其方差贡献率和累计方差贡献率见图3,在前5

21、个特征中,累计方差贡献率已经超过98%,一定程度上包含原有数据的完整信息.NoneLight Moderate StrongRockburst intensity30F20100NoneLight Moderate StrongRockburst intensity第4期SCFBCFWa1.0F0.80.60.4470.40.20.0Figure 3 Cumulative variance contribution rate chart3实验与结果分析3.1模型训练本文采用的模型分别为PCA-RF和RF模型,分别利用数据对其进行训练.在利用PCA对其数据集进行数据预处理过后,减少数据的允余,一

22、定程度上缩短模型训练的时间,提高模型的预测精准度.本文RF算法中,选定参数n_estimators为49,criterion为entropy,表示选用entropy信息熵来寻找节点和分枝,并对训练的模型进行迭代,不断使其准确率逼近一个有效的值,能一定程度上实现分类预测的效果.在对模型进行训练之后,统计各个模型的预测分类结果,采取准确率作为评价指标,以混淆矩阵的形式对实验模型的预测结果进行展示.同时统计每个模型的准确率,并进行不同模型之间的对比分析.在本文中,分别对两个模型进行训练,训练数据集和测试集的比例为8:2.3.2实实验结果分析3.2.1实验结果每个模型的预测与真实对比见表4,模型预测结

23、果混淆矩阵15见表5.表4中,左侧第二列为真郭浩,等:基于PCA-RF模型的冲击地压预测表3相关系数矩阵Table 3Correlation coefficient matrix table10.163 8540.163 85410.475 4720.511 5960.895 483-0.180 9680.297 3410.117 2550.534 3370.273 7100.9690.9890.8750.6972principal components图3累计方差贡献率图 417.SCFBCF0.475 4720.895 4830.511 596-0.180 96810.248 1780.2

24、48 1781-0.602 091 0.2878820.417 0700.355 573实标签,右侧为两个模型的预测结果,分别与真实数据进行对比;表5中为各个模型的预测结果的可视化,最左侧的0-3标签为对应的真实值,模型名cumulativevarindividual var46Wet-0.297 3410.534 3370.117 2550.273 7100.602 0910.417 0700.287 8820.355 57310.206 082-0.206 0821下方的0-3代表预测数据对应的标签,对角线是每个模型对应预测正确的个数,表4模型真实值与预测值对比表Table 4Compar

25、ison of model real valueand forecast value各模型真实值与预测值对比序号真实标签13(Strong)23(Strong)30(None)43(Strong)52(Moderate)63(Strong)73(Strong)80(None)90(None)103(Strong)112(Moderate)121(Light)130(None)14o(None)151(Light)163(Strong)171(Light)180(None)准确率3.2.2结果分析模型预测对比如图4所示.数字0 3分别对应四个等级,等级程度以数值大小依次递增.PCA-RF模型有两

26、个预测错误,样本序号为2 的将强PCA-RF32032332032100131088.9%RF32022332032110131077.8%418冲击地压预测为中度冲击地压;序号为8 的将无冲击地压预测为中度冲击地压,RF模型有四个预测错误,分别有2 个强冲击地压预测为中度冲击地压,1个无冲击地压预测为中度冲击地压,1个无冲击地压预测为轻度冲击地压,总体情况为Strong类型的冲击地压错误预测为除了无冲击地压(None)等级外其他冲击地压等级.两种模型中均未出现将严重冲击地压(Strong)预测为无冲击(None)地压,因为这种情况一旦在现实中发生,将会带来严重的后果,这会产生严重不良的影响.

27、通过实验结果可以看出,PCA-RF 的预测准确度最高.表5混淆矩阵Table 5Confusion matrixPCA-RF012301230(None)501041101(Light)030003002(Moderate)002000203(Strong)001600253+真实值:PCA-RF.RF210Figure 4 Comparison of model forecast4 结语通过对模型的训练与预测,结合混淆矩阵,通过对PCA-RF与RF模型进行比较,PCA-RF的预测准确度较高,从混淆矩阵及预测值和真实值的比较结果中可得到:在预测准确率方面PCARF模型 RF模型,且经过实验的验

28、证,运用主成分分析和不运用主成分分析的模型相比,前者在训练时哈尔滨商业大学学报(自然科学版)间上有一定缩短,从而达到缩短模型训练所需要的时间,提高模型效率的目的.因此,PCA-RF模型相对RF模型来讲,对冲击地压的预测具备一定的准确度,在一定程度上有利于对冲击地压进行有效的预测本文存在的不足:在预测结果中虽然PCA一RF模型总体预测效果不错,但还存在个例预测错误的现象,原因可能是算法内部的某些参数的设置有待提高和加强,后续工作将进一步完善参考文献:1窦林名,田鑫元,曹安业,等.我国煤矿冲击地压防治现状与难题J.煤炭学报,2 0 2 2,47(1):152-17 1.RF2陈结,高靖宽,蒲源源,

29、等.冲击地压预测预警的机器学习方法J.采矿与岩层控制工程学报,2 0 2 1,3(1):57-68.3姜福兴,刘懿,翟明华,等.基于应力与围岩分类的冲击地压危险性评价研究J.岩石力学与工程学报,2 0 17,36(5):10 41-10 52.4陶杰,邓东生,严武松.冲击地压模糊预测模型及应用J.科学技术创新,2 0 19(2 2):17-18.5田睿,孟海东,陈世江,等.RF-AHP-云模型下岩爆烈度分级预测模型J.中国安全科学学报,2 0 2 0,30(7):166-172.6丁月,汪学明.基于改进特征加权的朴素贝叶斯分类算法J.计算机应用研究,2 0 19,36(12):3597-360

30、0,3627.7 宋杰,王健,柳尚,等.基于改进PSO-BP模型的电磁辐射法冲击地压预测J.煤矿安全,2 0 19,50123456789101112131415161718样本序号图4模型预测对比图第39卷(6):205 208.8ZHANG J,WANG M,XI C.Prediction and Evaluationof Rockburst Based on Depth Neural Network J.Ad-vances in Civil Engineering,2021,2021(7):1-11.9李明亮,李克钢,秦庆词,等.岩爆烈度等级预测的机器学习算法模型探讨及选择J.岩石力学与

31、工程学报,2 0 2 1,40(S1):2806-2816.10 XIE X,JIANG W,GUO J.Research on RockburstPrediction Classification Based on GA-XCB ModelJ.IEEE Access,2021(99):1.11毕娟,李希建,陈刘瑜.预测冲击地压危险性等级R型因子Fisher判别J.中国安全科学学报,2 0 19,29(12):103 109,(下转50 1页)第4期5结语本文分析了管制员生活、工作环境中的众多应激源以及各个应激源对不良反应和应激的作用关系,利用模糊故障树映射模糊贝叶斯网络的空管人员人因可靠性评

32、估方法,评估了空管人员应激激活模糊可能性,逆向追踪各应激源的模糊重要度、状态重要度和后验概率,并通过算例验证了本文提出的模型方法的有效性,更加精确地确定了T-S模糊门条件概率将是下一步的研究重点.参考文献:1WIECMANN D,SHAPPELL S.A human error ap-proach to aviation accident analysis:the human factorsanalysis and classification system M.Hants,Ver-mont:Ashgate Publishing,2003.2TAYLOR S E.Health Psycholo

33、gyM.Boston:McGraw-Hill Press,1999.3 ROBBINS S P.Organizational Behavior M.ninth ed.New Jersey:Prentice-Hall International Press,2001.4蒋英杰,孙志强,谢红卫,等.人为差错概率量化方法综述J.科技导报,2 0 11,2 9(5):7 4-7 9.5 SHORROCK S T,KIRWAN B.Development and appli-cation of a human error identification tool for air trafficcontro

34、lJ.Applied ergonomics,2002,33(4):319-336.6 KIRWAN B,GIBSON H.CARA:A human reliabilityassessment tool for air traffic safety managementTech-nical basis and preliminary architecture M.London:The safety of systems.Springer,2007.7LI W C,DON H,YU C S.Routes to failure:Analysisof 41 civil aviation acciden

35、ts from the Republic of China刘继新,等:基于多应激源的空管人员人因可靠性分析47:1398-1409.9王世锦,隋东.空中交通管制员人因可靠性定量分析研究J.人类工效学,2 0 0 9,15(4):46-5 0.10LI P C,CHEN G H.A fuzzy Bayesian network ap-proach to improve the quantification of organizationalinfluences in HRA frameworks J.Safety Science,2012,50:1569-1583.11刘福鳌,赵振武,徐桢,等.

36、基于HFACS的管制员人因失误因素分析J.科技创新与应用,2 0 14(3):252-253.12袁乐平,张兴俭.空中交通管制员人因可靠性分析方法J.中国安全科学学报,2 0 17,2 7(9):98-103.13杨越,张燕飞,王建忠.基于CREAM和贝叶斯网络的空管人误概率预测方法J.中国安全生产科学技术,2 0 2 0,16(3):37-43.14GAITHER C,KAHALEH A.A modified model ofpharmacists job stress:The role of organizational,extra-role,and individual factors

37、on work-related out-comes J.Research in Social and AdministrativePharmacy,2008,4:231-243.15华小洋,胡宗武,范祖尧.模糊故障树分析方法J.机械强度,1998,2 0(1):35-40.16 WANG Y,XIE M.Approach to Integrate Fuzzy FaultTree with Bayesian NetworkJ.Procedia Engineer-ing,2012,45:131-138.501.using the human factors analysis and classif

38、ication sys-temJ.Accident Analysis and Prevention,2008,40:426-434.8ZAHRA M,ALI M.Measurement techniques for organ-izational safety causal models:Characterization and sug-gestions for enhancements J.Safety Science,2009,(上接418 页)12 KE B,KHANDELWAL M,ASTERIS P G,et al.Rock-burst occurrence prediction b

39、ased on optimized NaveBayes modelsJ.IEEE Access,2021(99):1.13YIGUO XUE,CHENGHAO BAI,DAOHONG QIU,etal.Predicting rockburst with database using particleswarm optimization and extreme learning machine J.Tunnellingand Underground SpaceTechnologyincorporating Trenchless Technology Research,2020,98(C).14BRUNI,CARDINALIV,VITULANOML D A ShortReview on Minimum Description Length:An Applica-tion to Dimension Reductionin PCA J.Entropy,2022,24:269.15 张开放,苏华友,窦勇.一种基于混淆矩阵的多分类任务准确率评估新方法J.计算机工程与科学,2021,43(11):1910-1919.16钱七虎.岩爆、冲击地压的定义、机制、分类及其定量预测模型J.岩土力学,2 0 14,35(1):1-6.

展开阅读全文
收益排行: 01、路***(¥15400+),
02、曲****(¥15300+),
03、wei****016(¥13200+),
04、大***流(¥12600+),
05、Fis****915(¥4200+),
06、h****i(¥4100+),
07、Q**(¥3400+),
08、自******点(¥2400+),
09、h*****x(¥1400+),
10、c****e(¥1100+),
11、be*****ha(¥800+),
12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服