收藏 分销(赏)

基于大数据的公路工程安全智能管控云平台构建研究.pdf

上传人:自信****多点 文档编号:582615 上传时间:2024-01-02 格式:PDF 页数:4 大小:1.60MB
下载 相关 举报
基于大数据的公路工程安全智能管控云平台构建研究.pdf_第1页
第1页 / 共4页
基于大数据的公路工程安全智能管控云平台构建研究.pdf_第2页
第2页 / 共4页
基于大数据的公路工程安全智能管控云平台构建研究.pdf_第3页
第3页 / 共4页
亲,该文档总共4页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、在公路工程中,由于施工流动性大、施工难度系数高,以及复杂的施工地形等因素,导致公路工程安全管理的难度增高1-2。随着信息技术的快速发展,基于大数据的安全管理得到了广泛应用,人工智能技术等为安全管理的改革创新提供了新的思路3。借助数据挖掘等先进的信息技术,可以提高安全管理的水平,对可能存在的安全事故进行预警,从而降低安全事故的发生率4。此次研究中,利用随机森林算法建立了以大数据为基础的安全智能管控云平台,希望可以借助该平台保障公路工程的安全实施。1 基于大数据挖掘的安全智能管控云平台1.1 基于决策树约简的随机森林算法数据挖掘技术中的随机森林算法以决策树作为基本分类模型,可以减少模型的偏差与方差

2、5-6。构建过程中,将样本数据集的抽取,作为训练决策树的样本集。然后是特征的选择,将决策树分裂时产生的最优特征作为模型的根节点,采用递归法生成信息增益、信息增益比和基尼指数 3 种不同特征的决策树。在样本训练时,基于大数据的公路工程安全智能管控云平台构建研究赵芳(山西路桥第二工程有限公司,山西临汾041000)摘要:我国公路、隧道等规模的增加给公路施工带来更高的危险系数,因此亟需进行安全管理系统的建设。利用决策树约简对随机森林算法进行优化,然后采用聚类方法得到高精度的随机森林,并将其应用于安全平台的数据层进行数据挖掘。实验结果表明:改进算法的平均准确率 86.28%、精确率 85.62%、召回

3、率 87.62%和 F 值 86.58%。改进模型预测结果的相对误差均小于传统的算法,在数据集 4 中,改进模型的误差值最小为 2.2%。实验结果表明,基于改进随机森林算法的安全平台模型具有较好的准确性,且该模型的分类性能高、规模低、资源消耗少,适用于公路安全智能管控云平台中。关键词:大数据;工程安全;智能管控;云平台;随机森林;决策树图1 随机森林算法的整体结构数据集子集2决策树模型2结果2最终类别投票决策树模型n结果n决策树模型1结果1子集1采样随机特征选取随机特征选取随机特征选取训练训练训练子集nCM&M 2023.0463因此需要对决策树进行剪枝操作7。在本次实验中,采取一种改

4、进的随机森林算法对决策树进行特征约简,以降低模型预测的时间,并减小模型存储。利用分类精度和多样性度量标准,选择性能较优的决策树,其中分类精确度的指标可以采用准确率、召回率和曲线下的面积(Area Under the Curve,AUC)等。AUC 表示接收器工作特性曲线下的面积,在 0,1 取值范围内,AUC 的值与模型区分能力成正比。AUC 可以用于二元分类问题。在本次实验中,选择将其作为分类性能的衡量指标。在对多元分类问题进行评估时,需要先将其拆分,求取平均值来评估模型的分类性能,如公式(1)所示。(1)式(1)中,K表示样本的分类数量,i类和j类样本的集合分别用Di和Dj来表示。假设有分

5、类器hi和hj分类器,对于样本xk,可以得到公式(2)中的输出结果hi(xi)。(2)式(2)中,c表示维度向量,pi,c(xk)表示样本xk在c维中属于j类样本的概率。定义分类器hi预测样本xk为类标记s的程度为Ci,其计算见公式(3)。(3)式(3)中,pi,s(xk)=maxhi(xk)。将待测数据集X分为输出类标记相同与不相同的数据集X1和X2,见公式(4)和(5)。(4)(5)在公式(4)和(5)的基础上,定义分类器hi和分类器hj的多样性度量方法,见公式(6)。类算法对子森林进行聚类,将其组合成新的随机森林。改进随机森林算法 TRRF 的流程如图 2 所示。利用验证数据集对原始随机

6、森林中决策树的 AUC值进行计算,作为其分类精度。由于数据集的特征维度、噪声数据等有差异,导致在利用分类精度筛选决策树时,高精度决策树的比例不一致。因此此次实验采取决策树数量不固定的办法,利用公式(7)找到比原始随机森林F分类精度更高的子森林SubF。(7)式(7)中,F=ti,i=1,2,.,K,A表示F中分类精度的均值,决策树ti的 AUC 值为Auci。如果子森林SubF中的决策树超过F中 2/3 的数量,则该子森林SubF可以作为需要进行聚类处理的子森林。如果子森林中的SubF决策树未超过 2/3 的数量,则计算F中所有Auc的标准差值,选择符合AucA-条件的决策树作为待聚类子森林。

7、将SubF进行聚类处理,把该子森林中所有决策树的分类结果作为数据集,假设子森林SubF中包含的决策树数量为P,那么可以得到P个需要进行聚类处理的样本。聚类处理的初始聚类中心从数据集中随机选取K个数据,然后计算样本x与聚类中心的最短距离D(x),利用公式(8)计算样本被选为聚类中心的概率。(8)利用公式(8)进行重复计算,直至聚类中心保持不变,最后可以得到K个聚类中心。利用公式(9)计算不同K值下每个类簇的轮廓系数。(9)式(9)中,类簇中所有样本到样本i的平均距离可以用ai来表示,最近类簇中所有样本到样本i的平均距图2 改进随机森林算法TRRF的流程数据集验证数据集AUC1AUC2AUCK训练

8、子集2训练子集1训练子集n训练子集2训练子集1选取高精度子森林聚类生成类簇组合生成子森林训练子集n抽样 (6)式(6)中,Mi,j 0,1,其值越接近 1,表明分类器hi和分类器hj间的差异越大。当Mi,j=0 时,分类器hi和分类器hj预测类标记一致;当Mi,j=1 时,分类器hi和分类器hj预测类标记不一致。1.2 基于决策树约简和聚类分析算法的随机森林算法利用分类精度和多样性度量标准进行决策树数量的约简,可以得到分类性能较优的决策树,接下来利用聚64工程机械与维修CONSUMERS&CONSTRUCTION用户施工离可以用bi来表示。假设数据集中存在n个样本,则数据集整体的轮廓系

9、数可以利用公式(10)得到。(10)数据集整体的轮廓系数值在-1,1 之间,SC=1 表示聚类结果最佳,SC=-1 表示聚类结果最差。选取最佳类簇中具有代表性的决策树,将这些决策树进行组合,生成精度高、相似度低的随机森林。1.3 基于改进随机森林算法的公路工程安全智能管控云平台构建在信息时代,可以借助科学技术对安全管理进行改进。在本次研究中以安全管理数据为基础,利用人工智能技术中的深度学习对大数据进行挖掘,以此来构建安全智能管控云平台。智能管控云平台的建立主要包括 4 个逻辑步骤:首先,对安全风险进行识别并获取数据信息;其次,对工作人员的行为、设备操作和设备运行等进行数据集成与分析;再次,对收

10、集到的安全信息进行智能预警;最后,实现安全管理与应用。安全管理智能云平台的架构如图3 所示。在智能云平台的设计中,将平台分为了感知层、逻辑层、数据层、功能层和应用层。人工智能技术是识别安全隐患和实现预警的关键技术,主要应用于智能平台的数据层。人工智能分析模块,对数据层中的安全管理信息进行变量筛选,然后建立数据分析模型。通过模型性能的对比与优化,可以得到准确的分类结果,获得最优的分类模型。深度学习技术作为人工智能中的重要组成部分,可以实现对图像进行自动识别和捕捉,并进行安全隐患的分析及预警,从而避免安全公路施工过程中安全事故的发生。在上述研究中,数据层主要是利用改进的随机森林算法,对数据进行挖掘

11、分析,所得到的分析结果用于保证功能层和应用层的正常运转。2 实验结果和分析实验中选择 UCI 公开数据集、Bank Marketing 数据集、Sonar 数据集和 Income 数据集,用于随机森林改进算法性能的检验。选用准确率、精确率、召回率以及精确率和召回率的比值 F 值作为评价指标。2.1 两种随机森林算法各测试指标对比两种随机森林算法各测试指标对比如表 1 所示。表1 显示了改进的随机森林算法和原始的随机森林算法,在 UCI 公开数据集、Bank Marketing 数据集、Sonar 数据集和 Income 数据集中的各测试指标结果。由表 1 可知,在 UCI 公开数据集中,经过改

12、进的随机森林算法准确率为 88.07%,精确率为 86.15%,召回率为88.27%,F值为 87.16%,均高于原始的随机森林算法。在Bank Marketing 数据集中,经过改进的随机森林算法准确率为 83.02%、精确率为 81.91%,召回率为 85.14%,F值为 83.53%,均高于原始的随机森林算法。在 Sonar 数据集中,经过改进的随机森林算法准确率为 86.36%、精确率为 86.25%,召回率为 87.57%,F值为 86.86%,均高于原始的随机森林算法。在 Income 数据集中,经过改进的随机森林算法准确率为 87.67%、精确率为 88.17%,召回率为 89.

13、49%,F值为 88.78%,均高于原始的随机森林算法。2.2 不同数据集中两种随机森林算法各测试指标对比表 2 中展示了传统的随机森林算法和改进的随机森林算法的决策树数量、多样性度量值,以及各算法的运行时间。表1 两种随机森林算法各测试指标对比数据集算法正确率/%精确率/%召回率/%F值UCI随机森林84.9479.9985.9582.82改进的随机森林88.0786.1588.2787.16Bank Marketing随机森林77.2776.0577.9777.47改进的随机森林83.0281.9185.1483.53Sonar随机森林81.7179.9982.0181.00改进的随机森林

14、86.3686.2587.5786.86Income随机森林86.6684.6486.7685.65改进的随机森林87.6788.1789.4988.78图3 安全管理智能云平台的架构应用层安全智能云平台应用信息共享一体化协调公有云私有云大数据云基础设施动态数据静态数据服务器局域网安全智能管控大数据应用功能安全智能管控大数据分析与存储安全数据处理原始数据处理功能层数据层逻辑层感知层CM&M 2023.0465传统的随机森林算法和改进的随机森林算法的指标对比结果,其中多样性度量值采用了熵度量作为对比的标准。2.3 真实数据集中安全管理模型性能测试结果由上述结果可以看出,改进算法的熵度量值

15、较传统算法均有所增长,且改进算法的规模比传统算法的规模低。但是对比传统算法与改进算法的运行时间,可以看到改进的随机森林算法由于引入了聚类算法,导致改进随机森林算法的运行时间高于传统的随机森林算法,时间开销较高。利用 7 个的真实数据集,对安全管理模型进行整体的算法性能测试,结果见图 4。由图 4 可以看出,不同算法建立的安全管理模型预测结果的相对误差值,传统随机森林模型中的相对误差,均大于改进的随机森林模型。在数据集 4 中,改进的随机森林模型误差值最小为 2.2%,验证了基于改进随机森林算法的安全平台模型具有较好的准确性。3 结束语在公路工程施工的安全管理研究中,利用改进的随机森林算法构建安

16、全智能管控云平台。利用决策树约简和聚类分析对随机森林模型进行优化,在不同的数据集中的测试结果表明,改进算法的平均准确率 86.28%、精参考文献1 魏丽彬.基于 BIM 技术的高速公路隧道安全运营管理应用研究 J.公路交通科技:应用技术版,2019,15(11):234-236.2 吴翚,李昊,姜兰兰,等.山区公路安全风险点研判与评价研究 J.公路,2019,64(6):55-60.3 FRodrguez,Florez-TapiaAM,LFontn,etal.Veryshort-termwindpowerdensityforecastingthroughartificialneuralnetw

17、orksformicrogridcontrolJ.RenewableEnergy,2020,145(C),1517-1527.4 PethZ,TrkR,SzalayZ.Asurveyofneworientationsinthefieldofvehicularcybersecurity,applyingartificialintelligencebasedmethodsJ.TransactionsonEmergingTelecommunicationsTechnologies,2021,32(10):1-19.5 LanT,HuH,JiangC,etal.Acomparativestudyofd

18、ecisiontree,randomforest,andconvolutionalneuralnetworkforspread-FidentificationJ.AdvancesinSpaceResearch,2020,65(8):2052-2061.6 Tang,Zhipeng,MEI,etal.IdentificationofthekeyfactorsaffectingChinesecarbonintensityandtheirhistoricaltrendsusingrandomforestalgorithmJ.JournalofGeographicalSciences,2020,30(

19、5):56-69.7 XiangB,ZengC,DongX,etal.TheApplicationofaDecisionTreeandStochasticForestModelinSummerPrecipitationPredictioninChongqingJ.Atmosphere,2020,11(5):508-522.图4 真实数据集中安全管理模型的性能测试结果表2 不同数据集中两种随机森林算法各测试指标对比算法数据集UCIBank MarketingSonarIncome随机森林决策树数目220220220220熵度量0.730.660.650.70运行时间/s58175155145改进

20、的随机森林决策树数目19231721熵度量0.790.760.720.78运行时间/s79244219211确率 85.62%、召回率 87.62%和F值 86.58%均高于原始的随机森林算法。传统随机森林模型中的相对误差均大于改进的随机森林模型。真实数据集中改进的随机森林模型误差值最小为 2.2%。改进后的随机森林算法的分类性能高,模型规模降低,资源消耗减少。但是改进的随机森林算法运行时间较长,后续研究中可以考虑通过并行设计来减少运行时间的消耗。数据集改进的随机森林随机森林预测结果的相对误差/%更 正本刊 2023 年第 1 期刊发的李会撰写的基于模型数据与变形监测分析深基坑安全处理研究一文,原文中表 1、表 2 表头有误,正确应为“表 1土层参数信息”、“表 2监测要求及测点布设”。特此更正。

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签
资源标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服