机器学习在装修装饰行业成本估算的研究.pdf

资源描述

1、现代营销上旬刊2023.04XDYX科学管理一、DNN神经网络原理与工程成本估算本文研究的装饰装修工程成本数据来源于以往公司承接的100组商业写字楼装修装饰工程案例，包括招投标项目和商业承接工程等。每组包括10个成本特征值，经过对以往案例的分析总结，对装修装饰工程成本影响最明显的特征值主要包括地面面积、墙面面积、天花板面积、吊顶及照明套数、门窗安装套数、弱电工程面积、机房工程面积、喷淋系统套数、报警系统套数、暖通空调面积因素等，并通过机器学习方法对100组工程案例的特征值进行成本估算。目前，机器学习中谈论的神经网络是指“神经网络学习”，1943年，MacCulloch和Pitts将神经网络学习

2、抽象为简单模型架构，神经元节点接收其他神经元传递过来的输入数据信号，通过带权重的链接传递这些输入信号，然后比较神经元接收到的总输入值和神经元的阈值，再经过“激活函数”运算，得到神经元的输出值。（一）DNN深度神经网络DNN 深度神经网络（Deep Neural Networks），是含有多个隐藏层的神经网络，其核心思想是数据信号正向传播，输出误差通过隐藏层逐层反向传播的学习过程。输入层节点接收到输入信息，并传递给下面的各个隐藏层，逐层处理内部信息数据，再传到输出层，这是信号的正向传播过程。当输出的计算结果与预期值产生误差时，误差就会转向反向传播，通过输出层节点，修正各层权值，再向隐藏层、输入层

3、反向传播，通过不断循环的正向传播和误差反向传播，调节各层权值，直到输出的最终误差降至事先调好的数值或者允许的误差范围内结束。在DNN神经网络算法中，给定的训练集D=(x1,y1),(x2,y2,.(xm,ym),xiRd,yiRl，即输入示例由d个属性描述，输出 i维实值向量，建立一个多层前馈神经网络结构，拥有 d个输入神经元，q个隐藏层神经元，i个输出神经元，其中隐藏层第h个神经单元的阈值用h表示，输出层第j个神经元的阈值用j表示，输入层第i个神经元与隐层第h个神经元之间的链接权重为vih，隐藏层第h个神经元与输出层第j个神经元之间的链接权重为whj，隐藏层第h个神经元接收到的输入为h=i=

4、1dvihxi，输出层第j个神经元接收到的输入为j=h=1qwhjbh，隐藏层第h个神经元的输出是bh。设输出层神经元和隐藏层神经元的激活函数均采用 Sigmoid 函数，对训练例(xk,yk)，假设神经网络的输出为k=(k1,k2,.kl)，即 kj=f(j-j)则网络在(xk，yk）上的均方误差是，EK=12j=1l(kj-ykj)2得到网络中有(d+l+1)q+1 个参数需要确定输入层到隐藏层，得到 dq 个权值，隐藏层到输出层，得到 ql 个权值，i 个输出神经元的阈值，q 个隐藏层神经元的阈值。通过迭代学习计算方法，在每一轮迭代中对参数进行更新计算，参数 v 的迭代计算式为 v v+

5、v，对于隐层到输出层的链接权 whj，DNN 算法基于梯度下降方法，以目标的负梯度方向对参数进行调整，对于上述均方误差Ek，给定的学习率，有whj=-EKwhjj是第j个输出层节点的输入数值，可以看到whj会第一个影响j，然后whj再影响其输出值kj，然后影响EK，有 EKwhj=EKkjkjjjwhj根据j的定义，有jwhj=bh得到gj=EKkjkjj=-(kj-ykj)f(j-j)=kj(1-kj)(ykj-kj)由此得到算法中关于whj的更新公式，whj=gjbh使用学习率（0，1)，其作用就是控制神经网络算法的每一轮迭代中更新的步长，如果学习率太高，则会产生振荡，太低又会造成收敛速度

6、过于缓慢。对于每个训练样例，先将数值赋予输入层的神经元，随后，每一层神经元将信号向前传递，直到输出层产生结果数值，之后输出层计算出数值误差，将误差反向传播到隐藏层的神经元，依据隐藏层神经元计算出的误差对链接权和阈值进行调整，迭代过程循环进行，直到训练误差达到一个很小的值为止。机器学习在装修装饰行业成本估算的研究马静（上海理工大学上海200052）摘要：装修装饰行业工程成本的估算所涉及的特征变量较多，包括人工成本、装修材料、楼地面、墙柱面、天棚工程、油漆涂料、门窗工程等。由于人员素质、工程管理、工程材料成本波动、行业细分等因素使实际发生成本与预算成本相差甚远，预算不能为实际工程的成本提供精准的成

7、本指导。本文在传统成本管理方法的基础上，加入了机器学习DNN神经网络、随机森林模型，对装修装饰成本进行较为准确的估算和预测，将成本控制从事后控制转为事前预防，以期降低项目成本，并提高项目进度及利润率。关键词：成本估算；DNN神经网络；随机森林模型中图分类号：F275.3文献标识码：ADOI：10.19921/ki.1009-2994.2023-04-0133-045133现代营销上旬刊2023.04XDYX科学管理（二）激活函数在多层神经网络的架构中，上一层的输出节点和下一层的输入节点之间，具有一个对应的函数关系，这个函数就是神经网络的激活函数，是指如何把“激活的神经元的特征”通过函数把特征保

8、留并映射出来，即负责将神经元的输入映射到输出端。主要的激活函数有Sigmoid函数，对于二分类的问题，一般使用的就是这个函数。Tanh函数，取值范围为-1，1，输出以0为中心，可以看成是一个放大版本的Sigmoid函数。Relu函数，又被称为线性修正单元函数，当该函数的自变量绝对值大于0，函数的输出值为输入值本身，当自变量的绝对值小于等于0时，输出为0。本文选用Relu激活函数建立DNN模型，预测项目成本，计算简单，实际收敛速度比其他激活函数快很多。（三）DNN神经网络构建从DNN位置划分的不同层级，其神经网络层模型架构可以分为三种类别，输入层、隐藏层、输出层。从第二层开始，每个神经元都会获得

9、上一层所有神经元的结果，即每一个y=wx+b的值。损失函数使用 MAE=i=1N|yi-xi|n，表示预测值与实际值之间的误差，损失函数数值越小，其模型的鲁棒性越好，损失函数是模型学习的指导，使用梯度下降的方式，让w值与b值使损失函数的值越小越好。梯度下降的公式如下：xn+1=xn-df()xdx利用此公式延伸到计算w,b 上wnew=wold-Lossw带入损失函数中（四）DNN神经网络在装修装饰工程成本估算中的应用工程造价是指给定项目的总建设成本，传统的估算方法包括专家调查法、类比估算法、资源单价法、工作分解法、回归分析法、指数平滑法、模糊数学法、灰色估算方法等。在开发装修装饰的工程中，神

10、经网络对于工程造价，可以起到很好的估算效果，项目成本管理数据贯穿项目的全部生命周期，目的是更快速准确地对比相似工程的成本指标，拿地时快速估算装修装饰项目工程成本，可以更好地实现公司工程成本估算。在研究装饰装修工程特征影响因素之间的关系过程中，选取以往100组实际的工程项目，工程数据收取了工程周期成本的各项费用，根据公司的标准对工程特征费用进行分类，用于DNN神经网络的模型建立，一共包含10个特征值。具体包括地面面积、墙面面积、天花板面积、门窗安装套数、弱电工程面积、机房工程面积、喷淋系统套数、报警系统套数、暖通空调面积等。本案例选择Relu函数建立神经网络模型，将10个成本特征数据进行归一化处

11、理，区间为（0，1）。基于工程项目数据进行模型训练和估算时，需要划分训练集和预测集，随机选择 70 组作为训练集，30 组作为预测集，对于模型预测的结果与实际值的误差，使用MAE函数作为损失函数，重复迭代，直到所有权重参数收敛到合理值。采用相关系数 R2，均方根误差RMSE和平均绝对误差MAE三个指标，来评判模型估算输出和实际输出的拟合程度以及估算精度。其中拟合优度R2，用来衡量模型中自变量对因变量的结实程度，即回归预测结果对特征变量的拟合情况，它的值在0到1之间变化，越靠近1则说明模型对于样本的拟合程度越好。均方根误差RMSE，通常用来衡量预测结果好坏的指标，具有较高的灵敏性，在计算中会突出

12、与真实值偏差较大的预测结果对模型整体运行能力的影响，因此均方根误差越小，则代表模型的预测效果就越好。平均绝对误差MAE，能够弥补平均相对误差MRE的误差值正负抵消问题，可以更加准确地反映模型预测上的误差，MAE越小则说明模型预测越准确，评估值与真实值越接近。根据训练集和预测集的划分原则，进行工程特征和造价成本载入，其中输入层是10个神经元，为影响造价成本的10个工程特征，隐层含有10个神经元，输出层只有一个神经元，为预测的工程成本。设定网络参数，随机初始值和阈值，学习率设定为 0.05，10个隐藏层，采用带动量的梯度下降法对网络进行训练，迭代次数为1000次。基于训练集数据对网络进行DNN神经

13、网络训练学习，测试集数据输入，验证模型的预测性能，给出测量化指标，根据R2，均方根误差RMSE和相对误差MAE三个指标来评判模型的拟合效果。R2=0.9929，RMSE=7123.35，MAE=8178.655通过DNN神经网络对住宅工程成本的估算，拟合效果R2达到99.29%，比以往传统方法更为精确，为工程成本估算提供了更加明确的指导。二、随机森林估算装修装饰项目成本（一）随机森林理论随机森林方法属于机器学习的一大分支集成学习，机器学习有两种任务回归和分类，随机森林可以同时胜任这两种任务。区别在于对离散值进行预测采用的是分类任务，对连续值进行预测采用的是回归任务。随机森林首先要建立决策树，再

14、将众多决策树整合成森林，用来预测最终结果，这就是随机森林算法。Breiman等人于20世纪80年代发明了分类树算法，重复二分数据进行回归或者分类，由此大大降低计算量。Breiman于2001年把分类树组合成随机森林，在数据和变量的使用上进行随机化，生成许多分类树，再将分类树的结果进行汇总，在运算量没有显著增加的前提下，随机森林提高了其预测精度。随机森林对缺失数据比较敏感，对多元共线性不敏感，对于多达几千个解释变量的作用也可以很好地进行预测。随机森林就是在随机的方式下建立一个森林，森林里分布许多决策树，且每一棵决策树之间没有关联。在建立好森134现代营销上旬刊2023.04XDYX科学管理林模型

15、后，进行一个新的样本输入，使随机森林中的每一棵决策树分别做一次判断，对于分类算法，验证这个样本属于哪一类别，再总结哪一类样本被选择次数最多，可以预测这个样本归为哪类。随机森林既可以处理分类问题，处理属性是离散值的量。同时也可以预测数据，处理属性为连续值的量。除此之外，随机森林还可以检测异常点和进行无监督聚类学习。决策树是树状结构，它的每个分支表示一个特征属性在某个值域上的输出，每个非叶节点表示在这个特征属性上的测试，每一个叶节点存放一种类别。首先，从根节点开始，使用决策树进行决策，测试待分类项中相应的特征属性，并按照其数值选择对应的输出节点分支，在到达叶子节点之后，得到叶子节点存放的类别就是决

16、策结果。机器学习算法包含随机森林，它属于机器学习项下的集成学习，集成学习可以分为 Bagging（自主抽样集成）、Boosting和 Stacking 三种类型，随机森林采用的是 Bagging 思想。Bagging 具体如下。1.每次有放回地从训练集中取出 n 个训练样本，组成新的训练集；2.利用新的训练集，训练得到M个子模型；3.对于分类问题，采用投票方法，得票最多的子模型的分类类别为最终的类别；对于回归问题，采用简单的平均方法得到预测值。（二）随机森林模型构建随机森林以决策树为基本单元，通过集成大量的决策树，构成随机森林，森林算法是以决策树为估计器的Bagging算法，其构造过程如下。1

17、.构建单棵决策树随机森林是多棵决策树的集成，树的构建包括样本和特征。样本：对于一个总体训练集T，T中共有N个样本，每次有放回地随机选择N个样本。通过这种方式选择好的N个样本用来训练一个决策树。特征：假设训练集的特征个数为d，每次仅选择k（kd）个构建决策树。构建决策树，第一步：在训练集T的N个样本中，有放回地随机选择N个样本，用来训练一个决策树，作为其根节点处的样本。第二步：在决策树的每个节点需要分裂时，每个样本有M个属性，从这M个属性中随机选取m个属性，满足以下条件：m M，然后从这m个属性中采用某种策略，选择其中1个属性作为该节点的分裂属性。第三步：在形成决策树的过程中，每个节点都要按照第

18、2步的方法来分裂，一直到不能再分裂为止，对整个决策树形成过程不做剪枝操作。第四步：按照步骤13建立大量的决策树，通过这种方式构成随机森林。2.构建随机森林随机森林由众多决策树构建而成，每棵决策树都会有一个投票结果，最终投票结果最多的类别，就是最终的模型预测结果。（三）随机森林在装修装饰工程成本估算中的应用建立随机森林模型，选择算法模型 Random Forest Re-gressor，导入100组装修装饰工程案例数据，进行成本估算。将100组数据建模，设置最大深度分别切分3,4,5。根据评价指标R2,均方根误差RMSE和相对误差MAE来评判模型的拟合效果，验证随机森林模型，验证结果分别为拟合度

19、R2=0.9940，均方根误差RMSE=11109.75，平均绝对误差MAE=7467.316。通过与DNN神经网络验证指标的比对，两者的拟合度都达到99%，结果较为准确，可以考虑采用两个模型作为项目成本估算的适用方法。其中，随机森林模型拟合度较DNN神经网络模型高，平均绝对误差较DNN模型低，但是均方根误差比DNN模型高。三、结语当前，装修装饰工程日益复杂，行业竞争日趋激烈，有效提高项目成本管理水平，建立系统完善的信息化平台，已经成为装修装饰企业提高核心竞争力的重要手段，充分利用企业成本数据信息，建立神经网络模型，可以采用DNN神经网络、随机森林等模型，快速估算和预测装修装饰工程项目成本，拟

20、合度均达到99%，以实现项目成本管理的目标，控制项目成本，提高企业利润，并从整体的角度全面分析成本因素，为企业的招投标项目以及投资决策提供准确、稳定的依据。参考文献：1潘华,乐云,李永奎.神经网络在工业厂房造价估算中的应用研究J.计算机仿真,2010,27(08):307-310+367.2时艳.基于BP神经网络预估的绿色建筑工程成本研究J.建筑与装饰,2018(48):114-115.3丁瑞丰,肖程耀.施工企业基于人工神经网络模型在建筑工程成本预测的实例应用J.四川建筑,2020,40(05):375-378.4吕芳.基于BP神经网络的高层建筑工程成本造价评估模型J.辨识建模与仿真,2021

21、(03):113-114.5陈悦华,郑思敏,刘文路.基于机器学习的工业建筑工程造价预测研究J.武汉理工大学学报,2021(04):314-315.6熊一,詹智红,柯方超.基于改进BP神经网络的变电站检修运维成本预测J.电子科学与技术学报,2021(04):44-45.7王静娜.基于随机森林算法的二手车估价模型研究D.北京交通大学,2019.8郑胜洁,徐余明,胡祖翰,等.基于随机森林的城市轨道交通桥梁故障预测模型J.北京交通大学学报,2022(05):01-10.9陈欣影.基于随机森林原理的郑州汛期降水量预报J.农业科技,2022(09):157-159.10李明洁,王明常,王凤艳.基于多特征随机森林算法的深圳市土地利用分类J.世界地质,2022(03):198-206.作者简介：马静（1985），女，回族，辽宁省大连市人，本科，研究方向：工程成本管理。135

展开阅读全文