1、SHANDONG ELECTRIC POWER山东电力技术第50卷(总第311期)2023年第10期 人工智能 DOI:10.20097/ki.issn1007-9904.2023.10.006基于GA算法优化Stacking集成学习的金属材料大气腐蚀速率研究田辉,樊志彬,王倩,米春旭(国网山东省电力公司电力科学研究院,山东济南250003)摘要:针对大气环境下电网设备中金属材料的腐蚀速率预测问题,提出一种基于遗传算法(genetic algorithm,GA)优化Stacking集成学习算法模型,挖掘大气环境因子与镀锌钢腐蚀速率的关系。该模型为双层结构,融合了多个预测模型的优点。通过GA算法
2、优化第一层各个初级学习器的待调参数,将初级学习器学习到的数据交给第二层次级学习器做进一步拟合。同时,结合K折交叉验证的方式有效降低过拟合现象。结合Spearman相关系数和随机森林特征重要性评估方法,筛选出与镀锌钢腐蚀速率相关性最高的5个环境因子作为输入,由此展开镀锌钢腐蚀速率预测研究。试验结果表明,相较于单一的机器学习模型,该模型能有效提高预测镀锌钢材料腐蚀速率的拟合度,降低预测误差。关键词:大气腐蚀;环境因子;电网设备;机器学习;腐蚀速率中图分类号:TG172.3文献标识码:A文章编号:1007-9904(2023)10-0043-07Study of Atmospheric Corros
3、ion Rate of Metal Materials Based onGA-optimized Stacking Integrated Ensemble LearningTIAN Hui,FAN Zhibin,WANG Qian,MI Chunxu(State Grid Shandong Electric Power Research Institute,Jinan 250003,China)Abstract:In order to investigate the relationship between atmospheric environment factors and the cor
4、rosion rate of galvanizedsteel,a genetic algorithm(GA)based optimized Stacking integrated learning algorithm model is proposed for predicting thecorrosion rate of metallic materials in grid equipment.The model,which has a two-layer structure,combines the benefits of manyprediction methods.The GA met
5、hod is used to tailor each primary learners parameters in the first layer,and the secondary learnerin the second layer receives the primary learners data for further fitting.At the same time,K-fold cross-validation is combinedwith other techniques to successfully mitigate the overfitting phenomena.B
6、y combining Spearmans correlation coefficient and therandom forest feature importance assessment method,the five environmental factors with the strongest correlation to the corrosionrate of galvanized steel were chosen as inputs,and the study of predicting the corrosion rate of galvanized steel was
7、subsequentlyconducted.In comparison to a single machine learning model,the experimental findings demonstrate that the model can effectivelyenhance the fit and decrease the error in forecasting the corrosion rate of galvanized steel materials.Keywords:atmospheric corrosion;environmental factors;power
8、 grid equipment;machine learning;corrosion rate0引言电网系统在人民日常生活以及社会经济活动中担负着举足轻重的作用,电网设备稳定运行是保证供电的基础。电网设备中的金属材料易受大气腐蚀的影响,众多研究发现腐蚀对设备自身稳定性和服役性能均有较大影响,易造成较大经济损失和安全隐患1-2。准确了解电网设备金属材料的腐蚀情况是保障电网供电安全稳定的关键,因此需要对电网设备金属材料进行腐蚀预测,保证能够提前了解设备的腐蚀情况,以便及时维护。基金项目:国家电网有限公司科技项目“基于电网大气腐蚀图的数据挖掘及电网设备服役寿命评价技术研究”(5200-2020164
9、71A-0-0-00)。Science and Technology Project of State Grid Corporation of China“Research on Data Mining and Service Life Evaluation Technology ofPower Grid Equipment Based on Atmospheric Corrosion Map”(5200-202016471A-0-0-00).43山东电力技术第50卷(总第311期)2023年第10期大气腐蚀是一个复杂的过程,许多金属材料的腐蚀规律仍不能被准确掌握,其往往受相对湿度、温度、污染
10、物等多种环境因素的影响,目前还没有准确合理的腐蚀预测模型。因此,研究各种大气环境下腐蚀的影响因素和腐蚀过程的动力学规律,对预测腐蚀损失具有重要意义。为了得到准确的模型来估计不同环境条件下的腐蚀规律,一些学者已经做了许多工作。环境因子对腐蚀速率影响定量关系的研究模型主要包括剂量响应方程模型和机器学习模型等。其中,剂量响应方程模型是基于现场暴露腐蚀试验结果与试验点环境参数回归分析的经验公式。大量研究表明,金属材料的大气腐蚀过程同时受到多种环境因子的影响,许多研究已经得出包括温度、湿度、润湿时间、SO2沉积量、Cl-沉积量以及污染物等是影响腐蚀的主要因素,并分析了各自对金属材料腐蚀速率的影响3-5。
11、因此现有大多数研究也是基于上述因素建立剂量响应方程。最常用的剂量响应方程的基本形式遵循简单的线性或对数线性关系6。叶堤等7结合灰色关联分析和非线性回归方法,同时考虑了氮元素的影响,建立了基于大气腐蚀机理的碳钢、Zn、Cu 的腐蚀剂量响应方程。李牧铮等8通过建立各自的和综合的多元线性回归方程组,除了考虑氮元素外,还考虑了大气沉降物中水溶性降尘量,给出了金属材料的大气腐蚀预测剂量响应方程。由于腐蚀数据的不确定性大,以及传统回归方法在处理非线性交互效应方面的局限性,依赖经验公式会得到不同的剂量响应方程,这样会产生各种各样的公式,不利于推广。同时,影响腐蚀速率的因素较多,依靠剂量响应方程不能综合考虑各
12、种环境因子的相互影响。近几年,基于机器学习的方法在腐蚀研究中得到了越来越广泛的应用。机器学习模型可通过在经验和数据中学习,自动搜索知识,而不依赖于预先确定的方程,能更好地理解和预测大气腐蚀。人工神经网络(artificial neural network,ANN)9、随机森林(random forest,RF)10、支持向量机(support vectorregression,SVR)11等算法已经应用在各类数据挖掘中。在腐蚀预测方向上也有了一些研究,其中 Cai等12研究了相对湿度、温度、二氧化硫和氯化物对动态环境中短期腐蚀行为的影响,提出了一种描述环境因子统计分布的多参数方法。Zhi 等1
13、3结合 RF 系数和 Spearman 系数的混合方法,降低了维度,给出了不同服役周期下影响腐蚀速率主要的环境因子,建立了 SVR 腐蚀预测模型。Pei 等14改进了 RF 模型,提高了对碳钢大气腐蚀的预测精度,且预测能力明显强于 ANN 和 SVR 模型。以往研究中使用的机器学习模型往往是 12 种模型,容易造成过拟合或者欠拟合现象,并没有充分发挥各个模型的优势,因此基于机器学习的腐蚀预测还有很大的研究空间。研究分析影响腐蚀的环境因子,并将遗传算法和 Stacking 集成学习模型结合,建立腐蚀预测模型。相较于以往的腐蚀预测模型,该模型能够充分发挥各个机器学习模型的优势,在提升拟合度的同时,
14、有效减少过拟合现象,提高模型的适用性。同时,通过较少的环境因子,更加便捷有效地对腐蚀速率进行预测,减少因采集过多环境因子带来的工作量。1Stacking集成学习模型原理Stacking 集成学习算法一般分为两层,第一层为初级学习器,第二层为次级学习器。原始数据集经过初级学习器训练得到一个新的数据集,用来训练次级学习器,并最终得到预测结果15。该方法在训练过程中,通过不同算法模型的优化组合,发挥各自的优势,从而提高整个模型的预测准确率。其结构如图 1 所示。图1Stacking算法示意Fig.1 Schematic of stacking algorithm首先,将数据分为训练集 Tr和测试集
15、Te,为进一步降低过拟合,训练集 Tr又被分成 K 份:Tr1,Tr2,TrK。在第一层初级学习器中,取其中 K-1份作为训练集,另外一份作为验证集,每个模型分别进行 K 次训练,每次可以得到一个验证集预测结果 V 和一个预测集结果 P,分别表示为 V1,V2,VK、P1,P2,PK。经过 m 个模型训练则可以得到44m 组训练集预测结果,验证集预测结果为V11,V12,V1K,V21,V22,V2K,Vm1,Vm2,VmK,预测集结果为P11,P12,P1K,P21,P22,P2K,Pm1,Pm2,PmK。同时,对 K 次训练得到的预测集结果求平均值得到 m 组测试集预测结果:P1,P2,P
16、m。由第一层训练集预测结果和测试集预测结果组成第二层次级学习器的输入,实现对第一层初级训练器结果优化,提高预测的准确性。1.1初级学习器对于初级学习器,用到的算法包括随机森林算法、自适应增强算法(adaptive boosting,AdaBoost)、梯度提升决策树算法(gradient boosted decision trees,GBDT)和 极 端 梯 度 提 升 算 法(extreme gradientboosting,XGBoost)。1)随机森林算法。随机森林由 Breiman 等提出,是基于树的机器学习算法,其基本单元是决策树。它是一个集成分类器,由许多独立的决策树组成,并输出大
17、多数决策树预测的类。算法过程如图 2 所示。图2随机森林算法示意Fig.2 Schematic representation of the random forestalgorithm算法步骤如下:a)将训练数据集有放回抽取 N 次,得到新的子训练集D1,D2,DN,作为决策树根节点处的样本。b)随机选取属性做节点分裂属性,并重复该步骤。c)通过以上步骤,建立大量决策树,形成随机森林。d)将每棵树输出的预测值求平均值得到最终预测结果。2)AdaBoost 算法。AdaBoost 算法是由 Freund 和 Schapire16在 1995年提出,针对同一训练集进行不同学习器(分类器)的训练,并
18、将这些弱学习器集合起来,组成一个更有效的强学习器。在解决回归问题时,具体算法过程如下。a)初始化每个样本数据的权值分布。假定练集样本为T=(x1,y1),(x2,y2),.,(xN,yN)(1)训练集的第 k 个弱学习器的输出权重为Dk=(k1,k2,.,kN)(2)式中:ki(i=1,2,N)为第 i 个样本在第 k 个弱学习器的输出权重。则初始化样本集权重为D1=(11,12,1N)1i=1N,i=1,2,N(3)b)进行第 k 次迭代。使用具有权值分布 Dk(k=1,2,K)的训练样本集进行学习,得到弱学习器gk。训练集上的最大误差为Ek=max|yi-gk(xi)(4)式中:xi为第i
19、个样本;yi为xi的目标值。计算每个样本的相对误差为eki=yi-gk(xi)2/E2k(5)计算在gk训练数据集上的回归误差率为ek=i=1Nkieki(6)计算弱学习器系数为k=ek/(1-ek)(7)更新训练样本集的权值分布为k+1,i=ki/(i=1Nki1-ekik)-1-ekik(8)c)结束 K 轮迭代,得到最终强学习器为Q(x)=gk*(x)(9)式中:gk*(x)为所有ln1k的中位数值乘以对应序号k*对应的弱学习器。3)GBDT 算法与 XGBoost 算法。GBDT 算法由 Friedman17提出,是一种迭代的决策树算法,由多棵决策树组成,所有树的结论累加起来作为最终答
20、案。GBDT 算法可以看成是 M 棵树组成的加法模型。田辉,等:基于GA算法优化Stacking集成学习的金属材料大气腐蚀速率研究45山东电力技术第50卷(总第311期)2023年第10期F(x,)=m=0Mmhm(x,m)(10)式中:x为输入样本;、m为模型参数;hm(x,m)为分类回归树;m为每棵树的权重。其算法过程如下。a)初始化学习器F0(x)=arg minci=1nL(yi,c)(11)式中:L()为损失函数。b)建立 M 棵分类回归树。计算第 m 棵树(m=1,2,.,M)对应的响应值为rm,i=-L(yi,F(xi)F(xi)F(x)=Fm-1(x)(12)式中:F(x)为学
21、习器函数;Fm-1(x)为第m-1轮得到的学习器。用(xi,rm,i)拟合得到第 m 棵回归树 Tm,叶子节点区域划为Rm,j(j=1,2,Jm),Jm为第 m 棵回归树叶子节点的个数。遍历所有节点,计算回归树 Tm的每个叶子节点Rm,j的输出值,即为最佳拟合值 cm,j。cm,j=arg mincxi Rm,jL(yi,Fm-1(xi)+c)(13)更新学习器为Fm(x)=Fm-1(x)+j=1Jmcm,jIx(14)Ix=1,样本 x 在第 i 棵树的第 j 个叶子里0,样本 x 不在第 i 棵树的第 j 个叶子里c)重复步骤直到满足停止条件,累加得到最终的学习器表达式为FM(x)=F0(
22、x)+m=1Mj=1Jmcm,jIx(15)XGBoost 算法是建立在 GBDT 算法上,进一步改进了算法,不再详细展开。1.2次级学习器次级学习器由人工神经网络模型构成。人工神经网络的节点相当于一个神经元,这些神经元接收外界的输入信息进行计算和调整,并将它们输送到其他神经元。神经元的计算函数由神经元输入连接的权重定义,通过恰当地改变这些权重大小可以学习得到计算函数,对输入数据建立相关模型。BP(back propagation,BP)神经网络是常见的神经网络算法,是一种基于误差反向传播算法的三层前馈神经网络,主要由输入层、隐含层和输出层构成。BP神经网络具有实现任何复杂非线性映射的功能,使
23、其适合求解内部机制相对复杂的问题,其网络结构如图3 所示。其中输入层、隐含层和输出层神经元个数分别为 M、I 和 J,Xm表示输入层第 m 个神经元,Ki表示隐含层第 i个神经元,Yj表示输出层第 j个神经元。图3BP神经网络Fig.3 BP neural network隐含层和输出层采用 Tan-Sigmoid 函数作为传递函数tansig(n)=2/(1+e-2n)-1(16)式中:n 为迭代次数。采用 Levenberg-Marquardt 算法对网络权值进行修正(n+1)=(n)-e(n)JTJ+J-1JT(17)式中:J为包含误差性能函数对网络权值一阶导数的雅克比矩阵;为一个需要设置
24、的常数;e(n)为网络总误差。权重/阈值学习函数采用梯度下降动量法来进行权值的迭代(n)=-(1-)e(n)+(n-1)(18)式中:为学习率;为动量因子。2预测模型构建对于随机森林、AdaBoost 算法等几个初级学习器,需要设置决策树最大深度和基分类器个数,依靠人工经验选择的方式往往效果不佳,采用遗传算法对其优化后得到更好的拟合效果。遗传算法是一种受进化和自然遗传学原则指46导的随机搜索和优化技术。遗传算法由一种群体组成,其中每个个体代表搜索优化问题的一种可能的解决方案。通过适应度函数筛选优质个体;然后,在交叉算子的控制下产生新的个体,通过突变算子将随机噪声添加到后代中,以改变其“基因”。
25、通过重复上述过程,最终提供一个较好的解决方案。基于 GA 优化的 Stacking 集成学习模型框架如图 4 所示,整个预测过程主要分数据预处理、遗传算法优化参数、初级学习器模型训练、次级学习器模型训练及模型预测。具体过程如下。a)数据预处理。通过对数据集进行数据的清洗,删除掉不符合实际的数据,并对缺失部分的数据进行补齐。b)将数据集分割成测试集和验证集,并对测试集分成 K 份,进行 K 折交叉验证。使用遗传算法求得各个初级学习器的最优参数组合(最大深度和基学习器个数),以优化初级学习器的模型。c)使用初级学习器训练得到训练集预测结果V11,V12,V1K,V21,V22,V2K,Vm1,Vm
26、2,VmK,以及测试集预测结果 P1,P2,Pm。d)将初级学习器训练得到的结果作为新的数据集,使用次级学习器进行训练得到最终结果。3模型评价指标设计拟合优度 R2和均方根误差 RMSE两个评价指标,其具体表达式如式(19)所示。y =()i=1nyi/nSreg=i=1n(yi-y)2Sres=i=1n(yi-yi)2Stot=i=1n(yi-y i)2R2=Sreg/Stot=1-Sres/StotRMSE=i=1n(yi-yi)2n(19)式中:yi为待拟合数据;yi为拟合数据;y 为待拟合数据均值;Sreg为回归平方和;Sres为残差平方和;Stot为总平方和。图4预测模型流程Fig.
27、4 Prediction model process flow4算例分析取用山东省 28 个暴露腐蚀试验站的镀锌钢腐蚀数据对提出的模型进行验证。结合 Spearman 相关系数和随机森林特征重要性评估的方法,分析了多个环境因子与腐蚀速率的相关性,结果如表 1 所示。通过表 1 可以得出,润湿时间和 Cl-沉积量对镀锌钢腐蚀速率的影响较大。结合以往研究和本文的分析将温度、湿度、润湿时间、SO2沉积量和 Cl-沉积量这几个主要环境因子作为模型的输入来进行训练。将 28 条站点数据中的 23 条数据作为训练集,5条作为测试集。利用 Python 编写基于 GA 优化的Stacking 集成学习模型。
28、遗传算法模型的初始种群个数设置为 20 个,交叉率为 40%,变异率为 66.6%,迭 代 20 次,求 得 随 机 森 林、Adaboost、GBDT 和田辉,等:基于GA算法优化Stacking集成学习的金属材料大气腐蚀速率研究47山东电力技术第50卷(总第311期)2023年第10期XGBoost 初级学习器的最大深度和基分类器个数分别为(16,174)、(20,109)、(11,11)和(7,156)。表1环境因子与镀锌钢腐蚀速率的相关性Table 1 Correlation between environmental factors andcorrosion rate of galv
29、anized steel环境因子温度湿度润湿时间PM2.5PM10O3NO2SO2沉积量Cl-沉积量Spearman 相关系数-0.261-0.1220.739-0.116-0.1860.013-0.122-0.0640.586随机森林特征重要性评估0.0240.0850.4330.0140.1150.0540.0440.0210.210人工神经网络的隐含层节点数设置为 10,学习速率为 0.015。迭代次数设为 25000 次。经过次级学习器的训练,得到 28 站镀锌钢腐蚀速率实际值和预测值如表 2 所示,测试集在不同模型下的预测结果拟合优度 R2和均方误差 RMSE如表 3 所示。表2镀锌
30、钢腐蚀速率实际值和预测值Table 2 Actual and predicted values of corrosion rate ofgalvanized steel单位:m/a1234567891011121314150.7301.5181.0282.3650.7860.9692.2750.7081.4971.2461.5980.9030.6262.0001.5491.2361.7261.1952.1221.7301.0642.0871.4760.8080.8990.7751.1181.1910.9031.1561.4971.5980.7862.2752.0001.2462.3651.59
31、80.7080.7860.7031.2461.2460.7080.7861.2321.5461.0622.0181.7271.2062.1691.1760.8701.0750.8551.1981.1021.0010.9691.2331.5051.4772.2572.4040.9141.9921.5110.6350.8620.7040.8641.3570.8171.0250.7131.4540.9691.9510.7540.9102.2950.6491.5141.1871.4500.9150.5681.9231.460站点序号原始腐蚀速率RF 预测值Adaboost预测值GBDT预测值XGBoo
32、st预测值GA 优化Stacking 预测值161718192021222324252627280.6832.5590.7030.4973.0771.6141.7551.4524.3562.4970.6250.7171.0991.2071.8562.0960.9511.6452.1071.8141.7002.0771.6611.0050.9471.5681.0282.0002.3650.7302.0002.2752.0001.5182.3441.6020.8150.7201.6541.3531.7602.0790.8431.5322.0441.6811.6342.0531.6120.9290.
33、9811.3781.0232.0952.2621.0242.2492.2202.0042.2211.7431.5980.8221.0131.5040.6302.4041.1920.4642.7641.8621.7361.4133.1091.5940.9991.0600.716站点序号原始腐蚀速率RF 预测值Adaboost预测值GBDT预测值XGBoost预测值GA 优化Stacking 预测值表3不同模型预测结果的评价指标Table 3 Evaluation indexes of prediction results ofdifferent models评价指标R2RMSERF1.1270.
34、367Adaboost1.0280.472GBDT1.1270.366XGBoost1.2760.187GA 优化 Stacking0.7450.724结合表 1、表 2 和表 3 可以得出,在模型中减少了 PM2.5、PM10、NO2、O3等环境因子输入的情况下,可以实现以较少的环境因子作为模型输入开展腐蚀速率的预测。该模型结合了多个预测模型的优点,可以充分发挥各个模型的作用。相较于 RF、Adaboost、GBDT 和XGBoost 算法的单个模型,通过该模型第一层初级学习器和第二层次级学习器神经网络的训练,优化了预测效果,提升了拟合优度,降低了均方根误差。5结束语为了更好地拟合大气环境与
35、电网设备材料腐蚀的量化关系,提出一种基于 GA 优化的 Stacking 集成学习预测模型。利用该模型对山东省 28 个暴露腐蚀试验站的环境与镀锌钢腐蚀数据进行训练,相较于常规的机器学习模型,可以在使用较少的环境因子的情况下实现对电网设备金属材料腐蚀速率的预测;在降低过拟合的同时拟合优度得到进一步提升,表2(续)48均方根误差得到进一步减小,能更有效地实现镀锌钢腐蚀速率的预测。使用文中提出的模型可以进一步地指导电网设备的部署和防护,降低因腐蚀老化造成的经济影响,具有一定的实用性和推广价值。文中使用的数据量有限,将来会继续收集实验数据以优化模型,同时将暴露周期因素考虑在内,构建长期腐蚀速率模型。
36、参考文献1樊平成,李军,李龙,等.电网设备金属部件的腐蚀与防护 J.黑龙江电力,2021,43(4):307-311.FAN Pingcheng,LI Jun,LI Long,et al.Corrosion and protection ofmetal parts of power grid equipmentJ.Heilongjiang ElectricPower,2021,43(4):307-311.2刘伟,蒋以奎,葛红花.我国电网设备大气腐蚀及控制 J.上海电力学院学报,2016,32(4):349-354.LIU Wei,JIANG Yikui,GE Honghua.Atmospher
37、ic corrosion andcontrol of power grid equipments in China J.Journal of ShanghaiUniversity of Electric Power,2016,32(4):349-354.3叶堤,赵大为,李娟,等.大气污染对碳钢的腐蚀影响研究 J.重庆建筑大学学报,2005,27(1):80-83.YE Di,ZHAO Dawei,LI Juan,et al.Study on the effects ofatmospheric air pollution on the corrosion of carbon steelJ.Jou
38、rnal of Civil and Environmental Engineering,2005,27(1):80-83.4丁国清,张波.钢在自然环境中的大气腐蚀研究进展 J.装备环境工程,2010,7(3):42-48.DING Guoqing,ZHANG Bo.Advances in the study of atmosphericcorrosion of steels in the natural environmentJ.EquipmentEnvironmental Engineering,2010,7(3):42-48.5杜钢,李光茂,朱晨,等.不同环境条件下可溶性沉积盐对金属大气腐
39、蚀的影响 J.环境技术,2021,39(5):94-100.DU Gang,LI Guangmao,ZHU Chen,et al.Effect of solubledeposited salts on atmospheric corrosion of metals under differentenviromental conditionsJ.Environmental Technology,2021,39(5):94-100.6KNOTKOVA D,BOSCHEK P,KREISLOVA K.Results of ISOCORRAG program:processing of one-yea
40、r data in respect tocorrosivity classificationJ.ASTM Special Technical Publication,1995,1239:38-38.7叶堤,赵大为,张冬保.金属材料大气腐蚀破坏的剂量响应函数研究 J.中国腐蚀与防护学报,2006,26(6):351-354.YE Di,ZHAO Dawei,ZHANG Dongbao.Dose-response functionstudy of atmospheric corrosion damage of metallic materialsJ.Journal of Chinese Socie
41、ty for Corrosion and Protection,2006,26(6):351-354.8李牧铮,张军,祁凤玉.环境因子与大气腐蚀关系的数学模型和大气腐蚀预测 J.中国腐蚀与防护学报,1993,13(1):10-18.LI Muzheng,ZHANG Jun,QI Fengyu.Mathematical model of therelationshipbetweenenvironmentfactorsandatmosphericcorrsoion and prediction of atmospheric corrosionJ.Journal ofChinese Society
42、for Corrosion and Protection,1993,13(1):10-18.9KAMRUNNAHAR M,URQUIDI-MACDONALD M.Prediction ofcorrosion behavior using neural network as a data mining tool J.Corrosion Science,2009,52(3):669-677.10 曲志豪,唐德志,胡丽华,等.基于优化随机森林的H2S腐蚀产物类型及腐蚀速率预测 J.表面技术,2020,49(3):42-49.QU Zhihao,TANG Dezhi,HU Lihua,et al.Pr
43、ediction of H2Scorrosion product types and corrosion rate based on optimizedrandom forest J.Surface Technology,2020,49(3):42-49.11 FANG S,WANG M,QI W,et al.Hybrid genetic algorithms andsupport vector regression in forecasting atmospheric corrosion ofmetallic materialsJ.Computational Materials Scienc
44、e,2008,44(2):647-655.12 CAI Y,ZHAO Y,MA X,et al.Influence of environmental factors onatmospheric corrosion in dynamic environmentJ.CorrosionScience the Journal on Environmental Degradation of Materials&Its Control,2018,137:163-175.13 ZHI Y,JIN Z,LU L,et al.Improving atmospheric corrosionprediction t
45、hrough key environmental factor identification byrandom forest-based modelJ.Corrosion Science,2021,178:109084.14 PEI Z,ZHANG D,ZHI Y,et al.Towards understanding andprediction of atmospheric corrosion of an Fe/Cu corrosion sensorvia machine learning J.Corrosion Science,2020,170:108697.15 周志华.机器学习 M.北
46、京:清华大学出版社,2016.16 FREUND Y,SCHAPIRE R E.A decision-theoretic generalizationof on-line learning and an application to BoostingJ.Journal ofComputer and System Sciences,1997,55(1):119-139.17 FRIEDMAN J H.Greedy function approximation:a gradientBoosting machineJ.The Annals of Statistics,2001,29(5):1 189-1 222.收稿日期:2022-11-08修回日期:2023-03-31作者简介:田辉(1995),男,硕士,主要研究方向为电网材料腐蚀与防护;樊志彬(1987),男,硕士,高级工程师,主要研究方向为电网材料腐蚀防护及数据挖掘技术;王 倩(1987),女,硕士,工程师,主要研究方向为电网材料腐蚀与防护;米春旭(1985),男,硕士,工程师,主要研究方向为材料腐蚀与防护。(责任编辑车永强)田辉,等:基于GA算法优化Stacking集成学习的金属材料大气腐蚀速率研究49