收藏 分销(赏)

数据驱动的文献辅助管线钢产线落锤撕裂韧性内禀特征关联_商春磊.pdf

上传人:自信****多点 文档编号:461167 上传时间:2023-10-11 格式:PDF 页数:10 大小:1.80MB
下载 相关 举报
数据驱动的文献辅助管线钢产线落锤撕裂韧性内禀特征关联_商春磊.pdf_第1页
第1页 / 共10页
数据驱动的文献辅助管线钢产线落锤撕裂韧性内禀特征关联_商春磊.pdf_第2页
第2页 / 共10页
数据驱动的文献辅助管线钢产线落锤撕裂韧性内禀特征关联_商春磊.pdf_第3页
第3页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、数据驱动的文献辅助管线钢产线落锤撕裂韧性内禀特征关联商春磊1,2),王传军3,4),刘文月3,4),朱德鑫1,2),汪水泽1,2),董林硕1,2),吴桂林1,2),高军恒1,2),赵海涛1,2),张朝磊1,2),吴宏辉1,2)1)北京材料基因工程高精尖创新中心,北京1000832)北京科技大学碳中和创新研究院,北京1000833)海洋装备用金属材料及其应用国家重点实验室,鞍山1140094)鞍钢集团北京研究院有限公司,北京102200通信作者,刘文月,E-mail:;高军恒,E-mail:摘要管道运输是当前长距离输送石油、天然气等能源最经济的方式之一,具有优异的低温韧性是保证管线钢安全运输的重

2、要特征.落锤撕裂试验(Dropweightteartesting,DWTT)是衡量管线钢低温韧性的最有效的方法.在目前的工作中,根据钢厂提供的产线数据集和文献收集的管线钢数据集,建立了基于机器学习的 DWTT 剪切面积预测模型.基于纯产线数据和文献数据辅助的产线数据构造了两种机器学习策略方案,测试了不同机器学习算法,效果最好的均是随机森林模型,策略一的纯产线数据模型的性能指标皮尔逊相关系数(PCC)为 0.64,策略二的文献数据辅助的产线数据模型的性能指标皮尔逊相关系数(PCC)为 0.92,文献数据的增加有效提高了 DWTT 剪切面积预测精度.机器学习技术为优化和预测 DWTT 剪切面积提供

3、了一种新的思路.关键词管线钢;落锤撕裂试验;机器学习;数据驱动设计;符号回归分类号TG142Predictionofthedrophammer-derivedteartoughnessofpipelinesteelproductionlinesusingliteraturedataandproductionlinedataSHANG Chun-lei1,2),WANG Chuan-jun3,4),LIU Wen-yue3,4),ZHU De-xin1,2),WANG Shui-ze1,2),DONG Lin-shuo1,2),WU Gui-lin1,2),GAO Jun-heng1,2),ZH

4、AO Hai-tao1,2),ZHANG Chao-lei1,2),WU Hong-hui1,2)1)BeijingAdvancedInnovationCenterforMaterialsGenomeEngineering,Beijing100083,China2)CarbonNeutralInnovationInstitute,UniversityofScienceandTechnologyBeijing,Beijing100083,China3)StateKeyLaboratoryofMetalMaterialsforMarineEquipmentandApplication,Anshan

5、114009,China4)AnsteelBeijingResearchInstituteCo.LTD,Beijing102200,ChinaCorrespondingauthor,LIUWen-yue,E-mail:;GAOJun-heng,E-mail:ABSTRACTPipelinetransportationisthemosteconomicalmeansoftransportingoil,naturalgas,andotherenergysourcesoveralongdistance.Withtheincreasinglyharshserviceenvironmentofpipel

6、inetransportation,therequirementsofpipelinesteelintermsofstrength,hydrogen-inducedfractureresistance,andcorrosionresistancehaveincreased.Inareassuchasplateausordeepseas,excellentlow-temperaturetoughnessisimportanttoensurethesafetransportationofpipelinesteel.Dropweightteartestingisoneofthemosteffecti

7、vemethodsformeasuringthelow-temperaturetoughnessofpipelinesteel.Thetestinvolveslargespecimenswithfullwallthickness.Throughthecharacterizationoftheductilebrittleshearareaandligamentwidthofthesample,thetoughnessandtear收稿日期:20221219基金项目:国家自然科学基金面上资助项目(52071023)工程科学学报,第45卷,第8期:13901399,2023年8月ChineseJou

8、rnalofEngineering,Vol.45,No.8:13901399,August2023https:/doi.org/10.13374/j.issn2095-9389.2022.12.19.001;http:/resistanceofpipelinesteelcanbebetterreflected.However,thedropweightteartestisdifficult,time-consuming,andlaborious,anditconsumesalargeamountofexperimentalresources.Inthiswork,amachinelearnin

9、g-basedmodelforpredictingthedropweightteartest-derivedshearareawasestablishedaccordingtoproductionlinedatasetsprovidedbysteelmillsandpipelinesteeldatasetscollectedfromtheliterature.Differentmachinelearningalgorithmsweretestedusingthetwodatasets.Thebestmodelswererandomforestmodels.StrategyIincludedon

10、lyproductionlinedatasets,andthePearsoncorrelationcoefficient(PCC),whichistheperformanceindex,predictedbythemachinelearningmodelwas0.64.StrategyIIinvolvedliteraturedataandproductionlinedata,andthePCCpredictedbythemachinelearningmodelwas0.92.Theconsiderationofliteraturedataeffectivelyimprovedthepredic

11、tionaccuracyofthedropweightteartestsheararea.Moreover,instrategyII,toavoidtheoverfittingofthemachinelearningmodel,afeaturescreeningtechniquewasadopted.Finally,ageneticprogramming-basedsymbolicregressionapproachwasdevelopedtoestablishaformuladescribingtherelationshipbetweentheselectedfeaturesandtheta

12、rgetshearareadata.ThePCCoftheprecisionofthisformulawas0.83,whichindicatesthattheformulacanbeusedtoestimatethedropweightteartest-derivedparametersofpipelinesteel.Themachinelearningtechnologyprovidesanewmethodforoptimizingandpredictingthedropweightteartest-derivedshearareaofpipelinesteel.Moreover,thec

13、ombinationofproductionlinedataandliteraturedataremarkablyimprovedtheaccuracyofthemachinelearningmodel,whichalsoallowsforthepredictionofothermaterialproductionlinedataviamachinelearningtechniques.KEYWORDSpipelinesteel;dropweightteartesting;machinelearning;data-drivendesign;symbolicregression管线钢是石油、天然

14、气等能源运输的主要方式,需要具有高强度、高韧性的力学性能和优异的抗撕裂能力13,此外,为了保证管线钢能源运输的安全性,必须具有足够的低温韧性.落锤撕裂试验(DWTT)可表征管线钢低温韧性,落锤撕裂试验采用全壁厚大尺寸样品,通过表征样品韧脆剪切面积和韧带宽度,可以较好反映管线钢的韧性和抗撕裂性能.但 DWTT 实验操作难度大,费时费力,极大地消耗了实验测试资源.近年来,机器学习技术在材料研发中的应用发展迅速,利用机器学习辅助材料进行成分、工艺与性能间的关系研究越来越受到关注,并被广泛应用于工业生产各阶段45.例如,Li 等6归纳了工业场景下时序预测方法及应用,介绍了三类时序预测算法,并围绕工业数

15、据分析与决策问题,重点分析了循环神经网络、卷积神经网络、编码解码器模型三类深度学习模型的优缺点及适用的工业应用场景.Geng 等7基于混合机器学习模型,利用化学成分和冷却速度预测低合金钢的相变温度和硬度,并计算了 6 种钢的焊缝热影响区连续冷却相变图,分类模型的预测精度达 100%.Chen等8采用三种策略分别预测了低合金钢夏比冲击韧性,利用符号回归建立了各特征与夏比冲击韧性的物理公式,有效提高了低合金钢高韧性研发效率.本文采用不同的机器学习算法探究产线数据特征与管线钢 DWTT 性能之间的关系,建立了基于机器学习的管线钢 DWTT 性能预测模型,并给出了管线钢材料特性与 DWTT 性能之间的

16、定量关系.此外,借助文献数据辅助产线数据拓宽训练集范围,通过特征工程等机器学习技术有效提高产线数据机器学习模型的预测精度.1研究策略机器学习方法通过建立代理模型(F)来推断目标属性(Y)和材料描述符(X)之间的关联,即 Y=F(X).如果有 n 个特征和 p 个机器学习模型,那么机器学习模型的数量为 p(2n1)9,候选的机器学习模型数量非常庞大,对于一个给定问题的最优解决方法是寻找 p 和 n 的最优组合.本研究旨在通过选择合适的产线数据特征并结合最优机器学习算法来预测管线钢的 DWTT 性能.图 1 给出了机器学习的两种策略流程图.策略 I 为机器学习代理模型,输入产线数据,特征为数据集中

17、各管线钢的成分(Ci)、热处理参数(Hi)和力学性能.另一方面,策略 II 中机器学习代理模型输入产线数据和文献收集数据,构成材料描述符的物理特征(Pi)也被添加到策略 II 的特征集.为避免出现过拟合现象,对 14 个合金元素、3 个力学性能和 30 个物理特征进行特征筛选.筛选后的数据集,采用机器学习模型对其建模.1.1数据收集与处理本文的产线数据集来自鞍钢集团北京研究院有限公司,原始数据集由 27 个量组成,包括 16 个合金元素、2 个热处理参数、3 个材料属性、5 个力学性能和 1 个目标性能剪切面积(Sheararea,SA).合金元素包括 Fe、C、Cr、Si、Mn、P、Ni、S

18、、Mo等,热处理参数包括二次轧制温度(ST)、终轧温商春磊等:数据驱动的文献辅助管线钢产线落锤撕裂韧性内禀特征关联1391度(FT),力学性能包括维氏硬度(HV)、屈服强度(YS)、抗拉强度(TS)、伸长率(EL)、屈强比(YR).27 个量的缩写,物理意义、最大值、最小值和平均值见表 1.经过数据清洗,合并几乎无变化的数据和过滤数值缺失过多的数据10,如有些数据组的二次开轧温度数值没有记录上,这些数据组被清洗掉,最终保留 1088 组数据用于构建模型.本文的文献数据集来自 20 篇文献1,1129,包括107 组数据.原始数据集由 20 个量组成,包括14 个合金元素、2 个材料属性、3 个

19、力学性能和1 个目标性能(SA).合金元素包括 Fe、C、Cr、Si、Mn、P、Ni、S、Mo 等,力学性能包括屈服强度(YS)、抗拉强度(TS)、伸长率(EL)、屈强比(YR).20 个量的缩写、物理意义、最大值、最小值和平均值见表 2.1.2机器学习算法众所周知机器学习算法一般分为监督学习和无监督学习,针对特定问题选择合适的模型至关重要30.回归模型是一种监督学习方法,本研究采用文献中常用的回归模型算法,包括 KNN、KS-tar、Bagging、RandomCommittee(RC)、RandomTree(RT)和 RandomForest(RF)来预测 DWTT 性能.采用 K 折交叉

20、验证(这里 k=10)评估机器学习模型的性能.几种广泛使用的统计指标包括皮尔逊相关系数(PCC)、平均绝对误差(MAE)和均方根误差(RMSE)用来评估模型性能.在回归问题中,皮尔逊相关系数能够识别模型的预测精度,代表了预测值与真实值之间相关性的紧密程度.皮尔逊相关系数的公式定义如下:PCC=ni=1(yiy)(yi y)ni=1(yiy)2ni=1(yi y)2(1)yi yy y其中、和 分别为实际值、预测值、实际值的均值和预测值的均值.皮尔逊相关系数的取值范围为1 到 1,其绝对值越接近 1,相关性越好.平均绝对误差和均方根误差表示实测值与预测值之间的差异.平均绝对误差和均方根误差值越接

21、近0 表示 SA 实验值与预测值越相近31.平均绝对误差和均方根误差的计算公式如下:MAE=1nni=1|yi yi|(2)RMSE=ni=11n(yiyi)2(3)2结果针对两种不同的策略,产线数据和文献数据辅助的产线数据,分别采用不同的机器学习模型对其进行建模,具体结果详述如下.2.1策略一:基于产线数据结果通过策略 I 训练 6 个经典机器学习模型,用来评估产线数据特征对 DWTT 性能的贡献.不同机器学习模型的表现如图 2(a)所示,随机森林 RF 模型表现出最高的预测精度(皮尔逊相关系数(PCC)=Production line dataStrategyStrategyFeature

22、 selectionMachine learningJudgementApplyOptimizationCirculationData collectionProduction line data+Literature data图图1本研究中机器学习策略流程图Fig.1Flowchartofmachinelearningstrategiesinthisstudy.1392工程科学学报,第45卷,第8期0.64,平均绝对误差(MAE)=0.30,均方根误差(RMSE)=0.81),其次是 RC 和 Bagging.并将最优的 RF 模型预测值与相应的实验数据绘制于图 2(b)中.2.2策略二:基

23、于文献数据辅助的产线数据结果在策略一中,由于产线数据过于集中,采用多种机器学习模型对其建模,效果都没有明显提升.为了进一步提高模型性能,广泛搜集文献数据,与产线数据一起组成新的数据集,构成策略二,并且在策略二中引入管线钢原子特征量.表 3 列出了管线钢中 30 个原子特征,大致包括 19 个原子属性(A),6 个原子属性平均浓度(CA)和 5 个原子属性基于 Fe、C 差异值(dAK),在 3 个计算公式中 ai代表原子分数,Ai代表每个元素的原子属性,ANi代表元素 i 的原子序数,Ak代表元素 k 的原子属性.这些原子特征为预测 DWTT 性能提供了相对简单的原子尺度物理基础,并与工艺参数

24、和拉伸性能参数一起作为策略 II 中机器学习模型的起始特征,共计 36 个.2.2.1特征筛选特征筛选,即去除无关和冗余特征,可以降低模型复杂度,避免过拟合现象,保持或提高预测能力.上述 36 个特征,每个特征与 DWTT 性能相关性强弱不一.冗余的特征会导致构建的机器学习模型变得复杂.经过特征筛选后,可以得到简单准确的模型,并且用筛选后的特征训练的模型更容易解释6.表表1DWTT 产线数据集中 27 个量Table1Twenty-sevenvaluesintheDWTTproductionlinedatasetInput/outputAbb.DescriptionMaxMinMeanInpu

25、tsFeMassfractionofiron/%97.95297.64097.803CMassfractionofcarbon/%0.0900.0500.063SiMassfractionofsilicon/%0.2500.1500.204MnMassfractionofmanganese/%1.7001.5501.618PMassfractionofphosphorus/%0.0180.0080.013SMassfractionofsulfur/%0.0030.0010.002NiMassfractionofnickel/%0.0200.0000.007CrMassfractionofchr

26、omium/%0.2200.0180.123MoMassfractionofmolybdenum/%0.0900.0500.069TiMassfractionoftitanium/%0.0170.0080.012CuMassfractionofcopper/%0.0240.0000.010VMassfractionofvanadium/%0.0160.0000.002AlMassfractionofaluminum/%0.0440.0160.030NMassfractionofnitrogen/%0.0080.0010.004NbMassfractionofniobium/%0.0500.03

27、00.039BMassfractionofboron/%0.00030.00010.0001CeqCarbonequivalent0.4040.3390.374THThickness/mm181216.838HVVickershardness268169200.575UTSTensilestrength/MPa746493613.817YSYieldstrength/MPa638400535.162ELElongation/%502041.465YRYieldstrengthtotensilestrengthratio0.960.680.872STSecondaryrollingtempera

28、ture/C1079654898.165FTFinalrollingtemperature/C886666837.054TTETesttemperature/C152015.441OutputSASheararea/%1008895.132商春磊等:数据驱动的文献辅助管线钢产线落锤撕裂韧性内禀特征关联1393Filter、Wrapper 和 Embeddedmethods 这三种方法常用于特征选择,三种方法也可以混合使用,加速完成对数据集的特征筛选10,36.Filter 方法仅分析数据集的固有特征,具有快速且独立的优势.Wrapper 方法在特征子集空间搜索特定的学习算法,以获得最佳的模型性

29、能.Embedded 方法通过使用学习算法的非相干信息寻求计算成本和性能之间的平衡.表表2DWTT 文献数据集中 20 个量Table2TwentyvaluesinDWTTliteraturedatasetInput/outputAbb.DescriptionMaxMinMeanInputsFeMassfractionofiron/%98.1895.6397.680CMassfractionofcarbon/%0.1050.0350.055SiMassfractionofsilicon/%0.400.000.237MnMassfractionofmanganese/%1.941.101.657

30、PMassfractionofphosphorus/%0.0160.000.007SMassfractionofsulfur/%0.0130.000.002NiMassfractionofnickel/%0.400.000.081CrMassfractionofchromium/%0.300.000.051MoMassfractionofmolybdenum/%0.300.000.090TiMassfractionoftitanium/%0.330.000.021CuMassfractionofcopper/%0.300.000.050VMassfractionofvanadium/%0.50

31、0.000.025AlMassfractionofaluminum/%0.040.000.008NbMassfractionofniobium/%0.500.000.036THThickness/mm38.507.5021.715UTSTensilestrength/MPa1023540649.327YSYieldstrength/MPa951469559.944ELElongation/%57834.131TTETesttemperature/C08029.019OutputSASheararea/%100980.0140.8(a)0.60.40.20RTKStarKNN BaggingRC

32、RF0.450.520.570.580.610.64Machine learning models1.00.80.60.40.20MAE/%MAEPCCPCC(b)100Mode1:RandomForestPCC:0.64MAE:0.3RMSE:0.8180604020002040Predicted SA/%Experimental SA/%6080100Predicted SA/%Experimental SA/%100969288100969288图图2产线数据的机器学习模型结果.(a)6 种机器学习模型在产线数据上的皮尔逊相关系数(PCC)和平均绝对误差(MAE)值;(b)实验值与RF

33、模型预测值的比较(所有模型均通过 10 折交叉验证进行评估)Fig.2Machinelearning(ML)modelresultsforproductionlinedata:(a)pearsoncorrelationcoefficient(PCC)andmeanabsoluteerror(MAE)valuesofsixMLmodelsonproductionlinedata;(b)comparisonbetweentheexperimentalvaluesandthepredictedvaluesoftheRFmodel(Allmodelswereevaluatedwith10-foldcr

34、oss-validation)1394工程科学学报,第45卷,第8期首先,图 3 给出了文献辅助产线数据不同特征之间的皮尔逊相关系数图,其中负相关和正相关分别用红色和蓝色表示.在右上部分,圆的填充部分越大,相关性越高;在左下部分,每个椭圆的颜色越深,相关性越高.相关系数(PCC0.8)用于识别高度相关的特征37,并将这些特征聚为一簇.相应地,有 6 个高度相关的数据簇,每个簇只保留一个特征,以保证机器学习建模时没有冗余信息.此外,选取了与其他特征相关性较低的 7 个特征.其次,使用 F-Selector 算法包38评估每个特征与 DWTT 性能之间的相关性强弱,从上述 6 个聚类中选择相关性最

35、强的特征,分别是 BP、YM、TVE、CDOR、CCS 和 DVEFe.加上 7 个相关性较差的特征,再次利用 F-Selector 方法对 13 个特征子集的相关性强弱进行排序,最终选取前 5 个特征子集如图 4(a)所示.第三,在保留的 5 种特征中,为了进一步筛选出更适合的特征组合,采用 Wrapper 方法进行特征表表3原子特征列表Table3ListofatomicfeaturesAbb.DescriptionFormulaReferencesDPEFePEdifference(Fe-based)dAK=ni=1ai(1AiAk)28,3235DPECPEdifference(C-b

36、ased)DVEFeVEdifference(Fe-based)DVECVEdifference(C-based)DARFeARdifference(Fe-based)CDORMeanconcentrationofDORCA=ni=1aiAini=1aiANiCVEMeanconcentrationofVECMRMeanconcentrationofMRCCSMeanconcentrationofCSCCRMeanconcentrationofCRCPEMeanconcentrationofPECAMMeanconcentrationofAMEBEElectronbindingenergies

37、ANAtomicnumberA=ni=1aiAiAMAtomicmassPRPoissonsratioMPMeltingpointYMYoungsmodulusBPBoilingpointNENumberofelementsCECohesiveenergyDENdensityE1FirstionizationenergyDORWaberCromerpseudopotentialradiiTVEValanceelectronMRMetallicradiusCSPettiforchemicalscaleCRClementisatomicradiiPEPaulingelectronegativity

38、ARAtomicradiiMVMolarvolume商春磊等:数据驱动的文献辅助管线钢产线落锤撕裂韧性内禀特征关联1395子集选择.例如,如果只包含一个特征,就会有k 个拟合模型;如果包含两个特征,则有 k(k1)/2个拟合模型等.在策略一产线数据几种模型建模时,RF 模型预测效果最优,因此本次所有特征子集排列组合都使用随机森林 RF 算法进行建模.一共训练了 31 个 RF 模型,图 4(b)(c)比较了它们的性能.图中每个点代表一个 RF 模型的性能,红色边界线是随着特征数量的增加,最佳拟合模型的轨迹.当特征数量为 3 时,平均绝对误差最小,皮尔逊相关系数最大.为简化模型,特征数量限制为

39、3.在这 31 个 RF 模型中,包含 TTE、TVE 和DVEFe这 3 个特征子集的机器学习模型表现最佳.2.2.2模型评估管线钢的 DWTT 剪切面积预测是一个回归问题.通过特征筛选得到的 3 个原子特征加上成分,采用 6 种不同的机器学习回归算法进行建模.使用多种指标评估了输入特征和 SA 之间的相关性.六种回归模型的皮尔逊相关系数和平均绝对误差性能如图 5(a)所示,随机森林 RF 模型的皮尔逊相关系数值为 0.92,表现最佳,性能如图 5(b)所示.3讨论产线数据限于生产原因,往往数据较为集中,如:生产 X70 级别管线钢的产线,就只能提供 X70ELTHCAMMRCRDENTVE

40、EBEANAMTTESAYMMPDARFeDPEFePEE1CCRCMRCPECSCCSARPRCEBPMVDORCDORYSUTSCVEDPECDVEFeDVECELTHCAMMRCRDENTVEEBEANAMTTESAYMMPDARFeDPEFePEE1CCRCMRCPECSCCSARPRCEBPMVDORCDORYSUTSCVEDPECDVEFeDVEC1.0Correlation coefficient0.80.60.40.200.20.40.60.81.0图图3DWTT36 个特征的 Pearson 相关系数图(在特征集的相关系数矩阵中,颜色越深,相关性越高)Fig.3Pearson

41、correlationcoefficientdiagramof36featuresofDWTT(Inthecorrelationcoefficientmatrixofthefeatureset,thedeeperthecolor,thehigherthecorrelation)UTS(a)PEYSE1ELCCSTHYMCDORTVEBPDVEFeTTE0102030Importance scoreFeatures40(b)PCC1234Number of featuresThe best subsect containing:TTE+TVE+DVEFe0.90.80.70.60.55(c)Th

42、e best subset containing:TTE+TVE+DVEFeMAE/%9876451234Number of features5图图4管线钢 DWTT 的特征筛选过程.(a)13 个特征子集的平均重要性得分按升序排列;每个可能的特征子集 RF 模型的(b)皮尔逊相关系数(PCC)和(c)平均绝对误差(MAE)值分布Fig.4FeaturescreeningprocessofpipelinesteelDWTT:(a)theaverageimportancescoresof13featuresubsetsarerankedinascendingorder;thedistributi

43、onof(b)pearsoncorrelationcoefficient(PCC)and(c)meanabsoluteerror(MAE)valuesforeachpossiblefeaturesubsetRFmodel1396工程科学学报,第45卷,第8期管线钢数据,且成分和工艺参数都相差不大.本文通过引入一定的文献数据,与产线数据结合拓宽机器学习数据集的有效范围,此外,为防止出现过拟合现象,采用特征筛选技术,筛选出与目标特征相关性较高的特征,机器学习模型结果有了明显的提高.上述 RF 模型是“黑盒子”,往往难以解读和完全理解模型的参数细节.符号回归3940是一种监督学习方法,可以挖掘出某种

44、隐藏的数学公式,以此利用特征变量预测目标变量,符号回归的优点就是不依赖先验的知识或者模型来为非线性系统建立符号模型.本研究中建立的符号回归模型每代中包含 1200 组潜在公式树,通过对生成公式的复杂性准确率进行综合评估,得到每个公式的适应度.经过 20 次迭代,最终筛选出适应度评分最高的公式,如下所示:SA=1.25TTE8.37DVEFeTTE+109.05(4)该公式预测精度如下:皮尔逊相关系数(PCC)=0.83,平均绝对误差(MAE)=7.15,均方根误差(RMSE)=9.99.在本文研究的范围内,建立的数学模型提供了测试温度和物理性能与落槌撕裂实验性能之间关系的定量关系,此处可作为设

45、计具有优异落槌撕裂实验性能的管线钢的一般估计.测试温度 TTE 单位摄氏度,常表示低温下管线钢韧性,物理特征量 DVEFe代表铁基价电子差,在一定程度上降低了管线钢韧性.4结论综上所述,策略一产线数据的机器学习模型预测精度较差,为了提高模型精度,策略二引入文献数据以辅助产线数据,经过特征筛选后,机器学习模型精度有了明显提升,随机森林 RF 模型的皮尔逊相关系数由 0.64 提高到 0.92.为了直观理解管线钢各特征与 DWTT 的关联,采用符号回归的方法,得到了管线钢韧性测试温度和物理特征与DWTT 的数学关系式,该公式精度皮尔逊相关系数为 0.83,可作为设计 DWTT 性能的管线钢的一般估

46、计.文献数据辅助的产线数据集对于提升机器学习模型精度有很大的作用,这也为其他材料产线数据的机器学习技术提供了新的思路.参考文献YooJY,AhnSS,SeoDH,etal.NewdevelopmentofhighgradeX80toX120pipelinesteels.Mater Manuf Process,2011,26(1):1541Li H L,Ji L,Kang T W.Significant technical progress in theWest-EastGasPipelineProjects-LineOneandLineTwo.Nat GasInd,2010,30(4):1(李

47、鹤林,吉玲,康田伟.西气东输一、二线管道工程的几项重大技术进步.天然气工业,2010,30(4):1)2JiLK,FengH,ZhangJM,etal.Strain-hardeningbehaviorofhighgradelinepipesteelanditsinfluencefactors.J Xian ShiyouUniv(Nat Sci Ed),2017,32(3):99(吉玲康,封辉,张继明,等.高钢级管线钢形变硬化行为及其影响因素分析.西安石油大学学报(自然科学版),2017,32(3):99)3RenZP,LiDG,LiXW,etal.Constructionandthinking

48、ofbigdata research and development platform for steel enterprises.JIron Steel Res,2021,33(11):1118(任子平,李德刚,李晓伟,等.钢铁企业大数据研发平台的建设与思考.钢铁研究学报,2021,33(11):1118)4Wang G D,Liu Z Y,Zhang D H,et al.Transformation and51.00.8(a)0.60.40.20KStar BaggingRTKNNRCRF0.90.90.90.910.920.92Machine learning models5.55.04

49、.54.03.53.0MAE/%MAEPCCPCC(b)100Mode1:RandomForestPCC:0.92MAE:4.05RMSE:7.2880604020002040Predicted SA/%Experimental SA/%6080100图图5文献数据辅助的产线数据机器学习模型结果.(a)6 种机器学习模型在文献数据辅助的产线数据集上的皮尔逊相关系数(PCC)和平均绝对误差(MAE);(b)实验值与 RF 模型预测值的比较(所有模型均通过 10 折交叉验证进行评估)Fig.5Resultsofthemachinelearningmodelonthecombinationoflit

50、eraturedataandproductionlinedata:(a)pearsoncorrelationcoefficient(PCC)andmeanabsoluteerror(MAE)ofsixmachinelearningmodelsonthecombinationofliteraturedataandproductionlinedata;(b)comparisonbetweentheexperimentalandpredictedvaluesoftheRFmodel(Allmodelswereevaluatedwith10-foldcross-validation)商春磊等:数据驱动

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      联系我们       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号  |  icp.png浙ICP备2021020529号-1 浙B2-2024(办理中)  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服