收藏 分销(赏)

基于成像高光谱技术的露天煤矿区复垦土壤剖面有机碳和全氮预测及制图.pdf

上传人:自信****多点 文档编号:2199239 上传时间:2024-05-22 格式:PDF 页数:12 大小:3.15MB
下载 相关 举报
基于成像高光谱技术的露天煤矿区复垦土壤剖面有机碳和全氮预测及制图.pdf_第1页
第1页 / 共12页
基于成像高光谱技术的露天煤矿区复垦土壤剖面有机碳和全氮预测及制图.pdf_第2页
第2页 / 共12页
基于成像高光谱技术的露天煤矿区复垦土壤剖面有机碳和全氮预测及制图.pdf_第3页
第3页 / 共12页
亲,该文档总共12页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、基于成像高光谱技术的露天煤矿区复垦土壤剖面有机碳和全氮预测及制图彭思涵,包妮沙,雷海梅,刘善军,杨天鸿(东北大学资源与土木工程学院,辽宁沈阳110000)摘要:k 露天煤矿区复垦土壤在经过开采剥离覆盖过程后,其有机碳(SOC)和全氮(TN)的垂直分布发生巨大变化,并且直接决定植被恢复物种的选择和生态恢复效果。因此,在双碳目标下,复垦 SOC 和 TN 在 0100cm 剖面的监测及制图,是评估矿区生态恢复及复垦工程固碳的重要基础。相比于传统的化学方法,高光谱技术是一种快速而且无损,已经广泛应用于土壤属性估测的技术,成像高光谱技术相比于点位光谱测量具有图谱合一的优势。因此以我国北方干旱半干旱草原

2、大型露天煤矿复垦土壤为研究对象,采集不同复垦工程、复垦年限的土壤剖面样本,揭示不同复垦年限和复垦方式下土壤剖面 SOC 和 TN 垂直分布规律和高光谱特征,通过深度挖掘和筛选 SOC 和 TN 特征波段和指数,构建可解释性机器学习模型,从而实现土壤剖面 SOC 和 TN 的制图,结果表明:土壤光谱反射率随 SOC 和 TN 质量分数的增加而降低,通过集成皮尔森相关性分析和选择连续投影算法,对点状高光谱数据进行降维和去冗余,最终明确表征 SOC 质量分数的30 个特征波段和表征 TN 质量分数的 18 个特征,并基于特征波段建立了 SOC 和 TN 三维光谱特征指数;通过对比偏最小二乘回归(PL

3、SR)、随机森林模型(RF)和径向基函数(RBF)神经网络预测模型,发现对光谱数据进行特征波段筛选和变换,可以提高预测精度,其中随机森林模型预测 SOC 和 TN 的精度最高,对 SOC 的预测结果为 R2=0.97、RMSE=7.5g/kg、LCCC=0.84、bias=3.70,TN 预测结果为R2=0.78、RMSE=0.33g/kg、LCCC=0.74、bias=0.19;利用 SHAP 可解释机器学习模型方法对输入特征进行重要度排序,发现提出的三维光谱指数对模型预测的贡献大于大部分特征波段;使用最佳模型可以快速绘制出成像高光谱图像中每个像素的 SOC 和 TN 质量分数,实现矿山土壤

4、剖面中 SOC 和 TN 质量分数的制图和可视化。基于成像高光谱技术绘制露天煤矿区复垦土壤剖面可以揭示复垦土壤形成和演化过程,阐明复垦年限、复垦植被类型在剖面演替过程中的驱动力,为露天煤矿区复垦土壤碳汇潜力的动态监测以及土壤固碳技术的效益评价提供重要的数据来源和技术支持。关键词:成像高光谱技术;干旱半干旱露天煤矿;复垦土壤;土壤剖面;有机碳;全氮中图分类号:TD88文献标志码:A文章编号:02539993(2023)07294912Prediction and mapping of organic carbon and total nitrogen in reclaimed soil pro-

5、files in surface coal mining areas based on imaging hyperspectral technology收稿日期:20230410修回日期:20230630责任编辑:王凡DOI:10.13225/ki.jccs.CN23.0469基金项目:国家重点研发计划资助项目(2022YFC2903900);国家自然科学基金资助项目(52074063,U1903216)作者简介:彭思涵(1996),女,辽宁本溪人,博士研究生。E-mail:通讯作者:包妮沙(1985),女,内蒙古呼伦贝尔人,教授,博士。E-mail:引用格式:彭思涵,包妮沙,雷海梅,等.基于

6、成像高光谱技术的露天煤矿区复垦土壤剖面有机碳和全氮预测及制图J.煤炭学报,2023,48(7):29492960.PENGSihan,BAONisha,LEIHaimei,etal.PredictionandmappingoforganiccarbonandtotalnitrogeninreclaimedsoilprofilesinsurfacecoalminingareasbasedonimaginghyperspectraltechnologyJ.JournalofChinaCoalSociety,2023,48(7):29492960.第48卷第7期煤炭学报Vol.48No.72023年

7、7月JOURNALOFCHINACOALSOCIETYJul.2023PENGSihan,BAONisha,LEIHaimei,LIUShanjun,YANGTianhong(School of Resources and Civil Engineering,Northeastern University,Shenyang110000,China)Abstract:Aftertheprocessofsurfacemining,strippingandcovering,theverticaldistributionoforganiccarbon(SOC)andtotalnitrogen(TN)i

8、nthereclaimedminesoilundergoesgreatchanges,whichdirectlydeterminestheselectionofve-getationspeciesandtheeffectivenessofecologicalrestoration.Therefore,underthedualcarbontarget,monitoringandmappingSOCandTNinreclaimedsoilprofile(0100cm)aretheimportantbasisforevaluatingecologicalrestorationandcarbonseq

9、uestrationinminingareas.Comparedwithtraditionalchemicalmethods,hyperspectralimagingisarapidandnon-destructivetechniquethatcanbeusedfortheeffectiveestimationoftheimportantindicatorsofsoilproperties.Imaging spectroscopy technology has the advantage of spectral integration compared to point spectral me

10、asurement.Therefore,thereclaimedsoilfromaridandsemi-aridgrasslandminingareasinnorthernChinawasselectedasthere-searchobject,andsoilprofiles(0100cm)fromdifferentminingareas,modesandyearswerecollected.Theverticaldis-tributionpatternsandhyperspectralcharacteristicsofSOCandTNinprofileswererevealedunderdi

11、fferentcultivationyearsandpatterns.Andthen,withthefeaturebandsandspectralindicesofSOCandTN,theinterpretablemachinelearn-ingmodelswereconstructedtoachievemappingSOCandTNcontentsinprofiles.Theresultsindicatedthat:Thespec-tralreflectanceofthesoilsamplesdecreasedwiththeincreaseofSOCandTNcontents.Bycombi

12、ningstackedfeaturese-lectionmethods(Pearsoncorrelationcoefficientsuccessiveprojectionsalgorithm,PCC-SPA),hyperspectraldatawerere-ducedindimension.30bandsofSOCand18bandsofTNwereclearlyidentified,andthree-dimensional(3D)spectralin-diceswereestablished;Bycomparingdifferentmachinelearningalgorithms(part

13、ialleastsquaresregression;PLSR,randomforest;RF,andradialbasisfunctionmodel;RBF),thepredictionaccuracycouldbeimprovedbyfilteringandtransformingtheselectivebandsofhyperspectraldata.TheRFwithselectivebandsandoptimal3DspectralindicesdemonstratedthebestresultswithR2=0.97,RMSE=7.5g/kg,LCCC=0.84,bias=3.70f

14、orSOCandR2=0.78,RMSE=0.33g/kg,LCCC=0.74,bias=0.19forTN;UsingSHAPvaluetoexplaintheimportancerankingofinputfeaturesinmachinelearningmodels,itwasfoundthatthecontributionof3Dspectralindextomodelpredictionisgreaterthanthatofmostfeaturebands;Withtheoptimizationmodel,theSOCandTNcontentofeachpixelinthehyper

15、spectralimagecouldbequicklypredicted,andthemappingandvisualizationoftheSOCandTNcontentsintheminesoilprofilecouldberealized.Mappingprofilesofreclaimedsoilinopen-pitcoalminingareasbasedonimaginghyperspectraltechnologycanhelpunderstandandrevealtheformationandevolutionprocessofreclaimedsoil,clarifythedr

16、ivingforcesofreclama-tionyearsandvegetationtypesinthesuccessionprocessoftheprofile.Itcanalsoprovideimportantdatasourcesandtech-nicalsupportfordynamicmonitoringofcarbonsequestrationpotentialofreclaimedsoilinopen-pitcoalminingareasandevaluationofthebenefitsofsoilcarbonsequestrationtechnology.Key words

17、:reclaimedsoil;soilprofile;aridandsemi-aridopencastcoalmine;imaginghyperspectraltechnology;or-ganiccarbon;totalnitrogen2020 年,我国在第七十五届联合国大会上对世界做出“碳达峰”及“碳中和”的双碳承诺。作为双碳目标的主战场,干旱半干旱地区的煤矿区减碳、固碳是重点的工作方向,大面积的生态修复也是主动践行绿色低碳开采的必然选择1-2。煤矿区的生态修复需要土壤重构和植被重建以恢复并稳定生态系统功能3,而采矿活动伴随的土地资源损毁也将导致露天煤矿区“土壤植被”生态系统的固碳能力下降

18、。因此,露天煤矿区的生态修复既是恢复矿山生态系统的必由之路,又是增强矿区碳汇能力的重要手段4-5。土壤中有机碳含量(SOC,1550 亿 t)显著高于全球植被(420 亿620 亿 t)和大气(760 亿 t)的总碳含量6-7,对全球生态系统的潜在影响是巨大的8。同时土壤中氮元素的增加也将促进 SOC 的积累9,土壤中全氮(TN)作为土壤重要的养分之一,也将直接影响地表植物的生长10。因此对煤矿区土壤中碳、氮元素的监测在双碳目标下的生态修复进程中是十分必要的。露天煤矿区复垦土壤,与自然土壤相比通常含有较低的有机质和养分,不利于地表植被的生长。煤矿区露天开采、排废以及复垦的过程中,土壤经过“剥离

19、运输储存运输覆盖”过程,导致土壤中的碳、氮含量在垂直方向上与自然状态土壤存在巨大差异11。2950煤炭学报2023年第48卷LIU 等12通过对平朔露天煤矿区复垦土壤研究发现,SOC 和 TN 在 0100cm 的土壤剖面中质量分数分布与自然土壤不同,且大多土壤属性(容重、pH、磷、钾等)在复垦开始后逐渐增加,而土壤中碳、氮在多年内不易恢复。KUMAR 等13通过对印度拉尼甘吉露天煤矿排土场生态修复研究中发现,复垦土壤中SOC 和 TN 质量分数的垂直分布会随复垦年限的增加而变化。因此,仅考虑表土层中的碳、氮质量分数,无法准确表征露天煤矿区复垦土壤恢复效果。传统的土壤剖面的调查,主要通过人工观

20、察、剖面开挖、环刀取样等步骤,需要大量时间和经济成本,工作效率较低。而高光谱技术可以大幅度提高数据的获取和处理速度,尤其是成像高光谱技术具有图谱合一的优势,能够同时获取待测物体的图像信息和光谱信息。其中的光谱信息有助于对土壤属性进行定量反演。与传统土壤质量分析方法(如燃烧法或铬酸盐氧化法)相比,可见光近红外(Vis-NIR,3502500nm)光谱技术能够更快速、无损地估计土壤质量参数14-15。BEN-DOR 等16提出 Vis-NIR 范围包括丰富的化合物信息,可以将光谱信息与 SOC 和 TN 等土壤参数建立定量关系,且 Vis-NIR 区域的光谱反射率与 SOC 含量显著相关。VISC

21、ARRAROSSEL 等17根据澳大利亚国家土壤档案馆中约 40000 个土壤样本数据,提出自然土壤中有机碳的重要波长为 510、610、630、690、1910 和 2490nm,全氮的重要波长为460、620、640、1390、1910 和 2330nm。随着利用高光谱技术估测 SOC 和 TN 技术的发展,高光谱技术已经开始用于复垦土壤属性的监测中。BAO 等18提出光谱特征、光谱指数与相结合偏最小二乘支持向量机模型(PLS-SVM)可用于煤矿区复垦土壤中不同地形下的有机质质量分数预测;TAN 等19通过光谱变换和相关性分析筛选特征波段,建立基于偏最小二乘回归(PLSR)的煤矿区土壤重金

22、属浓度定量反演模型;ZHU 等20分别建立了二维、三维光谱指数与随机森林(RF)模型,实现煤矿区土壤中有机质含量预测制图,另外 LI 等21通过光谱变化和建立二维光谱指数,并建立 PLSR、RF 和径向基函数(RBF)神经网络模型,对比 3 种模型对土壤盐分的预测精度。传统的 PLSR模型是土壤属性质量分数预测最为常用的校准模型,它可以拟合出光谱数据和属性值之间的线性关系,然而机器学习模型通常由于能够拟合非线性关系而提供更高的预测精度。XU 等22在建立水稻土壤剖面中 TN 的预测模型时,发现各种非线性机器学习模型如人工神经网络(ANN)、立体主义回归树(CUBIST)、k-最近邻(KNN)、

23、支持向量机回归(SVMR)和极端梯度增强(XGBoost)的性能均优于 PLSR。但同时机器学习模型由于其难以解释特点也被称为“黑箱”模型,因此机器学习的可解释性也逐渐成为了重要研究方向。此外,高光谱图像由于同时具有空间维信息和光谱维信息,因此其数据量急剧增加,波段之间的信息存在冗余问题,导致数据处理时间成本增加,甚至预测模型精度下降等问题。因此如何有效利用成像光谱数据对目标属性进行高效率、高精度的定量反演及制图也是现阶段的研究重点。SORENSON 等23利用10002500nm 的高光谱图像(256 个波段),通过多元自适应回归样条方法筛选了 11 个 SOC 特征波段和 14 个 TN

24、特征波段,实现对森林土壤剖面 SOC 和TN 质量分数的定量反演及制图研究;XU 等24利用3961019nm 的 1040 个波段对水稻土的碳成分进行定量反演及制图,基于竞争自适应加权算法,筛选出 70 个 SOC 特征波段,通过特征筛选方法从高维数据中选择特征信息,可以消除无效信息和噪声,降低模型计算成本。由于土地挖损、压占、塌陷等人为扰动因素,复垦土壤相比自然环境中的土壤,存在有机质质量分数低、颗粒大、异质性程度高,尤其在垂直分布方向上不确定性大,目前对复垦土壤的监测还更多的关注 030cm表层土壤的质量,以点状的光谱测量技术为主,利用成像高光谱技术监测矿区复垦土壤中垂直方向上的SOC

25、和 TN 的质量分数和分布情况却很少受到关注。因此,利用成像高光谱技术对不同排土场和不同复垦方式下的土壤剖面 SOC 和 TN 进行分析,不仅可以理解和揭示复垦土壤形成和演化过程,还可以为露天煤矿区复垦土壤碳汇潜力的动态监测以及土壤固碳技术的效益评价提供重要的数据来源和技术支持。另外,在大多数研究中,反演模型通常是由高光谱图像上提取的光谱数据构建,对相同测量条件下(如光照、剖面粗糙度、土壤湿度等)的高光谱图像反演通常结果较好,如果测量条件发生改变,则会导致模型的不确定性25。已经有学者开始尝试利用实验室点状光谱构建模型,进而对卫星高光谱图像(GF-5)反演,实现煤矿区土壤重金属(Zn、Ni、C

26、u)的预测制图26。因此笔者旨在探究这样一种具有可推广及普适性的高光谱建模方法,以实现排土场复垦土壤剖面 SOC、TN 含量的快速监测与制图。以内蒙古东部草原地区为主要研究区,以宝日希勒露天矿、伊敏露天矿、扎赉诺尔露天矿 0100cm复垦土壤为研究对象,利用实验室光谱辐射计获取第7期彭思涵等:基于成像高光谱技术的露天煤矿区复垦土壤剖面有机碳和全氮预测及制图29513502500nm 可见光近红外光谱,进一步利用成像光谱系统获取 3502500nm 高光谱图像(464 个波段):基于实验室点状光谱,集成皮尔森相关系数和连续投影算法,深度挖掘 SOC 和 TN 的光谱特征规律;提出三维光谱指数,提

27、高 SOC 和 TN 质量分数的光谱响应关系;通过对比 PLSR、RF、RBF 预测模型的精度,结合 SHAP 值对其输入特征进行深度解释和分析,提出最优模型;分析不同复垦年限和复垦方式下土壤 SOC 和 TN 质量分数的垂直分布规律。最终基于实验室点状光谱数据构建最优模型,实现复垦土壤剖面的高光谱图像反演,以达到露天矿区排土场复垦土壤剖面的快速监测及制图目的。研究结果将为双碳目标下,利用高光谱技术评估矿区 0100cm复垦土壤固碳能力提供理论基础。1研究区概况1.1研究区内蒙古东部草原地区为国家能源战略基地,十四五期间提出“双碳双控”目标,即阶段性目标和能耗的双碳目标双控全面落实。针对内蒙古

28、煤炭资源开发,政府提出到 2025 年全面落实生产煤矿全部达到绿色矿山标准的发展目标。笔者以该地区 3 个大型露天矿区的排土场作为研究区域,分别为宝日希勒露天煤矿(SiteI)、伊敏露天煤矿(SiteII)和扎赉诺尔煤矿(SiteIII)(图 1)。伊敏露天煤矿和宝日希勒露天煤矿的采矿工程始于 1985 年和 2004 年,并分别于 1999 年和 2009 年开始复垦工程。扎赉诺尔煤矿采矿寿命超过 100a,并于 2012 年关闭。1.2土壤取样和化学分析2017 年 8 月,通过实地调查,从复垦矿区采集了65 份土壤样本。复垦方式为覆土后进行人工筛选植被后播种或自然恢复 2 种。覆土主要以

29、开采时收集并保存的原地貌土壤为主。利用螺旋土钻进行样品采集,从 SiteI(4 份剖面)、SiteII(2 份剖面)和 SiteIII(2 个剖面)以及 1 个自然对照区域(1 份剖面)共采集了 9 份完整土壤剖面样品,见表 1。土壤剖面样品自然干燥后,获取成像光谱数据。随后分层收集不同深度位置(010、1020、2030、3050、5070、70100cm)土壤样品,经破碎和 2mm 过筛后,获取点状光谱数据。所有土壤样品使用 LECOCHN 元素分析仪(美国密歇根州 LECO 实验室设备公司)通过干燃烧法分析 SOC 和 TN 质量分数。表 1 研究区概况Table 1 Study are

30、a overview研究区样本数量/份矿山所属区域土壤特性样品标签复垦方式复垦年份覆土厚度/cm主要植物种类SiteI28土壤主要是栗钙土,一些低洼地区有草甸土。腐殖质层厚度为2040cm,有机质质量分数为2.9%4.0%2011201220132014覆土后人工播种201120122013201430冰草、羊草、披碱草SiteII16土壤主要是栗钙土,腐殖质层厚度为2050cm,有机质质量分数为2.9%4.0%,pH为8.09.1。土壤缺磷、富钾、中度氮20052009覆土后自然恢复2005200910山羊草、苔草、独行菜、蒿、蒲公英SiteIII21土壤主要是栗钙土,一些低洼地区有草甸土。

31、一些地区草地退化后出现土壤盐渍化。土壤缺乏氮和磷,pH在5.57.520002005覆土后自然恢复2000200510艾蒿、苔草、山羊草1.3光谱数据获取土壤剖面的高光谱图像是使用 GaiaSorter 高光谱成像系统进行拍摄获取。成像光谱仪在 4001000nm 的光谱分辨率为 2.8nm,10002500nm 的55N50N45N115E120E125EN0200 400 600 800 kmSite Site Site 海拉尔市哈尔滨长春沈阳#$!RRR5#$!图1研究区位置Fig.1Studyarealocation2952煤炭学报2023年第48卷光谱分辨率为 10nm。在数据采集期

32、间,4 个 200W溴钨灯提供均匀光源。获取后的高光谱图像数据由SpecVIEW 软件(SpecVIEWLtd.,Uckfield,UK)进行处理。同样由于低信噪比,去除了末端光谱波段。在实验室条件下使用 SVC-HR-1024 光谱辐射计(spectraVistaCorporation,NY,USA)获取土壤样品的点状光谱信息,光谱波长为 3502500nm(VNIR-SWIR 区域),共 973 个波段,光谱分辨率为1.5nm。实验室内使用 50W 卤素灯作为唯一光源,天顶角 45照射土壤样本表面。数据采集期间,每30min 使用SpectralonTM 白板(Labsphere,NH,U

33、SA)进行校正,每个样本分别旋转获取 4 条光谱,剔除异常数据后取平均值作为该样本的原始光谱数据。使用 3 次样条插值法对点光谱(973 个波段)进行重采样,重采样后448 个波段,以匹配高光谱图像的光谱分辨率。然后使用 Savizky-Golay 方法对原始光谱进行平滑和去噪,随后由于低信噪比,去除末端光谱,最终生成 440 个波段的光谱数据。光谱数据获取过程如图 2 所示。0102030405060708090100土壤剖面深度/cm图2成像光谱与点状光谱获取过程Fig.2Imagingspectroscopysetupandpointspectroscopysetup2材料与方法2.1波

34、段选择和光谱指数计算为了降低计算成本甚至获取更高的预测模型精度,对实验室内获取的点状光谱进行特征波段筛选。X(MK)MKXk(0)N(N M1)首先选择皮尔森相关性分析(PCC)确定土壤中 SOC和 TN 质量分数的高相关性波段。随后利用连续投影算法(SPA)27,解决特征冗余问题,它是一种基于投影的简单快速的特征选择技术,可以通过最小化向量空间共线性来解释特征变量之间的高度相关性28。该算法目前已用于各种样品光谱的特征波段筛选过程中29。它是一种向前循环选择方法:假定光谱矩阵为,为样本数,为波段数,分别记和为初始的迭代向量和需要提取的波段个数,连续投影算法的具体步骤:q=1XjXk(0)k(

35、0)=j(1)初始化:(第 1 次迭代),在光谱矩阵中任选其中一列向量,记为(即);S=j,1 j K,j k(0),k(q1)xjS(2)集 合 S 定 义 为,即还没有被选择进波段集的列向量,分别计算 对 中向量的投影向量;k(q)=arg(max?Pxj?,j S)(3)记录最大投影的序号;xj=Pxj,j S(4)将最大投影作为下轮的投影向量;q=q+1q N(5),如果,回到步骤(2)继续投影。NKxk(0)N这样得到组波段集合,对每一对和对应的波段集合分别构建多元线性回归模型,以模型的预测均方根误差(RMSE)为依据,选择使 RMSE 最小的波段集合作为最佳的特征波段集。R1R2R

36、3另外,为了进一步提高光谱信息和土壤性质之间的响应关系,可以通过波段组合算法建立不同的光谱指数30-31。利用这种形式生成包含多波段信息的新光谱参数,可以消除背景噪声和大气因素的影响32、提高特征参数模型反演的精度。因此,基于特征波段,利用三维波段组合算法分别建立了 5 种三维光谱指数(TBI,threedimensionalindex)33,、分别表示不同特征波段的反射率,计算公式为TBI1=(R1R2)/(R2R3)(1)TBI2=(R1+R2)/R3(2)TBI3=(R1R2)/(R2+R3)(3)TBI4=R1/(R2R3)(4)TBI5=(R1R2)/(R1R2)(R2R3)(5)2

37、.2模型建立与精度评价为了从整个样本集中提取代表性的校准子集,选择 SPXY 样本划分算法34,SPXY 是基于 Kennard-Stone 算法35提出的一种改进方法,通过正则化将 X和 Y 向量方向的距离结合,更加全面的评估和划分数据集。将实验室光谱数据集(共计 65 个样本)分成校准集(大约 75%)和预测集(大约 25%)。随后比较了第7期彭思涵等:基于成像高光谱技术的露天煤矿区复垦土壤剖面有机碳和全氮预测及制图2953线性模型和传统机器学习算法(即偏最小二乘回归(PLSR)、随机森林模型(RF)和径向基函数(RBF)神经网络)对预测 SOC 和 TN 含量的有效性。输入数据集包括全波

38、段(FS)数据集和特征波段+3D 光谱指数数据集。PLSR 模型是使用 R(4.2.1)中“pls”软件包建立;RF 模型是使用 MATLAB 软件中的“TreeBag-ger”函数建立,并根据 WANG 等36的建议,将树的数量设置为 1000;RBF 神经网络是利用 MATLAB 软件中“newrbe”函数搭建。另外由于机器学习一直无法解决可解释性的问题,通过 Python 中的 SHAP 库37可以用于解释机器学习模型的输出,它是在博弈论基础上发展而来的,可以把每个特征的贡献程度以SHAPvalue 形式量化。使用确定系数(R2)、均方根误差(RMSE)和林氏一致相关系数(LCCC)和偏

39、差(bias)评估预测模型的准确性。R2是数据中解释方差比例的度量,R2和LCCC 越接近 1,说明预测模型越稳定;RMSE 和 bi-as 越小,说明模型的预测能力越强。R2=ni=1(yi y)2/ni=1(yi y)2(6)RMSE=vt1nni=1(yi yi)2(7)LCCC=2rs ysys2 y+s2y+(y y)2(8)bias=1nni=1(yi yi)(9)yi yiin y yrsys y式中,和分别为第 次的观测值和预测值;为样本数量;和 分别为观测值和预测值的平均值;为观测值和预测值之间的皮尔逊相关系数;和分别为观测值和预测值的标准偏差。3结果与分析3.1复垦土壤 S

40、OC 和 TN 光谱特征由图 3 可以看出,土壤光谱反射率随着 SOC 和 TN质量分数的增加而降低。当 SOC 质量分数小于12.96g/kg 以及 TN 质量分数小于 1.11g/kg 时,光谱曲线特征在 600800nm 处发生变化。在可见光区域,SOC 的光谱曲线出现相交。在波长 1400、1900和 2200nm 附近出现吸收特征,这是由于作为水合阳离子的组合振动16。有机物在 Vis-NIR 区域的光谱吸收特征主要由于 NH、CH 和 CO 基团的拉伸和弯曲38。BEN-DOR 等39将 1100、1600、17001800、2000 和 22002400nm 的波段被确定为SOC

41、 和 TN 的主要特征波段。3.2SOC 和 TN 的特征波段筛选图 4(a)为基于皮尔森分析(PCC)得到的 SOC 和TN 质量分数与 400 至 2500nm 反射率之间的相关性分析。SOC 在 1403nm 附近和 TN 在 738nm 处相关系数最高,分别为 0.72 和 0.70。随后使用 SPA 特征选择算法对显著性小于 0.001 的波段去除其波段之间的共线性。最终如图 4(c)所示,SOC 有 30 条特征波段,分布在 11001500nm 和 1890nm;TN 有 18 个特征波段,其中在可见光(VIS)区域分布 7 个,在 NIR-SWIR 区域中分布 11 个。3.3

42、3D 光谱指数与 SOC 和 TN 质量分数的相关性利用筛选的 30 个 SOC 特征波段和 18 个 TN 特征波段,进行不同波段之间的数学组合,以构建三维光谱指数。表 2 列出了 5 种与 SOC 和 TN 相关性最高的指数及其波段组合规则,可以看出,TBI41486.6nm/(1105.7nm1105.7nm)和 TBI5(1486.6nm1402.6nm)/(1486.6nm1402.6nm)(1402.6nm1324.2nm)5001 0001 5002 0002 50001020304050反射率/%波长/nm(a)不同SOC质量分数下光谱反射率曲线5001 0001 5002 0

43、002 50001020304050反射率/%波长/nm(b)不同TN质量分数下光谱反射率曲线5.22 g/kg12.96 g/kg16.35 g/kg18.34 g/kg20.19 g/kg35.13 g/kg84.91 g/kg0.33 g/kg0.50 g/kg1.11 g/kg1.41 g/kg1.87 g/kg2.19 g/kg4.16 g/kg图3矿山复垦土壤中不同 SOC 和 TN 质量分数的光谱反射率曲线Fig.3ReflectanceofreclaimedminesoilwithdifferentcontentsofSOCandTN2954煤炭学报2023年第48卷与 SOC

44、 质量分数具有最高的相关系数 0.86。TBI1(1217.7nm543.6nm)/(543.6nm488.4nm)与 TN质量分数具有最高的相关系数 0.84。图 5 为相关系数最高的表征有机碳光谱指数TBI4、TBI5,和表征全氮光谱指数 TBI1 的可视化,图中 X、Y 和 Z 轴表示特征波段从小到大排列后的波段位置(1、2和 3)。右侧的颜色条表示各波段与所研究土壤性质之间的相关系数,切片位置是相关系数达到最大值时对应的波段位置,因此图 5 中不同方向的切片相交位置即为构建最佳三维指数的 3 个波段位置。与图 4(a)相比可以发现,3D 光谱指数相比于光谱反射率,与土壤属性质量分数的相

45、关性更高,响应关系更强。这是由于通过特征波段之间的数学组合,可以更加充分地考虑不同波段之间的相互作用关系,增强土壤 SOC 和 TN 质量分数与光谱信息之间的潜在关系,同时还可以最大程度上减少不相关波段的影响40。3.4SOC 和 TN 预测模型利用 PLSR、RF 和 RBF 算法建立 SOC 和 TN 预测模型。输入数据包括全波段原始光谱数据集和特征波段+3D 光谱指数数据集。与 PLSR 和 RBF 模型相比,RF 模型在输入优化校准集之后,对 SOC(R2=0.97,RMSE=7.5 g/kg,LCCC=0.84,bias=3.70)和 TN(R2=0.78,RMSE=0.33g/kg

46、,RCCC=0.74,bias=0.19)的预测精度最高。且相比于全波段数据输入的 RF 模型,SOC 的 R2增加了 0.03,TN 的 R2增加了 0.11,因此 3个模型中,RF 是更有效的预测模型。此外,可以看到在输入数据优化后,3 个模型的预测误差(bias)均降低,这表明从高维数据中选择有效波长可以消除无效信息和噪声,降低模型计算成本,另外光谱指数的建立还可以提高光谱信息与土壤属性的响应关系。一些研究表明,PLSR 作为一种线性方法,在非线性问题中往往表现不佳24。在本研究中,全波段输入的 PLSR 模型的预测精度确实不理想,而当使用特征波段+3D 光谱指数作为输入数据集时,PLS

47、R 模型预测 SOC 和 TN 时的 RMSE 分别降低 38%和 27%,LCCC 分别从 0.36 和 0.30 增加到 0.75 和 0.66,优化输入集后的 PLSR 的精度与非线性模型(RBF 和 RF)相当甚至更好(表 3)。这些结果表明,特征选择可以表 2 最佳 3D 指数的波段组合及相关系数Table 2 Pearson correlation coefficient of the bandcombinations of the optimal 3D indices土壤属性 光谱指数波段运算相关系数SOCTBI1(R1324.2nmR1425.0nm)/(R1425.0nmR1

48、441.8nm)0.74TBI2(R1486.6nm+R1105.7nm)/R1167.3nm0.77TBI3(R1486.6nmR1324.2nm)/(R1486.6nm+R1105.7nm)0.75TBI4R1486.6nm/(R1105.7nmR1105.7nm)0.86TBI5(R1486.6nmR1402.6nm)/(R1486.6nmR1402.6nm)(R1402.6nmR1324.2nm)0.86TNTBI1(R1217.7nmR543.6nm)/(R543.6nmR488.4nm)0.84TBI2(R1385.8nm+R617.0nm)/R781.4nm0.80TBI3(R1

49、357.8nmR1217.7nm)/(R1357.8nm+R617.0nm)0.79TBI4R1385.8nm/(R659.4nmR659.4nm)0.83TBI5(R426.9nmR961.8nm)/(R426.9nmR961.8nm)(R961.8nmR1217.7nm)0.815001 0001 5002 0002 5000.30.40.50.60.70.8波长/nm相关系数SOCTN(a)土壤SOC和TN质量分数与原始光谱反射率的相关性0102030405010203040506000.51.01.5波段数量/个RMSE(SOC)RMSE(TN)SOCTN(b)SPA筛选特征波段500

50、1 0001 5002 0002 500波长/nm特征波段(c)SOC和TN的特征波段分布TNSOC图4SOC 和 TN 的特征波段筛选Fig.4CharacteristicbandscreeningforSOCandTN第7期彭思涵等:基于成像高光谱技术的露天煤矿区复垦土壤剖面有机碳和全氮预测及制图2955有效提高 PLSR 模型的可预测性,并从高维数据中提取线性信息。为了揭示每个输入特征的重要性情况,使用SHAP 分析方法对每个输入变量在 RF 模型中对SOC 和 TN 预测的贡献进行排序(图 6)。基于 SHAP值排序结果,发现在 SOC 建模过程中,5 种 3D 光谱指数的贡献最大;在

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服