1、doi:10.11707/j.1001-7488.LYKX20220577基于多光谱成像与机器学习的植物叶绿素含量反演*范学星1张慧春1,2邹义萍3,4黄玉萍1边黎明3(1.南京林业大学机械电子工程学院南京 210037;2.南京林业大学林业资源高效加工利用协同创新中心南京 210037;3.南京林业大学林学院南京 210037;4.江苏青好景观园艺有限公司南京 211225)R21R22RMSE2R23RMSE3R24RMSE4R2adjusted1R2adjusted2MAE2R2adjusted3MAE3R2adjusted4MAE4摘要:【目的】利用多光谱图像光谱信息快速准确检测植物叶
2、绿素含量,为植物生长监测、胁迫诊断与精确管理提供参考依据和技术指导。【方法】以冬青科中 1 年生苗期的大别山冬青和北美冬青为研究对象,构建一套基于多光谱相机 RedEdge-MX 近端提取植物表型信息的系统,采集成熟期和生长期 2 个品种冬青叶片的蓝色、绿色、红色、近红外、红边 5 个波段的多光谱图像,处理得到每个叶片各波段处的光谱反射率。将得到的光谱反射率与使用手持式叶绿素含量测定仪测得的叶绿素相对含量(SPAD)进行相关性分析,采用传统支持向量回归(SVR)算法与网格搜索算法(GS)、遗传算法(GA)和粒子群算法(PSO)进行反演建模,对比得到拟合度最高的反演模型,实现利用多光谱图像光谱信
3、息快速准确检测植物叶绿素含量。【结果】对比传统 SVR 算法与优化后 GS-SVR 算法、GA-SVR 算法和 PSO-SVR 算法得到 反 演 模 型 的 光 谱 反 射 率与 SPAD 相 关 性,其 模 型 拟 合 度 分 别 为=0.24,均 方 根 误 差 RMSE1=0.160;=0.72,=0.097;=0.84,=0.073;=0.91,=0.066。校正决定系数=0.23,平均绝对误差 MAE1=0.119;=0.71,=0.069;=0.83,=0.050;=0.87,=0.044。【结论】综合对比发现,优化后的PSO-SVR 算法反演预测效果表现最佳。本研究通过采集植物多
4、光谱图像,采用对比优化后的 PSO-SVR 算法得到 5 个波段光谱反射率与 SPAD 的最优反演模型,预测模型的准确性和鲁棒性增加,可以实现植物叶片叶绿素含量的快速检测。同时,本研究结果推广应用至遥感层面,可以实现对大面积区域内的植被叶绿素进行反演,能够为精确林业苗木生长监测、胁迫诊断与动态调控提供理论基础和技术支撑。关键词:多光谱图像;叶绿素含量;表型信息;粒子群优化算法;支持向量回归中图分类号:TP391.1文献标识码:A文章编号:10017488(2023)07007811Inversion of Plant Chlorophyll Content Based on Multispec
5、tral Imaging and Machine LearningFan Xuexing1Zhang Huichun1,2Zou Yiping3,4Huang Yuping1Bian Liming3(1.College of Mechanical and Electronic Engineering,Nanjing Forestry UniversityNanjing 210037;2.Co-Innovation Center of Efficient Processing andUtilization of Forest Resources,Nanjing Forestry Universi
6、tyNanjing 210037;3.College of Forestry,Nanjing Forestry UniversityNanjing 210037;4.Jiangsu Qinghao Ornamental Horticulture Co.,Ltd.Nanjing 211225)Abstract:【Objective】Rapid and accurate detecting chlorophyll content in plant leaves is an important step to explore thephotosynthesis,nitrogen nutrition,
7、stress status and yield prediction.In this study,multispectral image spectral information wasused to quickly and accurately detect plant chlorophyll content,in order to provide reference and technical guidance for plantgrowth monitoring,stress diagnosis,and precise management.【Method】In this study,t
8、he 1-year-old seedlings of Ilexdabieshanensis and Ilex verticillata were targeted.A multispectral camera,RedEdge-MX,was used to construct a system forextracting plant phenotypic information.The system collected multispectral images of the leaves of the two species at maturity andgrowth stages in fiv
9、e bands,including blue(B),green(G),red(R),near infrared(NIR),and red edge(RedEdge).The multispectralimages were processed to obtain the spectral reflectance at each band of each leaf.Correlation analysis was conducted between theobtained spectral reflectance and the relative chlorophyll content(SPAD
10、 value)obtained by using a hand-held chlorophyll contentanalyzer.The traditional support vector regression(SVR)algorithm and the grid search(GS)algorithm,genetic algorithm(GA)and particle swarm optimization(PSO)were used for inversion modeling,respectively.The inversion models were compared,anda mod
11、el with the highest fitting degree was obtained and it was able to quickly and accurately predict plant chlorophyll content 收稿日期:20220828;修回日期:20221024。基金项目:国家自然科学基金项目(32171790,32101615,32171818);江苏省农业科技自主创新资金项目(CX233126);江苏省重点研发计划现代农业项目(BE2021307);江苏省 333 工程项目(苏人 20186)。*张慧春为通讯作者。第 59 卷 第 7 期林业科学 V
12、ol.59,No.72 0 2 3 年 7 月SCIENTIA SILVAE SINICAEJul.,2 0 2 3R21RMSE1R22RMSE2R23RMSE3R24RMSE4R2adjusted1MAE1R2adjusted2MAE2R2adjusted3MAE3R2adjusted4MAE4using multispectral image spectral information.【Result】The results showed that the correlation between the spectral reflectanceand SPAD was obtained w
13、ith the inversion model selected by comparing the traditional SVR algorithm with the optimized GS-SVR algorithm,GA-SVR algorithm and the PSO-SVR algorithm,the model fitting degrees were=0.24 and(root mean-squareerror)=0.160;=0.72,=0.097;=0.84,=0.073;=0.91,=0.066,respectively.Secondly,(adjusted R-squ
14、ared)=0.23,(mean absolute error)=0.119;=0.71,=0.069;=0.83,=0.050;=0.87,=0.044.【Conclusion】After comprehensive comparison,it is found that the optimized PSO-SVR algorithm has the best inversion prediction effect.In this study,by collecting multispectral images of plants,the optimizedPSO-SVR algorithm
15、 is used to obtain the optimal inversion model of spectral reflectance and SPAD in five bands,which canrealize the rapid detection of chlorophyll content in plant leaves.Combined with the multispectral imaging and machine learningalgorithms,the accuracy and robustness of the models have been improve
16、d.Meanwhile,the results of this study can be extended toremote sensing level to realize the inversion of vegetation chlorophyll in a large area,providing theoretical basis and technicalsupport for accurate forest seedling growth monitoring,stress diagnosis and dynamic regulation.Key words:multispect
17、ral image;chlorophyll content;phenotypic information;particle swarm optimization algorithm;supportvector regression 植物生理生化表型信息(如叶绿素、水分、干物质、氮、磷、钾、其他微量元素等)的快速获取对于选育优良品质、监测植物生长和指导精准栽培具有重要意义(石吉勇等,2019)。叶绿素是植物叶片进行光合作用必需的物质,其含量与植被生长的健康状况、生理活性、氮素营养和光合能力密切相关(Santana et al.,2021;Somkuti et al.,2021)。传统叶绿素常采用
18、丙酮浸提等实验室理化分析方法进行测定(王好运等,2019),不仅成本高、效率低、周期长、操作要求复杂,而且具有破坏性和不可恢复性。无损式叶绿素速测仪能快速检测出植物叶片叶绿素含量,但传感器实际测量面积小(如 SPAD-502 的测量区域仅 2 mm3 mm),需多次取点采样测量取平均,测量结果易受叶片厚度影响,不利于大规模推广(李修华等,2021)。植物生长是一个动态的长期过程,不同生长时期叶绿素会发生变化,而传统测量方法无法快速、连续测定植物叶绿素含量。因此,有必要对叶绿素含量进行无损式、高精度、自动化的定量研究与分析(李欣雨等,2022;Clemente etal.,2021)。光学检测技
19、术以其非接触性、快速、无损伤、高灵敏度、高分辨率等优势为植物表型信息分析提供了技术支撑(岑海燕等,2018;边黎明等,2020)。RGB 成像传感器价格低廉、便携,且使用方法简单,但多数只能获取植物株高、叶面积、叶片颜色数量等形态结构参数。高光谱、荧光等成像方式能敏感探查植物在叶绿素、氮磷钾含量等生理生化表型参数上的变化(翁海勇等,2021;姜洪喆等,2022;由珈齐等,2021),但由于设备价格昂贵、处理分析过程复杂和周期较长等限制了其应用。在精准农林领域,迫切需要能够对植物叶片叶绿素等生理生化表型参数进行移动分析的高性能且低成本的新技术。多光谱相机价格适中,具有结构紧凑、波段数多和成像速度
20、快等优点,用于采集目标的窄波段多光谱图像,可同时获取一维光谱信息和二维空间信息,兼具形态结构和生理生化表型参数的分析功能。近年来,国 内 外 研 究 人 员 利 用 多 光 谱 相 机 获 取 大 豆(Glycine max)、小 麦(Triticum aestivum)、玉 米(Zeamays)等植物图像,从中提取光谱反射率等参数进而达到检测叶绿素含量的目的(唐彧哲等,2022;Sari etal.,2022)。在现有研究报道中,多利用无人机平台搭载多光谱相机进行遥感作业(Cuaran et al.,2021;石永磊等,2022),对于搭载多光谱相机的近端感知表型信息系统的研究还较少。在对单
21、株植物或叶片、花、果等组织器官维度上进行多光谱图像采集时,遥感作业不再适用,因此基于近端多光谱成像感知技术的植物表型获取显得尤为重要。本研究以大别山冬青(Ilex dabieshanensis)和北美冬 青(Ilex verticillata)为 研 究 对 象,构 建 一 套 搭 载Micasense RedEdge-MX 五通道多光谱相机近端采集植物表型信息的系统,分别采集植物叶片的蓝色(blue,B)、绿 色(green,G)、红 色(red,R)、近 红 外(nearinfrared,NIR)、红边(red edge)5 个波段的多光谱图像,处理得到每个叶片各波段的光谱反射率。将得到的
22、光谱反射率与使用手持式测定仪 SPAD-502 得到的叶绿素相对含量(SPAD)采用 SVR 算法与 GS 算法、GA算法和 PSO 算法优化后的 SVR 进行反演建模,对比得到拟合度最高的反演模型,实现利用多光谱图像光谱信息快速准确检测植物叶绿素含量,以期为植物的第 7 期范学星等:基于多光谱成像与机器学习的植物叶绿素含量反演79 生长监测、胁迫诊断与精确管理提供参考依据与技术指导。1材料与方法 1.1供试材料大别山冬青叶形多为长圆形,革质质感、叶片较厚,叶片常绿,且不掉落;北美冬青叶形多为长卵形,纸质质感、叶片较薄,每年 12 月叶片会掉落。二者同属冬青科(Aquifoliaceae),且
23、皆速生、易繁殖、生长适应性强,具有绿植盆栽、美化环境、制作药材等多种用途,在生态、经济领域具有重要价值。本研究供试的大别山冬青和北美冬青试验苗木来自南京市八卦洲现代农业科技园区的国家林业与草原局冬青工程技术中心推广示范基地,选用 1 年生苗期的大别山冬青和北美冬青各 16 株(共计 32 株)置于人工气候箱(宁波江南制造厂,RZX 型)内进行适应性生长培养,并进行正常水肥管理。人工气候箱的环境参数设置如下:相对湿度 80%,昼夜时间比 168,昼夜温度分别为 25、20,光照强度 278 molm2s1。叶片是植物的重要器官之一,其大小、颜色等是衡量植物健康与长势的重要指标(陈珠琳等,2020
24、;李秋洁等,2021)。试验首先以大别山冬青叶片为研究对象,待适应性生长期结束后,进行第一次成熟期叶片采集:每株为 1 组,每组保留 23 片顶叶后由上至下离体摘取 10 片成熟期叶片(图 1d),共采集 160 片;第一次成熟期叶片摘取完成后,将试验用苗重新放置回人工气候箱进行恢复性生长培养。待试验用苗重新生长出新叶后,进行第二次生长期叶片(图 1c)采集,共采集160 片。其次以北美冬青叶片为研究对象,因北美冬青叶片采摘后新叶生长速度慢、叶片生长前后叶色变化不明显等因素导致不易于准确区分叶片的生长期和成熟期,故以采集大别山冬青成熟期叶片相同操作只采集北美冬青成熟期叶片(图 1e),共采集
25、160 片,3次试验共采集 480 片叶片样本。1.2表型信息采集 1.2.1多光谱图像采集系统本研究构建的多光谱相机近端采集植物表型信息系统如图 2a 所示。建立1.2 m1.2 m1.5 m 的多光谱相机近端表型采集平台,并用黑色植绒布构建暗箱环境,平台顶部 4 个边缘布置功率为 5 W 的白光灯 LED 光源,为多光谱相机成像提供稳定的光环境。多光谱相机 RedEdge-MX(图 2b)水平固定在平台上,成像单元距离成像目标40 cm。多光谱相机 RedEdge-MX 同时拥有 5 个波段,每个波段单独成像,分别对应波长 475 nm(蓝波段)、560 nm(绿波段)、668 nm(红波
26、段)、842 nm(近红外波段)、717 nm(红边波段),可各自获取高精度的多光谱图像。1ab2GBDLSRNIRRedEdge345图 2多光谱相机近端采集植物表型信息系统Fig.2A system for collecting plant phenotypic information at theproximal end of a multispectral cameraa:多光谱相机近端采集平台实物。1:稳定光源;2:稳定暗箱环境;3:RedEdge-MX 多光谱相机;4:云台;5:PC 控制端。b:RedEdge-MX 多光谱相机组件。B:蓝波段;G:绿波段;R:红波段;NIR:近红
27、外波段;RedEdge:红边波段;DLS:模块。a:Physical map of the near-end acquisition platformof the multispectral camera.1:Stable light source;2:Stable dark boxenvironment;3:RedEdge-MX multispectral camera;4:Gimbal;5:PC controlterminal.b:RedEdge-MX multispectral camera assembly.B:blue band;G:green band;R:red band;NIR
28、:near infrared band;RedEdge:red edge band;DLS module.1.2.2SPAD 测定多光谱图像采集完成后,使用便携式叶绿素含量测定仪 SPAD-502 对各组每个单元的大别山冬青叶片和北美冬青叶片进行叶绿素相对含量(SPAD)测定。SPAD-502 通过测量叶片在 650 nm和 940 nm 2 种波长光学浓度差的方式确定当前叶绿 素 相 对 含 量。根 据 以 往 研 究,加 杨(Populus canadensis)、银杏(Ginkgo biloba)、冬青(Ilex chinensis)、柠檬(Citrus limon)、棉花(Gossyp
29、ium spp.)、桃树(Prunus persica)、紫 藤(Wisteria sinensis)和 车 前 草(Plantago depressa)等植物的 SPAD 与丙酮浸提法测定的叶绿素含量之间存在显著线性关系(赵京东等,2020;杨虹霞等,2019;王璐等,2020),又因叶绿素仪使用时具有非破坏性、方便携带等优点,因此优先选 c.生长期叶片Growing leavesabe.成熟期叶片Mature leavesd.成熟期叶片Mature leaves图 1试验植株Fig.1Test planta:大别山冬青试验植株;b:北美冬青试验植株;c:大别山冬青生长期叶片;d:大别山冬青
30、成熟期叶片;e:北美冬青成熟期叶片。a:I.dabieshanensistest plants;b:I.verticillata test plants;c:I.dabieshanensis growing leaves;d:I.dabieshanensis mature leaves;e:I.verticillata mature leaves.80林业科学59 卷 择便携式 SPAD 叶绿素仪测定叶绿素含量(Jiang et al.,2022;曹德美等,2021)。在测定 SPAD 时,为减小误差,避开叶片叶脉位置对每个单元叶片多点采样测定3 次,并取平均值作为最终 SPAD。1.2.3光
31、谱反射率提取待所有样本叶片 SPAD 测定完成后,借助 ENVI5.3 软件绘制每个叶片各波段处的感兴趣区域(region of interest,ROI)。因成像过程中相机镜头边缘存在边缘减光现象,故 ROI 绘制过程中尽量在叶片边缘以内且尽可能包括多的叶片面积。获得最大 ROI 框并进行掩膜、去除掩膜处无效反射值等操作后得到叶片划定 ROI 处平均反射值。通过相同方式对标准灰板进行处理,利用标准灰板 ROI 内平均反射值、冬青叶片 ROI 内平均反射值、各波段标准反射率系数、比值换算得到冬青叶片 B、G、R、NIR和 RedEdge 等 5 个 波 段 的 反 射 率(Fernndez e
32、t al.,2021)。2数据预处理与算法选择比较 2.1数据归一化处理得到各波段处的反射率在 0,1 之间,使用原始数据代入算法训练。考虑到 SPAD 存在范围波动且与反射率差值较大,且本研究后续使用的 SVR 算法中,一致化的特征能加速寻找支持向量的时间,因此为提升反演模型的收敛速度和精度,使用 Min-Max标准化方法,将原始 SPAD 变换到 0,1 之间。对数据进行预处理后,总计 480 组样本数据作为反演数据样本。其中,变换公式为:X=XXminXmaxXmin。(1)XmaxXmin式中:X 为叶绿素含量测定仪 SPAD-502 测定的 SPAD;为所有样本中 SPAD 最大值;
33、为所有样本中SPAD 最小值,均无量纲单位。2.2波段反射率与 SPAD 的相关性分析相关性分析是对 2 个或多个变量进行分析,从而衡量变量之间的相关密切程度。本研究中,存在 B、G、R、NIR、RedEdge 等 5 个波段的反射率和 SPAD 共 6个变量,分析 5 个波段反射率与 SPAD 之间的相关性,筛选相关性较高的波段反射率用于后续反演建模的自变量,有利于提高反演建模的速度和模型的精度。获取的不同生长时期、不同品种冬青叶片 5 个波段反射率与 SPAD 之间的相关性分析结果如图 3。图 3 中,蓝色至红色的色带为从负相关至正相关的变化过程,扇形面积越大、颜色越深,则表示 2 个变量
34、之间的相关程度越高。由图 3 可知:大别山冬青成熟期叶片 G、RedEdge 波段与 SPAD 呈较高负相关性,分别为0.86 和0.71;大别山冬青生长期叶片 G、R和 RedEdge 波段与 SPAD 呈一定负相关性,分别为0.22、0.53 和0.29;北美冬青成熟期叶片 G、RedEdge波段与 SPAD 的负相关性分别为0.59 和0.36;所有冬青叶片试验样本 R、NIR 波段与 SPAD 分别呈正相关性和负相关性,分别为 0.39 和0.42。可见,不同生长时期、不同品种的冬青叶片 5 个波段反射率与SPAD 的相关性存在较大差异,为确保后续反演模型对所有样本的准确性及推广应用到
35、其他物种时的普适性,本研究后续反演建模时,不再剔除 5 个波段反射率中与 SPAD 相关性较低的变量,即 5 个波段反射率全部作为自变量。2.3SVR机器学习是一种通过调整系统内部参数,总结数据规律,得出预测模型并利用该模型对未知数据进行比较准确预测或估计的方法(刘铮等,2022)。支持向量机(support vector machine,SVM)是机器学习中关注较多的算法之一,在机器学习领域展现出超强的性能优势。SVR 作为 SVM 的分支被提出,是基于 SVM 的函数逼近回归问题的学习方法,被广泛应用于回归分析。SVR 算法应用过程中,核函数选取对所建模型的速度和精度影响较大。本研究利用
36、SVR 算法对多光谱图像中冬青叶片 5 个波段反射率与 SPAD 进行反演预测,选用与线性核函数、多项式核函数和 Sigmoid核函数相比运算相对简单、映射维度更广、稳定性更好和精度更高的径向基核函数(radial basis function,RBF)作为 SVR 的核函数(王芳东等,2022)。惩罚因子 c 可使拟合模型的复杂度与误差达到折中效果,核函数参数 g 能反映训练样本数据的范围特性(梁栋等,2015),所以选定核函数后,SVR 算法中超参数 c 和 g的合适取值将直接影响 SVR 算法的学习能力和最终模型的准确度。2.4GS-SVR、GA-SVR 与 PSO-SVRGS 是一种穷
37、举搜索的调参手段,遍历由所有参数可能性交叉组成的网格,搜索得到最优参数。GS算法搜索速度快,简单易实现。GA 是模仿进化论机制构建的自适应全局搜索和优化方法,能在搜索过程中自动获取和累积有关搜索空间的知识以求得最佳解。GA 算法存在交叉、变异等操作,在寻优速度上会略显缓慢。PSO 是通过粒子个体的行为与群体内信息的交互,利用协作和信息共享来寻找最优解。PSO 算法是解空间追随的最优粒子,相较于 GA 算法更易实现。本研究采用 GS、GA 与 PSO 优化算法,配第 7 期范学星等:基于多光谱成像与机器学习的植物叶绿素含量反演81 合 5 折交叉验证法(cross validation,CV)对
38、 SVR 算法中的超参数 c、g,相较于传统 SVR 算法中 c、g 的默认值进行寻优,并计算寻优结果的交叉验证均方误差(cross validation mean square error,CVMSE)。通过分别代入寻优结果,建立 GA-SVR、GA-SVR 与 PSO-SVR 模型,算法寻优流程如图 4 所示。3结果与分析 3.1反射率与 SPAD 的拟合度分析R2R2adjustedR2采集大别山冬青和北美冬青叶片共 480 片,以每个单位冬青叶片 5 个波段反射率作为自变量,SPAD作为因变量,取大别山冬青成熟期、生长期叶片与北美冬青成熟期叶片各 70%即 336 组数据作为训练集,剩
39、下的各 30%即 144 组数据作为测试集,建立反演预测模型。为评判模型好坏,拟选用决定系数(),均方根误差(root mean-square error,RMSE)对模型拟合度进行评估,选用校正决定系数(adjusted R-squared,)抵消样本数量对的影响。传统 SVR 算法与R2R2adjustedGS、GA 和 PSO 优化算法所建立的反演预测模型为基于 SVR 的不同模型,当拥有多个模型时,引入平均绝对误差(mean absolute error,MAE)进一步对比评判不同 模 型 的 优 劣 性。与在 0,1 之 间 越 大、RMSE 与 MAE 越小,说明预测样本与实测样本
40、偏差越小,模型拟合度越高。1/k kkR2R2adjustedR2本研究初始使用默认值 c=1、g=(为自变量类别数;本研究自变量为不同波段反射率,=5),代入SVR 算法建立反演预测模型。由图 5 可知,模型总拟合度=0.24,RMSE=0.160,=0.23,MAE=0.119。可见,总样本的均未超过 0.5,拟合图中数据点分布离散,说明使用默认值 c、g 的 SVR 拟合效果较差,参考价值小。由于使用默认值 c、g 的传统 SVR 对于叶片叶绿素含量的反演预测模型表现不佳,因此本研究探索利用 GS 优化算法对 c、g 的取值分别进行粗略寻优和精确寻优(图 6)。图 6 中寻优等高线图和寻
41、优 3D 视图的 X、Y 轴坐 1.00BabcdBGGRRNIRNIRRedEdgeRedEdgeSPADSPADBGRNIR RedEdge SPADBGRNIR RedEdge SPADBGRNIR RedEdge SPADBGRNIRRedEdgeSPADBGRNIRRedEdgeSPADBGRNIRRedEdgeSPAD0.820.640.450.270.090.090.270.450.640.821.001.000.820.640.450.270.090.090.270.450.640.821.001.000.820.640.450.270.090.090.270.450.640.
42、821.001.000.820.640.450.270.090.090.270.450.640.821.00图 3叶片波段反射率与 SPAD 的相关性分析Fig.3Correlation analysis between blade band reflectance and SPADa:大别山冬青成熟期叶片;b:大别山冬青生长期叶片;c:北美冬青成熟期叶片;d:所有冬青叶片试验样本。B 为蓝色波段;G 为绿色波段;R 为红色波段;NIR 为近红外波段;RedEdge 为红边波段;SPAD 为叶绿素相对含量。a:I.dabieshanensis mature leaves;b:I.dabiesh
43、anensis growing leaves;c:I.verticillatamature leaves;d:All test samples of Ilex leaves.B:the blue band(Blue);G:the green band(Green);R:the red band(Red);NIR:the near infrared band;RedEdge:the red edge band(RedEdge);SPAD:the relative content of chlorophyll.82林业科学59 卷 log2c log2g28,2824,2424,24R2R2adj
44、usted标分别为、,等高线图中同一条等高线为相同的 MSE,3D 视图中 Z 轴为均方误差 MSE,图中颜色由蓝至黄代表 MSE 由小至大。最优参数的取值,即为等高线图和 3D 视图中 MSE 最小的位置。GS 粗略寻优时,把 c、g 的寻优范围设为,由粗略寻优等高线图和 3D 视图得出,粗略寻优结果为 c=1,g=147.033 4,CVMSE=0.018,且 当 c、g 的 范 围 为 时,CVMSE 取值达到最小,在 0,0.06 处。在粗略寻优的基础上,把 c、g 的寻优 s 范围设为,再次进行精细寻优,缩小参数搜索空间的同时提高寻优速度。由图可见,CVMSE 的分布范围明显比粗略寻
45、优时有所下降,精细寻优结果为 c=2、g=16 时,CVMSE=0.017,把 c、g 寻优结果代入 SVR 算法,反演预测模型拟合度、RMSE、和 MAE 的表现如图 7。由图 7 拟合结果可知,GS-SVR 反演预测模型总R2R2adjustedR2R2adjusted拟合度=0.72,RMSE=0.097,=0.71,MAE=0.069。GS-SVR 反演预测模型的拟合效果有一定提升,且拟合图中数据点的离散程度得到改善。对比使用默认值 c、g 和 GS 优化算法寻优后的 c、g 反演预测模型,拟合度相差较大且 GS-SVR 反演预测模型的与分别提升 0.48、0.48,RMSE 与 MA
46、E 分别下降0.063、0.050,说明 c、g 的不同取值确实对模型拟合度存在重要影响。因此,GS-SVR 虽已表现出一定拟合度,但还存在一定上升空间,故本研究在 GS-SVR 算法模型基础上,继续应用 GA 优化算法对 c、g 进行寻优(图 8)。R2R2adjustedGA 寻优时,设置最大进化代数为 100,种群数量为 20,交叉和变异概率分别为 0.4 和 0.01,c 的范围为0.1,100,g 的范围为 0.01,1 000。由 GA 优化算法2 次寻优过程可知,种群适应度随着进化代数增大经历先急剧下降、后平稳波动的过程。曲线最低位置,代表 MSE 最小。第一次寻优最佳适应度起始
47、值和平均适应度起始值分别为 0.012 9 和 0.016 5,在进化代数为 15 和 10 时趋于稳定状态。第二次寻优起始最佳适应度起始值和平均适应度起始值分别为 0.014 7 和0.018 4,在进化代数为 21 和 20 时趋于稳定状态。相较第二次寻优,第一次寻优过程中最佳适应度和平均适应度起始值较小且下降速度和趋于相对稳定的速度更快。2 次寻优在 c、g 的取值上虽有区别,但CVMSE 均为 0.009,说明 MSE 已趋于稳定,不需要再继续进行多次寻优。将一次寻优结果 c=0.749 6、g=82.914 4 代入 SVR 算法,反演预测模型拟合度、RMSE、和 MAE 的表现如图
48、 9。由图 9 拟合结果可知,GA-SVR 反演预测模型总 BGRNIRRedEdge波段反射率Band reflectivity 超参数算法寻优Hyperparameter algorithm optimizationSVR 反演预测模型SVR inversionprediction model各波段植物叶片Plant leaves in various bands参数可能性组合Parameterpossibilities combinations形成网格Form a grid遍历搜索Traverse searchGS 寻优 GS SearchGA 寻优 GA SearchPSO 寻优 PS
49、O Search交叉验证Cross validation波段参数解码Band parameterdecoding遗传算子作用:交叉、变异Genetic operator role:crossover,Mutations形成种群Form a population计算适应度值Calculate fitness value波段参数解码Band parameterdecoding粒子群算子作用:速度更新、位置更新The role of particle swarm operator:Speed update,location update形成种群Form apopulation计算适应度值Calcul
50、ate fitness value交叉验证Cross validation最优 c,g 带入 SVROptimal c,g are brought into SVR图 4算法寻优流程Fig.4Algorithm optimization process 64615855524946SPAD 预测值 SPAD predicted value43402531374349SPAD 参考值 SPAD reference value所有数据集 All datasets总拟合度 Overall fitR2=0.24RMSE=0.160Radjusted=0.23MAE=0.1195561677379852