收藏 分销(赏)

基于LSTM长短期记忆网络的樟子松木材气干密度NIRS模型预测.pdf

上传人:自信****多点 文档编号:2398156 上传时间:2024-05-29 格式:PDF 页数:10 大小:3.89MB
下载 相关 举报
基于LSTM长短期记忆网络的樟子松木材气干密度NIRS模型预测.pdf_第1页
第1页 / 共10页
基于LSTM长短期记忆网络的樟子松木材气干密度NIRS模型预测.pdf_第2页
第2页 / 共10页
基于LSTM长短期记忆网络的樟子松木材气干密度NIRS模型预测.pdf_第3页
第3页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、Vol.44 No.3Mar.2024第 44 卷 第 3 期2024 年 3 月中 南 林 业 科 技 大 学 学 报 Journal of Central South University of Forestry&Technologyhttp:/收稿日期:2023-04-27基金项目:黑龙江省重点研发计划子课题(GA21C030,GA19C006)。第一作者:彭润东(),硕士研究生。通信作者:李耀翔(),教授,博士,博士生导师。引文格式:彭润东,李耀翔,陈雅,等.基于 LSTM 长短期记忆网络的樟子松木材气干密度 NIRS 模型预测 J.中南林业科技大学学报,2024,44(3):179-

2、188.PENG R D,LI Y X,CHEN Y,et al.NIRS model prediction of air-dry density of Pinus sylvestris wood based on long short-term memory network(LSTM)J.Journal of Central South University of Forestry&Technology,2024,44(3):179-188.基于 LSTM 长短期记忆网络的樟子松木材 气干密度 NIRS 模型预测彭润东,李耀翔,陈 雅,张哲宇,刘晓利(东北林业大学 机电工程学院,黑龙江 哈尔

3、滨 150040)摘 要:【目的】木材密度不仅与木材的各种材性密切相关,而且是衡量木材质量与价值的重要指标。采用近红外光谱(Near infrared spectroscopy,NIRS)分析技术能够快速、高效地预测木材密度,避免了传统试验中繁琐的检测步骤。长短期记忆网络(Long short-term memory network,LSTM)作为循环神经网络(Recurrent neural network,RNN)的变体,不仅可以学习序列数据之间的高阶特征信息,而且克服了 RNN 中的长距离依赖、梯度爆炸与梯度消失等问题。将 LSTM 与 NIRS 结合,提出一种能够准确预测樟子松木材气干

4、密度的无损检测技术,为提高 NIRS 模型预测木材气干密度精度提供理论依据。【方法】该研究以樟子松木材样本为研究对象,用近红外光谱仪获得 106 个樟子松样本的光谱数据,并在恒温(202)恒湿(65%3%)的环境下测定样本的气干密度。通过对比多组预处理方法和特征选择方法,采用 Savitzky-Golay 卷积平滑(Savitzky-Golay smoothing,SGS)等方法进行预处理,采用竞争性自适应加权算法(Competitive adaptive reweighted sampling,CARS)进行波段选择,剔除 NIRS 数据中的高频噪声与冗余信息,提升光谱数据质量、建模速度与精

5、度。为验证 LSTM 模型预测能力,将其与偏最小二乘回归(Partial least squares regression,PSLR)、卷积神经网络(Convolution neural network,CNN)等建模算法对比分析。上述 3 种算法被分别应用于建立樟子松木材气干密度近红外预测模型。【结果】基于上述 3 种建模方法建立的 NIRS 模型均可实现樟子松气干密度的有效预测。且 LSTM 模型的预测精度与回归拟合度均优于 PLSR 与 CNN 模型。其中 SGS+CARS 处理后的 LSTM 模型的预测精度最高、泛化性能最强、拟合效果最好(R2=0.959,RMSEP=0.005,RP

6、D=5.033)。【结论】通过对樟子松木材光谱数据与气干密度的采集,建立了一种新型的基于 NIRS 分析技术与 LSTM 的木材气干密度检测方法。LSTM 预测模型相较于传统的回归模型,模型的预测精度更高,回归效果更好,鲁棒性更强。该检测方法既可保证木材的完整性,又可以提高气干密度的预测精度,实现了对樟子松木材气干密度的快速无损检测,为木材近红外光谱分析提供了可参考的模型与理论依据。关键词:长短期记忆网络;近红外光谱;樟子松;气干密度中图分类号:S781.31 文献标志码:A 文章编号:1673-923X(2024)03-0179-10NIRS model prediction of air-

7、dry density of Pinus sylvestris wood based on long short-term memory network(LSTM)PENG Rundong,LI Yaoxiang,CHEN Ya,ZHANG Zheyu,LIU Xiaoli(College of Mechanical and Electrical Engineering,Northeast Forestry University,Harbin 150040,Heilongjiang,China)Abstract:【Objective】Wood density is not only relat

8、ed to various wood properties,but also an important indicator to evaluate the quality and value of wood.The NIRS analysis technique can predict wood density quickly and efficiently,avoiding the tedious detection steps in conventional experiments.As a variant of recurrent neural network(RNN),long sho

9、rt-term memory network(LSTM)can not only learn the high-order characteristic information between sequential data,but also handle the problems of long-distance dependencies,gradient explosion and gradient extinction in RNN.By combining LSTM and NIRS,a non-destructive detecting technique that can Doi:

10、10.14067/ki.1673-923x.2024.03.018彭润东,等:基于 LSTM 长短期记忆网络的樟子松木材气干密度 NIRS 模型预测180第 3 期木材密度作为木材重要的物理特性1,不仅与木材抗弯强度、弹性模量等木材机械性能高度相关2,而且间接影响碳汇的估算3,是评价木材品质与应用价值的重要综合经济指标之一,直接影响木材的终端应用4。因此快速、准确、高效地预测木材密度对确定木材性质及提高木材综合利用率具有重要意义。然而传统的木材密度测量方法虽然测定精准度较高,但是存在步骤繁琐且耗时长,大量样品的测定无法快速实现等问题。随着无损检测技术的不断发展,近红外光谱(Near infra

11、red spectroscopy,NIRS)分析技术作为一种新型无损检测技术,将化学计量学、光谱学、基础测量学与计算机技术相结合,可以快速、准确、客观地反映待测样品中某些组分的含量5-6。NIRS分析技术凭借操作简便、便捷高效且测试可重现性等优点,已被广泛应用于木材密度7-9、树种分类10、材性检测11、含水率12-13等木材科学研究领域中。Li 等14基于 NIRS 技术,结合遗传算法优化支持向量机法利用局部相关性最大化(LCM)算法提取的光谱敏感波段,实现了榆树样品气干密度快速预测。Zhang 等4基于 NIRS 技术,提出了 Resnet1D-SVR-TrAdaBoost.R2 模型,实

12、现了落叶松样品气干密度的无损、准确预测。赵鹏等10基于可见光/近红外光谱数据,以五种东北地区常见的树种为研究对象,建立小波变换降维与最小二乘支持向量机相结合的模型同时预测木材的树种与密度,预测集树种识别率达到 100%,预测集密度的相关系数高达 0.941,实现了木材树种与密度的同时预测。付立岩等15以 8 种进口木材为研究对象,利用多元模态分解等方法与可见/近红外光谱数据结合,提出了 MEMD-SPA-XGBoost 分类模型,实现了 8 种进口木材的准确识别,木材识别准确率高达 96.5%。尽管 NIRS 技术具有无损、便捷、高效等优点,但 NIRS 光谱实际建模的过程中,NIRS 光谱中

13、存在谱带重叠,以及光谱信号微弱,两端噪音大,信噪比低等问题,严重影响 NIRS 模型预测精度与泛化性。近年来,随着计算机技术的不断发展,深度学习在文本分类、语音与图像处理应用领域取得显著成果16。长短期记忆网络(Long short-term memory,LSTM)凭借着可以学习序列数据中的时间信息,高效地提取数据中的有效信息等优点,与传统的深度学习模型相比,在处理序列数据时,LSTM 具有更优秀的模型表达能力与预测精度。LSTM 是循环神经网络 RNN(Recurrent neural network)的一种变种模型,通过引入称为单元/记忆细胞(unit,memory cell)的隐藏状态

14、解决了RNN 在处理长序列数据时产生的长期依赖、梯度消失与爆炸等问题。每个记忆细胞通过“遗忘门”、“输入门”和“输出门”结构来获得长序列数据中的长期依赖和筛选保留有效信息。由于 NIRS 数据由波长或频率大小排列的吸光度构成17-18,因此 NIRS 数据是一种长序列数据。将 NIRS 光谱数据导入 LSTM 模型中时,LSTM 模型中的记忆细胞可以存储上一波段的有效信息并传递给下一波段,最后综合全部波段的有效信息建立 NIRS 的分析模型。因此 LSTM 模型可以用于 NIRS 的回归accurately predict the air-dry density of Pinus sylves

15、tris wood was proposed to provide a theoretical basis for improving the accuracy of the NIRS model in predicting the air-dry density of wood.【Method】In this study,the spectral data of 106 samples of P.sylvestris were obtained by NIRS spectrometer,and the air-dry density of these samples was obtained

16、 with NIRS spectrometer under constant temperature(202)and relative humidity(65%3%)environment.By comparing multiple groups of pretreatment methods and feature selection methods,Savitzky-Golay smoothing(SGS)and other methods were used for pretreatment,competitive adaptive weighting algorithm(CARS)wa

17、s used for band selection,eliminating high-frequency noise and redundant information in NIRS data,and improving spectral quality,modeling speed and accuracy.In order to verify the predictive ability of LSTM model,it was compared and analysed with the modelling algorithms such as partial least square

18、 regression(PSLR),convolutional neural network(CNN).Each of these above-mentioned three modelling methods were applied to establish a near-infrared prediction model for the air-dry density of P.sylvestris wood.【Result】The NIRS models established based on the above-mentioned modelling methods achieve

19、d effective prediction of the air-dry density of P.sylvestris wood.And the prediction accuracy and regression fit of LSTM model were better than PLSR and CNN model.The LSTM model treated by SGS+CARS had the highest prediction accuracy,the strongest generalization performance and the best fitting eff

20、ect(R2=0.959,RMSEP=0.005,RPD=5.033).【Conclusion】Through the collection of spectral data and air-dry density of pine sylvestris wood,a novel method for detecting air-dry density of wood based on NIRS and LSTM was established.Comparing to the traditional regression model,LSTM model has higher predicti

21、on accuracy,better regression effect and stronger robustness.The detection method can not only ensure the integrity of the wood,but also improve the prediction accuracy of the air-dry density,which achieves the rapid non-destructive detection of the air-dry density of the Pinus sylvestris wood,and p

22、rovides a referable model and theoretical basis for the NIRS analysis of wood.Keywords:long short-term memory network;near infrared spectroscopy;Pinus sylvestris;air-dry density181中 南 林 业 科 技 大 学 学 报第 44 卷性分析。目前,已有研究人员将 LSTM 模型运用到光谱领域,并取得了良好的效果。如邓志扬等17 利用 LSTM 模型结合山楂果实的 NIRS 数据,实现了无损鉴别山楂果实种类。卢诗杨等19利

23、用LSTM 模型结合樱桃的拉曼光谱数据,实现了不同产地樱桃的快速分类。Zeng 等20将 LSTM 以及其变种模型与 NIRS 数据结合,实现了瑞格列奈等药片的准确分类。樟子松 Pinus sylvestris 作为东北林区常见的具有耐寒、耐贫瘠与速生等优良特性的材林树种,是具有高经济、生态价值的优良树种,是我国东北地区涵养水源与防风固沙工程中重要树种之 一21-23。木材密度根据定义不同,可以分为 3 类:基本密度、气干密度与绝干密度。由于实际生产中使用的木材以气干材为主,并且气干密度为进行木材工艺性质评价与生产使用的重要依据9,24-25。因此本研究以樟子松木材气干密度为研究对象。本研究将

24、 LSTM 应用于樟子松气干密度的NIRS 模型构建,实现对樟子松气干密度的无损检测。以 106 个樟子松样本为研究对象,采用多种预处理方法对光谱数据处理,探索不同预处理方式对 LSTM 模型预测精度的影响。采用 CARS 提取预处理光谱的特征波段,利用波段优选后的光谱数据,建立 LSTM 模型,并同时建立 PLSR 与CNN 预测模型,对比 3 个模型拟合效果与预测精度。结果表明本研究构建的 LSTM 模型预测精度高,模型鲁棒性强,为预测木材气干密度提供了一种新的技术手段和理论依据。1 材料与方法1.1 样本气干密度测定试验使用的一条樟子松原木购置于吉林省珲春市制浆造纸厂。在标准木根部自上而

25、下连续截取 10 cm 高的木圆盘,从木圆盘中截取木条,共获得 106 个 2 cm2 cm5 cm,各切面粗糙度参数 Ra 均为 12.5 m 的樟子松样本。根据木材气干密度的定义,木材的气干密度等于木材在大气条件下干燥,达到气干状态时的重量与体积的比值。在实验前,将樟子松样本在自然通风干燥(室温:202,相对湿度:65%3%)的实验室中放至质量恒定,测得此时样本的平衡含水率约为12%(极差为 2.76%,均值为 11.96%),并利用近红外光谱仪采集样本的光谱数据。气干密度的具体测定按照木材密度测定方法(GB/T 19332009)进行。1.2 主要设备与仪器采用的光谱扫描仪为美国 ASD

26、 公司产品,全称为 LabSpec Pro FR/A114260 便携式物质成分分析光谱仪测量近红外光谱。算 法 运 行 环 境:AMD Ryzen 7 5800H with Radeon Graphics;操作系统为 Windows 11,16 G计算机内存。所 用 软 件 包 括 MATLAB R2022a 和 Jupyter Notebook 6.4.8,为实现模型优化和对比不同建模算法,系统环境配置了 Keras、Tensorflow、Numpy 与 Math 等 Python 3.9.12 运算库。1.3 光谱采集由于横切面的光谱吸收最强,其余的切面的光谱吸收相对较弱26。本研究采集

27、试样横切面的光谱数据作为样本数据。近红外光谱仪采用漫反射方式采集光谱,光谱范围为 350 2 500 nm,分辨率为 3 nm。采集光谱前,利用光线探头扫描聚四氟乙烯白板,实现空白校正。之后每测完 2 个样本,进行 1 次空白校正。然后在样本的横切面的 3 个不同位置(基本覆盖横切面全部面积)用光纤探头各扫描 1 次,仪器每次扫描时间约为 0.15 s。设定仪器对样品连续扫描 30 次后生成一条光谱,取 3 次测量的光谱数据平均值为样本原始光谱数据。得到全部样本原始光谱的吸光度光谱图。如图 1 所示,在 1 440,1 894 nm 附近的吸收峰较为明显,并且对应水分子 H-O 键的二倍频吸收

28、带。由于扫描得到的 NIRS 光谱不仅包含研究所需信息,也包含了各种杂音,自然光以及样本内部杂质的光谱信息,因此需要对光谱数据进行预处理,剔除光谱中的噪声与冗余信息。1.4 NIRS 光谱数据处理由于樟子松样本 NIRS 光谱扫描过程中受到仪器背景、样品状态以及自然光等因素影响,采集的 NIRS 光谱中存在大量的噪声与其他冗余信息。这类信息会严重干扰所建 NIRS 模型的预测精度和稳定性。因此本研究在模型建立前,为提高模型的预测精度。采用光谱预处理方法排除 NIRS 光谱中的基线漂移、噪音等问题,从而提高模型的质量与精度。将光谱数据导入 MATLAB 中,用 Savitzky-Golay卷积平

29、滑27,标准正态变量变换,去趋势与移动平均平滑29等预处理方法及其组合12等 12 种预处理方法。预处理的评价模型采用 LSTM 模型;彭润东,等:基于 LSTM 长短期记忆网络的樟子松木材气干密度 NIRS 模型预测182第 3 期并利用竞争性自适应重加权进行对预处理后的光谱数据波段优选。图 1 樟子松木材样本近红外原始光谱图Fig.1 Original near-infrared spectra of P.sylvestris wood samples1.5 数据集划分由 于 光 谱-理 化 值 共 生 距 离(Sample set partitioning based on joint

30、X-Y distance,SPXY)算法在区分训练集与预测集时同时考虑光谱数据矩阵与化学值矩阵,可以保证选择的样本集更具有代表性。为避免樟子松样本分布不均导致样本的训练集与预测集不具有代表性等问题。本文选用SPXY 算法区分训练集与预测集。选择样本集的1/4 作为预测集,3/4 作为训练集。共得到训练集样本 85 个,预测集 21 个。训练集划分为校正集与验证集(比例为 62)分别用于模型的拟合与超参数的调整。预测集不参与模型建立只被用于检验模型的预测与泛化能力。以预测集的决定系数R2,均方根误差 RMSEP 和 RPD,来评价模型的预测能力。划分结果见表 1。表 1 樟子松木材气干密度统计值

31、Table 1 Air-dry density statistics of P.sylvestris wood g/cm3样本集Samples set样本数Number of samples最大值Max value最小值Min value平均值Mean value训练集Train set850.6340.5210.563预测集Prediction set210.6100.5260.5451.6 LSTM 网络构建1.6.1 LSTM 网络记忆细胞结构图 2 为 LSTM 网络记忆细胞结构图,计算方法参考文献 30-31。Xt为记忆细胞的输入数据,ht表示记忆细胞隐藏层输出,ct存储着记忆细胞信

32、息,ct-1与 ht-1为上一刻的记忆细胞信息与隐藏层输出。Xt、ct-1与 ht-1组成记忆细胞的输入。输入通过遗忘门 ft选择性的“遗忘”部分输入的信息,通过输入门 it选择性的“记忆”部分输入的信息。输入信息分别通过 ft与 it后合并,将上一刻的记忆细胞状态信息 ct-1更新为 ct。之后将信息传递给下一个记忆细胞。ot为控制输出信息 ht的输出门。Tanh 激活函数:将输入映射至-1,1 的范围内。:sigmoid激活函数,将输入映射到 0,1 范围内。Wf、Wi、Wc、Wo:权重矩阵。bf、bi、bc、bo:偏置矩阵。图 2 LSTM 单元结构Fig.2 LSTM unit str

33、ucture1.6.2 LSTM 模型参数设置:LSTM 模型由 1 个输入层、3 个 LSTM 层、3个 Dropout 层、4 个全连接层和 1 个输出层组成。分别标记为 Input、L1、L2、L3、D1、D2、D3、F1、F2、F3、F4 和 Output。LSTM 层中所含的隐藏单元 units 个数均为 512,激活函数为修正线性183中 南 林 业 科 技 大 学 学 报第 44 卷单元(ReLU)。Dropout 层中的损失率均为 0.3,全连接层的输出维度分别为 256,128,16 和 1。使用 ReLU 为激活函数,模型训练时,批量大小(batch size)设 置 为

34、1,迭 代 次 数(epoch)为50。选择 RMSprop 优化器、均方误差(MSE)为损失函数进行训练。初始学习率(learning-rate)为 0.001,学习率减少因子(factor)为 0.05,学习率下限(min_lr)为 1e-7。在 15 个 epoch 中模型性能未能得到提升时,则学习率减少的动作被触发。为了更好地提高 LSTM 模型的稳定性和预测能力,本文选用 4-折交叉验证的方法校正模型的参数。本研究设计的 LSTM 定量模型训练流程如图 3 所示。图 3 LSTM 算法流程图Fig.3 The flowchart of LSTM algorithm1.7 对比模型建立

35、本研究选择偏最小二乘回归(Partial least squares regression,PLSR)与 卷 积 神 经 网 络(Convolution neural network,CNN)对樟子松气干密度的 NIRS 光谱数据进行分析。1.7.1 偏最小二乘回归PLSR 是化学计量学中经典的线性回归分析模型,在 NIRS 光谱分析领域应用广泛。PLSR 通过预测残差平方和(PRESS)提取数据的最佳主成分数,并进行线性回归。该方法适用于自变量间存在共线性且样本数量较少的回归分析11,32。1.7.2 卷积神经网络CNN 是深度学习领域的重要分支。CNN 凭借着局部感知与权值共享等特点,可以

36、隐形地从复杂数据中有效学习合理超参数和高级特征33。为使 LSTM 模型具有可比性,本研究所建立的 CNN 预测模型卷积层数、卷积核数量,Dropout层与全连接层数量等,均与 LSTM 中的回归模块保持一致。卷积层中卷积核的大小为 51,步长为1。池化层采用最大池化,大小为21,步长为1。1.8 评价标准在 NIRS 定量分析模型建立后,需要借助化学计量学中的指标,统计分析比较模型的优劣。本研究选用预测集决定系数(R2)、预测集均方根误差 RMSEP 与标准剩余预测偏差 RPD 作为模型评价参数,计算公式参考文献 6。2 结果与分析2.1 样本预处理基于 12 种预处理方法处理后的光谱数据,

37、彭润东,等:基于 LSTM 长短期记忆网络的樟子松木材气干密度 NIRS 模型预测184第 3 期建立 LSTM 预测模型。探索不同预处理方法对LSTM 模型预测精度的影响。如表 2 所示,NIRS经过不同预处理方法后,LSTM 模型的评价指标。通过比较各模型的评价指标,经预处理的 NIRS数据建立的 LSTM 模型的预测集 R2、RMSEP 与RPD 相较于原始光谱,模型的准确率与泛化性能均得到提升。表明对 NIRS 数据进行预处理可以提高 LSTM 模型提取 NIRS 高级信息的能力。表 2 不同预处理方法对 LSTM 模型的樟子松密度预测模型的影响Table 2 The influenc

38、e of different preprocessing methods on the prediction model of P.sylvestris wood预处理方式Pretreatment method训练集 Train set预测集 Prediction set决定系数 R2均方根误差 RMSEC决定系数 R2均方根误差 RMSEPRPDNone0.7990.0140.0720.0230.935SGS0.9450.0070.8750.0062.895SNV0.9250.0080.8500.0102.642Detrending0.8840.0110.5500.0131.527MSC0.

39、7720.0150.7850.0122.209MAS0.7970.0140.3160.0181.239Normalize0.8030.0140.6450.0131.720MSC+Auto+SGS0.9440.0070.8490.0072.641SNV+Auto+SGS0.9160.0090.8020.0092.301SNV+Detrending0.8160.0130.5880.0141.597MSC+MC+Auto0.3910.0240.1370.0231.103SNV+DT+MC+Auto0.8080.0140.4390.0161.368SGS+MC+Auto0.9440.0070.8440

40、.0072.591综合分析预测集的评价指标 R2、RMSEP,和RPD,可以发现选用 SGS 处理后的 LSTM 模型的精度最高,模型的拟合效果最优、预测精度最高(R2=0.875,RMSEP=0.006,RPD=2.895)。基于SGS,SNV,MSC+Auto+SGS,SNV+Auto+SGS,SGS+MC+Auto 等预处理方法处理后的数据建立的 LSTM 模型,模型质量明显优于其他预处理方法,模型的评价指标数值较为接近,并且 RPD均大于 2.0。故后续建模中采用的预处理方法为SGS,SNV,MSC+Auto+SGS,SNV+Auto+SGS,SGS+MC+Auto。2.2 光谱特征波

41、段选择与分析预处理后的 NIRS 光谱数据,虽然基本剔除了NIRS 光谱中夹杂的随机噪声、基线偏移等问题,提高了 NIRS 信噪比。但 NIRS 数据仍旧是含有复杂冗余信息的高维度数据,其共线性严重干扰后续 LSTM 网络提取有效波段间的高维特征,并影响模型预测精度以及建模速度。为减少无关变量对建模的干扰,提高建模的精度与速度,需要提取 NIRS 数据中的特征波长。本研究以 CARS 筛选最佳特征波段,CARS筛选后的特征波段作为 LSTM 模型的输入,建立模型并预测樟子松的气干密度。采用 CARS 处理NIRS 数据时,蒙特卡洛采样法(MSC)分别对样本采样 100 次,以 10 折交叉验证

42、构建潜变量因子数为 10 的 PLSR。以 SGS 处理后的 NIRS 数据为例(图 4),由图 4a 可知,随着采样次数的增加,被选中的对模型贡献率大的波长点迅速地减少,但衰减趋势逐渐放缓。由图 4b 可知,在 1-26 次的模型运算过程中,NIRS 数据中越来越多冗余信息被剔除。当采样次数大于 27 时,RMSECV 数值呈现上升趋势,这表明大量冗余信息被剔除的同时,部分对模型贡献率大的波长点开始被去除,导致模型的预测精度降低。图 4c 中的星号线表示最小 RMSECV 对应的子集数。对比图 4ab 的结果相互对应,表明采样次数为 27 次时,RMSECV 最小,此波长变量子集是与樟子松样

43、品气干密度相关的最佳波长组合,共筛选得到 53 个特征波长。利用 CARS 法筛选特征波长,剔除了大部分的冗余信息,最终选取 53 个 NIRS 波长点选为特征波长参与 LSTM 模型的构建。模型的预测结果相比无特征选择提升明显,其中预测集 R2提高到0.959,RMSEP 降低到 0.005。2.3 模型预测能力的对比与预测为验证基于 LSTM 的建立樟子松气干密度NIRS 模型的有效性与稳定性,将 LSTM 模型与185中 南 林 业 科 技 大 学 学 报第 44 卷PLSR 和 CNN 所建的樟子松气干密度的定量回归模型进行对比(表 3)。通过对比表 3 中 5 种预处理后的光谱数据的

44、 LSTM、PLSR、CNN 等模型的预测结果可知,LSTM 模型的回归效果最优,因为LSTM 网络可以更有效地学习光谱波段间的有效信息并剔除冗余信息,更擅于处理序列数据。CNN模型的回归结果最差,因为 CNN 网络虽然可以提取光谱中特征,但是无法学习特征之间的相关性信息,并不能很好地描述序列数据,所以效果并不理想。PLSR模型的回归效果略优于CNN模型,因为建模时样本集的数量较小,并且光谱经过特征提取后的特征波段之间线性相关,PLSR 模型擅长解决共线性于小样本建模等问题,因此模型的效果较佳。(a).选择变量数目;(b).RMSECV;(c).回归系数路径。(a).Number of sam

45、pled variables;(b).RMSECV;(c).Regression coefficient path.图 4 CARS 波段选择变化趋势图Fig.4 CARS bands selection trend chart表 3 不同光谱预处理方法与不同建模方法组合的建模结果Table 3 Modeling results of combinations of different spectral pretreatment methods and different modeling methods建模方法Model预处理方式Pretreatment method训练集 Train se

46、t预测集 Prediction setRPD决定系数 R2均方根误差 RMSEC决定系数 R2均方根误差 RMSEPLSTMSGS0.9820.0040.9590.0055.033SNV0.8430.0120.6300.0101.685MSC+Auto+SGS0.9410.0070.8960.0073.183SNV+Auto+SGS0.9470.0070.8640.0092.778SGS+MC+Auto0.9660.0060.7830.0062.200PLSRSGS0.9840.0040.9180.0093.559SNV0.9090.0090.5280.0121.492MSC+Auto+SGS

47、0.9780.0050.8000.0102.279SNV+Auto+SGS0.9630.0060.7730.0102.137SGS+MC+Auto0.9960.0020.7460.0062.034CNNSGS0.9130.0090.8700.0102.840SNV0.5660.0210.1780.0161.131MSC+Auto+SGS0.9780.0050.8250.0102.452SNV+Auto+SGS0.8910.0100.8830.0082.990SGS+MC+Auto0.9690.0060.7540.0062.067SGS、SNV、MSC+Auto+SGS、SNV+Auto+SGS

48、、SGS+MC+Auto 这 4 种预处理方法中,不同的建模方法对应的最优预处理方法不同(表3)。采用 LSTM 建立模型时,最优的预处理彭润东,等:基于 LSTM 长短期记忆网络的樟子松木材气干密度 NIRS 模型预测186第 3 期方法为 SGS,预测集的 R2为 0.959,RMSEP 为0.005,RPD 为 5.033。此时模型的预测精度最高,拟合效果最好,稳定性最强。当预处理方法 为 MSC+Auto+SGS、SNV+Auto+SGS 时,模型的预测性能较优,预测集的决定系数均大于0.85,RPD 均大于 2.5。采用 PSLR 模型时,SGS为最优预处理方法(R2=0.918,R

49、MSEP=0.009,RPD=3.559)。CNN 模型的最优预处理方法为SNV+Auto+SGS,预测集的 R2为 0.883,均方根误差 RMSEP 为 0.008,RPD 为 2.99。经过综合比较,当采用SGS处理光谱数据时,CNN 模型的预测结果相对较好,预测集樟子松气干密度的 R2为 0.870,比 SNV+Auto+SGS 处理后的 CNN 模型预测集 R2低了 1.450%。但 SGS 处理后的光谱数据建立的 LSTM、PLSR 模型预测集 R2均大于 0.90,RPD 均大于 3.5。因此 SGS 为最佳的预处理方法。利用最优的 LSTM、PLSR、CNN 模型对未参与建模的

50、预测集样本进行预测分析,检验模型的预测精度与稳健性。3 种模型对樟子松气干密度的预测结果如图 5 所示。基于 LSTM 所建的定量预测模型,对于预测集樟子松气干密度的预测值与真实值最接近,预测精度最高。图 5 不同最优模型的预测性能Fig.5 The prediction performances of different best models3 结论与讨论3.1 结 论本研究提出了一种基于近红外光谱的樟子松气干密度预测模型。将 NIRS 数据归为序列数据,利用 LSTM 模型分析 NIRS 数据,实现对樟子松气干密度的预测。LSTM模型在12种光谱预处理条件下,SGS、SNV、MSC+Au

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服