收藏 分销(赏)

基于红外漫反射谱和机器学习的粉末物质识别.pdf

上传人:自信****多点 文档编号:2351832 上传时间:2024-05-28 格式:PDF 页数:10 大小:3.60MB
下载 相关 举报
基于红外漫反射谱和机器学习的粉末物质识别.pdf_第1页
第1页 / 共10页
基于红外漫反射谱和机器学习的粉末物质识别.pdf_第2页
第2页 / 共10页
基于红外漫反射谱和机器学习的粉末物质识别.pdf_第3页
第3页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 21 卷 第 10 期2023 年 10 月Vol.21,No.10Oct.,2023太赫兹科学与电子信息学报Journal of Terahertz Science and Electronic Information Technology基于红外漫反射谱和机器学习的粉末物质识别高颂1,阎结昀1,王迎新2,解研2(1.北京邮电大学 理学院,北京 100876;2.清华大学 工程物理系,北京 100084)摘要:红外光谱可有效携带化合物结构以及化合物组成成分的信息,在化学研究、纯度检测和药物识别领域已得到广泛应用。但在实际应用场景中,由于缺乏标准样品制备的条件,红外光谱识别准确率较低,效率

2、较差,使这项技术受到了极大限制。本文采用可调谐红外量子级联激光器作为激光源,建立记录粉末样品漫反射光谱的实验系统。以葡萄糖和聚乙烯混合粉末漫反射谱为例,通过 Kubelka-Munk(K-M)方程和 Kramers-Kronig(K-K)关系合成样品的透射谱,并验证漫反射谱还原透射谱的可能性。将光谱数据用于两种神经网络模型中,对混合粉末质量分数进行预测。结果表明,在 K-K 关系变换下,长短期记忆(LSTM)网络模型预测效果最佳,明显优于 BP神经网络模型;在 K-M 方程变换下,两种神经网络对高质量分数葡萄糖样品的预测都比较准确,对低质量分数的预测较差。两种漫反射光谱校正方法都不同程度地提高

3、了训练结果的准确性,LSTM 模型整体优于 BP 神经网络模型。这些研究结果有助于发展基于频率可调谐或宽谱红外激光的未知混合粉末样品的识别技术。关键词:量子级联激光器;漫反射;红外光谱法;Kramers-Kronig关系;人工神经网络中图分类号:TN21 文献标志码:Adoi:10.11805/TKYDA2022035Powder compound identification based on infrared diffuse reflectance Powder compound identification based on infrared diffuse reflectance sp

4、ectroscopy and machine learningspectroscopy and machine learningGAO Song1,YAN Jieyun1,WANG Yingxin2,XIE Yan2(1.School of Science,Beijing University of Posts and Telecommunications,Beijing 100876,China;2.Department of Engineering Physics,Tsinghua University,Beijing 100084,China)AbstractAbstract:Infra

5、red spectroscopy can effectively carry the information of compound structure and compound composition,which has been widely used in chemical research,purity detection and drug identification.However,in practical application scenarios,due to the lack of standard sample preparation conditions,the low

6、accuracy and low recognition efficiency of infrared spectroscopy also make this technology limited.By using a tunable infrared Quantum Cascade Laser(QCL)as the source,an experimental system for recording the diffuse reflection spectra of powder samples is established.Taking the diffuse reflectance s

7、pectrum of a mixed powder of glucose and polyethylene as an example,the Kubelka-Munk(K-M)equation and the Kramers-Kronig(K-K)relations are utilized to synthesize the transmission spectrum of the sample from the experimentally measured diffuse reflectance spectrum of pure glucose,and the possibility

8、of the transformation of the transmission spectrum from the diffuse reflectance spectrum is verified.On this basis,spectroscopic data are applied to two neural network models to predict the mass fraction of mixed powder.The results show that the Long Short-Term Memory(LSTM)predicts the best results

9、under the K-K relations,significantly better than the BP neural network.Under the K-M equation,both neural networks are more accurate in predicting the glucose samples with high mass fraction and poorer in predicting the glucose samples with low mass fraction.Both diffuse reflectance spectral correc

10、tion methods improve the accuracy of the training results,and the LSTM prefers to the BP neural network.This work contributes to the development of the identification of unknown mixed powder samples based on frequency-tunable or broad spectral infrared lasers.文章编号:2095-4980(2023)10-1247-10收稿日期:2022-

11、02-12;修回日期:2022-03-14太赫兹科学与电子信息学报第 21 卷KeywordsKeywords:Quantum Cascade Laser;diffuse reflection;infrared spectroscopy;Kramers-Kronig relations;artificial neural network太赫兹波是指频率在 0.110 THz 的电磁波,波长在 0.033 mm 之间,是一种红外波。太赫兹波在物质识别、光谱分析中有着独特的优势,在大气成分监测、痕量物质监测等领域具有重要的应用前景1。中红外激光是指波长在 2.525 m 之间的电磁波,频率在 12

12、120 THz 之间,近年来亦被称为深太赫兹波段而受到太赫兹科学和技术领域研究人员的关注。因其在空气中传播性较强,在物质中透过性较好,当辐照在物质表面时,可引起分子的收缩振动,使分子内电子发生能级间的跃迁现象,可反映出物质中化学键和官能团等信息。由于光谱信息的稳定性取决于待测物质化学成分的稳定性,当物质成分发生稳定变化时,这些变化在红外光谱中也有相应的强度变化关系。基于这些特点,利用中红外进行物质识别和对物质光谱深入研究一直是领域内的热门话题2-4。红外光谱法(Infrared Spectroscopy,IR)是一种能够有效研究化合物结构以及组成成分的光学方法,是分子吸收光谱的一种,其作为化学

13、研究中的一种重要鉴别和分析方法,已得到广泛应用5。对于不同聚集状态的物质,通常采用傅里叶变换红外光谱(Fourier Transform Infrared Spectroscopy,FTIR)的方法来分析化合物性质,这种方法大量用于气体化合物的分析工作。目前对于固体和液体的化合物分析主要采用拉曼光谱方法6。但在常温状态下,分子获得的能量较小,大部分电子处于未激发态,不能有效反映物质的结构信息。若对化合物进行定量分析,需对样品的制备以及实验环境有一定的要求7。太赫兹时域光谱技术是太赫兹光谱技术研究的主要方法,和 FTIR 同样用于中红外波段以及远红外波段。太赫兹时域光谱技术通过时间延迟的方式获取

14、时域电场强度的物理量,然后通过傅里叶变换从时域信息中获取频域中的光谱信息8-9。由于太赫兹时域光谱技术通过脉冲的方式激发太赫兹脉冲信号,不同于 FTIR 采用红外热辐射的方式产生光源,因此这种同步相干的探测方式使太赫兹时域光谱技术受热辐射背景噪声的影响较小。但在实际应用中,为保证高性能、高精确度,常采用制冷型太赫兹探测技术,太赫兹探测器设计较为复杂,体积庞大,如果在室温环境下,探测器的灵敏度和带宽往往达不到分析要求10。若用外差法进行探测,需进行大量的准备工作建立实验系统,且探测效率低,目前尚不能满足投入实际应用的需求。而中红外光谱分析技术因其工作频率范围大,解决了光谱带宽的限制,同时室温工作

15、的连续波激光光源及室温工作的探测器产品已经成熟,集成度高等特点也一定程度上解决了太赫兹漫反射光谱研究工作中的难题。1994 年,美国贝尔实验室首次在超晶格结构中实现了能够发射中红外和远红外频段激光的量子级联激光器(QCL)。此后,可调谐红外量子级联激光器被成功研制,其可调谐范围达到 1 000 cm-1,峰值功率高达 150 mW11。实际实验环境中,漫反射光谱辐射较弱,对比吸收光谱选择性差,给研究工作带来了巨大困难,这种高功率宽谱可调谐红外激光器的发明给漫反射光谱分析带来了可能。蒋涛等采用固源分子束外延技术,基于半绝缘-等离子体波导工艺制作了太赫兹量子级联激光器,其在 10 K 工作温度、3

16、50 mA 激励电流下的中心频率为 2.93 THz,电流密度达到 156 A/cm2,输出功率达到 7.84 mW,提高了太赫兹器件的性能12。Erik R Deutsch 等利用红外 QCL实现了表面痕量污染物的漫反射光谱检测13。Paul Dean 等14和 I S Golyak 等15分别通过太赫兹 QCL 和中红外QCL 研究了在粉末样品漫反射光谱中获取有效吸收系数的方法,证明了漫反射测量在粉末样品分析中的适用性。光谱分析与常规的化学方法制样分析不同,它不能通过化学反应有损地对物质进行鉴定,因此常采用计算机技术中的机器学习方法来建立模型。通过对模型的参数约束,光谱中携带的吸收特征信息

17、可从重叠的光谱数据集中被提取出来,从而反映出待测物质的分子结构、性质等物理参数和化学参数,也可以在检测混合物纯度、成分中加以应用。张活等16基于太赫兹时域光谱技术建立了最小二乘、区间最小二乘等回归模型,预测了三七粉中掺杂的淀粉成分。张航等17基于傅里叶红外光谱技术建立了最小二乘回归模型,并引入了遗传算法、竞争自适应重加权采样等特征选择方法,实现了乙醇固态发酵过程的参数预测。L Wang18等基于傅里叶红外光谱技术建立了支持向量机和反向传播神经网络模型,识别出皂荚样品中掺杂的蔷薇和玫瑰成分。黄妙芬等19利用卫星采集的可见光-近红外光谱数据建立了长短期记忆(LSTM)网络模型,预测了海水中石油污染

18、的含量。本文采用商用可调谐红外 QCL 作为激光源,记录葡萄糖粉末和葡萄糖、聚乙烯在不同浓度下的混合粉末漫反射光谱。通过 Kubelka-Munk(K-M)方程和 Kramers-Kronig(K-K)方程分别计算样品的有效吸收系数,进一步验证两种漫反射光谱校正方法的适用性,并提出了基于漫反射光谱校正的预处理方法,通过构建 BP 神经网络、LSTM 模型,实现了混合粉末样品的浓度识别。1248第 10 期高颂等:基于红外漫反射谱和机器学习的粉末物质识别1实验系统和实验样品1.1 基于频率可调谐红外 QCL 的粉末样品漫反射谱实验系统本文采用的激光器为 Block Engineering(美国)

19、公司生产的 LaserTune 可调谐红外量子级联激光器,工作波段在6.0910.61 m,峰值功率约为 101.2 mW,平均功率变化范围在 0.522.52 mW,激光器和光电探测器以脉冲的模式实现采集信息的同步。为消除实验光路长度以及测试样品对激光器与光电探测器同步率的影响,本实验中将激光器脉冲持续时间设置为 60 ns,重复频率为 0.5 MHz;光电探测器采样持续时间设置为 70 ns,采样延迟根据光路长度等因素设置为 110 ns。同时为了获取较高精确度的漫反射光谱,激光调谐步长设置为 0.5 cm-1。实验光路如图 1 所示,其中 1 为可调谐红外 QCL;2 为碲镉汞(MCT)

20、光电探测器;3 为测试样本;4 为平面镜;5为 45离轴抛物面镜;6 为锗透镜;7 为 QCL-MCT 光电探测器连接线;8 为 QCL-PC 连接线;9 为 PC;1-3 间引导线为入射辐射;3-2 间引导线为漫反射辐射。QCL 工作产生的红外辐射通过平面镜以及 45离轴抛物面镜反射聚焦在测试样品上,产生吸收、反射和漫反射现象。将样品位置替换为平面镜,将光电探测器置于反射角位置,如收集反射辐射得到的功率谱与激光器出厂参考报告功率谱有强相关性,说明测量光路具有良好的可靠性。为了收集到漫反射辐射且受镜面反射辐射影响最小,将光电探测器置于法线位置,并由一个 Ge 透镜收集漫反射辐射。测量数据通过两

21、条连接线同步传输到 PC 中,整个光路的长度大约在 50 cm 左右。1.2 测试样本数据获取在实验数据获取阶段,为消除激光器功率波动对结果的影响,首先将探测器置于图 1 中 1 和 4 之间,将测得激光器功率波动范围较小的 942.751 300.75 cm-1作为研究波段,并记录结果作为参考激光器功率信号 I0。实验所用的聚乙烯样品是颗粒大小为 5675 m 的白色粉末,无需特殊制备;葡萄糖粉末颗粒较大,需在玛瑙研钵中进行 23 min的研磨制备,将粉末研磨至 60 m 左右。然后将测试样品置于 5 cm5 cm2 cm 聚丙烯方形容器内并填满,放置于图1 中 3 的位置。将样品整理平整,

22、以减少入射辐射在样品内部发生多次反射吸收现象,获得较高强度的漫反射辐射信号。测量葡萄糖粉末样品光谱 20 组,以及葡萄糖和聚乙烯混合粉末在 6 个不同质量分数下(聚乙烯质量分数分别为 0.01、0.05、0.1、0.3、0.5、0.7),不同点位的实验光谱,每组质量分数下测量 20 组,共 120 组,每组数据有 731 个数据点,记为 I1。计算 R=I1/I0作为漫反射率,混合粉末样本数据集如图 2 所示,横坐标为波数,纵坐标为漫反射率。2红外漫反射光谱分析理论2.1 Kubelka-Munk 理论研究者们建立了许多理论模型来描述光在介质中发生漫反射辐射的现象,尤其是光在非均匀介质中的传播

23、。其中最常用的是 Kubelka-Munk 理论,因为它的公式化理论较为简单,通过对辐射传输方程的推导,描述了均匀漫反射辐射在一维半无限各向同性空间的传播过程20。F(R)=ks=()1-R22R(1)式中:R为样品在无限厚时的反射率;k 为样品的吸收系数;s 为样品的散射系数。实际应用中,样品厚度并不需要无限厚,一般在几个毫米以上的就可以适用 K-M 方程。Fig.2 Diffuse reflectance spectra of mixed glucose/PE powder图2 葡萄糖和葡萄糖/聚乙烯混合粉末漫反射光谱曲线图Fig.1 Device for collecting diffu

24、se reflectance signals from solid samples图1 收集固体样品漫反射实验装置1249太赫兹科学与电子信息学报第 21 卷2.2 Kramers-Kronig 理论当光入射至两种介质的界面时,根据菲涅耳方程,反射、折射和吸收系数之间存在代数关系,介质的反射率可以表示为一个复函数:r(v)=(n-1)+i(n+1)+i=ei(2)式中:n 为样品的折射率;为样品的消光系数;为反射波的振幅。本文中,光通过空气和样品两种介质。对等式两端取对数得lnr(v)=ln(v)+i(v),函数ln(v)和(v)为复函数的实部和虚部,它们之间满足Kramers-Kronig

25、关系21:ln(v)=P(20v()vv2-v2dv)(3)(v)=P(-2v0ln(v)v2-v2dv)(4)式中:P 为主值积分;v为吸收峰位置的振动频率。由于漫反射辐射R(v)=2(v),可以通过式(5)来计算吸收系数 k:k(v)=2(v)sin(v)1-2(v)cos(v)+R(v)(5)上述关系适用于光在介质表面发生正入射的情况,且发生于空气-样品的介质表面。具体实验中,漫反射光谱R(v)是在有限的波数范围内测量得到的,因此需要对(v)的相位进行外推22:i(v)=-12-0dte-ivt-dvln(v)eivt+120dteivt-dvln(v)eivt(6)通过式(1)(5)的

26、推导,以及式(6)的外推方法,最终通过式(5)(6)可以从物质的漫反射光谱中计算吸收系数 k。2.3 漫反射光谱校正方法的应用取实验测量的 20 组葡萄糖粉末样品光谱平均值,并进行 7 点多项式(Savitzky-Golay,SG)平滑减弱激光器功率噪声对分析结果的影响。如图 34 所示,图 3 为计算后葡萄糖漫反射光谱;图 4 为漫反射校正变换后得到的吸收光与参考数据23的对比。通过对比可以观察到,实验参考所用的葡萄糖吸收光谱在 1 024 cm-1、1 079 cm-1、1 106 cm-1、1 149 cm-1、1 204 cm-1附近出现了吸收峰,峰值位置已在图中用虚线标出。其中 K-

27、M 方程变换后对应吸收峰位置的透过率分别为 0.08、0.45、0.35、0.22、0.12;K-K 方程变换后对应吸收峰位置的透过率分别为0.18、0.63、0.59、0.50、0.32。K-M 方程和 K-K 方程计算后的合成光谱在吸收峰附近也出现了峰值,应用OHaver 团队开发的寻峰软件对合成光谱进行吸收峰的强度定量计算,调整幅度、斜率、光滑宽度和自适应宽度4 个参数约束寻峰最终的结果24。其中幅度设置为 1,斜率设置为 0.005,光滑宽度和自适应宽度设置为 10,在光谱分析中常用峰面积表示峰强度,其中 K-M 方程变换后对应吸收峰强度分别为 32.04、4.02、13.19、21.

28、75、17.26;K-K 方程变换后对应吸收峰强度分别为 20.78、5.53、11.18、19.15、12.30,峰值相关性系数分别为 0.84和 0.91,误差范围在5 cm-1。这几个吸收峰的出现是由于 C-C 键和 C-O 键的拉伸以及原子群 OCH、COH、CCH的变形劈裂成多个峰25。这个结果说明在不经过如 KBr 压片法等样品预处理方法下,通过漫反射校正方程变换,也可以从漫反射光谱中得到样品吸收光谱的信息。Fig.3 Measured diffuse reflectance spectroscopy of glucose图3 实验测量葡萄糖漫反射光谱1250第 10 期高颂等:基

29、于红外漫反射谱和机器学习的粉末物质识别3神经网络建模与结果分析3.1 神经网络模型选取为识别预测混合样品中葡萄糖的质量分数和探究漫反射光谱校正方法对识别效果的影响,本文选择了 2 种神经网络模型(BP 神经网络和 LSTM 网络)建立回归任务,对葡萄糖质量分数进行预测。3.1.1 BP 神经网络和天牛须搜索算法模型BP 神经网络也称前反馈人工神经网络。该网络由输入层、隐含层和输出层构成,其自适应过程由信号的前向传递过程和误差的反向传递过程组成,在训练过程中循环迭代调整各层权重值,当误差减小到预期值时输出预测结果26。在红外光谱数据处理中,可以将光谱数据作为输入传递至网络模型中,并将待输出物理参

30、数作为网络输出,从而构建反映光谱数据和待输出物理参数关系的回归模型。天牛须搜索算法(Beetle Antennae Search,BAS)是在 2017 年提出的一种多目标函数优化算法。它的原理基于天牛的觅食天性,因为天牛的触角对气味强度的感知很灵敏,当天牛右边触角接收到气味强度比较强时,就会往右飞;反之,天牛则会向左飞。与遗传算法、模拟退火算法、蚁群算法等类似,BAS 可以在未知函数以及未知梯度的数据集上实现自动寻优,可以显著提高寻优速度27。本文将 BAS 和 BP 相结合,在网络训练之前,首先对初始 BP 神经网络设置的阈值和权重进行优化,寻找最优的阈值和权重,然后再应用到神经网络模型中

31、进行训练。这样可以避免神经网络模型因为梯度下降导致陷入局部最优解的情况,进一步提升了神经网络模型的可靠性,也在一定程度上解决了 BP 神经网络容易陷入局部最小化而导致泛化能力差的问题。3.1.2 LSTM 网络模型为解决前后数据之间的依赖问题,研究者们开发了循环神经网络(Recurrent Neural Network,RNN)用于处理时序数据,其本质依然是 BP 神经网络中应用的梯度下降法。与基础的神经网络层与层连接方式不同,RNN 在层与层之间的神经元处也建立了更新权重的连接。但这种方式连接的网络会导致激活函数导数发生累乘的现象,从而导致“梯度消失”和“梯度爆炸”情况28。LSTM 网络引

32、入了“门”机制,将神经网络的输入层和隐含层迁入记忆单元,加入了遗忘机制。整个网络结构由输入门、遗忘门、输出门和循环自连接的神经元构成,通过遗忘与输入、输出的方式有效解决了“梯度消失”和“梯度爆炸”的问题29。3.2 模型评价指标为对模型预测精确度进行评价,本文选择均方误差(Mean Square Error,MSE)、平均绝对百分比误差(Mean Absolute Percent Error,MAPE)作为误差评价指标。其中:EMS=t=1n|actual(t)-forecast(t)2n(7)式中:n 为目标值个数;actual 为实际值;forecast 为预测值。MSE 用来评判预测模型

33、的精确度,值越小,模型预测结果越好。本文中,目标值为葡萄糖质量分数,可能会出现有部分质量分数下预测结果偏离真实值较大,但模型整体预测评价效果好的现象,从而导致对模型错误的评估。因此引入 MAPE 来评价预测结果较真实结果的平均偏离水平,如 MAPE 为 10,则说明预测结果偏离真实结果 10%,其表达式如下:Fig.4 Corrected absorption spectra and reference spectra图4 漫反射校正变换后得到的吸收光谱与参考数据的对比1251太赫兹科学与电子信息学报第 21 卷EMAP=1nt=1n|actual(t)-forecast(t)actual(t

34、)(8)3.3 预测结果分析3.3.1 BAS-BP 神经网络和 LSTM 网络模型对比本文选择的 BP 神经网络隐含层神经元节点数根据经验公式m=n+l+(=1210)(n 为输入层节点数,l为输出层节点数,m为隐含层节点数)设置为10个,初始训练权重值为1,训练误差设置为10-4,训练集按照120组混合粉末漫反射光谱总数据集 2/3 的比例随机选取,所有数据作为最终测试集,期望输出值为葡萄糖粉末质量分数。在选取 BAS 参数时,由于缺少经验公式的指导,经过多次试验调整,最终确定初始步长0=3,迭代次数n=100。BP 神经网络在优化复杂目标函数时容易出现梯度平缓下降的情况,发生这种情况时,

35、权值误差更新速度极小且缓慢,大大降低了网络训练速度。考虑到方法的可实用性,为进一步提高神经网络的训练效率,本文采用竞争性自适应重加权算法(Competitive Adaptive Reweighted Sampling,CARS)降低输入序列的维度。以原始光谱数据为例,依据均方根误差(Root Mean Square Error of Cross Validation,RMSECV)最小值原则,对数据集进行 50 次蒙特卡洛采样,并进行 5 次交叉验证,依次将提取变量加入算法中循环迭代。由图 5 可知,循环迭代 5 次后,在RMSECV 达到最小值时,样本的采样次数为 22 次,依据此结果提取

36、了 58 个波数下对应的数据点。图 5(a)为蒙特卡洛采样筛选波长数量的过程;图 5(b)为 RMSECV 变化过程,在曲线下降过程中消除了无关变量,在曲线上升过程中消除了相关性强的变量;图 5(c)为回归系数的变化趋势,“*”号标记处代表筛选最佳特征波长数量的位置,即采样次数为 22 次,得到特征波段 58 个。LSTM 网络模型的隐藏单元设置为 5 个,为防止在训练过程中发生过拟合现象,除去最后一层,每一层都进行 5%的随机权重的丢弃,然后连接一个全连接层,最后回归输出。训练过程使用自适应矩估计优化器,初始学习率设置为 0.000 5。训练集按照 3.3.1 中 BP 神经网络的选取方式随

37、机选取,所有数据作为最终测试集,期望输出值为葡萄糖粉末质量分数。图 6 为原始漫反射光谱在两种网络下的预测结果,表 1 为对原始漫反射光谱建模预测结果的评价指标。由图 6和表 1 可知,两种神经网络模型都实现了对目标值比较准确的预测,但对葡萄糖质量分数小于 70%的预测效果明显差于质量分数大于90%的预测效果,BAS优化算法处理后的BP神经网络预测结果向较小值偏离。分析原因是由于实验选择的聚乙烯粉末粒径较葡萄糖粉末粒径小,并且葡萄糖对红外波段的吸收比聚乙烯强,导致聚乙烯粉末质量分数在增加的过程中,测得的葡萄糖漫反射信号太弱,受噪声的影响较大。LSTM网络模型较BP神经网络模型MSE降低了0.0

38、01,MAPE分别降低了5.06、21.51,说明LSTM网络模型整体要优于BP神经网络模型。3.3.2 Kubelka-Munk 变换下 BAS-BP 神经网络和 LSTM 网络模型对比为验证漫反射光谱校正方程对模型预测结果的影响,首先对原始漫反射光谱进行 Kubelka-Munk 变换,得到新的数据集,并按照 3.3.1 中模型参数的设置方法进行建模,得到的结果如图 7 所示。表 2 为 Kubelka-Munk 变换数据集预测结果评价指标。Fig.5 Wavelength variables selection process for CARS feature extraction al

39、gorithm图5 CARS特征提取算法选取波长变量过程1252第 10 期高颂等:基于红外漫反射谱和机器学习的粉末物质识别由图 7 和表 2 可知,经过 Kubelka-Munk 变换后的模型整体精确度较原始漫反射光谱模型有了提高,MAPE 在BAS-BP 和 LSTM 模型上有了显著减小,分别减小了 29.90 和 13.7。但所有模型在葡萄糖质量分数小于 70%的区间表现变差,分析原因是:a)Kubelka-Munk 方程一般用于混入样品浓度较低的情况,本试验中,由于葡萄糖粉末吸收强于聚乙烯粉末,在混入高浓度的聚乙烯粉末后,葡萄糖质量分数小于 70%的区间,Kubelka-Munk 方程

40、的适用性变差,聚乙烯样品浓度要保持在 10%以下;b)Kubelka-Munk 方程的散射系数 s 依赖于样品的密度 以及样品粒径 a,在混合样品不均匀或者粒径大小相差较大的情况下,Kubelka-Munk 变换的效果会变差;c)由于试验中所选葡萄糖粉末颗粒较大,用玛瑙研钵进行 23 min 的研磨后,使葡萄糖粉末粒径尽量接近 PE 粉末的 5675 m 粒径大小。若采用合适的物理研磨方法继续使样品粒径减小,Kubelka-Munk 方程变换后漫反射光谱的质量会更好30。3.3.3 Kramers-Kronig 变换下 BAS-BP 神经网络和 LSTM 网络模型对比为进一步验证 Kramer

41、s-Kronig 变换对模型预测结果的影响,在对原始漫反射数据集进行 Kramers-Kronig 变换之后,采用与上节相同的方式进行建模分析,得到的结果如图 8 所示。表 3 为 Kramers-Kronig 变换数据集预测结果评价指标。由图 8 和表 3 可知,经过 Kramers-Kronig 变换后,BAS-BP 和 LSTM 网络模型的精确度有了较好的提升。BAS-BP 模型较原始的 BP 神经网络的提升主要体现在葡萄糖质量分数小于 70%的情况下,但在葡萄糖质量分数Fig.6 Predicted results for the original diffuse reflectanc

42、e dataset图6 原始漫反射数据集预测结果表1 原始漫反射数据集预测结果评价指标Table1 Evaluation of prediction results of original diffuse reflection datasetMSEMAPECARS-BP0.000 240.71CARS-BAS-BP0.002 057.16LSTM0.001 035.65Fig.7 Predicted results from the dataset after Kubelka-Munk transform图7 Kubelka-Munk变换后数据集预测结果表2 Kubelka-Munk变换数据集

43、预测结果评价指标Table2 Evaluation of prediction results after Kubelka-Munk transformMSEMAPEKM-CARS-BP0.00555.37KM-CARS-BAS-BP0.00327.26KM-LSTM0.00221.921253太赫兹科学与电子信息学报第 21 卷高于 90%的部分,BAS-BP 模型的预测结果对比原始的 BP 神经网络模型依然向较小值偏移。LSTM 网络模型将MSE 降到了 0.000 1,MAPE 降到了 17.08,在所有模型中获得了最准确的预测值。分析原因是:当激光辐照在样品表面时,样品分子内部伸缩振动

44、产生了吸收、反射和漫反射等复杂光学现象,信号被激光探测器接收产生了连续带状光谱,同时受样品粒径大小和折射率的影响,光谱形状也会发生变化,尤其表现在漫反射光谱中。与原子中相隔能级较大的电子跃迁产生的线状光谱不同,分子中除了电子态之间的电子跃迁外,还包括了能态间的振动态跃迁以及振动态内的转动态跃迁,能级间隔较为密集,LSTM 网络可以在光谱数据中建立不同波段、峰值之间的联系关系,从而有效地从高维度光谱数据集中反映目标物理参数的结果。对比 BP 神经网络,LSTM 网络不仅解决了前后数据之间的关系问题,而且解决了神经网络训练中容易出现的梯度消失现象,本试验在不增加多个隐藏层的单层网络结构下,依然能够

45、得到较好的预测结果,这个特点也在最终的训练结果中得到了较好的证明。4结论本文采用可调谐红外量子级联激光器作为激光源,在漫反射光谱的实验系统下测量了葡萄糖和聚乙烯混合粉末的漫反射光谱。对实验数据应用 Kubelka-Munk 方程和 Kramers-Kronig 方程分别校正得到合成吸收光谱,然后将数据集应用到 BP 神经网络、BAS 优化的 BP 神经网络和 LSTM 网络模型中建模分析,对混合粉末中葡萄糖质量分数进行预测,最终得到如下结论。在不进行标准样品制备的情况下,可以通过 Kubelka-Munk 方程或 Kramers-Kronig 方程变换获得葡萄糖粉末固体的合成光谱,得到多个与吸

46、收光谱峰值相关性较高的吸收峰,增加了通过漫反射辐射检测物质的可靠性。通过不同网络模型对葡萄糖质量分数预测结果进行分析,LSTM 网络作为一个优秀的神经网络变种模型,不仅继承了原始神经网络的传递特性,且考虑了数据间的依赖性,并解决了原始 BP 神经网络中容易出现的梯度消失问题,在对红外光谱回归问题的分析上有较强的优势。将混合粉末原始漫反射光谱数据集作为输入时,LSTM 网络模型预测效果整体优于 BP 神经网络模型。由于 Kubelka-Munk 方程的适用性受样品浓度、密度以及粒径大小的影响,对原始漫反射数据集变换后预测结果在高浓度表现较差。而 Kramers-Kronig 方程通过对因果关系的

47、建立,所有频率下实部代表的折射率集合共同决定了虚部的消光系数,反映了特定频率光子的吸收现象由整个频率相应的能级变化共同影响的物理意义。在 本 文 设 置 的 CARS-BP、CARS-BAS-BP、LSTM、KM-CARS-BP、KM-CARS-BAS-BP、KM-LSTM、KK-CARS-BP、KK-CARS-BAS-BP、KK-LSTM 共 9 种模型中,KK-LSTM 网络模型得到了最好的预测效果。这些结论和相关机器学习技术为基于宽谱可调谐 QCL 发展未知粉末固体样品快速高光谱识别提供了依据及技术基础。参考文献:1 刘瑞婷.太赫兹探测技术应用及发展研究J.中国无线电,2019(12):

48、18-21.(LIU Ruiting.Research on application and Fig.8 Predicted results for the dataset after Kramers-Kronig transform图8 Kramers-Kronig变换后数据集预测结果表3 Kramers-Kronig变换数据集预测结果评价指标Table3 Evaluation of prediction results after Kramers-Kronig transform MSEMAPEKK-CARS-BP0.003 0126.04KK-CARS-BAS-BP0.001 061.8

49、1KK-LSTM0.000 117.081254第 10 期高颂等:基于红外漫反射谱和机器学习的粉末物质识别development of terahertz detection technologyJ.China Radio,2019(12):18-21.)2 MIAO X,ZHAN H,ZHAO K,et al.Terahertz-dependent PM 2.5 monitoring and grading in the atmosphereJ.Scientia Sinica(Physica,Mechanica&Astronomica),2018,61(10):60-69.3 LI Z,Z

50、HU Y,HAO Y,et al.Hybrid metasurface-based mid-infrared biosensor for simultaneous quantification and identification of monolayer proteinJ.ACS Photonics,2019,6(2):501-509.4 HENSLEY B S,DRAINE B J.Detection of PAH absorption and determination of the mid-infrared diffuse interstellar extinction curve f

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服