1、孔维恒,曾令伟,饶宇,等.基于预分类策略的激光诱导击穿光谱技术用于岩石样品定量分析J.岩矿测试,2023,42(4):760770.doi:10.15898/j.ykcs.202212190234.KONGWeiheng,ZENGLingwei,RAOYu,etal.Laser-inducedBreakdownSpectroscopyBasedonPre-classificationStrategyforQuantitativeAnalysisofRockSamplesJ.RockandMineralAnalysis,2023,42(4):760770.doi:10.15898/j.ykcs.
2、202212190234.基于预分类策略的激光诱导击穿光谱技术用于岩石样品定量分析孔维恒1,曾令伟1,饶宇1,陈莎1,王旭1,杨燕婷2,段忆翔1*,樊庆文1*(1.四川大学机械工程学院,四川成都610065;2.成都艾立本科技有限公司,四川成都611930)摘要:岩石样品中复杂的基质效应严重影响激光诱导击穿光谱(LIBS)定量分析的准确性,其原因是目标元素的发射特性会受到基质的影响,导致其发射强度偏离理想的规律。为提高定量分析准确性,本文提出一种基于岩性基质特性的预分类定量分析方法。该方法首先构建基于 k 近邻(kNN)与支持向量机(SVM)算法的多层分类模型识别样品的岩性进行分类,通过 kN
3、N 算法将样品分成碳酸盐和硅酸盐两大类,再利用SVM 算法将大类细分成 6 类,而后针对不同岩性样品分别构建元素定量模型。通过采用预分类方法,可以确保分析的样品具有相似的化学成分,更好地确定分析时的基准线和校准曲线,从而减少分析中的不确定度,提高定量准确性。kNN 算法通过交叉验证选取最优的 k 值,同时使用网格寻优方法确定了 SVM 算法中关键惩罚参数 C 和 RBF 宽度参数,利用该分类模型对来自 6 类岩性的 39 个国标岩石样品和国标岩石混合样品中的 Si、Ca、Mg 和 K 元素进行分析,岩性识别的准确率达 100%,保证了后续定量分析的准确性,并针对不同岩性中的不同元素采用了合适的
4、预处理方式提升光谱数据的稳定性。相比于传统标准曲线定量方法,采用预分类方法可以减少不同岩性基质之间的相互影响,从而减小样品基质非均匀性带来的误差。对比两种方法进行数据分析,测试集样品的预测值与参考值相关性分析系数从 0.2310.664 提高至0.9940.999,平均相对标准偏差从 38.2%降低至 8.6%。与传统定量分析方法相比较,采用预分类定量分析方法所构建模型对上述 4 种元素定量分析结果准确性有着明显的提高,为提高岩石元素定量分析准确性提供新的思路,拓宽了 LIBS 技术的实际应用范围。关键词:激光诱导击穿光谱;岩石检测;定性定量分析;分析模型;预分类定量要点:(1)针对不同岩性中
5、的不同元素采用合适的预处理方法可以提高光谱数据稳定性。(2)通过预分类策略可以获得基质匹配的标准品以帮助构建与基质相关的标准曲线。(3)将不同岩性的样品分类之后再进行定量分析可以有效地提升定量分析结果的准确性。中图分类号:P597.3;O657.31文献标识码:A激光诱导击穿光谱(LIBS)是一种原子发射光谱技术,其原理是以高能激光脉冲直接作用在样品上,诱导样品产生等离子体,利用光谱仪对等离子体发射光谱进行采集分析,从而识别样品中元素组成和收稿日期:20221219;修回日期:20230331;接受日期:20230516基金项目:四川省科技厅重点研发项目(2022YFG0235)第一作者:孔维
6、恒,硕士研究生,主要研究方向为基于激光诱导击穿光谱的岩石定性定量分析方法。E-mail:。通信作者:段忆翔,博士,教授,主要研究方向为激光光谱、新型质谱分析方法及仪器的开发。E-mail:;通信作者:樊庆文,博士,研究员,主要研究方向为机械设计、分析仪器设计、机电控制、图像处理技术及应用。E-mail:。2023年7月岩矿测试Vol.42,No.4July2023ROCKANDMINERALANALYSIS760770760含量。LIBS 具有系统结构简单、微损伤检测、多元素同时检测、可进行原位分析等诸多优点1-3,已经被应用于冶金分析4-5、地球科学6-8、生物科学9-11等诸多领域。特别是
7、近些年来,中国在新一轮找矿突破战略行动中提出重点聚焦 1500 米以浅矿产资源的勘查,LIBS 技术因其原位分析和快速检测的优点,从而被广泛用于地质探测12-13,并且随着手持式 LIBS 仪器研发技术不断地成熟,LIBS 检测也逐渐从实验室走向地质勘探现场,帮助实现地质找矿新突破。但是岩石样品中元素成分复杂多样14-15,在 LIBS 分析检测过程中由于基质效应和光谱波动会严重影响分析结果的准确性16-17,从而会对不同岩性的岩石元素定量分析形成一定的困难。迄今为止,LIBS 研究人员已经进行大量的研究来解决这些问题,从 2001 年到 2019 年,每年发表的LIBS 文章数量迅速增长,达
8、到 7336 篇,LIBS 的发展正向着更高灵敏度、更高分辨率、更低检出限不断进发。国内外学者针对这些问题进行了诸多研究,其中包括 LIBS 定量算法18-19、LIBS 信号增强20-21、时间分辨 LIBS22、LIBS 图像辅助23-24等领域,用于探究和减小基质效应带来的定量不准确的问题。Agresti等18使用偏最小二乘回归(PLSR)和多层感知器(MLP)神经网络建立 LIBS 定量分析模型,将 32 个石灰石样品分成两组进行校准和验证,所获结果一致性证明了该模型在石灰石定量方面具有重大前景。Pagnotta 等19改进 Franzini 和 Leoni 算法(FL 算法)用于纠正
9、 LIBS 在地质材料成分测定中的基质效应,结果得出 FL 算法模型准确率高于单变量模型和 PLS 模型,且比人工神经网络的算法更简单和更可控。Hussain 等20利用磁约束和双脉冲-LIBS(DP-LIBS)两种增强技术对铝靶的 LIBS 进行对比研究,减小了基质效应对目标元素定量的影响,同时提高了 LIBS 灵敏度。Yang 等21构建了离焦共线双脉冲 LIBS 实验系统,并开展了预烧蚀和再加热等离子体光谱增强的相关实验,用于增强 LIBS 信号强度。Lu 等22研究了时间分辨率 LIBS 和卷积神经网络(CNN)的结合,以改善土壤中 K 元素的测定,通过提取和整合波长和时间维度的信息,
10、提升了定量分析的准确性。Yan 等23提出一种图像定量分析(IQA)方法,R2由常规频谱定量分析(SQA)方法的 0.9833 提高到 IQA 方法的 0.9996。Li 等24使用相应的图像强度对谱线强度进行标准化,用于水下 LIBS 定量分析,平均相对标准差(RSD)从 10.71%显著降低至 5.76%,为解决由基质效应造成的定量检测困难提供了新的思路。上述学者所采用的方法,在一定程度上减小了基质效应的影响,提升定量分析的准确性,但忽视了不同岩性之间基质的差异,以及相同岩性之间基质的相关性,这样就会导致相同含量的元素在不同岩性的样品中具有不同的 LIBS信号强度,从而影响分析结果的准确性
11、。本文提出了一种先预分类再定量的分析方法,根据不同类型岩石样品的基质,使用 kNN 和 SVM双层分类模型对样品进行分类,先将所有样品数据使用 kNN 算法将其分为碳酸盐与硅酸盐两类,再对大类中的样品使用 SVM 算法将其细分为 6 类,获得基质相互匹配的样品25,然后对分类后的样品数据使用各自最合适的数据预处理方法进行预处理,建立校准曲线,对测试集的样品含量进行预测。该方法为地质探测等领域中岩石定量分析提供参考价值和借鉴意义。1实验部分 1.1岩石压片样品制备本实验使用由成都艾立本科技有限公司提供的来自 6 类岩性的共 39 个国标岩石和国标岩石混合粉末样品,编号为 ALB1ALB39,包括
12、泥页岩(2 个)、火 成 岩(4 个)、白 云 岩(6 个)、石 灰 岩(14 个)、石膏岩(5 个)和砂岩(8 个),其中国标岩石混合样品采用相同岩性的两种国标岩石样品按照比例混合得到,这些岩石样品包含不同梯度的目标元素的含量,可以更好地对不同浓度下的元素进行定量分析研究。表 1 展示了不同岩石样品的编号、岩性以及 4 种目标元素的具体含量,其中元素含量由成都艾立本科技有限公司在第三方检测机构测得后提供。称取 1.0g 样品,使用压片机在 8MPa 压强下保压 20s 压制成直径 20mm 薄厚均匀的片状样品。1.2LIBS 装置介绍及实验参数设置本实验基于台式激光诱导击穿光谱仪(厂商:成都
13、艾立本科技有限公司,型号:LT02A),该仪器采用1064nm 的 Nd:YAG 激光器,重复频率 1Hz,单次脉冲能量 100mJ,仪器光谱探测范围 185960nm,光谱分辨率 0.1nm。样品放置于三维自动样品台,激光束由聚焦透镜聚焦于样品表面诱导产生等离子体,等离子体的发射光由光纤探头接收传输至光谱仪,形成具有 8192 个光谱强度数值的光谱图。为减少连续背景对光谱质量的干扰,本实验将延时时间设置为 1.5s。第4期孔维恒,等:基于预分类策略的激光诱导击穿光谱技术用于岩石样品定量分析第42卷761 1.3光谱数据采集针对每个岩石样品,随机地在样品表面 20 个位置采集光谱。为减少激光能
14、量波动对光谱的影响,每个位置的光谱由 4 次激光产生的光谱平均而成,总共采集 780 张光谱。为验证模型的泛化能力,从每类岩石样品中选取部分样品数据作为测试集不参与模型的训练,共选择 18 个样品的光谱数据作为测试集,其余光谱数据用于模型的训练。1.4光谱数据处理流程岩石中复杂的基质效应会影响 LIBS 定量分析的准确性和稳定性26,不同岩性的样品基质不同,类似基质样品的光谱具有一定的共性。为减小基质效应的影响,提升定量分析的准确性,本研究采取先对不同基质的岩性样品进行分类,再根据不同的类表139 个国标岩石样品和国标混合岩石样品的种类及 Si、Ca、Mg、K 元素含量Table1Typesa
15、ndelementalcontentsofSi,Ca,MgandKfor39nationalstandardrocksamplesandnationalstandardmixedrocksamples.企业编号国标 GBW 编号岩石类型Si元素含量(%)Ca 元素含量(%)Mg 元素含量(%)K 元素含量(%)ALB1GBW03101a泥页岩23.320.090.280.66ALB2*GBWE070146泥页岩21.136.991.043.57ALB3GBW07109火成岩25.420.990.396.21ALB4GBW07110火成岩29.431.760.504.29ALB5*GBW0711
16、1火成岩27.853.371.692.90ALB6*GBW07121火成岩30.931.900.982.16ALB7GBW070157白云岩3.9320.5211.860.03ALB8*GBW070158白云岩0.8721.5912.510.01ALB9GBW070159白云岩1.0121.5412.550.02ALB10*GBW070160白云岩2.4421.0712.260.03ALB11GBW07114白云岩0.2921.4413.080.03ALB12*GBW07136白云岩3.8523.6210.800.01ALB13GBW03107a石灰岩1.8935.781.070.35ALB1
17、4*GBW03108a石灰岩1.0533.623.490.17ALB15*GBW07108石灰岩7.2825.483.110.65ALB16GBW07120石灰岩3.1036.500.430.12ALB17GBW07127石灰岩0.2634.214.060.04ALB18*GBW07128石灰岩0.3429.966.970.04ALB19GBW07130石灰岩0.5038.630.850.04ALB20GBWE070149石灰岩1.4136.151.730.14ALB21*GBWE070150石灰岩2.1532.923.590.03ALB22*GBWE070151石灰岩1.5536.591.4
18、60.08ALB23GBWE070152石灰岩0.6238.420.700.05ALB24*GBWE070153石灰岩1.8634.692.590.15ALB25*GBWE070154石灰岩1.1037.110.740.14ALB26GBWE070155石灰岩0.4538.710.490.07ALB27*GBW03109石膏岩0.7828.031.040.08ALB28*GBW03109+GBW03111a(1+1)石膏岩0.5425.551.260.05ALB29*GBW03109+GBW03111a(2+1)石膏岩0.6226.381.190.06ALB30GBW03109+GBW0311
19、1a(3+1)石膏岩0.6626.791.150.06ALB31GBW03111a石膏岩0.2923.071.480.02ALB32*GBW03113砂岩44.680.120.060.56ALB33GBW03113+GBW03104(4+1)砂岩42.240.130.131.07ALB34GBW03113+GBW03104(9+1)砂岩43.460.130.090.81ALB35GBW03113+GBW03111a(4+1)砂岩35.804.710.340.45ALB36GBW03113+GBW03111a(9+1)砂岩40.242.420.200.50ALB37GBW03113+GBW070
20、156(4+1)砂岩35.827.780.230.45ALB38GBW03113+GBW07108(4+1)砂岩37.205.190.670.57ALB39*GBW03114砂岩41.810.240.101.72注:“*”代表测试集样品。国标混合样品编号后“()”中的数字代表混合比例。第4期岩矿测试http:/2023年762别分别对各元素进行定量分析的策略。整个数据处理的流程如图 1 所示。数据处理的大致流程如下:获取 21 个样品的 LIBS 光谱数据作为训练集,对这些数据进行相应的预处理(预处理方式有 MinMax归一化27、全谱归一化28、分通道归一化29),根据岩石含量的信息以及它们
21、的光谱图呈现出的规律,使用两层分类模型,对 6 类样品进行分类,然后基于每个类别分类之后的数据建立单变量定标模型。完成建立预分类定量分析模型之后,将 18 个样品的测试集 LIBS 光谱数据经过对应的预处理方法,输入到分类模型中得出分类结果,再将分类之后的数据输入到对应分类类别结果的单变量定标模型中预测样品的含量。训练集样品 LIBS 谱图测试集样品 LIBS 谱图谱图预处理根据样品的类别建立有监督判别分析模型基于每个类别的数据建立定量模型代入定量模型得到定量结果得到分类结果谱图预处理图1光谱数据处理流程图Fig.1Flowchartofspectraldataprocessing.1.5多层
22、分类模型的构建根据 1.4 节中的数据划分,本研究基于训练集数据构建多层的定量分析模型,再使用测试集数据来评估模型的预测能力。整个模型的构建思路遵循先分类后定量的策略。本研究使用 k 近邻算法和支持向量机算法来构建分类模型。其中 k 近邻(k-NearestNeighbors,kNN)对测试集数据进行预测时,会在训练集数据中找到与该数据最相似的 k 个邻居,将 k 个近邻中占多数的类别认定为该数据的类别30。支持向量机(Support-vectormachines,SVM)会构造一个最优的超平面,使得线性分类形成的几何间隔最大化,将原始数据映射至内核函数构造的高维特征空间,在高维特征空间上构造
23、线性分类31。根据样品中元素含量的差异,设计了一个双层的分类模型将 LIBS 光谱按照岩性类别分成 6 类:第一层采用 kNN 模型将所有光谱分为 A、B 两类,其中 A 类包括钙含量较高的白云岩、石灰岩和石膏岩,B 类由硅含量较高的火成岩、泥页岩和砂岩所构成;第二层使用径向基函数 SVM 模型将 A 类细分为白云岩、石灰岩和石膏岩,将 B 类细分为火成岩、泥页岩和砂岩。本研究中,kNN 模型的关键参数 k 值设定为 5;SVM 模型的关键参数惩罚参数(C)及径向基核函数(RBF)的宽度参数()分别设定为 1 和 0.1。这两个模型在测试集数据上的分类准确率均为 100%,整个分类模型的准确率
24、达到 100%,表明该分类模型能够有效地识别不同岩性。2结果 2.1不同岩性中不同元素的数据预处理结果对比针对分类后的每个类别,使用标准曲线法分别建立各元素的定量模型。考虑到 LIBS 光谱中元素特征峰饱和与特征峰附近具有干扰峰等情况32-33,分别选择 Si(I)250.69nm、Ca(I)585.745nm、Mg(I)516.732nm 和 K(I)766.489nm 作为定量分析线。在进行定量分析之前,为减小光谱之间噪声和干扰带来的差异,根据不同种类的岩石分别采用不同的预处理方法,包括全谱归一化、分通道归一化和 MinMax 归一化方法,分别见公式(1)、(2)和(3)。Ifn=IiIi
25、(1)IfnIiIi式中:代表全谱归一化后的峰强;代表第 i 个波长的光谱强度;表示所有波长的光谱强度之和。Icn=IijIij(2)IcnIijIij式中:代表分通道归一化后的峰强;代表第 j 通道中第 i 个波长的光谱强度;表示第 j 通道中所有波长的光谱强度之和。Imn=IiIminImaxImin(3)ImnImaxIminIi式中:代表 MinMax 归一化后的峰强;表示整个光谱中最大光谱强度值;表示整个光谱中最小光谱强度值;代表第 i 个波长的光谱强度。由于基质效应的影响,单一的预处理方式并不适合所有待测元素的定量分析,因此为提高定量分析的准确度和稳定性,采用不同的方法对数据进行预
26、处理。以所构建的单变量线性回归模型的决定系数(CoefficientofDetermination,R2)为评价指标34,选取了最佳预处理方法,结果如表 2 所示。从表 2 中可以得出,白云岩和火成岩中的 Si 元素采用分通道归一化的数据预处理方式可以获得较高的 R2,而对于石膏岩来说,无需对 Si 元素进行数第4期孔维恒,等:基于预分类策略的激光诱导击穿光谱技术用于岩石样品定量分析第42卷763据预处理便可以获得较好的相关性。同样对于不同岩性中同一元素采用相同的数据预处理方式,所求得 R2也大不相同,泥页岩中的 Ca 元素采用全谱归一化的处理方法,R2可以达到 0.962,远远大于砂岩中的
27、0.750。综合得出,针对不同的预处理方式,Si、Ca、Mg、K 四个元素在 6 类岩石样品中的 R2值大部分大于 0.90,有令人满意的结果。2.2未进行预分类和进行预分类两种方法定量结果对比对相同的训练集和测试集数据采用该预分类定量模型和不分类直接进行定量分析的标准曲线法进行分析。其中对 21 个训练集样品中 Si、Ca、Mg 和K 元素分别采用 MinMax 归一化、分通道归一化、全谱归一化和无数据预处理的预处理方式,其传统标准曲线分析法 R2为 0.765、0.541、0.539,0.600,预分类定量方法 R2为 0.998、0.992、0.999、0.998,对测试集预测效果有着较
28、好的提升。使用两种策略进行定量分析的预测值与真值的相关分析结果如图 2 所示。3讨论 3.1kNN 和 SVM 分类模型参数优化关键参数的优化对于 kNN 和 SVM 双层分类模型的性能影响很大。对于 kNN 算法,关键参数为k 值,代表的是算法所参考的近邻标签值的个数,k 取值较小时,模型复杂度较高,训练误差会减小,泛化能力减弱;k 取值较大时,模型复杂度低,训练误差会增大,泛化能力有一定的提高。在本文中采用交叉验证的方式选取最优的 k 值(k=5)35,用于岩石样品的预分类。对于 SVM 算法,本文选择 RBF 函数作为核函数,因为其具有良好的泛化能力,可以避免表2六种不同岩性岩石中不同元
29、素的预处理方式结果对比Table2Comparisonofresultsofpretreatmentmethodsfordifferentelementsinsixdifferentlithologiesofrocks.岩石岩性Si(I)250.69nmCa(I)585.745nmMg(I)516.732nmK(I)766.489nm数据预处理方式R2数据预处理方式R2数据预处理方式R2数据预处理方式R2白云岩分通道归一化0.998无数据预处理0.929全谱归一化0.999全谱归一化0.970火成岩分通道归一化0.985无数据预处理0.658无数据预处理0.813无数据预处理0.860泥页岩分
30、通道归一化0.778全谱归一化0.962分通道归一化0.998MinMax 归一化0.778石膏岩无数据预处理0.981MinMax 归一化0.780分通道归一化0.998无数据预处理0.981石灰岩全谱归一化0.977无数据预处理0.929全谱归一化0.984全谱归一化0.985砂岩全谱归一化0.977全谱归一化0.750全谱归一化0.925全谱归一化0.934010 20 30 40 500102030405060训练集测试集R2=0.765R2=0.664真实浓度(%)预测浓度(%)Si(I)250.69nm(a)训练集测试集R2=0.541R2=0.638训练集测试集R2=0.539R
31、2=0.461(b)(c)训练集测试集R2=0.600R2=0.231训练集测试集R2=0.998R2=0.999训练集测试集R2=0.992R2=0.994训练集测试集R2=0.999R2=0.999训练集测试集R2=0.998R2=0.996(d)(e)(f)(g)(h)0 5 101520253035400102030405060真实浓度(%)预测浓度(%)Ca(I)585.745nm0 2 4 6 8 101214024681012141618真实浓度(%)预测浓度(%)Mg(I)516.732nm0 1 2 3 4 5 6 702468K(I)766.489nm真实浓度(%)预测浓度
32、(%)0 1 2 3 4 5 6 70246K(I)766.489nm真实浓度(%)预测浓度(%)0 2 4 6 8 10121402468101214Mg(I)516.732nm真实浓度(%)预测浓度(%)0 5 10152025303540010203040Ca(I)585.745nm真实浓度(%)预测浓度(%)010 20 30 40 5001020304050Si(I)250.69nm真实浓度(%)预测浓度(%)ad 为不分类的定量相关性曲线;eh 为预分类定量相关性曲线。图2两种方法在训练集和测试集上的定量分析结果对比Fig.2Thequantitativeanalysisresul
33、tsofthetwomethodsarecomparedonthetrainingsetandtestset.(a-d)isthecorrelationcurvewithoutclassification,and(e-h)isthepre-classificationquantitativecorrelationcurve.第4期岩矿测试http:/2023年764过拟合问题,提高模型的鲁棒性,同时与其他核函数相比,RBF 核函数计算速度相对较快,可以提高模型分类的效率36,并且通过网格寻优方法确定了关键惩罚参数C 和RBF 宽度参数 的值分别为1 和0.1。3.2四种目标元素预处理结果讨论采
34、用不同预处理方法对 4 种目标元素进行预处理分析,可以提高光谱稳定性,增加定量分析准确性。但是由于火成岩中 Na 元素、砂岩中 Si 元素、石膏岩中 Ca 元素含量很高,在原始数据采集过程中,已经达到饱和37,所以在使用归一化方法对元素进行处理时,始终是以含量最高的元素作为最大值进行归一化,这样就会导致目标元素的光谱强度相对减弱,从而使 R2降低,表 2 中砂岩 Ca 元素的 R2较低,便是因为这个原因。本文对 6 类岩性中的 4 种元素均已采用合适的预处理方法。3.3四种目标元素多层模型定量结果讨论从图 2 可以看出,无论是训练集还是测试集,以预分类定量策略所构建的多层模型对 4 种元素分析
35、结果的相关性都有显著提高,均高于 0.99。Si、Ca、Mg 和 K 元素在测试集上定量分析结果的相关性从0.664、0.638、0.461 和 0.231 分 别 提 高 到 0.999、0.994、0.999 和 0.996。此外,从数据的分析处理中可以知道,传统定量分析模型的稳定性也比较差,Si、Ca、Mg 和 K 等 4 种元素在测试集上的平均相对标准偏差(RSD)分别为 3.4%、10.7%、48.2%、90.8%,而通过多层模型得到的 4 种元素 RSD 分别为 1.5%、5.2%、10.3%、17.4%,其稳定性与传统定量分析模型相比有了很大提高。这是因为多层模型中的预分类定量策
36、略,可以减小由基质效应所造成的定量结果的偏差。同时,相对单一的预处理方式,对不同岩性中不同元素采用不同的预处理方式能够有效地减小具有类似基质的光谱波动,从而降低定量分析的相对标准偏差38。本研究还采用测试集中真实值和预测值偏差范围(公式(4)作为评价定量结果的指标。偏差范围=00100%(4)0式中:为元素预测含量,为元素真实含量。采用箱线图来表示未进行预分类和进行预分类的 4 种元素在测试集上偏差范围25,如图 3 所示。如图 3 中的中心实线代表每个数据范围的中位数,方框显示数据范围中心的 50%。该图展示了采用预分类策略比未采用预分类策略,4 种元素的偏差范围都有明显地降低,尤其是对 S
37、i 和 K 元素的定量效果,有着显著提升。基于这种结果,在进行定量分析之前,根据岩石样品中基质的相似性进行预分类,可以减小不同基质之间的相互影响,增加定量准确性。同时通过对测试集上各元素预测值与目标值之间的平均相对误差来更加直观地评估两种方法的差异,结果如表 3 所示。从表 3 可以看出,多层模型的对 Si 元素的预测效果最好,平均相对误差只有4.65%。虽然其他三个元素的平均相对误差超过10%,但是相比于传统的标准曲线模型,预测的准确度显著提升。结果表明,采用多层模型的方法,分别针对基质相似的同一类样品构建定量分析模型,并且针对不同岩性中不同元素采用不同的预处理方式,能够减小基质效应造成的光
38、谱差异,提升定量分析的准确度和稳定性。表3传统标准曲线模型和多层模型两种方法在测试集上的定量分析结果的平均相对误差对比Table3Comparisonofthemeanvalueofrelativeerrorsofthequantitativeanalysisresultsonthetestsetbetweenthetwomethodsoftraditionalstandardcurvemodelandmulti-layermodel.元素传统标准曲线模型(%)多层模型(%)Si367.414.65Ca212.6612.40Mg66.6019.90K953.8526.95Si50510偏差范围
39、(%)误差范围(%)15202530(a)(b)MgKCaSiMgKCaSi0.80.400.40.81.21.6MgKCa未进行预分类进行预分类图3(a)未进行预分类和(b)进行预分类两种方法中 4 种元素的偏差范围的箱线图对比Fig.3Comparisonofboxlineplotsofdeviationrangesoffourelements in two methods:(a)Box line diagram ofdeviation ranges for Si,Mg,K and Ca without pre-classificationmethod;(b)Boxlinediagramo
40、fdeviationranges of Si,Mg,K and Ca using pre-classificationmethod.第4期孔维恒,等:基于预分类策略的激光诱导击穿光谱技术用于岩石样品定量分析第42卷765 4结论传统的标准曲线模型数据预处理方式单一,且定量的精度和稳定性较差,容易受到光谱波动和岩石中基质效应的影响。本文提出了一种先分类再定量的多层模型,采用 kNN 和 SVM 算法构建双层分类模型,采用交叉验证和网格寻优方法对 kNN 和 SVM中关键参数进行优化。通过预分类模型对岩石样品进行预分类,获得基质相互匹配的岩石样品,对于不同种类的样品采用不同的预处理方式以减小光谱数
41、据波动,再针对每种元素建立标准曲线模型,对 6 类岩石样品中 Si、Ca、Mg 和 K 元素进行定量分析,得到结果与传统标准曲线模型进行对比,定量的准确度有了明显的提高。研究表明该模型不仅可以减小基质效应对定量分析产生的影响,还可以校正由于硬件、环境、样品等因素导致定量分析的不稳定性。但是,目前的多层定量分析模型对于不同元素的预测效果还存在一定偏差,今后可以考虑采用结合多种不同算法建立预分类模型,达到更好的定量分析效果,为实际的野外岩矿分析作业提供有价值的帮助。Laser-induced Breakdown Spectroscopy Based on Pre-classificationStr
42、ategy for Quantitative Analysis of Rock SamplesKONG Weiheng1,ZENG Lingwei1,RAO Yu1,CHEN Sha1,WANG Xu1,YANG Yanting2,DUAN Yixiang1*,FAN Qingwen1*(1.SchoolofMechanicalEngineering,SichuanUniversity,Chengdu610065,China;2.ChengduAlibenScience&TechnologyCo.,LTD.,Chengdu611930,China)HIGHLIGHTS(1)Appropriat
43、epre-processingmethodsfordifferentelementsindifferentlithologiescanimprovethestabilityofthespectraldata.(2)Throughpre-classificationstrategy,itispossibletoobtainstandardsamplesthatarematchedwiththematrixtohelpconstructastandardcurverelatedtothematrix.(3)Sortingdifferentrocktypesofsamplesbeforequanti
44、tativeanalysiscaneffectivelyimprovetheaccuracyofthequantitativeanalysisresults.Grinded into powderPressure:8MPaPreclassificationmethodRock data of differentlithologiesAppropriatepretreatment fordifferent elementsDivided into six classesSiCaMgKSub-channel normalizationminmax normalizationfull spectru
45、m normalizationQuantitative analysisHolding time:20sDiameter 20mmTablet pressesLIBS deviceTraining setTest setR2=0.998R2=0.999010 20 30 40 5001020304050True concentration(%)Predicted concentration(%)第4期岩矿测试http:/2023年766ABSTRACTBACKGROUND:LIBStechnologyisanon-destructive,highsensitivity,highresoluti
46、onspectroscopytechnologythatcanbeusedtoanalyzethecompositionandstructureofchemicalsubstancesandmaterials.Ithasextensiveapplicationinfieldssuchaschemistry,materialsscience,lifescience,andgeologicalexploration,anditsemergencehasprovidednewmethodsandtechnologiesforthedevelopmentofthesefields.LIBStechno
47、logycanbeusedtonon-destructivelyanalyzethechemicalcompositionofundergroundrocksandminerals,helpinggeologiststobetterunderstandthecompositionandpropertiesofundergroundresources,thusprovidingbetterguidanceforgeologicalexplorationanddevelopment.Inrecentyears,scholarsathomeandabroadhavebeenexploringLIBS
48、technologyconstantly,andthroughimprovingthedetectionsystemandoptimizinglaserpulseparameters,highsensitivityLIBSanalysisatextremelylowconcentrationhasbeenachieved.Byusingfinerspectrallines,highersamplingrate,andmorepreciselaserpulsecontrol,highresolutionLIBSanalysisatnanoscalehasbeenachieved.Thecombi
49、nationofLIBStechnologywithmulti-spectralimageprocessingtechnologycanintegrateinformationfrommultiplespectralchannels to achieve a more comprehensive analysis of samples.However,the existence of matrix effects andspectralfluctuationsalwaysaffectstheaccuracyofLIBSquantitativeanalysis,andpoorreproducib
50、ilityandhighdetectionlimitsalsoneedtobesolved.OBJECTIVES:Toimprovetheaccuracyofquantitativeanalysisofcomplexmatrixsamples.METHODS:Amulti-layerclassificationmodelbasedonk-nearestneighbors(kNN)andsupportvectormachine(SVM)algorithmswasconstructedtoidentifytherocktypeofsamples.Thesamplesweredividedintot