1、 收稿日期:2 0 2 2-0 6-2 1 修回日期:2 0 2 2-0 9-1 5基金项目:“十三五”国家重点研发计划重点专项(2 0 1 9 Y F D 1 0 0 2 3 0 0)*通讯作者:熊智新,男,副教授,主要从事农林产品智能化及无损检测研究.E-m a i l:h b x z x n j f u.c o m.c n第3 9卷第3期V o l.3 9 N o.3分 析 科 学 学 报J OUR NA LO FANA L Y T I C A LS C I E N C E2 0 2 3年6月J u n e 2 0 2 3D O I:1 0.1 3 5 2 6/j.i s s n.1 0
2、 0 6-6 1 4 4.2 0 2 3.0 3.0 0 3二进制蜻蜓算法-直接校正算法优选标样集在小麦粉蛋白质近红外模型传递中的应用王红鸿1,陈 琴1,陈 勇1,熊智新*1,吴彩娥1,谢德红2(1.南京林业大学轻工与食品学院,江苏南京2 1 0 0 3 7;2.南京林业大学信息科学技术学院,江苏南京2 1 0 0 3 7)摘 要:为了实现小麦粉蛋白质含量近红外分析模型的传递,探究二进制蜻蜓算法(B i-n a r yD r a g o n f l yA l g o r i t h m,B D A)与直接校正算法(D i r e c tS t a n d a r d i z a t i o n
3、,D S)相结合构成的B D A-D S算法挑选标样集对模型传递结果的影响。以棱光S 4 5 0光栅型近红外光谱仪为主机,N e o S p e c t r aM i c r o傅里叶变换型近红外光谱仪为从机,采集了1 2 6个小麦粉的近红外光谱,用偏最小二乘回归法建立了主机近红外光谱与小麦粉蛋白质的关联模型。经B D A-D S算法模型传递后,主机模型对从机样品预测决定系数为0.9 8 1 2,预测标准偏差为0.1 8 3 8,从机与主机的光谱集合平均马氏距离由2 2.3 4下降到1.4 0,均接近于主机模型精度水平。该研究同时与采用K e n n a r d/S t o n e(K/S)挑
4、选标样集再结合D S构成的传统K/S-D S算法进行了对比,结果表明:相对于K/S-D S算法,B D A-D S算法挑选出较少的标样集就能表征仪器的差异,有效地提高了主机模型对从机样品的预测精度,为近红外模型传递提供了一种更加有效的标样集选择方法。关键词:二进制蜻蜓算法;直接校正算法;近红外光谱;模型传递;小麦粉蛋白质中图分类号:O 6 5 7.3 3 文献标识码:A 文章编号:1 0 0 6-6 1 4 4(2 0 2 3)0 3-2 6 7-0 8近红外光谱分析技术(N I R S)是近年来发展起来的一种新型的无损快速分析技术,随着化学计量学的发展和“互联网+”的推进,近红外光谱的网络化
5、布局也得到了快速发展,仪器多样化,测量更加快捷方便1,已经广泛应用于农业2、食品3、医药4、化工5等行业。然而在实际应用中,由于仪器老化、基线漂移、吸光度波动以及不同仪器的工作原理不同等原因,会导致一台仪器测得的样品光谱数据建立的定量分析模型不能直接应用于其他光谱仪上测得的样品光谱数据的分析1。为了提高定量分析模型的通用性,近红外光谱模型传递技术应运而生。模型传递中转换矩阵的求解主要有有标样法和无标样法两种。其中,有标样法需要在主、从仪器之间测得的光谱数据上选择一定数量的标样集,通过其建立主、从仪器之间光谱转换的数学模型,主要包括直接校正算法(D i r e c tS t a n d a r
6、d i z a t i o n,D S)6-8、分段直接校正算法9、S l o p e/B i a s法1 0、典型相关分析算法1 1等。无标样法则不需要标样集,主要包括有限脉冲响应算法1 2等。在有标样模型传递方法中,标样集的挑选很大程度上影响模型传递的效果,常用的标样集挑选方法有K e n n a r d/S t o n e(K/S)法1 3,1 4,其使用光谱间的欧氏距离或主成分间的距离来选择代表性样品,不易受干扰且计算量少,被广泛应用模型传递实验中。但K/S方法所选样品代表性主要是从建立校正模型而非模型转移角度考虑,不一定能较好地实现模型传递。本文研究试图采用二进制蜻蜓算法(B i n
7、 a r yD r a g o n f l yA l g o r i t h m,B D A)对模型传递中的标样集的挑选进行优化。762第3期王红鸿等:二进制蜻蜓算法-直接校正算法优选标样集在小麦粉蛋白质近红外模型传递中的应用第3 9卷蜻蜓算法(D r a g o n f l yA l g o r i t h m,D A)是M i r j a l i l i等在2 0 1 6年通过对自然界蜻蜓行为进行观察、总结和抽象后,提出的一种新的智能群体优化算法,并采用几种典型函数验证了算法的有效性1 5。D A算法在通讯1 6、机械1 7、车间调度1 8、地质勘探1 9等行业得到了广泛应用。在近红外光谱
8、分析建模中,主要应用B D A对特征波长的提取2 0,2 1。本文研究拟采用B D A算法,针对模型传递中标样集的挑选问题,以经D S算法传递后的从机样品光谱在主机模型上的预测结果标准偏差作为适应度值,从而在适应度函数构建中引入标样集信息,实现能反映主从机仪器差异的代表性标准转换集样品优选,提高模型传递的精度,并以台式光栅型与便携式傅里叶变换型近红外光谱仪所测的小麦粉光谱和蛋白质数据为例,探讨B D A-D S算法选择标样集进行模型传递的效果。1 实验部分1.1 仪器及试剂台式光栅型棱光S 4 5 0型光谱仪(上海棱光技术有限公司 中国);N e o S p e c t r aM i c r
9、o型光谱仪(傅里叶变换型)(S i-w a r eS y s t e m s公司,埃及);D 2 0 0杜马斯定氮仪(海能未来科技有限公司)。实验样品:超市购买的不同品牌以及不同批次的1 2 6个小麦粉样品,常温保存。1.2 算法原理1.2.1 蜻蜓算法 D A算法的主要灵感来源于蜻蜓群体在自然界中的飞行状态:静态和动态。在静态群体中,蜻蜓组成小型群体在小区域内来回飞行以捕捉其它会飞的猎物,静态群体的主要特征是飞行路径和局部运动的变化,而在动态蜻蜓群里中,蜻蜓群体会在一个方向上进行长距离的飞行。而蜻蜓群体的这两种状态可以当做群优化的两个阶段:探索和开发。蜻蜓创建子群,以静态的方式探索不同区域,
10、而在动态中,蜻蜓以更大的群体往一个方向飞行,这属于开发阶段。任何群体的主要目标都是生存,群体中所有的个体应该被食物所吸引而远离危险因素。生物学家观察到,蜻蜓主要通过5种主要策略来改变他们的位置:避撞、结队、聚集、觅食、躲避,这5种策略的数学模型表达式见表1。i表示第i个个体;X,个体当前位置;Xj,第j个相邻个体的位置;N,相邻个体的数目;Vj,第j个相邻个体的速度;X+,食物的位置;X-,敌人的位置;s、a、c、f、e分别为避撞、结队、聚集、觅食、躲避的因子;w,惯性因子;t,当前迭代次数;Xt表示步长矢量;Xt表示位置矢量。表1 蜻蜓5种主要位置更新策略的数学建模T a b l e1 M
11、a t h e m a t i c a lm o d e l i n go f f i v em a j o rp o s i t i o ns h i f t s t r a t e g i e so fd r a g o n f l yP o s i t i o ns h i f t s t r a t e g yE q u a t i o nS e p a r a t i o nSi=-Nj=1X-XjA l i g n m e n tAi=Nj=1VjNC o h e s i o nCi=Nj=1XjN-XA t t r a c t i o nt of o o dFi=X+-XD i
12、s t r a c t i o nf r o me n e m yEi=X-+XP o s i t i o nu p d a t eXt+1=(s Si+a Ai+c Ci+f Fi+e Ei)+wXiXt+1=Xt+Xt+1 采用s i n g l e-B D A算法进行波长选择时,位置向量Xj中的每个元素值只能是0或1,因此蜻蜓位置更新并非如表2所示的直接在原有位置Xt后加上更新速度值x,而是只能在0和1之间切换,这就需要对x进行连续域到离散域的转换。其中最简单、最有效的方法是采用传递函数,以x作为函数输入,返回一个0,1 之间的数值,表示位置变化的概率。采用的传递函数为2 2:T(x)=
13、xx2+1(1)计算了所有个体位置变化概率后,应用式(2)更新蜻蜓在空间中的搜索位置:Xt+1=-XtrT(xt+1)(2)式(2)中:r为0到1之间的随机数,负号表示逻辑取反运算。862第3期分 析 科 学 学 报第3 9卷1.2.2 直接校正法(D S)本文先期采用了S B,D S及P D S进行了模型传递比较研究,表明D S方法能取得最佳效果,其原因应该是两类仪器基于不同分光原理,仪器差异主要表现为整个波段范围内的系统误差。因此本文后续研究中采用D S算法结合B D A优化标样集的选择。D S算法通过转化矩阵FD S将从机测得的未知光谱矩阵Xs,u n转换为未知样品传递后的光谱矩阵Xs,
14、t r。理论上,经过矩阵FD S传递后,Xs,u n与主机上测得的未知样品光谱矩阵Xm,u n是相等的。转换矩阵FD S由主机和从机的标样光谱矩阵Xm和Xs通过最小二乘法计算得到:FD S=X+sXm(3)式中,Xm为主机标样集光谱矩阵;Xs为从机标样集光谱矩阵;Xs+为Xs的广义逆矩阵,FD S为mm维的转换矩阵(m为波长点数)。对于在从机上测得的未知样品光谱矩阵Xs,u n,根据下式:Xs,t r=Xs,u nFD S(4)计算传递后的Xs,t r,用已经建立好的主机校正模型对Xs,t r进行预测得出光谱最终的预测值。1.2.3 B D A-D S算法 在B D A-D S集成算法中,B
15、D A作用是在校正集中挑选一定数量的样品作为标样集,根据其全局搜索能力强的特性在校正集样本空间中大范围搜索合适的标样集,适应度函数值为预测标准偏差(RM S E P),其用已经建立好的校正模型对从机验证集经D S算法传递后的光谱矩阵Xs,t r预测结果计算得到。每次实验迭代计算时,如果本次迭代最优解优于上次,则记录该最优解对应的验证集样品数及RM S E P。经过不断的迭代更新,最终选取验证集RM S E P值最小的样品集作为模型传递的标样集。B D A-D S的流程图如图1所示。图1 B D A-D S流程图F i g.1 B D A-D Sf l o wc h a r t本文用K e n
16、n a r d/S t o n e(K/S)算法挑选标样集,再结合D S构成K/S-D S算法进行模型传递作为对照实验,以验证B D A-D S方法的有效性。1.2.4 光谱差异分析方法 马氏距离(MD)能直观定量反映不同仪器(或样品集)间的光谱差异性大小,马氏距离越小,表明仪器(或样品集)间的差异越小2 3。本文采用主成分分析和马氏距离两种算法结合的方法评价仪器间的光谱差异。两台仪器间的平均马氏距离(MD)为:MD=mi=1(ti-t)(1n-1TTc e nTc e n)-1(ti-t)Tm(5)962第3期王红鸿等:二进制蜻蜓算法-直接校正算法优选标样集在小麦粉蛋白质近红外模型传递中的应
17、用第3 9卷式中,ti为从机i个样品的光谱得分,t为主机光谱阵得分矩阵T的平均值,Tc e n为矩阵T中心化后的矩阵,n为主机样品个数,m为从机样品个数。在本文中马氏距离用来计算主机光谱与从机光谱之间的差异性。1.2.5 预测模型建立与评价 本研究中主机预测模型的建模方法为偏最小二乘回归(P L S R)算法,交互验证采用留一法。主机模型的评价指标为模型交互验证决定系数(R2c v)和交互验证标准偏差(RM-S E C V),模型传递效果和模型预测能力是由样品预测值和标准值间的决定系数(R2p)和预测标准差(RM-S E P)2个指标进行综合评价2 4。在建模预测过程中,决定系数R2越接近1,
18、表示模型的回归或者预测结果越好,如果R2为负值,表示拟合效果极差。RM S E C V与RM S E P的值越小表示所建立的模型的稳定性与精确度越好。1.3 小麦粉蛋白质含量测定方法小麦粉蛋白质含量按照G B5 0 0 9.5-2 0 1 6 食品中蛋白质的测定 中燃烧法进行测量2 5。2 结果与讨论2.1 近红外光谱仪和光谱测量本研究中N e o S p e c t r aM i c r o型光谱仪将作为从机。棱光S 4 5 0型光谱仪将作为主机。表2和图2分别为这两台近红外光谱仪的主要技术参数和所采集的小麦粉光谱图。表2 近红外分析仪主要参数T a b l e2 I n s t r u m
19、 e n t a lp a r a m e t e r so fn e a r-i n f r a r e ds p e c t r o m e t e rI n s t r u m e n tS p e c t r a lt h e o r yR a n g eW a v e l e n g t hW a v e n u m b e rN u m b e ro fw a v e l e n g t h sI n t e r v a lR e s o l u t i o nN e o S p e c t r aM i c r oF o u r i e r13 5 0-25 5 0 n m74
20、0 7 39 2 2c m-12 5 71 3.6 2c m-11 6c m-1(a t 15 5 0n m)L e n g g u a n gS 4 5 0G r a t i n g9 0 0 25 0 0n m1 11 1 1 40 0 0c m-116 0 11n m1 2n m实验面粉样品常温保存,并在室温(2 0 2 3)环境下不作任何前处理,分别采用N e o S p e c t r aM i c r o型和棱光S 4 5 0型近红外光谱仪采集小麦粉的近红外光谱。采集光谱时,面粉样品铺平样品池,按1 2 0 间隔采集得到三条不同检测点的光谱,取它们的平均作为该样品的最终采集光谱。从
21、图2可以看出,由于两台近红外仪器的工作原理的不同,导致所测得光谱的波段范围、吸光度、数据间隔均不一致,因此无法直接共享预测模型。本文采用线性插值法和波段截取方法实现主机与从机光谱一致性匹配,以便于模型转移计算。图2 A:棱光S 4 5 0型部分小麦粉原始光谱;B:N e o S p e c t r aM i c r o型部分小麦粉原始光谱F i g u.2 A:P a r to ft h eo r i g i n a lw h e a tf l o u rs p e c t r u mo fS 4 5 0t y p e;B:P a r to ft h eo r i g i n a lw h e
22、 a tf l o u rs p e c t r u mo fN e o s p e c t r aM i c r o t y p e2.2 化学值测定与样品集划分根据实验需要把样品集划分为3个集合,分别为校正集、验证集和预测集。校正集用来建立主机校正模型以及从中挑选标样集;验证集用于对B D A-D S算法采用B D A所挑选出的某一标样集的D S模型传递效果以适应度函数予以评价;预测集用来评估最终优选的标样集的模型传递性能和模型的泛化能力。先从主机全部样品集中用K/S方法挑选出7 6个样品为校正集,再采用随机选样的方法把剩下的5 0个样品划分成验证集(3 0个)和预测集(2 0个)。各样品
23、集划分以及化学值分布如表3所示。2.3 光谱预处理及P L S模型的建立为了消除光谱数据中无关的信息和噪声以及仪器原因造成的基线漂移,本研究采用S a v i t z k y-G o l a y072第3期分 析 科 学 学 报第3 9卷表3 小麦粉蛋白质含量T a b l e3 W h e a t f l o u rp r o t e i nc o n t e n tS a m p l es e tN u m b e r(%)M i n(%)M a x(%)E x t r e m u m(%)M e a n(%)S D(%)C a l i b r a t i o ns e t7 66.3 4
24、1 4.8 38.4 91 0.1 91.9 4V a l i d a t i o ns e t3 06.8 41 2.6 85.8 51 0.4 51.0 5P r e d i c t i o ns e t2 08.8 11 4.1 95.3 81 0.4 71.3 4t o t a l1 2 66.3 41 4.8 38.4 91 0.3 01.6 8F i l t e r、标准正态变量变换和去趋势法三种预处理方法组合对主机和从机的光谱进行预处理。使用P L S R法建立主机校正模型,经留一法交叉验证确定最佳主成分为8,模型交互验证决定系数R2c v为0.9 7 4 3,RM-S E C
25、V为0.3 1 1 0。校正集的预测值与实测值的相关性见图3。2.4 模型预测结果与分析图4为主机模型对主机、从机的预测集2 0个样品预测值与实测值相关图,表4列出了各评价指标。由表4和图4可知,主机模型对主机预测集具有良好的预测精度,R2p和RM S E P分别为0.9 8 2和0.1 7 9 5,而将主机模型用于预测从机预测集时,R2p和RM S E P分别为-3 0.8 6 0 3和7.5 5 7 9,表明该主机模型难以用于从机样品的预测。计算主机校正集与主机、从机预测集光谱之间的平均马氏距离分别为1.3 6与2 2.3 4,这表明两台仪器所测光谱差异较大,导致主机模型无法准确预测从机样
26、品,因此有必要利用模型传递实现主从机模型共享。图3 主机模型交叉验证值与实测值相关图F i g.3 C r o s s v a l i d a t i o no fM a s t e rm o d e l图4 主机和从机预测值与实测值相关图F i g.4 P r e d i c t i o nr e s u l t s o fm a s t e r a n d t a r g e tm a c h i n e s表4 主机模型分别预测两台仪器预测集结果T a b l e4 T h em a s t e rm o d e l p r e d i c t s t h e r e s u l t s
27、o f t h e t w o i n s t r u m e n tp r e d i c t i o ns e t s r e s p e c t i v e l yR2pRM S E PM a s t e r0.9 8 2 00.1 7 9 5T a r g e t-3 0.8 6 0 37.5 5 7 92.5 模型传递图5 K/S-D S模型传递实验F i g.5 K/S-D Sm o d e l t r a n s f e r e x p e r i m e n t分别采用K/S-D S法、B D A-D S法实施主从机间小麦粉蛋白质预测模型的传递,并比较其效果。K/S法选择标样集
28、样品数n分别取n=5,7,9,N(N最大取7 3个),实验过程如图5所示。B D A算法的优化过程及结果具有一定的随机性,并不能保证每次都收敛到最优解,为此本文研究中进行了1 0次B D A-D S实验,以便通过多次计算验证B D A-D S方法选择标样集的可行性。B D A方法设置迭代次数5 0次,种群数1 0 0 0,最小标样集样品数量为5,最大为3 0。图6记录了1 0次实验中RM S E P变化情况。从图5中可以看出,当使用K/S算法挑选3 9个标样集样品时,D S模型传递预测效果最好(表5实验K 1 1),R2p为0.9 6 1 7,RM S E P为0.2 6 2 1。从图6可以观
29、察到每次实验迭代约4 0次后算法收敛到本次寻优的最优解,RM S E P均小于0.2 6,平均值为0.2 4 0 7。表5为B D A-D S与K/S-D S模型传递与预测效果比较,可以看出B D A-D S算法得到的预测R2p平均值为0.9 7 4 0,且均超过0.9 6,其中实验B 1和B 1 0选择的标样集完全相同,且达到最好的模型传递效果(R2p=172第3期王红鸿等:二进制蜻蜓算法-直接校正算法优选标样集在小麦粉蛋白质近红外模型传递中的应用第3 9卷图6 1 0次B D A-D S模型传递实验过程F i g.6 1 0B D A-D Sm o d e l t r a n s f e
30、r e x p e r i m e n t s0.9 8 1 2,RM S E P=0.1 8 3 8),并最接近主机预测集的预测结果(R2p=0.9 8 2,RM S E P=0.1 7 9 5),此时模型传递后从机预测集与主机校正集的平均马氏距离由之前的2 2.3 4下降至1.4 0,同样也接近主机预测集与主机校正集平均马氏距离(1.3 6)。1 0次实验在末期大部分收敛到8个标样集样本左右,最多1 0个,最小6个(见表5)。和K/S-D S相比,1 0次B D A-D S实验预测效果均优于前者。经K/S-D S算法模型传递后从机预测集与主机校正集的平均马氏距离为1.4 2,略大于1.4
31、0,进一步说明了B D A-D S算法的优势。表5 B D A-D S与K/S-D S模型传递与预测效果比较T a b l e5 M o d e l t r a n s f e ra n dp r e d i c t i o ne f f e c tN oM e t h o dN u m b e ro f s a m p l e s i ns t a n d a r ds a m p l es e tV a l i d a t i o ns e tP r e d i c t i o ns e tR2pRM S E PR2pRM S E PB 1B D A-D S80.9 4 7 60.2 3
32、9 80.9 8 1 20.1 8 3 8B 2B D A-D S80.9 5 3 10.2 2 6 90.9 6 2 40.2 5 9 7B 3B D A-D S80.9 4 9 80.2 3 4 70.9 7 3 40.2 1 8 3B 4B D A-D S80.9 4 9 60.2 3 5 10.9 6 8 30.2 3 8 3B 5B D A-D S1 00.9 5 4 30.2 2 3 90.9 7 0 70.2 2 9 1B 6B D A-D S90.9 5 4 00.2 2 4 60.9 7 3 70.2 1 7 3B 7B D A-D S60.9 3 0 90.2 7 5 40
33、.9 7 9 70.1 9 0 6B 8B D A-D S70.9 4 0 90.2 5 4 70.9 7 7 70.1 9 9 9B 9B D A-D S70.9 4 2 10.2 5 2 20.9 7 2 10.2 2 3 7B 1 0B D A-D S80.9 4 7 60.2 3 9 80.9 8 1 20.1 8 3 8K 1 1K/S-D S3 9-0.9 6 1 70.2 6 2 1由于B D A算法的寻优机理,通过B D A-D S算法的随机性,所选的标样集不唯一。图7标出7 6个校正集样品在1 0次计算实验中入选标样集样品编号出现的频次。从图中统计得出,入选标样集超过6次的样
34、品有3个,编号分别为9 4(6次)、9 6(8次)和1 2 7(7次),其中样品9 6和1 2 7也被实验K 1 1(K/S-D S方法)挑选进标样集。从K 1 1实验标样集中剔除这两个样本后用剩余标样集进行模型传递,得到对从机预测集的预测结果R2p为0.9 3 6 8,RM S E P为0.3 3 6 7,相较剔除之前的预测结果有所下降,这表明样品9 6和1 2 7在反映主、从机差异上具有显著的代表性,其是否入选标样集对模型传递结果有较大的影响。图8为实验B 1和实验K 1 1前两个主成分(P C A)分布图,使用P C A结合马氏距离对主机校正集进行异常样品识别,发现样品9 1为光谱残差界
35、外异常样品。剔除实验K 1 1标样集中样品9 1再进行模型传递,主机模型对从机预测集预测评价参数R2p为0.9 6 2 1,RM S E P为0.2 6 0 6,较未剔除样品9 1之前预测精度略有提升。实际上检查所有K/S-D S实验,样品9 1均被选进标样集中,这是因为K/S算法以距离最大的两个样品作为第一和第二标样集样品2 6,这就使样品9 1最初被选进标样集。而在1 0次B D A-D S实验中,由于B D A的寻优机理只有实验B 6和B 9的标样集挑选到了样品9 1,模型传递结果也都不是最优,而图7 B D A-D S模型传递实验所选标样集统计F i g.7 S t a t i s t
36、 i c so f t h e s e l e c t e ds t a n d a r ds a m p l e s e t i nB D A-D Sm o d e l t r a n s f e r e x p e r i m e n t图8 标样集主成分分布图F i g.8 D i s t r i b u t i o no fp r i n c i p a l c o m p o n e n t so f t h et r a n s f e r s e t272第3期分 析 科 学 学 报第3 9卷其余8次实验均未挑选到,一定程度上规避了异常样品入选。且通过图8可以看出,共有6个样本被
37、实验B 1和K 1 1选进标样集,且较均匀地散布在K/S算法所选择的标样集中间,进一步表明B D A-D S方法所选较少的标样集具有较广泛的代表性。由此可见,K/S方法基于光谱特征选取具有代表性的样本,但这种代表性主要从样品的差异性考虑,包含着仪器性能、测样技术、环境条件、样品状态、组分浓度等诸多因素,因此挑选出样品并不能集中反映仪器的差异,为了保证模型转移效果,排除其它因素干扰,只能采用更多的标样集提取仪器差异信息用于模型转移。同时K-S算法选择校正集时本身具有在特征空间中均匀取样和首选极值的特性,因此进行挑选标样集时,会将某些极端值样品选进标样集,一定程度影响模型传递的效果。而使用B D
38、A-D S算法,通过以标样集为决策变量,经模型转移后验证集的RM S E P为适应度函数值,直接在校正集样本空间中全局优化最优标样集,克服了K/S算法挑选标样集的不足,因此所选的标样集不仅少而精干,能更好地反映仪器间的差异性,而且降低了模型传递的复杂度1,也提高了模型转移后预测结果的精度。3 结论本文以棱光S 4 5 0光栅型近红外光谱仪为主机,N e o S p e c t r aM i c r oMEM S傅里叶变换近红外光谱仪为从机,采用B D A-D S方法优选标准样品集进行模型传递,并结合P L S R建立主机小麦粉蛋白质近红外分析模型。该方法使用B D A算法优选标样集,D S算法
39、用于模型传递,并通过预测决定系数(R2p)和预测标准偏差(RM S E P)参数与传统的K/S-D S方法进行对比。研究表明,B D A-D S方法可挑选出少量的样品作为标样集,其所包含的信息能充分表征仪器间的光谱差异,经模型转移计算后,主机模型对从机光谱数据取得良好的预测效果,并略优于K/S-D S方法,接近主机模型预测水平。因此B D A-D S方法进行标样集优选,得到的标样集规模小,用于模型转移后预测精度高,这为小麦粉蛋白质近红外光谱模型传递提供了一种可靠有效的模型传递方法,对于其它分析对象的近红外光谱模型传递也有重要的借鉴意义。参考文献:1 Z HAN GJ,C A IWS,S HA
40、OXG.P r o g r e s s i nC h e m i s t r y(张进,蔡文生,邵学广.化学进展),2 0 1 7,2 9(8):9 0 2.2 YAN GZL,HUAN GYP,S HE NGH,e t a l.T r a n s a c t i o n so f t h eC h i n e s eS o c i e t y f o rA g r i c u l t u r a lM a c h i n e r y(杨增玲,黄圆萍,沈广辉等.农业机械学报),2 0 1 9,5 0(5):3 5 6.3 GUO W C,Z HUDK,Z HAN GQ,e t a l.T r
41、a n s a c t i o n so f t h eC h i n e s eS o c i e t y f o rA g r i c u l t u r a lM a c h i n e r y(郭文川,朱德宽,张乾,等.农业机械学报),2 0 2 0,5 1(9):3 5 0.4 ME N GY,L IYQ,C A IR,e t a l.F i n eC h e m i c a l s(孟昱,李悦青,蔡蕊等.精细化工),2 0 1 3,3 0(1 0):1 1 4 3.5 CHE NP,Z HUXY,L IJY,e ta l.P e t r o l e u mP r o c e s s
42、 i n ga n dP e t r o c h e m i c a l s(陈瀑,祝馨怡,李敬岩等.石油炼制与化工),2 0 1 7,4 8(7):1 0 1.6 L U H X,WUPF,YAN G H H,e ta l.J o u r n a l o f I n s t r u m e n t a lA n a l y s i s(路皓翔,吴鹏飞,杨辉华等.分析测试学报),2 0 1 9,3 8(1):3 9.7 X U H R,L IQQ.T r a n s a c t i o n so f t h eC h i n e s eS o c i e t yf o rA g r i c u
43、 l t u r a lM a c h i n e r y(徐惠荣,李青青.农业机械学报),2 0 1 7,4 8(9):3 1 2.8 L I UPZ,Z HANGLP,L IWJ,e t a l.S p e c t r o s c o p ya n dS p e c t r a lA n a l y s i s(柳培忠,张丽萍,李卫军等.光谱学与光谱分析),2 0 1 4,3 4(6):1 5 3 3.9 WE NXY,X U YY,L IM G,e ta l.C h i n e s eJ o u r n a lo fA n a l y t i c a lC h e m i s t r y
44、(温晓燕,徐艳艳,李茂刚等.分析化学),2 0 2 1,4 9(1 0):1 7 5 8.1 0J INY,L IM,L WB,e t a l.S p e c t r o s c o p ya n dS p e c t r a lA n a l y s i s(吉纳玉,李明,吕文博等.光谱学与光谱分析),2 0 1 7,3 7(1):2 2 7.1 1Y a n gX,L o uP,Y a n gH Q,e t a l.A n a l y t i c a lL e t t e r s,2 0 1 9,5 2(1 4):2 1 8 8.1 2S ON G H Y,Q I NG.S p e c t
45、 r o s c o p ya n dS p e c t r a lA n a l y s i s(宋海燕,秦刚.光谱学与光谱分析),2 0 1 5,3 5(1 2):3 3 6 0.1 3Y A N GH,X I O N GZX,C H E NT.C h i n e s e J o u r n a l o fA n a l y s i sL a b o r a t o r y(杨浩,熊智新,陈通.分析试验室),2 0 1 8,3 7(2):1 6 3.1 4G A OYF,F ULY,Z HA I J,e t a l.E l e c t r o n i c sO p t i c s a n
46、dC o n t r o l(高云飞,付霖宇,瞿军等.电光与控制),2 0 1 9,2 6(6):1 8.1 5M i r j a l i l i,S e y e d a l i.N e u r a lC o m p u t i n ga n dA p p l i c a t i o n s,2 0 1 6,2 7(4):1 0 5 3.1 6S u r y aNS,T i r u m a l aRY,K o w s h i kCY,e t a l.M a t e r i a l sT o d a y:P r o c e e d i n g s,2 0 2 0,1 1(6):3 0 1.372
47、第3期王红鸿等:二进制蜻蜓算法-直接校正算法优选标样集在小麦粉蛋白质近红外模型传递中的应用第3 9卷1 7YUANYL,GUOZG,WAN GP,e t a l.J o u r n a l o fM e c h a n i c a lE n g i n e e r i n g(原永亮,郭正刚,王鹏等.机械工程学报),2 0 2 1,5 7(6):2 1 1.1 8D o n g s h e n gY,M i n g l i a n gW,D iL,e t a l.K n o w l e d g e-B a s e dS y s t e m s,2 0 2 2,2 3 8:1 0 7 8 1 5
48、.1 9YANH,Z HAN GJX,Z HOUN,e t a l.C h i n e s e J o u r n a l o fG e o t e c h n i c a lE n g i n e e r i n g(闫浩,张吉雄,周楠等.岩土工程学报),2 0 2 3,4 5(2):3 6 2.2 0C h e nY,W a n gZ,H u c kC.M o l e c u l e s,2 0 1 9,2 4(3):4 2 1.2 1CHE NY,WUCE,X I ON GZX.F o o dS c i e n c e(陈勇,吴彩娥,熊智新.食品科学),2 0 2 2,4 3(1 4):
49、2 1 9.2 2M i r j a l i l iS,L e w i sA.S w a r ma n dE v o l u t i o n a r yC o m p u t a t i o n,2 0 1 3,9:1.2 3WUT,Z H O N GN,Y A N GL.S p e c t r o s c o p ya n dS p e c t r a lA n a l y s i s(吴霆,钟南,杨灵.光谱学与光谱分析),2 0 1 7,3 7(1 0):3 0 7 8.2 4Z HAN GFP,Z HE NGY H,S ON GT,e ta l.J o u r n a lo fI n s
50、 t r u m e n t a lA n a l y s i s(张凤枰,郑一航,宋涛等.分析测试学报),2 0 2 0,3 9(1 1):8 1.2 5HEXZ,F E N GXY,Z HA OY,e t a l.T h eF o o dI n d u s t r y(何杏宗,冯雪雅,赵悦等.食品工业),2 0 1 8,3 9(1 2):1 6 9.2 6CHUXL.M o l e c u l a rS p e c t r o s c o p yA n a l y t i c a lT e c h n o l o g yC o m b i n e dw i t hC h e m o m e
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100