1、66 食品安全导刊 2023年10月(下)分析检测基于电子鼻的牛肉微生物污染状况 定量预测模型的构建付 硕1,刘淑梅1,张金龙1,张晓瑞2,韩方凯3(1.安徽创佳安全环境科技有限公司,安徽宿州 234000;2.江苏大学,江苏镇江 212013;3.宿州学院,安徽宿州 234000)摘 要:构建精确度高、速度快的预测模型对推动电子鼻技术走向实际应用具有重要的意义。研究以牛肉为对象,采集不同微生物污染程度牛肉样本的电子鼻传感器信息作为模型的输入,以样本微生物污染量化指标细菌总数(Total Viable Counts,TVC)为输出变量,构建定量预测模型。在模型构建时,对比采用线性的偏最小二乘法
2、(Partial Least Squares Regression,PLS)和快速人工神经网络极限学习机(Extreme Learning Machine,ELM)算法。结果显示,ELM 模型预测性能优于 PLS 模型,其训练集和测试集预测误差分别为 0.040 lgCFUg-1和 0.047 lgCFUg-1,相关系数分别为 0.976 和 0.972。所构建 ELM 模型能满足实际需求,可在牛肉品质检测与控制方面发挥积极作用。关键词:牛肉;电子鼻;模式识别模型;快速检测Construction of Quantitative Prediction Model of Beef Microbi
3、al Contamination Based on Electronic NoseFU Shuo1,LIU Shumei1,ZHANG Jinlong1,ZHANG Xiaorui2,HAN Fangkai3(1.Anhui Canca Security Environment Technology Co.,Ltd.,Suzhou 234000,China;2.Jiangsu University,Zhenjiang 212013,China;3.School of Suzhou,Suzhou 234000,China)Abstract:The construction of a high p
4、recision,high speed prediction model for promoting the electronic nose technology to the practical application has important significance.Research is an object with beef,collect different degree of microbial contamination of beef samples of electronic nose sensor information as input of the model,to
5、 sample microbial contamination to quantify the total bacterial count of the quantitative indicators as the output variable,build the quantitative prediction model.In the model building,compared with the linear partial least squares and artificial neural network fast extreme learning machine algorit
6、hm.The results show that the predictive performance of ELM model is better than that of PLS model.The predictive errors of the training set and test set are 0.040 lgCFUg-1 and 0.047 lgCFUg-1,and the correlation coefficients are 0.976 and 0.972,respectively.The ELM model can meet the actual demand an
7、d play an active role in beef quality detection and control.Keywords:beef;electronic nose;pattern recognition model;rapid detection致腐菌导致食品腐败变质,易产生有害物质,如小分子含氮化合物组胺等,直接威胁食品安全。因此,对食品中微生物污染状况的监测,对保障膳食安全极为重要。活菌总数(Total Viable Counts,TVC)是定量描述食品微生物污染状况的指标。然而TVC 的常规检测方法,即平板计数法通常需要经过48 h 的摇床培养,待平板上微生物生长、繁殖成
8、可观察的菌落后,再对菌落进行计数,经过换算,得基金项目:宿州市科技计划重点领域攻关项目(2021133);宿州学院企业合作开展非财政资金科研项目(2022xhx182);安徽高校自然科学研究重大项目(KJ2021ZD0139);宿州学院科研平台(2021XJPT);安徽高校优秀青年人才支持计划项目(gxyq2022105);宿州学院第四批学术技术带头人及后备人选、优秀学术技术骨干项目(2020XJHB04);安徽省高等学校教育教学改革研究重点项目(2022jyxm1592)。作者简介:付硕(1990),男,安徽亳州人,本科,工程师。研究方向:食品、环境卫生检验检测。Oct.2023 CHINA
9、 FOOD SAFETY 67分析检测到最终结果。平板计数法耗时、费力1,无法快速反映食品微生物污染状况,以及时调整食品保藏、销售、加工等策略。常见的食品快速检测方法,如电子舌2、电子鼻3等智能仿生检测方法以及近红外4、高光谱5等光谱学检测方法等,均已应用于不同种类食品保藏期间 TVC 的定量预测。然而,这些方法得到的电化学传感器或光谱学信号,受食品基质干扰严重6,因此建立快速检测方法所得到的传感器信号与 TVC之间精确度较高的定量预测模型,成为食品快速检测方法应用于生产实际的限制性因素之一。基于此,本研究以最常见的金属氧化物半导体型电子鼻传感器数据为输入,对比采用偏最小二乘法(Partial
10、 Least Squares Regression,PLS)和快速人工神经网络极限学习机(Extreme Learning Machine,ELM)算法构建牛肉贮藏期间 TVC 快速定量预测模型的精确度,以期推进食品快速检测技术在食品生产实际中的应用。1 材料与方法1.1 电子鼻数据本研究数据来源于 DEDY 等7于 2018 年发表在Data in Brief 的数据论文。所用的电子鼻系统是基于金属氧化物半导体型气敏传感器阵列,该系统包含 9 根 MOS 传感器。电子鼻试验在密闭样品室下持续 36 h,每分钟采集 1 次传感器信号,共计得到 2 160 组电子鼻传感器阵列数据。样品共 5 组
11、,最终得到 52 160 行 9 列的数据矩阵用于本研究的模型构建。电子鼻试验期间,牛肉样品的 TVC 从 3 lgCFUg-1以下(微生物污染程度轻微)增殖到近 5 lgCFUg-1(微生物污染程度严重)。图 1 展示出所有样品在电子鼻测试期间传感器数据及 TVC 数值,包含原始数据及归一化至 0,1 后的数据。1.2 模型构建方法及性能评价指标研究以电子鼻传感器所有数据为输入,以对应样本 TVC 实测值为输出,对比采用线性的 PLS 和非线性的 ELM 构建基于电子鼻技术的牛肉贮藏期间TVC 定量预测模型。选择 ELM 的主要原因是其计算速度显著快于常见的 BP-人工神经网络算法8。在模型
12、的构建过程中,随机选取 1/3 的样本作为测试集,其余样本作为训练集,且在 PLS 和 ELM 模型构建过程中保持一致。评估所采用的定量预测模型,本文依赖以下指标。相关系数(r)。该系数衡量电子鼻预测的牛肉 TVC 值与实际值之间的相关性,r 值越接近 1,证明预测的相关性越高,具体计算方法见式(1)。预测均方根误差(Root Mean Square Error,RMSE)也作为关键指标,它用于测量电子鼻预测的牛肉 TVC 值与实际值的误差程度,RMSE 越低,代表预测精度越高,反之则预测精度较差。2121()1()niiiniiyyryy=(1)式中:yi和 yi分别为样本集(训练集和预测集
13、)中第 i 个牛肉样本 TVC 的实测值和预测值,lgCFUg-1;y为样本集中所有牛肉样本 TVC 实测值的平均值,lgCFUg-19;n 为样本数。0.90.80.70.60.50.40.30.20.101.01201008060402000200040006000时间/min传感器响应值及活菌总数/(lgCFUg-1)传感器响应值及活菌总数/lgCFUg-1800010000120000传感器1传感器2传感器3传感器4传感器5传感器6传感器7传感器8传感器9活菌总数(a)原始数据传感器1传感器2传感器3传感器4传感器5传感器6传感器7传感器8传感器9活菌总数0.90.80.70.60.5
14、0.40.30.20.101.0传感器响应值及活菌总数/(lgCFUg-1)时间/min80001000012000020004000600080001000012000(b)归一化后的数据图 1 模型构建所用电子鼻传感器阵列数据及牛肉活菌总数数据68 食品安全导刊 2023年10月(下)分析检测21()niiiyyRMSEn=(2)式中:yi和 yi分别为预测集中第 i 个牛肉样本TVC 的实测集和预测值,lgCFUg-1;n 为预测集样本数9。2 结果与分析2.1 PLS 模型结果PLS 用于处理多个自变量和一个或多个因变量之间的关系,在解决多重共线性和高维数据问题时优势明显。PLS 通过
15、找到自变量和因变量之间的最大协方差来构建线性回归模型,用于预测未知样本的因变量值。基于 PLS 的基础理念,模型预测能力受到 PLS主成分数量的显著影响。因此,在构建 PLS 模型过程中,对输入的 PLS 主成分数进行优化是必要的。这一优化过程采用了“留一法”交叉验证。这种验证方法的核心思想是将每个样本视为验证集,用剩下的(N-1)个样本来创建 PLS 模型,然后运用验证集来检测新构建的 PLS 模型,以预测值和实测值误差的均值作为优化 PLS 主成分数的指标。如果对应的RMSE 值最小,则认为当前条件下的 PLS 模型是最优的。PLS 主成分筛选结果如图 2 所示。从图 2 可以看出,当主成
16、分因子数为 8 时,PLS模型的 RMSE 最低,为 0.319 7 lg CFUg-1。此条件下,PLS 模型训练集和测试集对鱼细菌总数的预测值和实测值之间的相关关系如图 3 所示,其测试集相关训练集 预测误差/(lgCFUg-1)10.44850.500.450.400.300.250.200.150.100.0500.35230.35690.35250.33900.32950.32120.32130.31970.319945主成分因子数6789图 2 不同 PLS 主成分下训练集预测误差实测值/(lgCFUg-1)r=0.938RMSE=0.3201.52.02.53.03.54.04.
17、55.05.52345预测值/(lgCFUg-1)(a)训练集r=0.937RMSE=0.3241.52.02.53.03.54.04.55.05.52345实测值/(lgCFUg-1)预测值/(lgCFUg-1)(b)测试集图 3 最佳 PLS 主成分下模型预测值与实测值相关关系图Oct.2023 CHINA FOOD SAFETY 69分析检测系数为 0.937,预测 RMSE 为 0.324 lgCFUg-1。2.2 ELM 模型结果ELM 是一种新型的单隐藏层前馈神经网络算法,具有出色的泛化性能和极快的学习速度。根据 ELM理论,对于一个特定的模式识别问题,隐含层的神经元个数和传递函数
18、可供筛选和优化,以获得预测性能较优的预测模型。鉴于人工神经网络隐含层神经元个数优化范围尚无统一范式可供遵循,本研究采用典型的试凑法,设定范围为 1,50,优化 ELM隐含层神经元个数。在 ELM 隐含层传递函数的筛选上,对比采用 3 种典型的函数8,公式为1Sig:()1xS xe=+(3)Sin:()sin()S xx=(4)1Hardlim:()0 x0S xx0=(5)图 4 显示了在隐含层神经元个数 1,50 范围内,3 种传递函数条件下,ELM 模型训练集和测试集的相关系数。从图 4 中可以看出,当选择 Sin 函数作为传递函数,且隐含层神经元个数为 45 的时候,ELM预测性能最佳
19、,其训练集相关系数为 0.976,测试集相关系数为 0.972。最优 ELM 模型的基本结构为 9-45-1,包含 9个电子鼻传感器输入变量,45 个单隐含层神经元,1个样品 TVC 预测输出变量。模型训练集和测试集对牛肉样本 TVC 的预测值及实测值依样本序号排列结果如图 5 所示,此时训练集和测试集的 RMSE 分别为0.040 lgCFUg-1和0.047 lgCFUg-1,优于PLS模型。3 讨论牛肉富含水分、蛋白质、脂肪等营养成分,极易变质腐败。微生物的生长繁殖是引发牛肉变质的主要原因。微生物生长繁殖过程中,释放出大量的蛋白酶、脂肪氧化酶、过氧化物酶,使牛肉中的蛋白质和脂肪等营养元素
20、分解为低分子化合物。蛋白质会被水解成肽,进而分解成氨基酸。氨基酸经过脱羧化、脱氨化、脱硫化等作用会生成相应的氨、小分子胺、有机酸等。脂质会在水解作用下生成游离脂肪酸、甘油、甘油酯和甘油二酯等。脂肪酸还可以进一步分解成酮酸或酮等10。这些产物中的烃类、酮类、醇类、醛类、酸类、酯类、含硫及杂环化合物等是牛肉保藏期间产生挥发性有机化合物的主要成分11。电子鼻传感器可以识别食品挥发性成分,进而实现微生物污染状况的间接预测。从构建的 PLS 模型及 ELM 模型的预测性能来看,ELM 模型的训练集和测试集相关系数分别为0.976 和 0.972,高 于 PLS 模 型 的 0.938 和 0.937,E
21、LM 模型的训练集和测试集的预测误差分别为 0.040 lgCFUg-1和 0.047 lgCFUg-1,均明显低于 PLS模型的 0.319 7 lgCFUg-1和 0.324 lgCFUg-1。主要是因为电子鼻传感器信号与预测目标 TVC 值之间是非常复杂的非线性关系,这是由电子鼻传感器特性所决定的,即传感器非特异性,且相互之间交互敏感,对食品挥发性物质的敏感性存在一定程度的交叉。ELM 具有出色的自学习和自适应能力,获得的结果优于线性的 PLS 算法12。4 结论本文研究构建了基于 MOS 型电子鼻信号处理的牛肉贮藏期间 TVC 定量预测模型。结果表明,非线性的 ELM 算法获得的结果较
22、线性的 PLS 算法好,0.20.4相关系数0.60.81.01020节点数3040500.20.4相关系数0.60.81.01020节点数3040500.20.4相关系数0.60.81.01020节点数304050训练集测试集训练集测试集训练集测试集(a)Hardlim(b)Sig(c)Sin图 4 不同隐层激活函数及节点数下对 ELM 模型训练集和测试集相关系数70 食品安全导刊 2023年10月(下)分析检测其训练集或测试集对样本 TVC 的预测值与实测值之间的相关系数均高于 0.97,预测误差均低于或等于 0.04 lgCFUg-1。ELM 模型预测精度高,运算速度快,能够满足实际需求
23、,可为牛肉质量安全控制提供借鉴。参考文献1 孙颖颖,董鹏程,朱立贤,等.食源性致病菌快速检测研究进展 J.食品发酵工业,2020,46(17):264-270.2HAN F K,HUANG X Y,TEYE E,et al.Quantitative analysis of fish microbiological quality using electronic tongue coupled with nonlinear pattern recognitionalgorithmsJ.Journal of Food Safety,2015,25(3):336-344.3DEDY R W,RIYA
24、NARTO S,ENNY Z.DWTLSTM for electronic nose signal processing in beef quality monitoringJ.Sensors and Actuators B:Chemical,2021,326:128931.4LIN M S,MOJGAN M,MURAD A,et al.Rapid near infrared spectroscopic method for the detection of spoilage in rainbow trout(oncorhynchus mykiss)filletJ.Journal of Foo
25、d Science,2006,71(1):18-23.5HUANG L,ZHAO J W,CHEN Q S,et al.Rapid detection of total viable count(TVC)in pork meat by hyperspectral imaging J.Food Research International,2013,54(1):821-828.6SANCHEZ P D C,AROGANCIA H B T,BOYLES K M,et al.Emerging nondestructive techniques for the quality and safety e
26、valuation of pork and beef:recent advances,challenges,and future perspectives J.Applied Food Research,2022,2(2):100147.7DEDY R W,RIYANARTO S,ENNY Z.Electronic nose dataset for beef quality monitoring in uncontrolled ambient conditions J.Data in Brief,2018(21):2414-2420.8HAN F K,JOSHUA H A,MARWAN M A
27、 R,et al.Machine-learning assisted modelling of multiple elements for authenticating edible animal blood foodJ.Food Chemistry,2022(14):100280.9HAN F K,HUANG X Y,JOSHUA H A,et al.Fusion of a low-cost electronic nose and Fourier transform near-infrared spectroscopy for qualitative and quantitative det
28、ection of beef adulterated with duckJ.Analytical Methods,2022,14(4):417-426.10HAN F K,HUANG X Y,TEYE E,et al.Nondestructive detection of fish freshness during its preservation by combining electronic nose and electronic tongue techniques in conjunction with chemometric analysisJ.Analytical Methods,2
29、014,6(2):529-536.11 孟一,张玉华,姜沛宏,等.牛肉贮藏过程中的挥发性成分分析 J.食品工业科技,2016,37(16):61-65.12HAN F K,HUANG X Y,TEYE E.Novel prediction of heavy metal residues in fish using a low-cost optical electronic tongue system based on colorimetric sensors arrayJ.Journal of Food Process Engineering,2019,42(2):e12983.活菌总数/(lgCFUg-1)65432106543210100020003000样品序号样品序号40005000600070008000期望输出预测输出(a)训练集活菌总数/(lgCFUg-1)65432106543210100020003000样品序号样品序号40005000600070008000期望输出预测输出(b)测试集图 5 所建最优 ELM 模型训练集和测试集预测值与实测值情况