收藏 分销(赏)

基于集成学习算法的M5卷接机烟支质量稳定性分析与控制.pdf

上传人:自信****多点 文档编号:3078230 上传时间:2024-06-15 格式:PDF 页数:3 大小:1.32MB
下载 相关 举报
基于集成学习算法的M5卷接机烟支质量稳定性分析与控制.pdf_第1页
第1页 / 共3页
基于集成学习算法的M5卷接机烟支质量稳定性分析与控制.pdf_第2页
第2页 / 共3页
基于集成学习算法的M5卷接机烟支质量稳定性分析与控制.pdf_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

1、中国新技术新产品2024 NO.2(上)-74-工 业 技 术如何利用现有卷接机大量、原始的数采数据分析、研究在线质量指标与设备、工艺参数间的关联性,一直是卷烟生产者面临的难题。该项工作不仅需要对卷接设备、工艺谙熟于心,还需要找到一种便捷、有效的数据处理和分析方法,在杂乱的大量底层原始数据中发现机理运行中的逻辑关系。本文以 PROTOS-M5 数采参数数据为基础,以在线烟支质量标准偏差为研究对象,采用集成学习算法来探寻、构建影响烟支质量稳定性的参数预测模型,并以中位数控制图1进行参数过程监控,以达到提升过程稳定性控制的目的。1 构建在线烟支质量标准偏差预测模型的算法准备1.1 Bagging

2、算法Bagging 是基于自助采样法的集成算法2,其定义为给定包括 m 个样本的数据集,Bagging 的基本流程如下。先随机取出一个样本放入采样集中,再把该样本放回初始数据集,使下次采样时该样本仍有可能被选中。经过 m 次随机采样操作,得到含 m 个样本的采样集。初始训练集中,有的样本在采样集里多次出现,有的从未出现,最终可采样出 T 个含 m 个训练样本的采样集,然后基于每个采样集训练出一个基学习器,再将这些基学习器进行结合。假定基学习器的计算复杂度为 o(m),则 Bagging 的复杂度大致为 T(o(m)+o(s)。考虑采样平均过程的复杂度 o(s)很小,而 T 通常是一个不太大的常

3、数,因此训练一个 Bagging 集成与直接使用基学习算法训练一个学习器的复杂度同阶,说明 Bagging 是一个高效的集成学习算法。自助采样过程还使Bagging具有另一个优点,由于每个基学习器只使用了初始训练集中约 63.2%的样本,剩下约36.8%的样本可作为验证集对泛化性能进行“包外估计”,为此须记录每个基学习器使用的训练样本。设定 D 表示 ht实际使用的训练样本集,令 Hoob(x)表示对样本 x 的包外预测,即仅考虑那些未使用 x 训练的基学习器在上的预测,如公式(1)所示。Hxh xyxDooby YtttT?argmax*1(1)式中:T 为复杂度,为样本空间,Dt为训练样本

4、集,ht(x)为训练预测值。则 Bagging 泛化误差的包外估计如公式(2)所示。?ooboobx yDDHxy?1?,(2)从偏差-方差分解的角度看,Bagging 主要关注降低方差,因此它在不剪枝决策树、神经网络等易受样本扰动的学习器上效用更明显。1.2 随机森林算法随机森林3是 Bagging 的一个扩展变体,在以决策树为基学习器构建 Bagging 集成的基础上,随机森林算法会进一步在决策树的训练过程中引入随机属性选择。传统决策树划分属性时,会在当前结点的属性集合(假定有 d 个属性)中选择一个最优属性,而随机森林算法会先从基决策树的每个结点的属性集合中随机选择一个包括K个属性的子集

5、,再从该子集中选择一个最优属性用于划分。其中参数 K=sqre(d)控制了随机性的引入程度。因此,随机森林中基学习器的多样性不仅来自样本扰动,还来自属性扰动,可使最终集成的泛化性能通过个体学习器间差异度的增加而进一步提升。1.3 构建在线烟支质量标准偏差预测模型的算法策略本文构建在线烟支质量标准偏差的数值预测模型采用 Bagging 与随机森林算法相结合的策略,其逻辑如下。假定集成包括 T 个基学习器 h1,h2,.hi,其中 h 在示例x 上的输出为 hi(x),本文对进行结合的策略是加权平均法,如公式(3)所示。H xwh xiiiT?1(3)基于集成学习算法的M5卷接机烟支质量稳定性分析

6、与控制朱轶张超黄国樑焦曦薛嫄(上海烟草集团有限责任公司上海卷烟厂,上海 200000)摘 要:PROTOS-M5卷烟机是上海某公司某专线的生产设备,具有较高的自动化和信息化水平,但如何充分利用复杂的在线数采数据来分析、构建有效、稳定的在线物测指标稳定性控制体系,一直是车间质量人员面临的难题。本文以在线烟支质量标偏为研究对象,基于 M5卷烟机在线数采数据,研究生产过程中的烟支质量稳定性控制,利用集成学习算法构建以在线烟支质量标偏为响应变量、设备参数簇为解释变量的回归模型,明确了在线烟支质量稳定性控制的关键参数和优化控制范围,并在此基础上构建关键参数的中位数过程控制图,为车间在线烟支质量稳定性预警

7、、监控提供重要的参考与指导。关键词:PROTOS-M5;在线数采;质量标偏;集成学习;中位数控制图 中图分类号:TS43文献标志码:A中国新技术新产品2024 NO.2(上)-75-工 业 技 术式中:wi为个体学习器hi的权重,通常要求wi0,=Tiiw11。随机森林对样本集和特征的随机选择已经将不同学习器的差异性提升至较高水平,导致不同学习器的预测精度有较大差异,为了使预测模型达到更高的精度,设置为自适应的权重分布,使权重 wi与该学习器的预测精度相关,即预测得越准,权重越大,如公式(4)所示4。SSEWj1=(4)式中:SSE 为在线烟支质量标准偏差真实值与预测值间差的平方和。由此,在线

8、烟支质量标准偏差预测模型的底层算法逻辑构建完毕。2 在线烟支质量检测系统准确度评价Protos-M5 微波测量传感器(MIDAS)由微波模块、MIDAS 计算机卡和电压处理器构成,其主要功能为在前、后道烟条上测量烟丝密度,烟条的密度由 MIDAS 测量传感器每隔一个增量(INC)测量一次。MIDAS2 计算机卡以INC 时钟脉冲采集得出的密度曲线数据,供质量调节和建立烟支型面曲线使用。目前 Protos-M5 在线烟支质量标准计算口径的形式为 100 支 10 子组,同时机台会基于微波测量传感器的数据进行烟支质量调节。当实际质量与额定质量差距超出规定范围时,控制系统会计算出一个新的吸丝带位置,

9、通过伺服电机驱动凸轮上、下位置来调整吸丝带位置,进而可使实际质量尽量接近额定质量。微波测量传感器在经过长时间、多工况生产后,系统测量准确性可能会发生一定偏移,进而造成在线烟支质量测量值不能真实反映实际烟支质量。因此为了确保构建在线烟支质量 SD 预测模型时,在线显示的烟支质量数据能够真实反映实际烟支质量的变化情况,须对 Protos-M5 微波测量系统的数据进行准确度检验。本文以 Protos-M5 前道烟枪为研究对象,在当班中段且设备处于稳定运行的过程中,随机选择 3 名检测人员在卷接与包装衔接处进行烟支取样。每名人员分 3 次进行前道烟支取样,每次取样 200 支,每次间隔 5min,记录

10、每次取样开始、结束时间。然后在同一台经过校准校验的密度仪上进行烟支质量检测,同时计算每次取样时间内前道在线烟支质量的测量均值。详细的测量与检验数据见表 1。表 1 在线检测与离线检测数据对比人员密度仪检测数据/mgMIDAS显示均值/mg烟道甲700.98700.69前道701.45701.10前道700.25700.01前道乙700.68700.26前道700.12700.36前道699.36699.68前道丙700.36701.12前道700.38700.69前道699.95700.21前道结果表明,在 95%的置信度下,以 0.5mg 作为显著性水平差异评价指标,经双样本 t 检验5可得

11、 MIDAS 在线烟支质量与密度仪检测的烟支质量存在差异,即 P=0.903,MIDAS 在线烟支质量与密度仪离线检测的烟支质量并无显著差异,因此可认为 MIDAS 在线烟支质量检测数据符合控制标准要求。3 基于随机森林算法的烟支质量 SD 预测模型构建3.1 数据表格预处理从 M5 目标机台的后台数采系统导取 2022 年 9 月2023 年 2 月的在线参数时间表,以时间为主索引,将各参数同步对齐并筛选重复值,最后执行并表操作,形成一张可供处理与分析的初级大表。以质量当前值-烟支质量短时标准偏差(前道)为响应变量,结合设备资料、参数命名规律进行参数分块,以区别质量指标与设备工艺参数。同时遍

12、历表内参数数据形态,进一步提取数值型、时间型参数,利用统计方法对数值型参数进行最大值、最小值、中位数、均值、方差和计数等维度赋值。3.2 数据清洗与整理根据每个参数的统计结果进行数据处理,剔除参数数值个数为 1 或全部为空值的参数,同时利用图表法查找指标的离群值,结合生产实际与偏离范围确定是否为异常数据,对确定为异常数据的参数采用删除或盖帽法6进行处理。3.3 数据集切分将质量当前值-烟支质量短时标准偏差(前道)为响应变量,同时明确加入模型构建的自变量参数范围,将整体数据集切分为测试集与训练集 2 个部分,用于模型测试与训练。同时为了保证复现效果,设置固定的随机种子。3.4 以集成学习构建的烟

13、支质量 SD 预测模型针对当前处理完毕的数据集,采用AdaBoost7、Stacking8、随机森林(random forest)和 XGboost 这 4 种集成学习算法模型进行训练学习,具体步骤如下。1)在 Python 环境中安装好相应的集成学习库,同时导入对应的模型算法,然后将训练集数据依次导入相应的算法中进行模型训练,形成初版模型。2)比较训练集中烟支质量短时标准偏差(前道)的实际值和预测值,计算训练集在模型上的均方误差,进而得到模型在训练集上的 R2值。3)将测试集数据导入上一步骤训练好的模型中,输出测试集在模型上的预测值,比较测试集中烟支质量短时标准偏差(前道)的实际值和预测值,

14、计算测试集在模型上的均方误差,进而得到模型在测试集上的 R2值。4)对比训练集与测试集的 R2值,如果两者比值 0.8,则判定为较明显的过拟合,启动模型调参;如果两者比值 0.8,则跳过调参环节。5)依次遍历预测结果影响较大的参数和对应的取值范围,分别进行模型的训练和评估,记录各参数不同取值组合下的测试集 R2,将测试集中 R2值最高的参数取值组合为最终的模型参数设置。6)参照步骤 2、3、4 对调参后的模型重新进行模型评估,计算新模型在测试集上的 R2值。将上述 4 种集成学习算法按照上述 6 大步骤分别进行烟支质量 SD 预测模型训练、评估、调参和再评估,比较可得基于随机森林算法的烟支质量

15、 SD 预测模型在测试集中国新技术新产品2024 NO.2(上)-76-工 业 技 术上 R2最高,为 0.941。3.5 模型因子效应排序通过利用随机森林算法构建基于在线数采参数数据的烟支质量 SD 预测模型,得出影响在线烟支质量标准偏差的关键因子排序和对应效应值,具体如下:VE 前道吸丝带调节装置的生产位置=0.2961;端头密度-前道烟条=0.1941;水分-前道烟条=0.1298;端头压实位置短时标准偏差-前道烟条=0.0837;ODM 前道烟条直径的校准偏量=0.0467;端头压实位置-前道烟条=0.0459;SE 前道粘接室调节偏移量=0.0215;VE 陡角输送机的比例系数=0.

16、0129。4 关键参数的预警与监控为了进一步控制在线烟支质量稳定性,基于该模型的关键因子效应排序结果,引入中位数控制图的过程监控方法,对在线烟支质量标准偏差、VE 吸丝带调节装置的生产位置等参数进行过程预警和监控。4.1 中位数控制图介绍中位数控制图属于计量型双值控制图,适用于产量较大、加工稳定的生产过程,将统计总体中的各变量值按大小依次排列起来形成一个数列,处于变量数列中间位置的变量值称为中位数。因此中位数控制图可以显示过程输出的分布宽度,可预见过程变差的趋势。4.2 构建烟支质量标准偏差中位数控制图基于 Protos-M5 原始数采频率与设备运行速度,选择在线烟支质量标准偏差、VE 吸丝带

17、调节装置的生产位置等参数合适的子组大小,本文所述专线选择单个数采点为 1min、子组大小为 5,以保证单个子组内的变差尽可能小。同时针对目标机台,选取处于稳定性生产阶段的样本数据,根据子组能够反应的潜在变化要求进行分组,确保子组数为 30 以上。完成子组分类后,须进行子组中位数计算。当在线烟支质量标准偏差、VE 吸丝带调节装置的生产位置等参数以升序排列时,根据样本数据计算出在线烟支质量标准偏差、VE 吸丝带调节装置的生产位置等参数,如公式(5)、公式(6)所示。kxxxxk21+=(5)kRRRRk+=21 (6)式中:x(o)为样本中的第 O 个元素;xk为中位数;K 为用于确定平均中位数的

18、子组数量;R 为极差;xk为所有子组中位数均值;R为极差均值。查子组个数系数表可得极差放大系数A2和中位数控制图的上、下限 LCL、UCL,而烟支质量标准偏差是望小的,因此其只有控制上限。计算过程如公式(7)公式(9)所示。CLx=x(控制中心线)(7)UCLx=x+A2 R,(n=5,A2=0.691)(控制上限)(8)LCLx=x-A2 R(控制下限)(9)式中:CLx为控制中心线;UCLx为控制上限;LCLx为控制下限。4.3 中位数控制图分析与完善在绘制完成在线烟支质量标准偏差、VE 吸丝带调节装置的生产位置等参数的中位数控制图后,须根据判异规则进行异常点判断。出现异常点时,须结合在线

19、烟支质量标准偏差预测模型进行原因排查和异常点剔除。基于异常点剔除后的样本数据重新绘制中位数控制图,重复上述步骤直至消除异常点。通过多轮计算可得目标机台的在线烟支质量标准偏差中位数控制图的中心线为 19.93,控制图上限为20.55,VE 吸丝带调节装置生产位置的中位数控制图中心线为-2.11mm,控制图上限为-1.85mm,控制图下限为-2.34mm。将计算所得控制限结合生产过程 SPCD 系统进行关键参数与在线烟支质量稳定性监控,根据统计过程控制(Statistical Process Control,SPC)八大判异规则判定监控对象出现异常点时,系统自动生成、反应预警信息,第一时间通知生产

20、管理者进行情况核实和调整,进而提升对过程稳定性的控制能力。5 结论本文通过建立、运用在线烟支质量标准偏差的预测模型和关键参数的中位数控制图,有效提升了设备生产过程中的质量指标监控和预警能力,明确了影响烟支质量稳定性控制的关键参数范围,并通过中位数控制图对其生产过程进行实时监控。当烟支质量标准偏差发生持续性异常波动时,能及时、有效地进行过程预警、调整,从而达到在线烟支质量稳定性控制的目的。参考文献1 曹程明,马义中.基于高质量过程的指数分布中位数控制图的统计设计 J.计算机集成制造系统,2020,26(3):641-647.2 杨琳,张林,叶泽辉.基于集成学习和近红外光谱的玉米种子含水率预测方法

21、研究 J.西北农业学报,2022,31(8):1025-1034.3 吕立新.基于随机森林的分布式数据关联性深度挖掘方法 J.内蒙古民族大学学报(自然科学版),2023,38(4):308-314.4 牛惠芳.回归分析与课堂评价模型中指标的选择 J.数学的实践与认识,2008(18):47-52.5 陈银梦,詹倩.运用双样本 t 检验的若干误区与正确条件J.统计与管理,2019(2):40-42.6 黄紫青.基于 Python 的信息采集与数据处理分析 J.集成电路应用,2022,39(10):23-25.7 刘晓玉,李灯熬,赵菊敏.基于多核 SVM 的 AdaBoost心力衰竭死亡率评估模型 J.太原理工大学学报,2023,54(5):804-811.8 刘佳梅,丁楷.基于 Stacking 集成学习的中文问句分类算法 J.智能计算机与应用,2023,13(9):85-88.

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服