1、收稿日期:2022-03-24修回日期:2022-05-07基金项目:国家自然科学基金(61503126);黑龙江省自然科学基金资助项目(F2018024)作者简介:徐通福(1997),男,福建三明人,硕士研究生。研究方向:无模型自适应控制。*摘要:针对未知非线性非仿射重复离散时间系统,将迭代域的动态线性化技术应用于非线性被控系统和未知非线性理想学习控制器,提出一种新的数据驱动迭代学习控制方案。通过设计一种改进的无模型自适应迭代学习控制算法对理想学习控制器的增益进行估计,该方案仅利用非线性系统的输入输出数据,便可自动调整迭代学习控制律。数值仿真和对高速列车模型的仿真验证了该方法的有效性和适用性
2、。关键词:数据驱动迭代学习控制;非线性重复系统;动态线性化;估计算法中图分类号:TP273;TP18文献标识码:ADOI:10.3969/j.issn.1002-0640.2023.05.005引用格式:徐通福,李秀英.基于控制器动态线性化的数据驱动 ILC J.火力与指挥控制,2023,48(5):33-38.基于控制器动态线性化的数据驱动 ILC*徐通福,李秀英(上海应用技术大学,上海201418)Dynamic Linearization Data Driven ILC Based on ControllerXU Tongfu,LI Xiuying(Shanghai Institute
3、of Technology,Shanghai 201418,China)Abstract:A new data-driven iterative learning control(ILC)scheme is proposed for unknownnonlinear non-affine repetitive discrete time systems by applying the dynamic linearization(DL)technique of iterative domain to nonlinear controlled systems and unknown nonline
4、ar ideal learningcontrollers.An improved model-free adaptive iterative learning control(IMFAILC)algorithm is designedto estimate the gain of ideal learning controller,and the scheme only utilizes the input and output dataof the nonlinear system to automatically adjust the iterative learning control
5、law.The validity andapplicability of the method are verified by a numerical simulation and by simulations on a high-speedtrain model.Key words:data-driven iterative learning control(ILC);nonlinear repetitive systems;dynamic lin-earization(DL);estimation algorithmCitation format:XU T F,LI X Y.Dynamic
6、 linearization data driven ILC based on controller J.FireControl&Command Control,2023,48(5):33-38.0引言迭代学习控制(iterative learning control,ILC)利用有限时间内先前迭代的信息来提高重复操作系统的跟踪性能1。它已经广泛应用于机器人、划片机、红外相机和列车等重复系统2-5。对于大多数现有的迭代学习控制方法,控制器的设计和稳定性的分析需要知道被控对象的动态模型。从这个角度来看,它们被认为是基于模型的 ILC。基于模型的 ILC是使用基本原理或辨识方法对被控对象建模。如果
7、对象是复杂的,那么基于模型设计的控制律的结构也会变得复杂,这导致控制器设计耗时、低效,甚至在某些实际情况下是不可能的。为了解决基于模型的 ILC 带来的一些问题,数文章编号:1002-0640(2023)05-0033-06火 力 与 指 挥 控 制Fire Control&Command Control第 48 卷第 5 期2023 年 5 月Vol.48,No.5May,202333(总第 48-)火 力 与 指 挥 控 制2023 年第 5 期据驱动的控制方法近年来吸引了越来越多的关注。李佳伟等在迭代学习控制的基础上引入遗忘因子,减少了系统的超调和振荡6。薄雨蒙等将基函数前馈调参技术和
8、ILC 技术结合,有效地提高了对时变的期望轨迹的控制精度7。梁建智等利用数据驱动迭代控制大大减小了数控机床位置跟踪误差8。数据驱动的迭代学习控制方法虽然消除了基于模型的控制方案的一些问题,但是仍然存在一些关键的问题。例如:学习控制器的设计通常是根据经验或一些系统知识确定的;学习控制增益没有精确地校准,只是采用固定的学习控制增益,该增益通常在迭代过程中启发式地确定。对此,本文对一般的未知非线性重复系统,提出了一种新的数据驱动迭代学习控制方法。首先,基于非线性理想学习控制器的动态数据模型,确定带有学习控制增益向量的迭代学习律。然后,利用改进的无模型自适应迭代学习控制(improved model
9、free adaptive iterativelearning control,IMFAILC)方案对学习控制增益向量中的复杂非线性进行估计,IMFAILC 方案的引入提高了被控对象的非线性跟踪能力。1理想学习控制器的动态线性化考虑未知的重复离散时间非线性非仿射单输入单输出系统(1)式中,和分别是第 i 次迭代的第 k 时刻的系统输出和控制输入,;代表未知的非线性函数,两个正常数 ny和 nu分别表示和的未知的阶数。假设 1:非线性系统(1)在迭代域中满足广义利普希茨条件,也就是说,对于任意时刻 k 和迭代 i,如果,那么有一个未知的常数 b0 使得(2)式中,。对于迭代学习控制,控制目的是设
10、计一个迭代学习控制律,使跟踪误差在迭代 i 趋于无穷大时,在有限的时间内等于零。其中,是系统所需的输出轨迹。所设计的迭代学习控制律不同于传统的有限时间或固定时间控制方案,它具备从先前迭代中学习的能力。对于受控设备(1),理想的学习控制器可以表示为(3)式中,是非线性函数,ne和 nc分别代表和未知阶数。理想学习控制器式(3)的物理意义是如果式(3)可用并应用于式(1)所描述的系统,它能保证系统输出提前一步等于期望输出,即。由于理想学习控制器式(3)的结构是未知的,所以它只是一个理论表达式。在实践中,通常根据经验或使用一些系统知识来选择具有先验确定结构的迭代学习控制律。然而,当被控系统的动态是未
11、知的,并且可能是复杂的,具有强非线性和时变参数、阶数和结构时,很难确定所设计的 ILC 在实践中是否有效。因此,需要寻求一种系统的方法来设计专门针对未知受控对象的迭代学习控制律。假设 2:对和的偏导数都是连续且一致有界的。假设 3:在迭代域中满足广义利普希茨条件,且如果,则存在一个未知常数b10,使得(4)式中,。整数和分别表示式(3)的跟踪误差和控制输入的线性化长度常数。定理 1:对于满足假设 1 和假设 2 的理想学习控制器式(3),如果,那么式(3)可以等价地变换为下面的动态线性化学习控制器(dynamic linearization learning controller,DLLC)9
12、(5)式中,是未知的学习控制增益。根据假设 2 和假设 3 的一致有界性,可得学习控制增益也是有界的9。式(5)和式(3)在数学表达上是等价的,这意味着如果把式(5)应用于系统(1),它可以提前一步驱动等于零,从这个角度上来说,在考虑控制器的设计过程中,全局的优化性能已经被考虑在内。已知假设 2显示了一般学习控制器的常见条件,它适用于许多迭代学习控制方法,如线性型迭代学习控制和自适340796(总第 48-)式中,和 代表步长因子,加入、使该算法具有更强的灵活性和一般性。为了增加估计算法式(7)对时变参数的跟踪能力,设置如下重置算法如果,那么,如果,那么(8)对设置重置是因为它是控制器增益,值
13、既不能太大,也不能太小。算法式(7)中,是未知的,为了估计的值,此处考虑如下准则函数(9)式中,代表权重因子。令,得(10)式中,代表步长因子。同样为了使估计算法式(9)对时变参数具有跟踪能力,设置如下重置算法如果或者,那么(11)根据式(10)和式(11),的估计值即式(7)可重写为应迭代学习控制10-11。假设 3 表明控制器输出的无界变化不能由先前迭代中 e()和 u()的有界变化产生。许多方法,如 P 型迭代学习控制和牛顿型迭代学习控制12,都满足这些假设。2学习控制系统设计所得到的 DLLC 式(5)在数学表达式上是式(3)的等价,且受控系统式(1)的非线性包含在学习控制增益向量中,
14、因此,可以被认为是一个非线性函数。为了估计 DLLC 式(5)中的可以使用估计算法,例如投影算法13。然而,当受控设备式(1)的物理动态具有强非线性和时变结构、顺序和参数时,这种参数估计算法可能导致较差的跟踪性能。本文为了估计,设计如下准则函数(6)式中,是权重因子,用来限制控制输入量的变化。等式右边的第 1 项是基于传统的参数估计准则函数即最小化真实值与估计值之差的平方,然而,仅仅应用此类准则函数推导出的估计算法,其参数估计值会对某些不准确的采样数据过于敏感,基于此,设计了等式右边的第 2 项。此外,等式右边的第2 项包含了跟踪误差,即在设计控制增益时,考虑了全局的优化性能。令,得(7)根据
15、式(12),式(5)可重写为(13)式(8)、式(10)式(13)共同组成了系统的学习控制律,本文称其为基于动态线性化学习控制器的改进的无模型自适应迭代学习控制(improved modelfree adaptive iterative learning control based on dynamiclinearization learning controller,IMFAILC-DLLC)。与现有的数据驱动控制方法相比,所提出的方法的主要优点在于,通过基于所建立的动态线性化数据模型优化控制目标函数,以系统的方式设计学习控制器,独立于被控对象的动态特性,并且沿着迭代轴使用动态线性化方法直接
16、构造,而不是间接地基于对象的特定模型。另一个改进是利用 IM-FAILC 方案对理想学习控制器增益进行自适应逼近,提高了被控对象的跟踪性能。3仿真本章给出了两个例子来证明 IMFAILC-DLLC迭(12)徐通福等:基于控制器动态线性化的数据驱动 ILC350797(总第 48-)火 力 与 指 挥 控 制2023 年第 5 期对于 IMFAILC-DLLC ILC、MFAILC、RBF-DLLCILC 3 种算法,系统初始的输入和输出分别设置为和9。本次仿真,设置 T=1 000,imax=100。对于IMFAILC-DLLC ILC,设 置 c1=0.65,c2=5,=10-5,=1,=0
17、.1,=0.3,=1。参数的选取类似于许多优化算法,通过反复试验以特定方式确定。图 1 图 3 是 IMFAILC-DLLC 迭代学习控制、RBF-DLLC 迭代学习控制和无模型自适应迭代学习控制在第 1,20,40 和 100 次迭代时的跟踪性能。第 1 次迭代的跟踪误差由无模型自适应控制产生,以保证 3 种迭代学习控制方法具有相同的跟踪性能。结果表明,IMFAILC-DLLC 迭代学习控制与RBF-DLLC 迭代学习控制在第 20 次迭代后的大部分时间间隔内具有令人满意的跟踪性能,而无模型迭代学习控制与期望轨迹仍有较大偏差,特别是在500 时刻以前。3 种 ILC 方法的学习性能如下页图
18、4 所示,其中纵轴是的最大绝对值。即。结果表明,IMFAILC-DLLC 迭代学习控制算法的收敛速度是 3 种迭代学习控制方法中最快的。图 1 图 4 的仿真结果表明,对于参数、阶数和结构随时间变化的复杂非线性 SISO 系统,所提出的 IMFAILC-DLLC 迭代学习控制优于 RBF-DLLC迭代学习控制和无模型自适应迭代学习控制。代学习控制的有效性。第 1 个例子是在一个复杂的非线性 SISO 系统上进行的,该系统具有时变的参数、阶数和结构。第 2 个例子是通过一个类似于高速列车模型进行的,这是一个典型的非线性 SISO 系统9。为了与本文提出的 IMFAILC-DLLC 迭代学习控制相
19、比,MFAILC14和 RBF-DLLC 迭代学习控制9也用于这两个例子。此外,初始控制器和被控对象的输入输出数据通过无模型自适应控制来产生15。3.1数值仿真考虑以下非线性系统9(14)式中,是时变参数。期望输出为(15)图 1IMFAILC-DLLC ILC 跟踪性能Fig.1Tracing performance of IMFAILC-DLLCILC图 2RBF-DLLC ILC 跟踪性能Fig.2Tracing performance of RBF-DLLC ILC图 3MFAILC 跟踪性能Fig.3Tracing performance of MFAILC360798(总第 48-
20、)图 4迭代过程最大误差Fig.4Maximum error of iterative process3.2高速列车模型仿真高速列车的动态离散时间模型如下所示9(16)其中,系统输出 v(k)(m/s)是高速列车的速度,控制输入 F(k)(N/kg)是单位质量上的牵引/制动力,ts=1(s)是采样时间,fb(k)(N/kg)表示单位质量上的基本阻力,fa(k)(N/kg)表示特定线路中单位质量上的附加阻力。(17)式中,a(k)是滚动阻力系数;b(k)是与摩擦和列车振动相关的阻力系数;c(k)是空气动力阻力系数。(18)式中,kg 表示列车的总质量。设置 c1=0.5,c2=2,=10-5,=
21、1,=0.1,=0.1,=1。对 于 IMFAILC-DLLC 迭 代 学 习 控 制、RBF-DLLC 迭代学习控制和无模型自适应迭代学习控制,高速列车的速度跟踪性能分别如图 5 图 8 所示,其中,vd为高速列车的期望速度。仿真结果表明,迭代 3 次后,3 种迭代学习控制方法都表现出了出色的跟踪性能,经过 10 次迭代后,IMFAILC-DLLC 迭代学习控制和 RBF-DLLC 学习控制的收敛误差分别从大于 5 m/s 降低到小于0.015 m/s,以及从大于 5 m/s 降低到小于 0.03 m/s,而MFAILC 的收敛误差在 10 次迭代后仍大于 0.1 m/s,如图 8 所示。实
22、验还表明,经过 10 次迭代后,IM-FAILC-DLLC 迭代学习控制和 RBF-DLLC 迭代学习控制的收敛误差接近。由此可以看出,对于控制输入饱和的高速列车模型,所提出的 IMFAILC-DLLC 迭代学习控制比 RBF-DLLC 迭代学习控制和自适应迭代学习控制具有更好的跟踪和学习性能。图 5IMFAILC-DLLC ILC 跟踪性能Fig.5Tracing performance of IMFAILC-DLLC ILC图 6RBF-DLLC ILC 跟踪性能Fig.6Tracing performance of RBF-DLLC ILC图 7MFAILC 跟踪性能Fig.7Traci
23、ng performance of MFAILC图 8迭代过程最大误差Fig.8Maximum error of iterative process徐通福等:基于控制器动态线性化的数据驱动 ILC370799(总第 48-)火 力 与 指 挥 控 制2023 年第 5 期4结论本文研究了一种新的数据驱动迭代学习控制方案。通过将 DL 技术应用于迭代域中的未知理想学习控制器,系统地设计了具有动态结构的迭代学习控制律。应用改进的无模型自适应迭代学习控制算法,对包含在学习控制增益向量中的受控系统的非线性进行估计,仿真结果表明,所提出的数据驱动迭代学习控制方案具有优异的跟踪性能和良好的收敛速度。参考文
24、献:1 杨亮亮,袁锐,史伟民,等.基于数据驱动的自适应最优迭代学习控制研究 J.机械工程学报,2021,57(17):207-216.YANG L L,YUAN R,SHI W M,et al.Research on adap-tive optimal iterative learning control based on data drivenJ.JournalofMechanicalEngineering,2021,57(17):207-216.2 袁海国,秦光耀,王鹏宇.基于模糊迭代学习控制的机器人轨迹跟踪 J.河南科技,2021,40(3):31-33.YUAN H G,QIN G Y
25、,WANG P Y.Robot trajectory track-ing based on fuzzy iterative learning control J.Henan Sci-ence and Technology,2021,40(3):31-33.3 王建新,郑浩.基于迭代学习控制的划片机高精度运动误差补偿 J.微处理机,2021,42(1):58-61.WANG J X,ZHENG H.Error compensation for high-pre-cision motion of dicing saw based on iterative learning con-trol J.M
26、icrocomputers,2021,42(1):58-61.4 王淳,郭兰杰,鄢南兴,等.红外相机扫描镜轨迹跟踪的迭代学习控制方法 J.红外与激光工程,2021,50(3):173-181.WANG C,GUO L J,YAN N X,et al.Trajectory trackingcontrol for scanning mirror of infrared camera based on iter-ative learning algorithm J.Infrared and Laser Engineer-ing,2021,50(3):173-181.5 何之煜,徐宁.非参数化迭代学习
27、控制的列车自动驾驶控制算法 J.铁道学报,2020,42(12):90-96.HE Z Y,XU N.Research on automatic train operation algo-rithm based on non-parametric iterative learning control J.Journal of the China Railway Society,2020,42(12):90-96.6 李佳伟,林娜,池荣虎.基于遗忘因子的数据驱动最优迭代学习控制算法研究 J.南京信息工程大学学报(自然科学版),2021,13(5):582-588.LI J W,LIN N,CHI
28、 R H.Forgetting factor based da-ta-driven optimal iterative learning control J.Journal ofNanjing University of Information Science&Technology(Natural Science Edition),2021,13(5):582-588.7 薄雨蒙,曹明生,高慧斌.结合前馈调参与迭代学习的数据驱动控制方法 J.控制理论与应用,2020,37(6):1367-1376.BO Y M,CAO M S,GAO H B.A data-driven controlmeth
29、od combining feedforward tuning and iterative learningJ.Control Theory&Applications,2020,37(6):1367-1376.8 梁建智,邱彪,陈宇燕,等.基于数据驱动的数控机床自适应迭代学习控制 J.机床与液压,2021,49(8):50-54.LIANG J Z,QIU B,CHEN Y Y,et al.Data-driven adaptiveiterative learning control for CNC systems J.Machine Tool&Hydraulics,2021,49(8):50-
30、54.9 YU X,HOU Z,POLYCARPOU M M.Controller-dynam-ic-linearization-based data-driven ILC for nonlinear dis-crete-time systems with RBFNN J.IEEE Transactions onSystems,Man,andCybernetics:Systems,2021,52(8):1-12.10 汪磊,杨慧中,陶洪峰.有限频域线性重复过程的动态迭代学习控制 J.控制与决策,2021,36(3):599-608.WANG L,YANG H Z,TAO H F.Dynamic
31、 iterative learn-ing control for linear repetitive processes over finite fre-quency ranges J.Control and Decision,2021,36(3):599-608.11 高艳芳,贺兴时,耿燕.基于伪逆模型的线性系统自适应迭代学习控制 J.纺织高校基础科学学报,2021,34(2):102-107.GAO Y F,HE X S,GENG Y.Adaptive iterative learningcontrol for linear systems based on pseudo-inverse
32、modelJ.Basic Sciences Journal of Textile Universities,2021,34(2):102-107.12 窦建君,李苏北,张克军.分数阶线性连续切换系统 P型迭代学习控制的鲁棒性 J.数学的实践与认识,2021,51(20):186-194.DOU J J,LI S B,ZHANG K J.Robustness of P type itera-tive learning control for a class of fractional-order linearcontinuous-timeswitchedsystem J.Mathematicsi
33、n Prac-tice and Theory,2021,51(20):186-194.13 杨海斌.一种基于改进仿射投影算法的判决反馈均衡器 J.现代计算机,2021,18(1):16-19.YANG H B.An improved affine projection algorithm fordecision feedback equalizer J.Modern Computer,2021,18(1):16-19.14 梁建智,谢祥强,杨铭,等.数控机床位置伺服系统的无模型自适应迭代学习控制 J.机床与液压,2020,48(13):124-128.LIANG J Z,XIE X Q,YAN
34、G M,et al.Model-free adap-tive iterative learning control of CNC machine tool positionservo systemJ.Machine Tool&Hydraulics,2020,48(13):124-128.15 任凯,高传强,张伟伟.翼型激波抖振的无模型自适应控制 J.空气动力学学报,2021,39(6):149-155.REN K,GAO C Q,ZHANG W W.Model-free adaptivecontrol of shock buffet flow over an airfoil J.Acta Aero-dynamica Sinica,2021,39(6):149-155.380800