1、基于 PID 型迭代学习控制的列车自动驾驶曲线跟踪算法研究王锡奎1,黄克勇1,李亚楠2(1.南京铁道职业技术学院通信信号学院,南京210031;2.中国联合网络通信集团有限公司江苏分公司云网运营中心,南京210008)摘要:针对基于比例微分积分(PID,ProportionalIntegralDerivative)控制的列车速度跟踪算法在跟踪进度、收敛性和稳定性等方面存在的不足,提出一种基于 PID 型迭代学习控制(ILC,IterativeLearningControl)的列车自动驾驶(ATO,AutomaticTrainOperation)曲线跟踪算法。通过迭代学习控制,优化跟踪过程,减小
2、跟踪误差,缩短收敛时间;设置典型场景对所设计的算法进行仿真试验,并将仿真结果与基于 PID 控制算法的跟踪效果进行对比分析。结果表明,PID 型 ILC 算法对列车目标速度和目标位移具有较高的跟踪精度,能够在有限的迭代次数内实现精确跟踪,验证了所提算法的有效性。关键词:比例微分积分(PID);迭代学习控制(ILC);列车自动驾驶(ATO);曲线跟踪算法;跟踪误差中图分类号:U284.48:TP39文献标识码:ADOI:10.3969/j.issn.1005-8451.2023.10.01Curve tracking algorithm for automatic train operation
3、 based on PID-typeiterative learning controlWANGXikui1,HUANGKeyong1,LIYanan2(1.SchoolofCommunicationandSignal,NanjingInstituteofRailwayTechnology,Nanjing210031,China;2.CloudNetworkOperationCenter,UnitedNetworkCommunicationsCo.,LTD.JiangsuBranch,Nanjing210008,China)Abstract:Toaddresstheshortcomingsof
4、trainspeedtrackingalgorithmsbasedonproportionalintegralderivative(PID)controlintrackingprogress,convergence,andstability,thispaperoriposedaPIDbasediterativelearningcontrol(ILC)based automatic train operation(ATO)curve tracking algorithm.The paper optimized the tracking processthroughiterativelearnin
5、gcontrol,reducedtrackingerrors,andshortenconvergencetime,setuptypicalscenariostoconductsimulationexperimentsonthedesignedalgorithm,andcomparedandanalyzedthesimulationresultswiththetrackingeffectofthePIDcontrolalgorithm.TheresultsshowthatthePIDILCalgorithmhashightrackingaccuracyfortraintargetspeedand
6、targetdisplacement,andcanachieveprecisetrackingwithinalimitednumberofiterations,provingtheeffectivenessoftheproposedalgorithm.Keywords:ProportionalIntegralDerivative(PID);IterativeLearningControl(ILC);AutomaticTrainOperation(ATO);curvetrackingalgorithm;trackingerror高速列车运行速度快,运行环境复杂多变,其运行控制系统易受内外部未知因
7、素的干扰,呈现出快时变、强非线性的特征。因此,亟需设计一种智能化的列车自动驾驶(ATO,AutomaticTrainOperation)控制器,以保证对列车运行的精确控制。现阶段,有关 ATO 控制算法的研究已取得大量成果,以比例微 分 积 分(PID,Proportional Integral Derivative)算法为代表,可将滑模控制1、预测控制2-3、模糊控制4、神经网络5-6等算法与 PID 相结合,用于解决列车速度自动控制精度不足、稳定性不高等问题。然而,上述方法均存在一定的局限性,如 PID 算法以线性近似列车速度控制中的非线性因素,无法保收稿日期:2023-04-12基金项目
8、:江 苏 省 高 等 学 校 基 础 科 学(自 然 科 学)面 上 项 目(21KJD580001);南 京 铁 道 职 业 技 术 学 院 优 秀 科 技 创 新 团 队(CXTD2022003)作者简介:王锡奎,讲师;黄克勇,教授级高级工程师。第32卷 第10期Vol.32 No.10研究与开发Research and Development文章编号:1005-8451(2023)10-0001-06RCA2023.10 总第 319 期1证控制精度;滑模控制、预测控制、模糊控制、神经网络等算法的控制规则和参数的设计与调整需要丰富的实际系统开发经验,要求较高。高速列车在运行过程中具有重复
9、性的特征,具体体现在列车的运行环境、运行计划、运行目标、运行工况、动力学模型、运行速度及轨迹跟踪等方面。迭代学习控制(ILC,IterativeLearningControl)是一种对以重复模式工作的系统进行跟踪控制的方法,主要适合于具有高度重复性特征的被控对象的控制器设计7。目前,ILC 已在航空、轨道交通等领域得到了较为广泛的应用。如文献 8 采用智能 PD型 ILC 算法解决了园区固定路段的清扫车路径跟踪问题;文献 9 提出了一种迭代控制与滑模控制相融合的策略,实现了机械臂对目标轨迹的精确跟踪;文献 10 设计了基于 ILC 的差分微分参数计算律,以减小时域和迭代域上的跟踪误差;文献 1
10、1 提出了一种无模型自适应 ILC 容错控制策略,用于解决高速列车速度轨迹跟踪问题;文献 12 提出了一种新的 ILC 方案,以保证高速列车运行控制的安全性和舒适性;文献 13 提出了一种将 ILC 和集体更新策略相结合的集体学习控制算法,可提高系统的自主学习能力。基于以上研究,本文提出基于 PID 型 ILC 的ATO 曲线跟踪算法,以期实现对列车目标速度和目标位移的精确跟踪,并通过典型场景,仿真其跟踪精度和收敛速度,验证了算法的有效性。1 问题概述高速列车的运行是一个连续复杂的过程,与人、系统和环境存在紧密的关联,通常可以将该过程抽象为一个非线性的多目标优化问题。ATO 系统需要具备对列车
11、速度自动调整的功能,从而精确跟踪列车速度防护曲线,减少列车在牵引、制动和惰行等工况之间的切换,提高列车的准点率、停车精度、舒适性,降低司机的工作强度。列车运行动力学模型是 ATO 系统中用于计算列车运行目标速度的基础,该模型如公式(1)(4)所示。dvdt=uw(v)g(s)(1)dsdt=v(2)w(v)=cav2+cvv+c0(3)g(s)=lsin(s)(4)v(0)=0s(0)=0w(v)g(s)scacvc0cacvc0式中,t 表示时间,s;v 表示列车运行速度,m/s,;s 表示列车运行距离,m,;u是 ATO 系统作用在单位质量上的牵引力或制动力,N/kg;表示单位质量上列车所
12、受的基本阻力,N;是列车所受的单位附加阻力,N;l 为经验常数,通常取重力加速度;为位置 s 处的线路坡度,;表示空气阻力常数;表示机械阻力常数;表示车轮滚动和滑动阻力常数;、均为经验常数。w(v)由式(3)可知,基本阻力包含与列车速度的二次方相关项,具有典型的非线性特征。非线性系统的控制器设计需要尽可能保留非线性部分,以提高控制器的精度。因此,本文将 PID 与 ILC 算法相结合,在初始状态一致的情况下,可以实现对于给定的列车超速防护速度曲线的精确跟踪,当迭代次数趋于无限大时,跟踪误差可以收敛到 0。2 算法设计速度曲线追踪的控制目标是使列车运行动力学模型中的控制量(列车运行速度 v 和位
13、移 s)能够精确地跟踪目标速度轨迹和目标位移轨迹。因此,在设计迭代学习控制器之前,须先确定 ATO 系统第 k次迭代时的跟踪误差。在列车运行区间中选择一段有限的时间区间0,T,通常可设 T 为列车在两个相邻站点间的运行时间。假定列车在该区间上重复运行,将列车的运行速度 v 和位移 s 作为 ATO 系统的两个状态,可以将公式(1)(4)表述为 ATO 系统的状态空间模型,当其迭代到第 k 次时,ATO 系统算法为(vk(t)sk(t)=(cav2k(t)+cvvk(t)+c0)g(sk(t)vk(t)+(10)uk(t)(5)yk(t)=vk(t)sk(t)(6)研究与开发2023年10月RC
14、A22023.10 总第 319 期vk(t)sk(t)vk(t)sk(t)uk(t)yk(t)式中,t 为时间变量,s;为第 k 次迭代的列车运行速度,m/s;为第 k 次迭代的列车运行位移,m;和分别为速度和位移的一阶导数,表示速度和位移的变化率;为 ATO 系统控制输入量,即 ATO 系统作用在单位质量上的牵引力或制动力;为 ATO 系统输出。ek(t)将系统的跟踪误差定义为ek(t)=ek,1(t)ek,2(t)=vk(t)vd(t)sk(t)sd(t)(7)ek,1(t)ek,2(t)vd(t)sd(t)式中,为速度跟踪误差,m/s;为位移跟踪误差,m;为目标速度,m/s;为目标位移
15、,m。基于 ILC 的理念,设计迭代学习控制律公式为uk+1(t)=uk(t)+ek(t)+ek(t)+wt0ek()d(8)=12ek(t)=12 ek(t)=12rt0ek()d式中,为关于误差的迭代学习增益;为误差变化率的迭代学习增益;为误差积分项的学习律。通过在该控制器的迭代学习律中加入误差变化率和误差积分项,使得 ATO 系统在多次迭代之后可实现列车运行轨迹的精确跟踪。3 仿真与分析通过典型场景对本文提出的 PID 型 ILC 算法进行仿真,并将仿真结果与 PID 控制结果进行对比分析,进而验证本文算法的有效性。3.1 控制器搭建cacvc0本次仿真在 Matlab(2018b)软件
16、环境下进行。公式(3)中的运行阻力参数、均为随列车动态运行和外界环境变化的未知时变参数,在 ATO系统控制器设计时通常采用经验常数。本文采用实际运营的高速铁路 CRH-3 型动车组部分技术参数作为仿真场景中的列车参数,如表 1 所示。3.2 仿真环境设计列车的运行仿真线路及其参数设置如下:(1)仿真中的线路总长为 99.95km,线路中的最大坡度为 10,坡道长度为 12.85km,此外还包括一段坡度为 7、长度为 4.1km 的线路,仿真线路及其参数如图 1 所示。38.5km12.85km39.4km4.1km5.1km107图1仿真线路及其参数ssin(s)s由于公式(4)中的通常为千分
17、率级,因此,可认为,取经验值 l 为标准重力加速度9.8m/s2,将图 1 中的坡度数据代入公式(4)可得到坡度附加阻力。(2)列车在仿真线路上运行需要有时刻表的约束,仿真运行时间 T 为 1460s,列车在 0,T 内运行的目标速度曲线公式为vd(t)=0.4tt 0,200)80t 200,620)800.5(t620)t 620,640)70t 640,850)70+0.2(t850)t 850,900)80t 900,1 300)800.5(t1 300)t 1 300,1 460(9)列车在 0,T 内的目标位移轨公式为sd(t)=0.2t2t 0,200)8 000+80(t200
18、)t 200,620)41 6000.25(t620)2+80(t620)t 620,640)43 100+70(t640)t 640,850)57 800+0.1(t850)2+70(t850)t 850,900)61 550+80(t900)t 900,1 300)93 5500.25(t1 300)2+80(t1 300)t 1 300,1 460(10)ts(3)本文设计的 ILC 算法是基于迭代域和时间域的,其中,反馈控制是在时间域上实现的;迭代学习控制是在迭代域上实现的。为保证仿真过程中的数据采样精度,将采样时间 设置为 0.1s。表1高速铁路 CRH-3 型动车组部分技术参数参数
19、取值编组长度200.67m编组重量380tca0.0166Nh2/(km2t)cv0.228Nh/(kmt)c07.75N/t最高运营速度350km/h平均起动加速度0.38m/s2第32卷 第10期王锡奎等:基于 PID 型迭代学习控制的列车自动驾驶曲线跟踪算法研究研究与开发RCA2023.10 总第 319 期3=0.50.5=0.050.05=0.010.01(4)经 过 反 复 试 验,选 取 迭 代 学 习 增 益,则迭代学习律公式为uILCk+1(t)=uk(t)+(0.50.5)ek(t)+(0.050.05)ek(t)+(0.010.01)wt0ek()d(11)(5)为方便比
20、较控制算法的性能优劣,将 PID算法与本文提出的 PID 型 ILC 算法在收敛速度、跟踪误差等方面进行比较。PID 控制算法控制律公式为uPID(t)=Kpe(t)+Kiwt0e()d+Kde(t)(12)KpKpKiKiKdKd式中,为比例项增益,=5;为积分项增益,=0.1;为微分项增益,=1014。(6)为量化比较控制算法的跟踪精度,定义跟踪误差率公式为re=|ydyr|yd100%(13)ydydyrre式中,为目标值,且0;为实际值;的取值保留小数点后 2 位。3.3 仿真结果分析在公式(11)所示的 PID 型迭代学习控制器和公式(12)所示 PID 控制器中运行上述仿真场景,可
21、得到速度跟踪轨迹和位移跟踪轨迹,分别如图 2、图 3 所示。3.3.1 速度跟踪结果分析图 2 给出了 PID 控制器对目标速度的跟踪轨迹和 PID 型迭代学习控制器在第 1 次、第 5 次、第 15次和第 30 次迭代时对目标速度的跟踪轨迹,以及第速度跟踪轨迹速度/(ms-1)时间/s图2速度跟踪轨迹位移跟踪轨迹位移/m时间/s图3位移跟踪轨迹研究与开发2023年10月RCA42023.10 总第 319 期re30 次迭代时在时间区间 197s,210s 和 610s,655s上的跟踪轨迹放大图。从图 2 中选取若干跟踪点,并根据公式(13)得到两种控制器第 30 次迭代后的速度跟踪误差率
22、,如表 2 所示。表2速度跟踪误差率分析时刻/s目标速度/(m/s)PID控制器速度/(m/s)rePID控制器速度PID型迭代学习控制器速度/(m/s)rePID型迭代学习控制器速度2008070.9811.28%79.600.50%205.28079.850.19%209.28079.860.18%244.48077.812.74%296.58079.620.48%619.580800%619.680800%627.376.3676.540.24%641.270700%684.97071.62.29%754.47070.110.16%由表 2 可知,PID 型 ILC 算法在第 30 次迭
23、代后的速度跟踪误差均小于 1%,明显优于 PID 算法;此外,对于相同的误差率,PID 型 ILC 算法的实现速率快于 PID 算法。3.3.2位移跟踪结果分析rere图 3 给出了 PID 控制器对目标位移的跟踪轨迹和 PID 型迭代学习控制器在第 1 次、第 5 次、第 15次和第 30 次迭代时对目标位移的跟踪轨迹,以及第30 次迭代时在时间区间810s,835s 上的位移跟踪轨迹放大图。由图可知,在 823.5s 时,目标位移为55940m,PID 控制器的跟踪位移为 54890m,误差为1050m,为 1.88%;PID 型迭代学习控制器的跟踪位移为 55870m,误差为 80m,为
24、 0.14%。3.3.3整体分析从图 2、图 3 可以看出,当迭代开始时,PID 型迭代学习控制器的跟踪轨迹与目标轨迹之间存在较大偏差;当迭代次数达到 15 次以上时,二者基本重合。PID 型迭代学习控制器最大跟踪误差绝对值与迭代次数的关系如图 4 所示。图4PID 型迭代学习控制器最大跟踪误差绝对值与迭代次数的关系由图 4 可知,PID 型迭代学习控制器的跟踪误差随着迭代次数的增加逐渐减小,当迭代次数达到 25次时,速度和位移跟踪误差接近于 0。综上,PID 型 ILC 算法通过学习列车运行的重复信息,可以快速接近目标速度和位移,实现精确跟踪。4 结束语本文分析了高速列车运行动力学模型,根据
25、列车运行过程中的重复性特征,设计了 ATO 曲线跟踪的 ILC 算法。将迭代学习控制律加入 PID 控制律中,通过学习跟踪过程中的误差因素和前次迭代的误差变化率,实现对期望轨迹的精确跟踪。此外,通过设置典型的仿真环境,利用真实的线路数据和列车参数对所设计算法的性能进行验证,并与现有算法进行对比。仿真结果表明,本文设计的算法具有更高的跟踪精度,随着迭代次数的增加,实际运行轨迹逐渐接近目标轨迹,跟踪误差逐渐减小,且最终收敛于零,从而证明了所提出的算法的第32卷 第10期王锡奎等:基于 PID 型迭代学习控制的列车自动驾驶曲线跟踪算法研究研究与开发RCA2023.10 总第 319 期5有效性和优越
26、性。参考文献杨艳飞,崔科,吕新军.列车自动驾驶系统的滑模PID组合控制J.铁道学报,2014,36(6):61-67.1杨宏阔,侯涛,陈昱.基于预测模糊PID控制算法的高速列车优化控制研究J.铁道运输与经济,2022,44(8):130-136.2王龙达,王兴成,刘罡,等.城市轨道列车速度曲线预测函数控制改进算法J.仪器仪表学报,2022,43(2):273-283.3唐博伟,李中奇,杨辉.基于自适应模糊终端滑模控制的高速列车速度跟踪C/第32届中国过程控制会议(CPCC2021)论文集,2021-07-30,太原.北京:中国自动化学会过程控制专业委员会,2021:903.4董昱,魏万鹏.基于
27、RBF神经网络PID控制的列车ATO系统优化J.电子测量与仪器学报,2021,35(1):103-109.5梁新荣,肖龙,王雪奇,等.高速列车速度跟踪神经网络 PID控 制 器 的 设 计 J.计 算 机 工 程 与 应 用,2021,57(10):252-258.6ArimotoS,KawamuraS,MiyazakiF.BetteringoperationofRobotsbylearningJ.JournalofRoboticSystems,1984,1(2):123-140.7姚文龙,庞震,池荣虎,等.基于智能PD型迭代学习控制的清扫车路径跟踪控制J.青岛科技大学学报(自然科学版),20
28、22,43(1):105-110.8孟琪迪,南新元,张永兴.基于PD型迭代学习的机械臂轨迹跟踪控制J.组合机床与自动化加工技术,2022(11):62-65,69.9何之煜,徐宁.非参数化迭代学习控制的列车自动驾驶控制算法J.铁道学报,2020,42(12):90-96.10GaoG,JinS,WangQ.Modelfreeadaptiveiterativelearningfault-tolerantcontrolforhigh-speedtrainswithspeedandinputconstraintsC/2021 IEEE 10th Data Driven Control andLear
29、ning Systems Conference(DDCLS),25 June 2021,Suzhou,China.NewYork:IEEE,2021:866-870.11HuangDD,HuangTF,ChenCR,etal.Iterativelearningcontrol for high-speed trains with velocity and displacementconstraintsJ.InternationalJournalofRobustandNonlinearControl,2022,32(6):3647-3661.12MeindlM,MolinariF,LehmannD,etal.Collectiveiterativelearning control:Exploiting diversity in multi-agent systemsforreferencetrackingtasksJ.IEEETransactionsonControlSystemsTechnology,2022,30(4):1390-1402.13何之煜.自适应迭代学习控制在列车自动驾驶系统中的应用D.北京:中国铁道科学研究院,2019.14责任编辑朱一研究与开发2023年10月RCA62023.10 总第 319 期