收藏 分销(赏)

未知扰动下的无人艇编队优化轨迹跟踪控制.pdf

上传人:自信****多点 文档编号:2501179 上传时间:2024-05-30 格式:PDF 页数:13 大小:4.23MB
下载 相关 举报
未知扰动下的无人艇编队优化轨迹跟踪控制.pdf_第1页
第1页 / 共13页
未知扰动下的无人艇编队优化轨迹跟踪控制.pdf_第2页
第2页 / 共13页
未知扰动下的无人艇编队优化轨迹跟踪控制.pdf_第3页
第3页 / 共13页
亲,该文档总共13页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、本文网址:http:/www.ship- J.中国舰船研究,2024,19(1):178190.WANG N,LIU Y J,GAO Y.Optimal trajectory tracking control of unmanned surface vehicle formation under unknowndisturbancesJ.Chinese Journal of Ship Research,2024,19(1):178190(in both Chinese and English).未知扰动下的无人艇编队优化轨迹跟踪控制扫码阅读全文王宁*1,刘永金2,高颖21 大连海事大学 轮机工

2、程学院,辽宁 大连 1160262 大连海事大学 船舶电气工程学院,辽宁 大连 116026摘 要:目的目的针对水面无人艇(USV)编队轨迹跟踪中存在的未知扰动和队形变化问题,提出一种基于有限时间扰动观测器的最优反步控制(FDO-OBC)方法。方法方法首先,基于虚拟结构法,建立无人艇编队控制框架,并设计运动学和动力学编队控制器;其次,设计有限时间扰动观测器,实时估计补偿未知环境扰动;然后,针对编队队形变化的轨迹跟踪问题,提出基于最优反步控制的动态轨迹优化策略,利用扰动观测器信息来计算最优控制输入,实现无人艇编队轨迹跟踪的动态优化;最后,采用李雅普诺夫稳定性理论证明该编队控制方法的稳定性。结果结

3、果仿真对比结果表明,FDO-OBC 策略可有效提高无人艇编队系统的精确性和鲁棒性。结论结论对于面向扰动环境下的无人艇编队控制系统设计,FDO-OBC 方法提供了一种新的技术手段。关键词:水面无人艇;编队控制;有限时间扰动观测器;最优反步中图分类号:U664.82文献标志码:ADOI:10.19693/j.issn.1673-3185.03348 Optimal trajectory tracking control of unmanned surface vehicleformation under unknown disturbancesWANG Ning*1,LIU Yongjin2,GA

4、O Ying21 College of Marine Engineering,Dalian Maritime University,Dalian 116026,China2 College of Marine Electrical Engineering,Dalian Maritime University,Dalian 116026,ChinaAbstract:ObjectiveA finite-time disturbance observer-based optimal backstepping control(FDO-OBC)method is proposed for the iss

5、ue of unknown disturbances and formation changes in the formation trajectorytracking of unmanned surface vehicles(USVs).MethodsFirst,the USV formation control framework isestablished on the basis of the virtual structure method,and the kinematics and dynamics formation control-lers are designed.Seco

6、nd,a finite-time disturbance observer is introduced to estimate and compensate for un-known environmental disturbances in real time.Further,a dynamic trajectory optimization strategy based onoptimal backstepping control is proposed for the trajectory tracking issue of formation change,and the inform

7、-ation of the disturbance observer is used to calculate the optimal control input and achieve the dynamic optim-ization of USV formation trajectory tracking.Finally,Lyapunov stability theory is used to demonstrate the sta-bility of the designed formation control method.ResultsThe simulation results

8、indicate that the proposedcontrol strategy can effectively improve the accuracy and robustness of the USV formation system.Conclu-sionThe FDO-OBC method provides a new technical means for the design of USV formation control sys-tems under unknown environmental disturbances.Key words:unmanned surface

9、 vehicles;formation control;finite-time disturbance observer;optimal back-stepping收稿日期:20230505 修回日期:20230806 网络首发时间:20240223 10:07基金项目:国家高层次人才支持计划项目(SQ2022QB00329);国家自然科学基金资助项目(U23A20680,52271306);国防基础科研计划资助项目(JCKY2022410C013);中央引导地方科技发展专项资金项目(2023JH6/100100010);大连市科技创新基金重大基础研究资助项目(2023JJ11CG009);中

10、央高校基本科研业务费专项资金资助项目(3132023501)作者简介:王宁,男,1983 年生,博士,教授,博士生导师。研究方向:自主海洋机器人。E-mail:n.wangieee.org刘永金,男,1995 年生,硕士。研究方向:多无人艇轨迹跟踪控制。E-mail:高颖,女,1990 年生,博士。研究方向:无人船最优控制。E-mail:*通信作者:王宁 第 19 卷 第 1 期中 国 舰 船 研 究Vol.19 No.12024 年 2 月Chinese Journal of Ship ResearchFeb.2024 0 引言近年来,水面 USV(unmanned surface vehi

11、cle,USV)凭借其成本低、机动性高和操作方便等优点,已成为执行海洋资源勘探、水环境监测、海上巡游、水上搜救和垃圾处理等任务的重要工具1-3。然而,随着海洋空间水面无人作业任务逐渐朝着复杂化、规模化方向发展,单个 USV 在能力和效率方面更难以满足大范围作业的需求,而 USV 编队系统因其工作效率高、覆盖区域广以及容错性能强等优势,引起了国内外学者的广泛关注4-6。编队的轨迹跟踪控制是多 USV 协同控制的关键问题之一,其目标是在保持编队几何形状的前提下,控制 USV 群体运动。通过控制预设的编队布局或改变期望的编队机动轨迹,即可协调USV 集群中的个体运动,以适应不同的任务需求。然而,在实

12、际航行中往往存在风、浪、流等时变未知因素的干扰,这些因素将严重影响 USV 的控制精度和稳定性。为此,李贺等7针对复杂扰动下的 USV 编队控制问题,提出一种基于有限时间扰动观测器的固定时间编队控制策略,实现了复杂扰动情况下 USV 编队系统对期望轨迹的精准跟踪。考虑受系统初始状态和外部扰动影响的 USV编队控制问题,余明裕等8结合固定时间扰动观测器,提出一种领航跟随编队控制方法,有效解决了存在复杂未知扰动情况下的 USV 编队控制问题。周卫东等9针对存在时滞和未知扰动影响下的 USV 编队队形控制及变换问题,设计了一种基于自抗扰技术的 USV 航向和航速编队控制器,从而有效地提高了编队系统的

13、鲁棒性和抗干扰能力。考虑未知时变外部扰动以及船舶自身速度不可测量的问题,Yu 等10提出了鲁棒实时输出反馈控制策略,设计了基于有限时间扰动观测的分布式编队控制器,以保证在有限时间内对时变虚拟领航者的精确跟踪。目前,虽然已针对不同扰动情况下的 USV 编队系统提出了不同的控制策略,但均未考虑 USV编队队形变换的动态轨迹优化问题。然而,由于内河水道宽窄变化等因素,USV 编队在内河水域航行时往往需要在轨迹跟踪过程中进行适当的队列变换,才能满足内河水道的航行要求,因此,优化内河 USV 编队队形变换的跟踪轨迹,也是需要考虑的问题之一。最优控制技术可以在保证非线性系统稳定的同时满足系统动态结构变化的

14、控制指标最优,一般可通过利用哈密尔顿雅克比贝尔 曼(HamiltonJacobiBellman equation,HJB)方程的解来设计11-13,然而,由于船舶动力学固有的非线性和复杂性,采用传统的最优控制方法求解HJB 方程时往往会造成“维数灾难”的问题14。强化学习是一种自学习优化方法,智能体通过与环境持续互动并调整其控制策略来优化累积收益,从而有效学习 HJB 方程的解,使得智能体控制在满足最优性原理的同时避免了维数灾难问题,因此,近年来也涌现了大量关于强化学习优化控制的研究成果15-19。Shinde 等20针对同质机器人的理想几何构型与控制问题,提出了一种基于强化学习的分布式编队控

15、制策略,其通过执行评判(ActorCritic)体系结构进行局部学习,最终实现了 同 构 机 器 人 编 队 系 统 的 全 局 渐 近 稳 定。Wang 等21提出了一种基于数据驱动的无模型强化学习控制方案,使 USV 在航行过程中仅基于输入/输出信号即可通过执行器评判器神经网络体系结构来自学习 USV 模型,从而通过数据驱动的形式实现 USV 轨迹跟踪的最优控制。Wen 等22提出了一种名为最优反步的新技术,其将基于执行器评判器强化学习框架的自适应动态规划技术融合到反步控制中,实现了严格反馈非线性系统的最优跟踪控制。然而,由于未知扰动环境下的 USV 编队系统具有高非线性和强耦合性,所以还

16、需进一步深入研究 USV 编队系统的最优轨迹跟踪控制问题。基于上述研究成果,本文拟提出一种基于有限时间扰动观测器的最优反步控制(finite-time dis-turbance observer-based optimal backstepping control,FDO-OBC)策略,旨在解决 USV 编队轨迹跟踪中存在的未知扰动和队形变化问题。首先,基于虚拟结构法,实现 USV 编队成员之间的位置和速度同步;其次,设计有限时间扰动观测器,实时估计补偿未知环境扰动;然后,将自适应动态规划与反步法相结合,提出基于最优反步控制的动态轨迹优化策略,利用扰动观测器信息来计算最优控制输入,以实现 US

17、V 编队轨迹跟踪的动态优化;最后,通过开展仿真实验,验证本文控制策略可以有效提高 USV 编队系统的精确性和鲁棒性。1 问题描述 1.1 关键引理引引理理 123:考虑式(1)所示的非线性系统:x(t)=f(x,t)(1)x(t)f(x,t)x(0)xx RnT(,x(0)t T(,x(0)x(t)Rn式中:表示系统状态,其中 t 为时间;为非线性函数。若,且为紧集,存在2 个正常数 和,对于,满足,则上述系统的解是半全局最终一致有界的,其中为 n 维欧几里得空间(n 为系统阶数)。第 1 期王宁等:未知扰动下的无人艇编队优化轨迹跟踪控制179kk引引理理 224:若存在 2 个正数 和,并且

18、满足如下形式:kI wt+Tt(s)T(s)ds kI(2)(s)T 0t,t+T式中:I 为单位矩阵;为已知的系统结构,其中 s 为时间 t 的积分自变量。若存在常数,则在中满足持续激励。J(t)J(0)J(t)aJ(t)+c引引理理 325:设定连续正定函数,且其初值是有界的,若成立,而其中 a 和c 均为常数,则存在如下不等式:J(t)eatJ(0)+ca(1eat)(3)引引理理 426:考虑式(4)所示的系统:0=k0L1n+1|0|nn+1sign(0)+11=k1L1n?10?n1nsign(10)+2.n knLsign(nn1)+L,L(4)jjkj 0L 0式中:和分别为系

19、统状态及其导数,其中 j=0,1,n,且 n 为系统阶数;,为增益系数;,为系统参数。若系统满足上述式(4)的条件,则其可在有限时间内稳定并收敛至平衡点。1.2 USV 数学模型由于大多数 USV 的运动控制问题主要考虑其水平面的三自由度运动,因此,针对由 N 艘 USV组成的编队系统,第 i 艘 USV 的运动学模型和动力学模型为 i=R(i)i i=M1C(i)i+D(i)iidi(5)其中,R(i)=cosisini0sinicosi0001(6)M=m11000m22m230m32m33C()=00c13()00c23()c13()c23()0D()=d11()000d22()d23(

20、)0d32()d33()(7)i=1,2,.,NUSVi=xi,yi,iTUSVi(xi,yi)ii=ui,vi,riTUSViuiviriR(i)C(i)D(i)i=ui,vi,riTUSVidi=dui,dvi,driTUSVim11=mX um22=mY vm23=mxgY rm32=mxgN vm33=IzN rUSVixg(xg,yg)xgIzXYNUSVic13()=m11vm23r c23()=m11u d11()=XuX|u|u|u|Xuuuu2d22()=YvY|v|v|v|d23()=YrY|v|r|v|Y|r|r|r|d32()=NvN|v|v|v|N|r|v|r|d33

21、()=NrN|v|r|v|N|r|r|r|式中:,表示编队系统中的序号;,为惯性坐标系下的位置和航向角;,表示附体坐标系下的前向速度、横向速度以及艏摇角速度;为旋转矩阵;M 为惯性矩阵;为科里奥利向心力矩阵;为阻尼矩阵;,为的控制输入;,为的外部 扰 动;,其 中 m 为的 质量,为船舶重心在船体坐标系中 x 轴上的分量(船舶重心在船体坐标系上的位置与坐标原点存在一定位置偏差,由于船舶建造时左右对称,故 y 轴上的偏差为 0,但存在前后位置上的偏差);为系统转动惯量;,分别为作用于各个自由度上的水动力系数,下文同理不再赘述;,;,。期望轨迹的定义为 d=R(d)d d=M(t)1C(d)d+D

22、(d)dd(8)d=xd,yd,dT(xd,yd)dd=ud,vd,rdTudvdrdd=ud,vd,rdT式中:,为期望的位置和航向角;,为期望的前向速度、横向速度和艏摇角速度;,为期望的控制输入。1.3 编队策略OEXEYEoxy本文将采用虚拟结构法来实现 USV 的编队控制策略。首先,根据编队作业任务来设计虚拟结构,并定义虚拟结构的运动行为;然后,控制各艘 USV 来跟踪虚拟结构中的虚拟参考点,从而实现编队的队形保持。图 1 所示为 USV 编队结构与 跟 踪 误 差 图,其 中为 大 地 坐 标 系,为船体坐标系。dUSVidilii设计虚拟刚体结构时,需选取虚拟结构中的一点作为虚拟参

23、考点,并使该参考点按照期望轨迹运动。对于结构中任意虚拟的位姿,均可以采用相对于虚拟参考点的距离 和角度予以表示,如式(9)所示。di=d+R(d)li(9)di=xdi,ydi,diTUSViR(d)li=licosi,lisini,0Toxy式中:,为虚拟的位姿;为期望轨迹的旋转矩阵;,为坐标系下相对于虚拟参考点之间的虚拟结构点。180“无人船艇自主性技术”专辑第 19 卷USViUSViUSViUSVi定义为跟踪虚拟的 USV,则本文的编队控制问题即转化为如下式所示与虚拟之间的位姿跟踪误差镇定问题。ei(t)=i(t)di(t)(10)ei=R(i)xe,ye,eTxeyeeUSVi式中,

24、其中(,)和分别为的位置误差和艏向跟踪误差。eii(t)i(t)R3USViUSViei(t)设定子系统的虚拟控制输入为,其中,则与虚拟之间的速度跟踪误差为ei(t)=i(t)i(t)(11)i(t)USVi i(t)ei式中:为实际运动速度;为反步法第 1步基于位姿跟踪误差设计的估计最优控制律。本文的控制目标为:针对 USV 编队轨迹跟踪中所存在的未知扰动以及队形变化的问题,提出一种 FDO-OBC 方法,从而使系统在保持队形的前提下,同时保证 USV 编队快速、精确地跟踪期望轨迹。liiUSVi ii dilimt?idi?=01)运动学目标:给定相对于虚拟参考点的距离 和角度,通过对的速

25、度最优虚拟控制律进行选取,使,即。iUSVii ilimti i=02)动力学目标:通过选取适合的最优虚拟控制输入,从而使的实际运动速度,即。2 控制器的设计 2.1 模型变换i(t)=R(i)i(t)USVi为了便于设计,令,则式(5)中的模型可以改写为 i=i i=f(i,i)+i+i(12)f(i,i)=Co(i,i)i+Do(i,i)iUSViCo(i,i)=式中:,为坐标转换之后的系统非线性项,其中RM1C(R1i)R1Do(i,i)=RR1RM1D(R1i)R1i=RM1ii=RM1diR(i)C(i)D(i),且R,C,D 即式(5)中的,。根据式(10)、式(11)和式(12)

26、,系统跟踪误差可以表示为 ei=i di ei=i+Fe+i(13)Fe=f(i,i)i式中,。i?i?LL 0假设 1:编队控制子系统受到的外界干扰具有上界,且式(13)中的满足,其中,为未知常数。2.2 有限时间扰动观测器设计为了消除式(13)中的外部扰动项,以提高USV 编队的跟踪精度,设计了如下有限时间扰动观测器:z0i=i+Fe+0i z1i=1i z2i=2i(14)其中:0i=k0L1/3sig2/3(z0iei)+z1i1i=k1L1/2sig1/2(z1i0i)+z2i2i=k2Lsign(z2i1i)(15)z0ieiz1iiz2iikj 0j=0,1,2 L=diag(1

27、,2,3)sigm(x)=|x|msign(x)式中:为速度跟踪误差的估计值;为外界扰动的估计值;为外界扰动一阶导数的估计值;,表示增益系数,其中;,表示有限时间扰动观测器的参数;。定定理理 1:在满足假设 1 的条件下,为跟踪误差动态系统(式(13)所设计的有限时间扰动观测器(式(14),可以实现对外部扰动的准确观测,且观测误差将在有限时间内收敛至平衡点。e0ie1ie2i证明证明:定义观测器的观测误差,分别为e0i=z0ieie1i=z1iie2i=z2ii(16)对式(16)的等号两端进行求导,并结合式(14)和式(15),得 e0i=e1ik0L1/3sig2/3(e0i)e1i=e2

28、ik1L1/2sig1/2(e1i e0i)e2i=ik2Lsign(e2i e1i)(17)由引理 4 可知,式(17)可以在有限时间收敛,liiUSVixyxeyeeUSV11l1虚拟 USV1虚拟 USVi虚拟参考点oYEOEXE图 1USV 编队虚拟结构的示意图Fig.1 Virtual structure diagram of USV formation第 1 期王宁等:未知扰动下的无人艇编队优化轨迹跟踪控制181本文所设计的有限时间扰动观测器可在有限时间内对扰动进行观测,即z1i i(18)证毕。2.3 运动学控制器设计USViVi(ei)根据式(13)设计的位姿跟踪误差动态系统,

29、其最优代价函数为Vi(ei)=mini(i)wtri(ei,i)ds=wtri(ei,i)ds(19)ri(ei,i)=Teiei+iTii(t)R3ei(i)i式 中:,其 中,为子系统的虚拟控制;为可容许的控制策略集合;为最优虚拟控制。根据式(19)并结合最优控制理论,即可获得最优虚拟控制的 HJB 方程:Hi(ei,i,Viei)=Teiei+iTi+(Viei)T(i di)=0(20)H*i/i=0采用梯度下降法,即,即可获得最优虚拟控制策略为i=12Viei(21)Vi/eiVi(ei)由于无法直接求得式(21)中的,所以不能求出最优虚拟控制策略的值,因此,将最优代价函数重新设计为

30、Vi(ei)=i?ei?2+V0i(ei)(22)iV0i(ei)=i?ei?2+Vi(ei)式中:为一个设计的正常数;。V0i(ei)采用神经网络逼近,得V0i(ei)=WTiSi(ei)+i(ei)(23)Wi RnnSi(ei)Rni(ei)Rn式中:,为理想的神经网络权重,其中为神经元数;,为基函数向量;,为神经网络近似误差。Vi(ei)i基于式(23),代价函数和最优虚拟控制策略可以重新表示为Vi=i?ei?2+WTiSi(ei)+i(ei)i=iei12TSieiWi12iei(24)Vi通过采用式(24)神经网络逼近之后的和i,HJB 方程可以重写为Hi(ei,i,Wi)=(2i

31、1)?ei?22iTei diWTiSiTei(iei+di)14?TSieiWi?2+i(t)=0(25)i=(i/Tei)i+(1/4)?(i/ei)?2(i/Tei)di式中,用于变量替换。WiVii如图2 所示,由于式(24)中的理想权重未知,所以引入了执行器评判器神经网络框架,分别对代价函数和虚拟控制输入进行估计,得Vi=i?ei?2+WTciSi i=iei12TSieiWai(26)ViVi iiWTci RnWTai Rn式中:为的估计值;为的估计值;和分别为位姿跟踪误差系统的评判器和执行器神经网络的权重。CriticActorCriticActori虚拟参考点虚拟USV1虚拟

32、期望轨迹i坐标转换z1ieieiddiiiiUSV1di.USVNUSVN扰动观测器有限时间aiciciai图 2基于 FDO-OBC 的 USV 编队轨迹跟踪控制图Fig.2 Diagram of trajectory tracking control for USV formationbased on FDO-OBC 将式(26)代入式(20)中,即可获得估计的最优 HJB 方程:Hi(ei,i,Wi)=?ei?2+?iei+12TSieiWai?2(2iei+TSieiWci)(iei+12TSieiWai+di)(27)WiWi式中,为理想权重的估计。hi(t)最优控制理论中,理想的

33、HJB 方程结果为 0,则估计 HJB 方程与最优 HJB 方程的误差为hi(t)=Hi(ei,i,Wi)Hi(ei,i,Wi)=Hi(ei,i,Wi)(28)Ei为了获得神经网络更新律,定义正定函数为Ei=12h2i(29)基于式(29),采用梯度下降法即可计算出评182“无人船艇自主性技术”专辑第 19 卷Wci判器神经网络的权重更新律为Wci=ci1+?i?2i(12i)?ei?22iTei di+14?TSieiWai?2+TiWci(30)其中,i=(Si/Tei)(iei+(1/2)(TSi/ei)Wai+di)ci 0式中:,为位姿评判器神经网络的学习率。Wai位姿执行器神经网络

34、的权重更新律为Wai=12SiTeieiaiSiTeiTSieiWai+ci4(1+?i?2)SiTeiTSieiWaiTiWci(31)ai 0式中,为位姿执行器神经网络的学习率。2.4 动力学控制器设计USViVi(ei)根据式(13)设计的速度跟踪误差动态系统,其最优代价函数为Vi(ei)=mini(i)wtri(ei,i)ds=wtri(ei,i)ds(32)ri(ei,i)=Teiei+iTii(t)R3ei(i)i式中:,其中,为子系统的虚拟控制输入;为容许的控制集合;为最优虚拟控制策略。i根据式(32),采用梯度下降法可得最优控制策略为i=12Viei(33)ViWiVii与 2

35、.3 节类似,采用神经网络逼近最优代价函数,但由于神经网络的理想权重矩阵未知,因此,需使用执行器评判器强化学习神经网络结构分别对代价函数和最优虚拟控制输入进行估计,即Vi=iei2+WTciSii=iei12TSieiWai(34)ViViiiiWTci RnWai RnnSi Rn式中:为的估计值;为最优虚拟控制输入估计后设计的系统最优控制输入;为设计的一个正常数;和分别为速度跟踪误差系统的执行器和评判器神经网络权重,其中为神经元数;,为基函数向量。USVi由于动态方程(12)中的最优控制输入i的描绘场景是惯性坐标系,因此,系统方程(5)中的动态输入为i=MRTi(35)Wci速度评判器神经

36、网络的权重更新律为Wci=ci1+i2(12i)ei2+2iTei(Fe+i)+14?TSieiWai?2+TiWcii(36)其中,i=(Si/Tei)Fe+z1iiei(1/2)(TSi/ei)Waici 0式中:,为速度评判器神经网络的学习率。Wai速度执行器神经网络权重更新律为Wai=12SiTeieiaiSiTeiTSieiWai+ci4(1+i2)SiTeiTSieiWaiTiWci(37)ai 0式中,为速度执行器神经网络的学习率。3 稳定性分析USViUSVi定定理理 2:由引理 1 可知,考虑初始条件和期望信号有界的 USV 系统,若虚拟控制律式(26)、更新律式(30)和式

37、(31),以及实际控制律式(35)、更新律式(36)和式(37)的设计参数可以满足下文的式(49)和式(57),则优化控制的所有跟踪误差为半全局一致最终有界,即可以跟踪虚拟达到期望的精度,并且使 USV 编队系统在保持队形的前提下快速、精确地跟踪期望轨迹。证明证明:根据式(11)和式(13),得 ei=ei+i di(38)Ji设计第 1 步李雅普诺夫函数为Ji=12?ei?2+12WTciWci+12WTaiWai(39)Wci=WciWiWai=WaiWi式中,分别为位姿评判器和执行器神经网络的近似误差。结合式(26)、式(30)、式(31)和式(38),对上述式(39)进行求导,得Ji(

38、t)=i?ei?2+TeieiTei di12TeiTSieiWiai2WTaiSiTeiTSieiWaiai2WTaiSiTeiTSieiWai+ai2WTi第 1 期王宁等:未知扰动下的无人艇编队优化轨迹跟踪控制183SiTeiTSieiWi+ci4(1+?i?2)WTaiSiTeiTSieiWaiTiWcici1+?i?2(WTcii(TiWci2iTei di+14?TSieiWai?2(2i1)?ei?2)(40)Wai=WaiWi根据式(25)和以及柯西不等式和杨氏不等式,则式(41)式(43)成立。Tei di12?ei?2+12?di?2(41)12TeiTSieiWi?ei?

39、2+WTiSiTeiTSieiWi(42)ci1+?i?2WTciiici2(1+?i?2)2i+ci2(1+?i?2)WTciiTiWci(43)将式(41)式(43)代入式(40),得Ji(t)Teiei(i32)?ei?2ai2WTaiSiTeiTSieiWaici2(1+?i?2)WTciiTiWciai2WTaiSiTeiTSieiWai+ci4(1+?i?2)WTaiSiTeiWTiiTSieiWai+ci4(1+?i?2)WTciiWTiSiTeiTSieiWai+(1+ai2)WTiSiTeiTSieiWi+ci2(1+?i?2)2i+12?di?2(44)根据杨氏不等式和柯西

40、不等式,则式(45)和式(46)成立。ci4(1+?i?2)WTaiSiTeiWTiiTSieiWai132WTaiSiTeiWTiiTiWiTSieiWai+2ci2WTaiSiTeiTSieiWai(45)ci4(1+?i?2)WTciiWTiSiTeiTSieiWai2ci2WTaiSiTeiTSieiWai+132(1+?i?2)WTciiWTiSiTeiTSieiWiTiWci(46)根据式(45)和式(46),则式(44)可以变为Ji(t)Teiei12?ei?2(i2)?ei?2(ai22ci2132WTiiTiWi)WTaiSiTeiTSieiWai11+?i?2(ci2132

41、WTiSiTeiTSieiWi)WTciiTiWci(ai22ci2)WTaiSiTeiTSieiWai+(1+ai2)WTiSiTeiTSieiWi+ci2(1+?i?2)2i+12?di?2(47)由此,可将式(47)改写为Ji(t)Ti(t)Ai(t)i(t)+Ci(t)+Teiei12?ei?2(ai22ci2)WTaiSiTeiTSieiWai(48)其中,Ci=(1+ai2)WTiSiTeiTSieiWi+ci2(1+?i?2)2i+12?di?2i=Tei,WTai,WTciTAi=diag(a11i,a22i,a33i)式中:矩阵,以及对角矩阵,其中对角元素分别写为:a11i=

42、i2a22i=(ai2ci2WTiiTiWi32)SiTeiTSieia33i=11+?i?2(ci2132WTiSiTeiTSieiWi)iTiiaiciAi(t)基于引理 2,通过选择满足以下条件的设计参数,即可使矩阵为正定:i 2ai 2ci+ki16WTiWici116supt0WTiSiTeiTSieiWi(49)kisup式中:为满足运动学误差跟踪系统持续激励的正常数;函数为取上限值符号,表示取变量的最大值。184“无人船艇自主性技术”专辑第 19 卷因此,式(48)就可以变换为Ji(t)Teiei12?ei?2ai?i?2+ci(50)ai=inft0minAi(t)infmin

43、ci=supt0Ci(t)式中:,其中函数为取下限值符号,表示取变量的最小值,表示取矩阵对角元素的最小值;。考虑反步法第 2 步,设计李雅普诺夫函数为Ji(t)=Ji(t)+12Teiei+12WTaiWai+12WTciWci(51)Wci=WciWiWai=WaiWi式中,。结合式(13)、式(36)和式(37)对上式求导,得Ji(t)=Ji+Tei(i+Fe+z1i)+WTai(12SiTeieiaiSiTeiTSieiWai+ci4(1+i2)SiTeiTSieiWciTiWci)ci1+i2WTcii(TiWci(2i1)2ei+2iTei(Fe+z1i)+14WTaiSiTeiTS

44、ieiWai)(52)与第 1 步李雅普诺夫函数类似,结合式(18)、式(34)以及杨氏不等式和柯西不等式,可将式(52)变换为Ji(t)Ji(i3)ei2(ai22ci2132WTiiTiWTi)WTaiSiTeiTSieiWaici1+i2(ci2132SiTeiTSiei)WTciiTiWTci(ai22ci2)WTaiSiTeiTSieiWai+(1+ai2)WTaiSiTeiTSieiWai+12(?f(i,i)?2+z1i2+?i?2)+ci22i(53)i=(i/Tei)i+(i/Tei)(Fe+i)+(1/4)?(i/ei)?2i式中,其中为动力学神经网络的近似误差。根据杨氏不

45、等式,得Teiei12?ei?2+12ei2(54)结合式(50)和式(54),可将式(53)转化为Ji(t)ai?i?2+ci(i72)ei2(ai22ci2132WTiiTiWTi)WTaiSiTeiTSieiWaici1+i2(ci2132SiTeiTSiei)WTciiTiWTci(ai22ci2)WTaiSiTeiTSieiWai+(1+ai2)WTaiSiTeiTSieiWai+12(?f(i,i)?2+z1i2+?i?2)+ci22i(55)将式(55)进一步改写,得J(t)ai?i?2+ciTiAii+Ci(ai22ci2)WTaiSiTeiTSieiWai(56)其中,Ci=

46、(1+ai2)WTiSiTeiTSieiWi+12(?f(i,i)?2+z1i2+?i?2)+ci22ii=Tei,WTai,WTciTAi=diag(a11i,a22i,a33i)式中,矩阵,对角矩阵,其中对角元素分别写为:a11i=i72a22i=(ai2ci2WTiiTiWi32)SiTeiTSieia33i=11+i2(ci2132WTiSiTeiTSieiWi)iTiiaiciAi(t)基于引理 2,通过选择满足以下条件的设计参数,即可使矩阵为正定:i 4ai 2ci+ki16WTiWici116supt0WTiSiTeiTSieiWi(57)ki式中,为满足动力学误差跟踪系统持续激

47、励的正常数。因此,式(57)可以变换为Ji(t)ai?i?2aii2+ci+ci(58)ai=inft0minAi(t)ci=supt0Ci(t)式中:;。进一步整理式(58),得Ji(t)ai(?i?2+i2)+ci(59)第 1 期王宁等:未知扰动下的无人艇编队优化轨迹跟踪控制185ai=minai,ai ci=maxci+ci式中:;。根据引理 3 可知,式(59)满足以下结果:Ji(t)eaitJi(0)+ciai(1eait)(60)aiUSVi通过式(60)可知,通过调整参数,令其足够大时,系统跟踪误差即可达到期望的精度,从而使可跟踪预定义的轨迹并达到期望精度。需注意的是,由于 F

48、DO-OBC 算法在数学层面是通过对式(19)和式(32)求极小值而得到的最优控制输入,并采用了执行器评判器神经网络结构来逼近最优代价函数,因此,FDO-OBC 算法在优化系统跟踪误差和输入等性能指标的同时,也增加了系统的计算量。4 仿真验证为了验证本文 FDO-OBC 算法的有效性与优越性,本节将通过 Matlab 软件对现有的 USV 模型CyberShip II27开展仿真研究,并与文献 28 中的反步控制进行仿真对比实验,其中有关 USV 模型的主要参数如表 1 所示。表 1 中的所有参数均经过归一化处理,在工程应用中,需根据实际情况对这些参数赋以相应单位。表 1 CyberShip

49、II 的主要参数Table 1 Main parameters of CyberShip II参数数值参数数值参数数值m23.8Yv0.861 2X u2Iz1.76Y|v|v36.282 3Y v10 xg0.046Yr0.107 9Y r0Xu0.722 5Nv0.105 2N v0X|u|u1.327 4N|v|v5.043 7N r1Xuuu5.866 4 在实船应用场景中,环保部门在某自然水域进行定期水质检测时,通常会采用固定的专业航线;由于河道宽窄变化等因素的影响,在跟踪参考轨迹过程中,USV 编队需采用多种队列结构的变换形式,因此,本节的仿真场景为假设环保部门在某自然水域定期进行

50、水质检测,且确定了一个定期使用的专业航线作为参考轨迹。基于此假设,对于由 3 艘 USV 组成的编队系统,其期望参考轨迹的控制输入如下:d=8,0,0.03T,t 145 s8,0,0.03+0.1sin(t145)175)T,145 s t 210 s8,0,0.015T,t 210 s(61)USV 编队系统的位置和速度初值如表 2 所示(已归一化处理)。USV 编队的未知环境扰动为:d1=1.8sin(t/61),1.6cos(t/51),sin(t/31)Td2=1.8sin(t/6+1),1.6cos(t/5+1),sin(t/3+1)Td3=1.8sin(t/6),1.6cos(t

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服