1、第 21 卷 第 2 期 装 备 环 境 工 程 2024 年 2 月 EQUIPMENT ENVIRONMENTAL ENGINEERING 81 收稿日期:2023-10-30;修订日期:2023-12-06 Received:2023-10-30;Revised:2023-12-06 引文格式:李政远,王俊雄.基于高阶递归神经网络的 AUV 鲁棒控制方法J.装备环境工程,2024,21(2):81-88.LI Zhengyuan,WANG Junxiong.A Robust Control Method for AUV Based on High Order Recurrent Neur
2、al NetworksJ.Equipment Environ-mental Engineering,2024,21(2):81-88.*通信作者(Corresponding author)基于高阶递归神经网络的 AUV 鲁棒控制方法 李政远,王俊雄*(上海交通大学 海洋工程国家重点实验室,上海 200240)摘要:目的目的 提出一种基于高阶递归神经网络的 AUV 鲁棒控制方法。方法方法 利用结构简单但逼近效果优越的高阶递归神经网络,对建模不确定性和外部未知干扰进行估计,并将其补偿到输入控制律中,以提高控制性能。之后,基于 HJI 理论和 Lyapunov 稳定性分析导出神经网络权重自适应更新律
3、和 AUV 自适应控制律,设计反步滑模方法作为对比方法,并进行仿真实验。结果结果 设计的基于高阶递归神经网络的 AUV 鲁棒控制方法的跟踪误差、调节时间等控制指标均优于反步滑模方法。设计的鲁棒控制方法可以控制 AUV 精确跟踪目标轨迹,同时具有优秀的控制性能和鲁棒性。结论结论 这一研究为 AUV 轨迹跟踪控制领域提供了一种高效且有效的方法,有望在复杂、不确定的水下环境中得到应用。关键词:自主水下航行器;轨迹跟踪;高阶递归神经网络;HJI 理论;鲁棒控制;Lyapunov 稳定性分析 中图分类号:U674.941;TP242.6 文献标志码:A 文章编号:1672-9242(2024)02-00
4、81-08 DOI:10.7643/issn.1672-9242.2024.02.011 A Robust Control Method for AUV Based on High Order Recurrent Neural Networks LI Zhengyuan,WANG Junxiong*(State Key Laboratory of Ocean Engineering,Shanghai Jiao Tong University,Shanghai 200240,China)ABSTRACT:The modeling uncertainties and external unknow
5、n disturbances,among other factors,impose higher demands on the control methods for Autonomous Underwater Vehicle(AUV)in terms of trajectory tracking.The work aims to propose an AUV robust control method based on high-order recurrent neural networks to address it.High-order recurrent neural networks
6、 with simple structure but superior approximation performance were employed to estimate modeling uncertainties and exter-nal unknown disturbances,which were then compensated for in the input control law to enhance control performance.Subse-quently,the neural network weight adaptive update law and AU
7、V adaptive control law were derived based on the HJI theory and Lyapunov stability analysis.Finally,a backstepping sliding mode method was designed as a comparative approach,and simula-tion experiments were conducted.The experimental results indicated that the proposed AUV robust control method base
8、d on high-order recurrent neural networks outperformed the backstepping sliding mode method in terms of tracking error,settling time,and other control metrics.Simulation experiments demonstrate that the proposed robust control method can effectively fa-cilitate precise target trajectory tracking by
9、AUVs,while simultaneously exhibiting excellent control performance and robust-ness.This research provides an efficient and effective approach for AUV trajectory tracking control,with the potential for appli-cation in complex and uncertain underwater environments.船舶及海洋工程装备 82 装 备 环 境 工 程 2024 年 2 月 K
10、EY WORDS:autonomous underwater vehicles;trajectory tracking;high order recurrent neural network;HJI theory;robust control;Lyapunov stability analysis 世界海洋面积占地球总面积的 2/3,目前人类还只探索了 5%的海洋,水下资源的勘探和开发仍然是海洋科技前沿热点之一。自主水下航行器(Autonomous Underwater Vehicle,AUV)不需要人工实时控制,具有较高的自主性和灵活性,将会是未来水下探索和开发的主要工具。AUV 的轨迹跟踪
11、控制策略是目前的研究热点。由于 AUV 自身参数存在不确定性,且运动伴随强扰动,AUV 的控制策略对精度、可靠性、鲁棒性等有更为严格的需求。传统的非线性控制方法往往基于反步法、滑动模态法等方法。为避免反步法中出现的微分爆炸问题,可采用一阶低通滤波器1-2或命令滤波器3-4替代微分运算。文献2结合反步法和积分滑模控制,提出了多输入多输出励磁直流电机的速度控制策略,可有效控制电机速度稳定在期望速度,然而在应对时变的参考信号时,该方法略有不足。文献3使用命令滤波器以避免微分爆炸,同时结合观测器观测海流扰动,将其补偿到控制律中,然而该方法未考虑建模不确定性以及未知扰动。为避免滑模控制方法中出现的抖振现
12、象,可采用线性饱和函数或非线性饱和函数5-6替代符号函数或高阶滑模控制7-9等方法抑制抖振。文献6结合传统的非奇异终端滑模控制和输入饱和函数,提出了具有输入饱和的非线性二阶系统的非奇异终端滑模控制器,并证明了在该控制律下,闭环系统的状态可以在有限时间内收敛到 0,然而该控制律依赖于不确定性有界且界限已知。文献9提出了一种对数滑模控制,利用自然对数函数替代符号函数以加快滑动阶段的收敛速度,并在此基础上构造了基于超扭曲算法的对数滑模流形,以减少稳定阶段的抖振。另外,H鲁棒控制策略近年来也备受关注,但在非线性系统中,H控制器鲁棒稳定时的条件往往为非线性不等式条件(NLMI),求解较为困难。文献10针
13、对无人船的转艏运动控制律,将 H控制器系统稳定的 NLMI 解耦并转化为多项式条件(PLMI),并使用平方和方法求解得到控制律。该方法可有效抑制外部扰动项,有较强鲁棒性,然而对于解耦困难甚至无法解耦的系统,该方法存在较大的局限性。文献11使用 H控制器解决车辆转向时的非线性和执行器饱和问题时,将非线性矩阵不等式线性化,转化为线性矩阵不等式的凸优化问题,但是存在状态维数增加时,控制输出趋于保守的问题。文献12则针对 AUV垂直面轨迹跟踪使用 H控制策略,并基于泰勒展开求解 HJI 不等式,具有较强的抗扰动能力。此外,随着深度学习的兴起,越来越多的神经网络模型也被应用到 AUV 控制策略中,以提高
14、控制性能。基于神经 网络的 AUV 控制策略多为在线学习,由于神经网络的“万能逼近”特性,神经网络可用于 PID 控制策略的参数整定13-15、模型不确定项逼近16-19和无模型的强化学习控制策略20-22。文献16将动态模糊神经网络用于补偿系统的不确定性,使用高斯函数作为隐藏层的激活函数,并结合观测器得到神经网络输出误差,基于反向传播给出权重更新律,最后将神经网络的输出补偿到基于反步法的控制律中,具备较好的自适应能力。文献18使用 RBF 神经网络估计 AUV 的未知非线性函数,并补偿到滑模控制器中,保证 AUV可以准确跟踪目标轨迹。然而,广泛使用的 RBF 神经网络或高斯隶属函数的精度依赖
15、于高斯函数的宽度和中心点的选取,当宽度或中心点选取不恰当时,逼近效果将无法保证。此外,当神经网络需要逼近复杂非线性系统时,往往需要增加神经元数量和网络深度,模型结构复杂度和在线更新计算时间都大幅增加。最后,使用基于损失函数和反向传播的参数更新方法无法证明系统在 Lyapunov 意义下的稳定性。为解决 AUV 建模参数不确定性和外部干扰等未知因素的影响,本研究提出了一种基于高阶递归神经网络的 AUV 鲁棒控制策略。此策略旨在利用神经网络的逼近能力来整体逼近系统的干扰项,并将其嵌入到控制策略中,以提高 AUV 的鲁棒性。为避免使用RBF 神经网络或高斯函数时的参数选取问题和降低计算复杂度,采用了
16、结构简单但逼近性能出色,且不依赖参数选取的高阶递归神经网络。控制策略的设计基于 HJI 理论和 Lyapunov 稳定性分析,从而导出了自适应控制律和权重自适应更新律。这些理论基础确保了控制策略的稳定性和鲁棒性,使 AUV 能够有效地对抗未知的干扰因素。此外,为了进行性能对比,还设计了一种反步滑模控制方法,作为传统方法的代表。通过仿真实验,对比了基于高阶递归神经网络的AUV 鲁棒控制方法与反步滑模 AUV 控制方法。结果表明,设计的 2 种方法都能有效地抵抗 AUV 的未知干扰项,具有强大的鲁棒性,尤其是基于高阶递归神经网络的 AUV 鲁棒控制方法,在稳态误差和调节时间等控制性能指标上均优于传
17、统的反步滑模控制方法。这些仿真实验结果验证了基于高阶递归神经网络的 AUV 鲁棒控制方法的出色控制性能,为 AUV 轨迹跟踪控制领域的进一步研究提供了重要的理论和实验依据。1 AUV 运动学-动力学模型 本文以一类全驱动 AUV 作为研究对象,为便于第 21 卷 第 2 期 李政远,等:基于高阶递归神经网络的 AUV 鲁棒控制方法 83 描述 AUV 的运动状态,定义全局的大地坐标系 O-xyz和随动的机器人坐标系 Oo-xoyozo,如图 1 所示。图 1 AUV 坐标系 Fig.1 AUV coordinate system AUV 在大地坐标系中位姿为T,x y z ,在机器人坐标系中,
18、速度与角速度为T,u v w p q rv,则可将 AUV 运动学-动力学模型表示为23:JvMvC v vD v vgd(1)式中:J()为大地坐标系到机器人坐标系的坐标转换矩阵;M 为惯性矩阵,M=M0+M;C(v)为科里奥利向心力矩阵,C(v)=C0(v)+C;D(v)为阻尼矩阵,D(v)=D0(v)+D;g()为恢复力和力矩,g()=g0()+g;T,uvwpqr 为各个自由度推进器的控制输入;T,uvwpqrddddddd为外界扰动项;M、C、D、g 为模型的不确定项。将模型不确定项和外界扰动项统一为系统的干扰项all dMvCD vgd,将式(1)改写为如下形式:dTMCDg (2
19、)其中:T10T1100T10T0TallTdTMJM JCJCvM JJ JDJDvJgJgJdJ(3)定理 1:矩阵2MC为一斜对称矩阵。证明如下:T10T110T10222222vCJMJCJM JJJCJCJM(4)考虑到水下机器人的斜对称特性,C0(v)为斜对称矩阵,故2MC为斜对称矩阵。2 运动控制器设计 2.1 基于高阶递归神经网络的鲁棒控制器 2.1.1 高阶递归神经网络 为获取模型中的不确定项d,并将其补偿到控制律中,采用高阶递归升级网络对不确定项进行逼近。高阶递归升级网络24(Higher-Order Recurrent Neural Network,HORNN)在 Pi-
20、Sigma 神经网络的基础上,增加了 2 个内环递归项,以提高网络的时间序列识别能力。相较于较为流行的循环神经网络如对角递归神经网络(Diagonal Recurrent Neural Network,DRNN)、约旦递归神经网络(Jordan Recurrent Neural Network,JRNN)等,在降低模型的整体结构复杂度(隐藏层神经元为 3 个)的同时,具有更好的自适应逼近能力。高阶递归神经网络的结构如图 2 所示。图 2 中各个权重分别为:111213212223313233121221223132121221223132,;,;,;,;,;,;,ffffffffffiiiii
21、iiiiiiiiioowwwwwwwwwwwwwwwwwwwwwwWWWW(4)以上权重矩阵需要自适应更新,其中(mjw),f i o q表示权重W中第 m 个输入到第 j 个输出的权重;f()为线性或非线性激活函数。本文设计网络结构为 2-3-1,定义期望轨迹 d和AUV 跟踪误差de ,神经网络输入为;xe e,输入输出均为 6 维向量。则隐藏层的第j个神经元的输出为:32111fiqjmj mmjmjmmskw skw xkwk(5)神经网络的输出:311jojy kfskw y k(6)则HORNN的输出可表示为:,dfiqohWW W W (7)式中:Wf、Wi、Wq、Wo表示理论最
22、优权值;为逼近误差。神经网络实际输出为:,fiqdohWWWW (8)式中:fW、iW、qW、oW为最优权值的估计值。为便于控制器设计,将,fiqohhWW W W在点,fiqoWWWW处进行泰勒展开:,Df i o qhWh (9)84 装 备 环 境 工 程 2024 年 2 月 图 2 HORNN 结构 Fig.2 Structure of HORNN 式中:,fiqohhWWWW、WWW,f i o q、为权重对应的偏导矩阵;D为泰勒展开的高阶项。其中各个权重关于输出的偏导数使用链式法可得:31313111onqnjnjnmfnmjnjnminmjnjy kfy kwky kfskwk
23、y kfskskwky kfskxkwk (10)2.1.2 控制律与权重自适应更新律 定义如下的1x和滑模函数2x:12xexece(11)式中:c 为正定矩阵。对 x1、x2求导,根据式(2)、式(7)和式(9),可得到式(12)。12121 22,Tf i o qd hWxxcxM xxM(12)式中:1CD,2111dcxgM ce ,D。则系统的反馈控制律与权重自适应更新律为:2222T21122 ,dTf i o q MxxhKxW(13)式中:K为正定对角矩阵;为自定义控制参数,0。式(13)基于Lyaponuv稳定性与HJI定理导出,推导过程见后文的稳定性分析。在每个控制时间步
24、中,神经网络各个权重的导数根据系统状态x2进行自适应更新,之后通过积分更新神经网络的各个权重。接下来基于更新后的权重,计算神经网络的输出,并将其输入到控制律中,提高系统的鲁棒性。基于高阶递归神经网络的AUV鲁棒控制方法的结构如图3所示。图 3 结构框图 Fig.3 Structural block diagram 2.2 基于反步法的滑模控制器 反步法和滑模法鲁棒性强,控制性能优异,是广第 21 卷 第 2 期 李政远,等:基于高阶递归神经网络的 AUV 鲁棒控制方法 85 泛应用于AUV的控制方法。本文结合反步法与滑模法设计了一种控制性能优秀的反步滑模控制器作为基于高阶递归神经网络的鲁棒控制
25、器的对比方法。对于跟踪误差1dx和滑模函数2xe ce,定义Lyapunov函数:TT11221122Vx xx x(14)TT1122Vx xx x(15)将式(1)、式(12)代入得:TT1112110all000()dVx cxxxcxJvJMdCD vg(16)令AUV控制输入如式(17)所示。10122211000tanh()d()M JK xKxxcxJvCDvg(17)其中,K1、K2为正定对角的控制参数矩阵,则TTT11212222alltanh Vx cxx K xxKxd。假设系统的干扰项 dall存在上界,则当 K2足够大时,0V,系统稳定。控制律(17)使用饱和函数ta
26、nh代替符号函数,以避免抖振,更具有工程意义。3 基于高阶递归神经网络的鲁棒控制器的稳定性分析 3.1 HJI 定理 针对式(18)所示非线性系统:xf xg xzh x(18)其中,为不确定干扰项;z是系统的评判指标。定义对于信号 t,其L2范数为 2t 12T0dttt,该范数可以衡量 t的能量大小。为了评判系统的干扰抑制能力,定义如下性能指标:202supzJ(19)其中J称为系统的2L增益,表示系统的鲁棒性大小。J越小,表示系统的鲁棒性越好。定理2(HJI定理25):对于一个正数,如果存在一个正定且可微函数 0L x,且:2221 2Lz(20)则J。3.2 稳定性证明 选取如下的Ly
27、apunov函数并求其导数:TT122,1122f i o qLtrx M xW KW(21)TT2222T1,12f i o qLtrx M xxxMWKW(22)将式(12)、(13)带入式(22),得到:TT2222T1T2,TTT2222221221122 f i o qLtrx D xxCxKxx xx xMWxW(23)考虑到定理1以及 WW,可继续化简为:TTTT222222221122 Lx D xx xx xx (24)为使用HJI定理,将式(12)改写为如下形式:2111122,21 Tdf i o qxcxxMhWxMMzx (25)定义:22222TTT22222222
28、T222112211221 102HLxx D xx xxx D xx(26)即:22221122L x(27)由HJI定理可知,系统稳定,证明完毕。4 仿真实验 为验证本文设计的基于高阶递归神经网络的鲁棒控制方法的正确性和优越性,使用MATLAB/Simulink设计了AUV轨迹跟踪仿真实验,AUV模型86 装 备 环 境 工 程 2024 年 2 月 参数和系统控制参数见表1。表 1 AUV 参数 Tab.1 Parameters of AUV 参数 数值/m kg 117,GGGxyz 0,0,0,BBBxyz 0.017,0,0.115 RBM 117,117,117,10.7,11.
29、8,13.4diag AM 58.4,23.8,23.8,3.38,1.18,2.67diag 0D 12090,9090,150120,1510,1512,1815uvwdiagpqr 21,K K 4,2II 0.05,fiqoK KKK 5,8,7,4IIII 设定系统总干扰项为 10sin(0.6),10sin(0.5),ttd 10sin(0.4),4cos(0.2),2sin(0.3)3cos(0.3),6sintttt T(0.1)t,选取目标轨迹sin(0.2),cos(0.2),0.2,dttt T0,0,0.2 t。AUV初始位姿和初始速度为 1,1,T1,0,0,0和T0
30、,0,0,0,0,0v。系统仿真时间为70 s,分别使用基于高阶递归神经网络的鲁棒控制器(HORNN)和基于反步法的滑模控制器(BSSM)控制AUV进行仿真实验。三维空间轨迹跟踪结果如图4所示,位置误差如图5所示,x、y、z三轴方向误差和三维空间位置误差均方误差(MSE)见表2,位置误差的调节时间(误差首次达到并保持在5%范围内所需的时间)见表3,姿态角误差如图6所示。图 4 三维轨迹跟踪结果 Fig.4 3D trajectory tracking result 图 5 位置误差曲线 Fig.5 Position error curve 表 2 HORNN 与 BSSM 均方误差 Tab.2
31、 MSE of HORNN and BSSM MSE HORNN BSSM MSE-x 2.869 2106 1.038 5 104 MSE-y 1.633 6106 1.399 8104 MSE-z 2.884 1104 3.888 5 104 MSE-3D 0.097 5 0.109 3 表 3 HORNN 与 BSSM 调节时间 Tab.3 Settling time of HORNN and BSSM 调节时间 HORNN(秒/s)BSSM(秒/s)x 轴 4.4 5.7 y 轴 4.3 5.9 z 轴 5.8 6.4 通过图4、图5以及表2、表3的结果,可以分析本文所设计的基于高阶递
32、归神经网络的鲁棒控制器与基于反步法的滑模控制器的性能。首先,2种控制器均表现出出色的控制效果。然而,对比BSSM控制器,HORNN控制器在各个方向的跟踪误差以及3维空间跟踪误差方面都表现得更加出色。此外,HORNN控制器还展现出更短的调整时间,使其能够更快速地追踪期望轨迹。另外,从图6的结果来看,2种控制方法在稳态阶段均能够保持姿态角在较小的范围内(误差小于0.05 rad)。然而,由于滑模项造成的抖振,BSSM控制器在稳态阶段仍然存在小范围内的波动,而HORNN控制器则能够维持更为稳定的输出。这些仿真实验结果表明,基于反步法的滑模控制 第 21 卷 第 2 期 李政远,等:基于高阶递归神经网
33、络的 AUV 鲁棒控制方法 87 图 6 姿态角误差曲线 Fig.6 Attitude angle error curve 器在多个方面都表现出更优越的性能,包括更低的跟踪误差、更快的调整时间以及更稳定的稳态输出。实验结果证明,设计的基于高阶递归神经网络的鲁棒控制器具有优越的控制品质,能够控制AUV进行精确的轨迹跟踪,应对建模不确定性和外界未知扰动。5 结语 本研究利用基于高阶递归神经网络和HJI理论的控制策略,专注于解决AUV在三维空间中的轨迹跟踪问题。首先,使用高阶递归神经网络作为系统建模工具,结构简单,且具有出色的逼近能力,在减少计算复杂度、节省算力的同时,有效地逼近了复杂的非线性系统的
34、未知因素和不确定项。其次,采用HJI理论,将高阶递归神经网络逼近的总干扰项嵌入到控制律中,确保AUV在不确定环境中的可控性和稳定性,并基于Lyapunov稳定性的分析,导出了神经网络权值的在线更新策略,以进一步增强系统的稳定性和鲁棒性。最后,通过与传统的反步滑模方法进行仿真对比实验,证明了基于高阶递归神经网络的AUV鲁棒控制方法的卓越性能。这种方法在稳态误差、调节时间和抗扰动性方面都表现出更佳的控制性能,为AUV轨迹跟踪问题的解决提供了一种高效而有力的方法,尤其适用于复杂、不确定的海洋环境下的AUV控制。未来的研究内容是使用设计的控制方法进行AUV实机测试。参考文献:1 BOUADI H,BO
35、UCHOUCHA M,TADJINE M.Sliding Mode Control Based on Backstepping Approach for an UAV Type-QuadrotorJ.World Academy of Science,En-gineering and Technology,International Journal of Me-chanical,Aerospace,Industrial,Mechatronic and Manu-facturing Engineering,2007,1:39-44.2 AFIFA R,ALI S,PERVAIZ M,et al.A
36、daptive Backstep-ping Integral Sliding Mode Control of a MIMO Sepa-rately Excited DC MotorJ.Robotics,2023,12(4):105.3 XU H,ZHANG G C,CAO J,et al.Underactuated AUV Nonlinear Finite-Time Tracking Control Based on Com-mand Filter and Disturbance ObserverJ.Sensors,2019,19(22):4987.4 WANG J H,ALATTAS K A
37、,BOUTERAA Y,et al.Adap-tive Finite-Time Backstepping Control Tracker for Quad-rotor UAV with Model Uncertainty and External Distur-banceJ.Aerospace Science and Technology,2023,133:108088.5 CHENG N B,GUAN L W,WANG L P,et al.Chattering Reduction of Sliding Mode Control by Adopting Nonlin-ear Saturatio
38、n FunctionJ.Advanced Materials Research,2010,143/144:53-61.6 DING S H,ZHENG W X.Nonsingular Terminal Sliding Mode Control of Nonlinear Second-Order Systems with Input SaturationJ.International Journal of Robust and Nonlinear Control,2016,26(9):1857-1872.7 LEVANT A.Sliding Order and Sliding Accuracy
39、in Slid-ing Mode ControlJ.International Journal of Control,1993,58(6):1247-1263.8 PERRUQUETTI W,BARBOT J P.Sliding Mode Control in EngineeringM.Florida:CRC Press,2002.9 DONG H L,YANG X B,BASIN M V.Practical Tracking of Permanent Magnet Linear Motor via Logarithmic Sliding Mode ControlJ.IEEE/ASME Tra
40、nsactions on Mechatronics,2022,27(5):4112-4121.10 黄宴委,黄鹏.非线性变参数无人船艏向 H鲁棒控制J/OL.控制与决策,2022:1-9.2023-10-28.https:/doi.org/10.13195/j.kzyjc.HUANG Y W,HUANG P.H Robust Heading Control for Nonlinear Parameter-Varying Unmanned Surface Ve-hicleJ.Control and Decision,2022:1-9.2023-10-28.https:/doi.org/10.13
41、195/j.kzyjc.11 孙船斌,方琳,童宝宏.受饱和约束的车辆转向非线性鲁棒模糊分布控制J.振动与冲击,2022,41(4):77-85.SUN C B,FANG L,TONG B H.Nonlinear Robust Fuzzy Distributed Control of Vehicle Steering with Saturation ConstraintJ.Journal of Vibration and Shock,2022,41(4):77-85.12 MAHAPATRA S,SUBUDHI B,ROUT R,et al.Nonlin-ear H Control for an
42、 Autonomous Underwater Vehicle in the Vertical PlaneJ.IFAC-PapersOnLine,2016,49(1):391-395.13 GNTHER J,REICHENSDRFER E,PILARSKI P M,88 装 备 环 境 工 程 2024 年 2 月 et al.Interpretable PID Parameter Tuning for Control En-gineering Using General Dynamic Neural Networks:An Extensive ComparisonJ.PLoS One,2020
43、,15(12):e0243320.14 AKHYAR S,OMATU S.Self-Tuning PID Control by Neural-NetworksC/Proceedings of 1993 International Conference on Neural Networks(IJCNN-93-Nagoya,Ja-pan).Nagoya:IEEE,2002.15 RODRGUEZ-ABREO O,RODRGUEZ-RESNDIZ J,FUENTES-SILVA C,et al.Self-Tuning Neural Network PID with Dynamic Response
44、ControlJ.IEEE Access,2021,9:65206-65215.16 贾鹤鸣,张利军,齐雪,等.基于神经网络的水下机器人三维航迹跟踪控制J.控制理论与应用,2012,29(7):877-883.JIA H M,ZHANG L J,QI X,et al.Three-Dimensional Path Tracking Control for Autonomous Underwater Vehi-cle Based on Neural NetworkJ.Control Theory&Ap-plications,2012,29(7):877-883.17 MUOZ F,CERVANTE
45、S-ROJAS J S,VALDOVINOS J M,et al.Dynamic Neural Network-Based Adaptive Tracking Control for an Autonomous Underwater Vehicle Subject to Modeling and Parametric UncertaintiesJ.Ap-plied Sciences,2021,11(6):2797.18 GUO Y Y,QIN H D,XU B,et al.Composite Learning Adaptive Sliding Mode Control for AUV Targ
46、et Track-ingJ.Neurocomputing,2019,351(C):180-186.19 ZHOU J J,ZHAO X Y,CHEN T,et al.Trajectory Track-ing Control of an Underactuated AUV Based on Back-stepping Sliding Mode with State PredictionJ.IEEE Access,1983,7:181983-181993.20 MA D F,CHEN X,MA W H,et al.Neural Network Model-Based Reinforcement L
47、earning Control for AUV 3-D Path FollowingJ.IEEE Transactions on Intelligent Vehicles,2023,PP(99):1-13.21 DUAN K R,FONG S,PHILIP CHEN C L.Reinforce-ment Learning Based Model-Free Optimized Trajectory Tracking Strategy Design for an AUVJ.Neurocomput-ing,2022,469(C):289-297.22 JIANG P,SONG S J,HUANG G
48、.Attention-Based Meta-Reinforcement Learning for Tracking Control of AUV with Time-Varying DynamicsJ.IEEE Transactions on Neural Networks and Learning Systems,2022,33(11):6388-6401.23 FOSSEN T.Marine Control Systems Guidance,Naviga-tion,and Control of Ships,Rigs and Underwater Vehi-clesD.Norway:Norw
49、egian University of Science and Technology Trondheim,2002 24 KUMAR R.Double Internal Loop Higher-Order Recur-rent Neural Network-Based Adaptive Control of the Nonlinear Dynamical SystemJ.Soft Computing,2023,27(22):17313-17331.25 WANG Y N,SUN W,XIANG Y Q,et al.Neural Net-work-Based Robust Tracking Control for RobotsJ.Intel-ligent Automation&Soft Computing,2009,15(2):211-222.