收藏 分销(赏)

基于联邦学习的中山站移动传感单元启发式路径规划算法研究.pdf

上传人:自信****多点 文档编号:2354680 上传时间:2024-05-28 格式:PDF 页数:13 大小:12.37MB
下载 相关 举报
基于联邦学习的中山站移动传感单元启发式路径规划算法研究.pdf_第1页
第1页 / 共13页
基于联邦学习的中山站移动传感单元启发式路径规划算法研究.pdf_第2页
第2页 / 共13页
基于联邦学习的中山站移动传感单元启发式路径规划算法研究.pdf_第3页
第3页 / 共13页
亲,该文档总共13页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 35 卷第 3 期 极地研究 Vol.35,No.3 2023 年 9 月 CHINESE JOURNAL OF POLAR RESEARCH September 2023 收稿日期 2022 年 10 月收到来稿,2022 年 11 月收到修改稿 基金项目 南极中山雪冰和空间特殊环境与灾害国家野外科学观测研究站(121163000000190015)资助 作者简介 王煜尘,男,1995 年生。博士,主要从事极端环境传感器及机器学习算法方向研究。E-mail:tyut_ 通信作者 窦银科,E-mail:;孙阳,E-mail: 基于联邦学习的中山站移动传感单元启发式路径规划算法研究 王煜尘1

2、,2 祝标2 郭井学2 窦银科1 姚旭2 孙阳2(1太原理工大学电气与动力工程学院,山西 太原 030024;2中国极地研究中心(中国极地研究所),上海 200136)摘要 启发式算法被广泛用于移动巡检单元的路径规划中。然而在一些特殊场合(例如南极中山站),有限的通信带宽、能源和计算能力要求移动巡检单元在路径规划算法中更有效率。为了解决上述困难,本研究提出了 1 个网络交换和分布式通信设施的设计方案,并将其作为实现数字孪生传感网络的基础。同时,本研究提出了1种改进型灰狼优化的路径规划算法,结合联邦学习机制,以提高路径规划算法的效率,减少资源消耗。通过一系列的仿真研究和南极中山站现场试验,验证了

3、该算法在启发式全局路径规划、规划成本评估和区域动态路径规划方面取得了良好的性能。本研究设计的硬件平台功能符合实际任务要求,新型启发式路径规划算法优于同类其他算法,联邦学习机制提高了规划算法中参数设置的效率,算法模型使南极中山站移动巡检单元的路径规划更加高效和可靠。关键词 路径规划 启发式算法 南极中山站 联邦学习 doi:10.13679/j.jdyj.20220428 0 引言 为实现特定的科考和生产目标,人类在极地、深空和远洋等偏远区域建立了诸多基础平台设施,如极地考察站、太空空间站以及钻井平台等。这些平台的建设和运行都依赖自动化与现代数字化技术,获取和监测平台系统自身的数字化状态是维持系

4、统稳定运行的首要条件1。当前,移动巡检单元是典型应用于获取和监测平台状态的技术,它是原位观测单元的升级,属于工业系统中独特的一类。其中,移动巡检单元本身获取的传感信息种类决定了该单元的任务执行能力2。在一些难抵达区域执行巡检和观监测任务时3,移动巡检单元的通信链路模式、路径规划模式、数字化感知程度以及系统的生命周期决定着监测工作的质量。随着工业 4.0 的实现,动态感知监测和智能决策起到了关键性作用4,在陌生环境或者人为建立的电子沙盘地图上开展自主导航研究变得十分必要。数字孪生(Digital Twins,DT)技术可利用模拟应用场景的方式提升移动巡检单元的应用和测试效率。尤其在工业机器人和智

5、能制造领域,数字孪生技术已逐渐成熟并且应用。与数字孪生相结合的智能制造具有智能传感和模拟的功能,使产品的生产更加高效和智能5。例如加工车间6、仓库管理和智慧电厂7等领域已将数字孪生技术作为实现物理信息融合的主要方式。伴随数字孪生技术的成熟,环境感知的质量影响着智能决策的质量,机器学习成为当前智能 第 3 期 王煜尘等:基于联邦学习的中山站移动传感单元启发式路径规划算法研究 393 决策过程的主流工具。联邦学习机制是实现分布式高级分析的“有力武器”3,通过应用该学习机制,针对智能决策过程的研究设计实现了更好的学习性能8。极地考察现场的任务执行往往受限于恶劣的自然环境和有限的基础设施条件,突破条件

6、限制,基于通信网络的远程监控系统成为科考平台的必然选择,建立和运行自动化的科考平台也是未来的发展趋势9。因此,本研究致力于设计 1 种适用于中国南极中山站站区的移动巡检单元,并提出适用于该单元的轻量化联邦学习结合路径规划算法的导航机制,以实现其在考察站内进行自动导航和区域巡检任务。同时,为提高移动巡检单元路径规划效率,减少资源消耗,对启发式路径规划算法进行了改进和现场试验,以期更高质量地监测科考平台运行状态,为南极考察站的安全高效运行提供有效支撑。1 网络结构与移动巡检单元设计 针对南极中山站现场条件和特殊工程需求,我们设计和组建了研究实验平台。除了移动巡检单元外,该平台的网络结构还包含计算和

7、通信部分,即计算机单元、NAS 阵列以及附属网络设施。基于应用需求和移动巡检单元的工作原理,我们设计了两类移动巡检单元,即室内轮式机器人(ZS_ibot)和 站 区 履 带 机 器 人(ZS_ubot)。ZS_ubot 的履带设计可以更好地适应站区室外冰雪地面和环境,同时配备了更高功率的通信模块和动力电池。该平台计算单元的核心算法包括数字孪生和联邦学习。数字孪生依赖于传感网络和算力,而联邦学习可以降低系统对原位单元通信和计算资源的需求。1.1 移动巡检单元的复合卫星网路通信模块设计 对于具备遥测与遥控功能的自动化设备,通信链路是维系操作端与被操作端的纽带。南极考察站的通信链路通过极区上空的卫星

8、搭建,中国南极中山站使用的主要通信卫星包括高轨卫星IS-17 以及低轨铱星(Iridium)网络系统。两类卫星通信系统中,高轨卫星通过大型天线接收信号,以辐射状网络连接中山站室内的以太网,低轨卫星通过室外移动巡检单元的铱星模块接收信号。因此,移动巡检单元ZS_ibot以及ZS_ubot采用无线(access point,AP)、WIFI 和直连卫星 3 种模式进行通信。其中室内移动巡检单元 ZS_ibot 可以切换的两个模式为 AP 与 WiFi 模式,室外移动巡检单元 ZS_ubot 可以切换的两个模式为 AP 模式和直连近地卫星模式(表 1)。两类移动巡检单元的通信示意图如图 1 所示。表

9、 1 移动巡检单元通信模块信息 Table 1.Information of mobile unit communication module 移动巡检单元通信链路 设备型号 AP 通信方式 TPLINK 150M ZS_ibot WIFI通信方式 Wio PR2040 AP 通信方式 DLINK DWL-2100APZS_ubot 卫星通信方式 Iridium 9523/9602 低轨卫星模块能够实现野外无遮挡地区的通信并且对系统能源消耗极小,接入新能源单元的情况下可以实现不间断运行。图 2a 所示为移动巡检单元的电气连接示意图,图2b为移动端卫星通信模组的野外实地测试效果。图 2a 仅展示

10、主要的电气控制模块,ZS_ubot 还包含微型计算机、其他各类传感器以及 ZS_ibot 等各类传感器,图 2b 展示了该模块的基本功能。该模块基于 Iridium9523的连续通信,能够在3 min内传输本地30 kB的完整数据到国内,数据可以是里程计信息、坐标信息以及图像,还可以单次接收 1 kB 以内的远程遥操作指令。其在前人研究10中已通过现场试验,可在极区非固定海冰上自主工作 355 天,模块测试结果满足功能需求。依靠卫星链路作为参数信息传播手段,低轨卫星模块能够为后续的联邦学习提供硬件基础。1.2 中心化的孤岛网络结构设计 中心化的孤岛网络结构是针对固定卫星地面站网络所使用的工作模

11、式。该结构将每个规模形似的建筑群归属到几个分离的服务器上。各子服务器的功能有 3 个:(1)存储隶属该服务器下对应建筑的 2D/3D 地图数据;(2)承担模型训练任务并生成路径规划结果,将路点发送至属于该服务器管辖范围内对应的移动巡检单元的微机上;(3)上传横向边缘计算所需参数到中心服务器,供全局模型使用。移动巡检单元产生的数据会通过无线 394 极地研究 第 35 卷 图 1 中山站室内及周边区域移动巡检单元通信网络示意图 Fig.1.Schematic diagram of indoor and peripheral area of Zhongshan Station mobile ins

12、pection unit communication network 图 2 本研究使用的移动巡检单元在极地的应用。a)ZS_ubot主控制器电气连接示意图;b)铱星通信单元野外测试结果展示 Fig.2.The components of mobile inspection unit used in this study and its application in polar regions.a)schematic diagram of the electrical connection of the main controller of the ZS_ubot;b)the results

13、of the field tests of the Iridium communication unit 以及有线网络传输到其管理节点、南极中心服务器以及国内的计算仿真服务器中(图 1)。数字孪生地图的生成借助两种技术,分别是无人机正射影像技术和地面单元全地图建模技术,这两种技术同时也对应着室内和室外两类场景。在每个单元隶属于的服务器(位于中山站区内)中会映射 1 个带有单元信息的数字孪生作业场景。随后,通过设定的地图精度等参数,将数字孪生地图拓扑化,使得地图成为 1 个二维平面图,依据危险距离将障碍抽象为矩形或者椭圆的简单几何图形。通过该方法,地图等信息的传输不再占用大量的通信资源,因此也有

14、望通过联邦学习来辅助实现数字孪生。1.3 移动巡检单元的智能传感器组合设计 为更好地进行测试,本研究将需要巡检的区域以及移动巡检单元进行了物理层面的数字孪生。两类移动巡检单元(ZS_ibot 和 ZS_ubot)进行数字孪生时使用的仪器组件如表 2 所示。两类移动巡检单元(ZS_ibot 和 ZS_ubot)的传感示意图以及孪生效果如图 3 所示。其中,室外场景的数字孪生沙盘是通过大疆 M300pro 无人机或者地面 16 线激光雷达对任务作业地区的正射影像或 SLAM 建图生成的点云沙盘,随后该沙盘存储到控制单元中作为沙盘地图。通过移动巡检单元本身的单线激光雷达全地图建模获得室内场 第 3

15、期 王煜尘等:基于联邦学习的中山站移动传感单元启发式路径规划算法研究 395 表 2 移动巡检单元数字化建模使用仪器信息 Table 2.Mobile unit communication module information 移动巡检单元 通信链路 设备型号 激光雷达 RplidarX4 深度相机 Astropo 超声波测距模块 HC-SR04 惯性测量单元(Inertial measurement Unit,IMU)MPU9250 轮式里程计 Esp8266 计算单元 Raspberry Pi 4B微控制单元(Microcontroller Unit,MCU)STM32F407 V6T6Z

16、S_ubot 实时动态(Real-time kinematic,RTK)华测U84B0 激光雷达 RS-LiDAR-16 深度相机 Intel D435i 组合导航模块 DETA100R 计算单元 IPC974-519-FLZS_ibot MCU STM32F407 V6T6 景的数字孪生沙盘。本地建模包含底图沙盘以及相关传感器与物理模型(图 3a 和 3b)。移动巡检单元在底图沙盘移动时(图 3c),通过激光雷达、里程计、深度相机等多类数据,使移动巡检单元可以在对应的栅格地图上进行计算机路径规划仿真。其中,ZS_ubot 利用深度相机和激光雷达建立周围的融合场景来判别路况和障碍,利用其搭载的

17、 RTK 模块确定位置坐标,并实现室外单元的感知和定位导航。而 ZS_ibot 通过单线激光雷达和 4 个方向的超声波测距模块,配合双目摄像头来感知和识别障碍与目标。由于默认该单元不与环境发生碰撞,且室内地面条件好,不会发生滑动摩擦,其在沙盘中的定位导航利用轮式里程计来实现。图 3 ZS_ubot 和 ZS_ibot 在极地现场的工作示意图。a)ZS_ubot 的基本组成以及路径规划仿真模型;b)ZS_ibot 的数字孪生地图建模以及路径规划仿真模型;c)ZS_ubot 的数字孪生地图建模;d)ZS_ibot 的数字孪生地图建模以及路径规划仿真模型;e)ZS_ubot 的路径规划仿真模型;f)

18、ZS_ibot 的路径规划仿真模型 Fig.3.Schematic diagram of ZS_ubot and ZS_ibot working in the polar field.a)basic composition of ZS_ubot and path planning simulation model;b)digital twin map modeling of ZS_ibot and path planning simulation model;c)digital twin map model-ing of ZS_ubot;d)digital twin of ZS_ibot an

19、d path planning simulation model;e)path planning simulation model of ZS_ibot;f)path planning simulation model of ZS_ibot 396 极地研究 第 35 卷 仿真得到的路径规划结果由服务器分发给上传数据的节点单元,作为全局路径,在遇到动态障碍时采用常用的传统动态窗口法(Dynamic Window Approach,DWA)或者时域弹性法(Time Elastic Band,TEB)进行模拟和计算11。执行任务的前提是基于孪生信息的规划,能够保证信息安全且高效传输,使得数字孪生建

20、模后获得的模型能够将路径规划仿真结果最大限度地靠近现实情况。因此,为获得全面的实际运行情况,保障自动驾驶的安全,需要进行精细化信息采集。而获取的精细化信息需要再拓扑化,以最大限度地提取需要的特征信息,提升信息传播效率。此外,需要考虑的是如何规划路径,以及如何通过联邦学习方法提升系统路径规划的质量。2 元启发算法与数字双胞胎模型 通信系统的另一重要部分是路径规划算法的实现,主要包括对路径规划算法的设计以及联邦学习中的数字孪生技术的融合。为实现该算法,首先要对移动巡检单元的路径规划任务进行描述,然后要对元启发式路径规划算法进行改进、融合和优化。2.1 移动巡检单元的路径规划任务 移动巡检单元路径规

21、划任务主要内容是路径定制和自主导航。在三维/二维空间中进行路径规划首先需要对空间进行离散化处理,转化为栅格/立方体空格。根据所设置的航点个数,在规划空间搜索有序的多个航点。从起点依次连接至目标点,形成航迹。规划空间使用矩阵表示为 S:111212122212nnnnnneeeeeeeeeS (1)在实际场景中存在障碍区域或者移动的其他载具,会影响移动巡检单元运动和路径选择,本研究将其定义为禁行区,即为威胁移动巡检单元安全的区域,以及移动巡检单元威胁环境的区域。在模拟过程中需要建立禁行区域单元,以将数字模型映射到计算机仿真计算。南极中山站的地形中各类障碍形状不一,为了使计算成本降低且有足够的安全

22、距离,本研究根据计算机最小地图单元建立了长方体和矩形障碍用来模拟禁行区m=(1,2,m)。禁行区可分为室外禁行区(超过行驶能力的坡度地形,建筑以及车辆等静止大型障碍,松软泥土和雪面,以及地理围栏之外等)及室内禁行区(桌椅,地沟,雪地车和大型设备等)。设定地图区域左下角为原点,每个禁行区域距离原点最近的点视为该区域的坐标,禁行区域位置集合表示为 bm=(b1,b2,bm),bi=(xm,ym),禁行区域的长为 lm,宽为 rm,高为 hm。如图3a 与 3b 中计算机仿真中的路径规划模型所示,对于具备 16 线雷达探测的 ZS_ubot 采用立体单元的地图;对于只拥有单线雷达的 ZS_ibot,

23、由于数字孪生建模后的地图是二维栅格图,因此采用二维平面图。两类地图的障碍坐标与区域选定规则一致。路径规划中移动巡检单元航迹规划的代价模型由多种指标构成,航迹代价为适应度数值的倒数。该指标由两部分组成:第 1 部分为里程计计数能量损耗函数 fodom,第 2 部分为禁行区威胁函数 fthre。由于仿真为理想情况,即无碰撞,轮胎与地面无相对滑动摩擦,fodom可以用路径长度等价表示,如公式(2)所示:odomodom1niifpl (2)其中,podom为动力轮胎半径的反比例函数值,具体根据数字孪生模型而定。在此可认为是 1 个比例常数。li为第 i 段的运行里程值。12222111iiiiiii

24、lxxyyzz (3)对于路径上的某点(xd,yd)距离障碍物上任意点(xr,yr)的距离为 di如公式(4)所示:12221111,idrdrmrmmmrmmiiiddiiidiidiidxxyyxxxyyyxxxxxyyyyyxx xyy ylr (4)移动巡检单元经过障碍时,需要确保不与障碍碰撞且保持一定安全距离。则将会有威胁函数fthre,如公式(5)所示:第 3 期 王煜尘等:基于联邦学习的中山站移动传感单元启发式路径规划算法研究 397 thre1niifQ (5)其中Qi为第 i段路径上距离障碍小于最佳距离dsu的点的威胁度之和,用公式(6)表示为:1su,nitttitQddd

25、dd (6)整体评价函数 Fes包含了公式(2)与公式(5)提出的能量损耗函数和威胁函数。通过 1对两类函数赋权重,如公式(7)所示:es1 odom1thre1Fff (7)针对数字孪生移动巡检单元的路径规划问题转换非线性规划问题求最优解。本研究使用元启发类优化器对问题进行求解。2.2 改进的灰狼优化算法 我们尝试改进灰狼优化算法对元启发类路径规划算法进行融合和优化。灰狼优化算法模拟了灰狼在自然界中的捕食行为,在算法中,为头狼领导整体,为成年公狼辅助决策,为普通公狼进行具体行动安排,服从三者,为剩余捕猎狼12。在 G 维搜索空间中,假设灰狼种群中的灰狼个体的数目为 N,其中第 i 只灰狼在

26、G 维空间中的位置可表示为 Xi=(Xi1,Xi2,XiG),猎物的位置对应于优化问题的全局最优解。灰狼优化算法的寻优过程为:在搜索空间中随机产生一群灰狼个体,对于这群灰狼个体进行适应度评估,得出适应度前 3 的灰狼个体、,由它们作为寻找猎物的位置(全局最优解)的基准,下一代的灰狼个体的位置根据、的位置计算得出。在捕食过程中,灰狼种群首先须对猎物采取包围行动。对应在灰狼优化算法的寻优过程中,确定个体与猎物之间的距离13如公式(8)所示:es1 odom1thre1Fff (8)distance(1)()pnnADXX (9)12Aara (10)22Cr (11)式中:Xp(n)为第 n 代时

27、猎物的位置向量;X(n)为第n 代时灰狼个体的位置向量;A 和 C 为系数;a 随着迭代次数从 2 线性递减到 0;r1和 r2为0,1之间的随机数;Ddistance为个体与猎物之间的距离。对于种群中其他的狼,根据最高级的3头灰狼、和 个体位置来判断猎物的方位,如下式所示:123DCDCDCXXXXXX (12)112233A DA DA DXXXXXX (13)123(1)/3t XXXX (14)改进灰狼优化算法目的在于解决在航迹规划中出现的航点杂乱导致个体适应度较低的现象。鉴于灰狼算法在搜寻距离时逐步降低参数a,导致更新策略不灵活,在寻找最优位置时,过程较长或者陷入局部最优。因此改进的

28、灰狼算法引入以下策略。1.结合贪婪搜索的初始化方法,在一定程度上提升种群个体的平均适应度。在智能体选择航点时,利用前一步的航点信息,将目标探索方向缩小至上一步点作为下边界,目标点为上边界的区域。在贪婪搜索算法的初始化方法如下:1,iixxU x e (15)1,iiyyU y e (16)其中,xi、xi+1 为个体中两个相邻的航点坐标的横坐标;yi、yi+1为个体中两个相邻的航点坐标的纵坐标;ex、ey 为目标点坐标的横坐标和纵坐标;U 为航点坐标的均匀分布函数。2.变速率的迭代控制系数:a随着迭代次数的增加,从 2 非线性递减到 0,变化速率先慢后快,可以利用函数表示,如公式(17)所示:

29、2cos(/)(/2)an N (17)式中的n为迭代代数,N设定迭代数。3.狼群攻击模式的权重变更,采取动态平均方法和静态平均方法相结合的位置更新策略,如公式(18)(20)所示:qsa (18)f=f+f+f (19)X(t+1)=(fX1+fX2+fX3)/f (20)其中,q为阈值;s为动态加权比例介入系数;f、f、f分别为 3 类智能狼的适应度值,f是整体适应度值。如果头狼与普通公狼适应度值差大于q,则使用动态加权平均;反之,采用原始的静态平均。398 极地研究 第 35 卷 3 仿真实验与现场试验 3.1 仿真实验 移动巡检单元路径规划的计算机仿真实验中,选择了 4 类场景分别对应

30、场景 1:室外环境(500 m 500 m);场景 2:室内开阔大环境(60 m 60 m);场景 3:室内复杂大环境(60 m60 m);场景 4:室内复杂小环境(16 m16 m)。其中场景4 是依托中山站室内发电建筑内景进行的规划,现场试验也在该场景中进行。场景 2 为整个站区,室外面积为 2.5105 m2,本研究通过二维路径规划结果作为实际路径规划任务的替代数据。原因在于无人机会导致某个正射投影下的垂直坐标改变该单元,而 ZS_ubot 的垂直坐标是固定的(随沙盘每个点固定的海拔),不需要考虑具体数值。因此继续使用二维地图规划算法,仿真计算平台参数如表 3 所示。图47分别为4个场景

31、的初始路径规划结果以及参数优化后的路径规划结果。其中,PSO 代 表粒子群算法,GA代表遗传算法,GWO代表灰狼算法,IGWO 代表改进的灰狼算法。图 4a4d 分别是初始参数输入下的路径规划结果。图 4a 为多类优化算法路径规划结果图,图4b为平面轨迹对比,图 4c 为 4 种优化算法的适应度变化对比,图4d 为最优规划路径的结果。图 4e4h 是优化后参数输入下的路径规划结果。类似地,图 57 的各分图也分别代表各自场景下的路径规划结果对比。表 3 计算机参数 Table 3.Computer configuration 参数种类 具体设置 硬件 台式工作站 中央处理器&频率Intel(R

32、)Core(TM)I5 10600 KF 4.10 GHz图形处理器 NVIDIA GeForce GTX 3060Ti 4 GB 可擦除存储器 DDR4 16 G 2666 MHz 硬盘 Seagate 8 T 软件 MATLAB R2019b 操作系统 Windows 10 图 4 场景 1 的路径规划仿真结果。a)初始化参数路径规划结果示意;b)无碰撞的初始化参数规划结果;c)优化算法对比;d)初始化参数下最优规划结果;e)优化后参数的规划结果;f)无碰撞的优化后参数规划结果;g)参数优化后的优化算法对比;h)优化后参数下最优规划结果 Fig.4.Simulation results o

33、f path planning for Scenario 1.a)illustration of initialized parameter path planning results;b)comparison of initialized parameter planning results without collision;c)comparison of optimization algorithms;d)optimal planning results with initialized parameters;e)planning results with optimized param

34、eters;f)planning results with optimized parameters without collision;g)comparison of optimization algorithms with optimized parameters;h)optimal planning results with optimized parameters 第 3 期 王煜尘等:基于联邦学习的中山站移动传感单元启发式路径规划算法研究 399 图 5 场景 2 的路径规划仿真结果。a)初始化参数路径规划结果示意;b)无碰撞的初始化参数规划结果;c)优化算法对比;d)初始化参数下最

35、优规划结果;e)优化后参数的规划结果;f)无碰撞的优化后参数规划结果;g)参数优化后的优化算法对比;h)优化后参数下最优规划结果 Fig.5.Simulation results of path planning for Scenario 2.a)illustration of initialized parameter path planning results;b)comparison of initialized parameter planning results without collision;c)comparison of optimization algorithms;d)o

36、ptimal planning results with initialized parameters;e)planning results with optimized parameters;f)planning results with optimized parameters without collision;g)comparison of optimization algorithms with optimized parameters;h)optimal planning results with optimized parameters 图 6 场景 3 的路径规划仿真结果。a)

37、初始化参数路径规划结果示意;b)无碰撞的初始化参数规划结果;c)优化算法对比;d)初始化参数下最优规划结果;e)优化后参数的规划结果;f)无碰撞的优化后参数规划结果;g)参数优化后的优化算法对比;h)优化后参数下最优规划结果 Fig.6.Simulation results of path planning for Scenario 3.a)illustration of initialized parameter path planning results;b)comparison of initialized parameter planning results without colli

38、sion;c)comparison of optimization algorithms;d)optimal planning results with initialized parameters;e)planning results with optimized parameters;f)Planning results with optimized parameters without collision;g)comparison of optimization algorithms with optimized parameters;h)optimal planning results

39、 with optimized parameters 400 极地研究 第 35 卷 图 7 场景 4 的路径规划仿真结果。a)初始化参数路径规划结果示意;b)无碰撞的初始化参数规划结果;c)优化算法对比;d)初始化参数下最优规划结果;e)优化后参数的规划结果;f)无碰撞的优化后参数规划结果;g)参数优化后的优化算法对比;h)优化后参数下最优规划结果 Fig.7.Simulation results of path planning for Scenario 4.a)illustration of initialized parameter path planning results;b)co

40、mparison of initialized parameter planning results without collision;c)comparison of optimization algorithms;d)optimal planning results with initialized parameters;e)planning results with optimized parameters;f)planning results with optimized parameters without collision;g)comparison of optimization

41、 algorithms with optimized parameters;h)optimal planning results with optimized parameters 从 4 个场景的结果中可得,在每个场景的规划算法中,本研究所提出的改进的灰狼算法(IGWO)均具有最快的收敛;每个算法的规划结果中,均存在无碰撞或无法到达目标的情况。相关设定参数以及结果见表 4。表 4 仿真实验参数对比 Table 4.Comparison of simulation experiment parameters 参数 场景1 场景2 场景3 场景4地图尺寸mm 500500 6060 6060 1

42、616初始栅格精度mm 55 0.60.6 0.750.75 0.40.4优化栅格精度mm 1010 1.51.5 1.51.5 0.40.4初始种群数量 100 50 30 120 优化种群数量 60 150 30 100 初始迭代数目 30 30 80 30 优化迭代数目 30 60 30 80 初始IGWO路径长度/m 896 88.2 96.6 16.24优化后IGWO路径 长度/m 714 77.7 92.4 15.68 在 4 个场景中,不同的地图精度所导致的威胁函数贡献区别较大。威胁程度与路径共同组成损失函数。在 4 个场景中规划路径的长度受联邦优化的引入而减少。4 个场景分别减

43、少了 182 m,10.5 m,4.2 m 以及 0.56 m。损失函数数值,运行时间以及各优化函数的横向对比如图 8 所示。其中图 8a8d分别代表场景1到场景4的结果。结合表4参数,可以看出,新提出的优化算法在原算法的基础上获得了更快的收敛,使该算法在本任务提出的数学模型中获得更广泛的优势。联邦学习机制引入后的参数输入,使得每个场景的损失函数在保证规划用时在同一数量级的前提下得到显著下降。3.2 现场试验 基于南极中山站自动巡检单元总体设计方案,本研究特别针对数字孪生和联邦学习执行路径规划算法进行了路径规划现场试验。这里选择仿真实验中的场景4作为示例,场景4是基于中山站发电建筑室内1层实际

44、地图的二维栅格映射。现场试验实现了1个面积约196 m2环境的点云建图和仿真 形 式 的 路 径 规 划(图9),针 对 本 地 给 定点 第 3 期 王煜尘等:基于联邦学习的中山站移动传感单元启发式路径规划算法研究 401 图 8 4 个场景路径规划用时,总路径长度以及损失值对比。a)场景 1;b)场景 2;c)场景 3;d)场景 4 Fig.8.Comparison of path planning time,total path length and loss values for four scenarios.a)Scenario 1;b)Scenario 2;c)Scenario 3

45、;d)Scenario 4 图 9 中山站发电栋内部导航实验示例。a)全局路径规划下的未知障碍躲避;b)小区域路径平滑;c)兴趣点到达及图像采集 Fig.9.Example of navigation experiment inside the power generation building of Zhongshan Station.a)unknown obstacle avoidance under global path;b)small area path smoothing;c)point of interest arrival and image acquisition 402 极

46、地研究 第 35 卷 位的自主路径导航以及通过卫星通信的遥操作给定点位的自主路径导航进行了测试。结合仿真的全局路径规划结果,可将现场试验的数字化过程显示在计算机的前端界面。由于栅格点集是离散的,而移动巡检单元在实际物理场景中的移动是连续的,因此考虑到阿克曼车型的特点,我们针对车体设计了局部区域的转向与平滑算法,以确保车辆在两个全局规划点位的过渡过程能够安全且高效。试验过程中,全局路径规划上出现 1 个临时障碍,且地图中未标注,本单元通过障碍识别对障碍物进行有效绕行,随后回归到全局轨迹上(图 9a)。图 9b 所示连续的红色箭头是当前状态的小区域路径平滑,目的是确保全局规划的小区域执行率。该单元

47、成功到达预先位置并对发电机的油囊情况进行了拍照(图 9c)。同时,巡检结果信息、路径损失函数、路径长度、规划用时以及设置参数均通过卫星传输到国内。本研究的总体设计方案完成了南极中山站遥操作,并实现了巡检单元自主巡检的基本功能。4 讨论 本研究形成了 1 套应对南极中山站通信算力资源短缺情况,基于数字孪生和联邦学习执行路径规划算法的机制。该方法在中山站的试验效果良好,适用于南极地区考察站移动巡检单元应用。但其也具有局限性,主要包括以下两点。其一,该单元过度地依赖站区内的通信网络,即站区内的全覆盖无线通信网。这一点在南极中山站室内已经局部实现,而在室外则通过临时搭建200 m 直径大功率热点覆盖的

48、方式进行通信和实验。但对于南极地区的大多数考察站,站区无线网路全覆盖的投入较大,实施存在困难,因此应用在其他类似场景时工程难度较大。其二,时刻改变的地理信息。在南极,大风雪等极端天气很常见,这就需要快速更新点云地图(厚积雪的积累影响区域的表面高程)。目前仍然缺乏实时更新数字地图的有效手段,因此本研究推荐适用场景转向室内的移动巡检单元作业。此外,本研究主要针对的是路径规划问题及其对应的联邦学习机制,对于动态避障,轨迹预测等联邦学习机制的主要服务对象未作展开介绍。尽管还存在局限和不足,本研究设计的移动巡检单元已经初步满足了南极中山站室内巡检工作的基本需求。其优点在于节省通信资源以及当地算力资源(某

49、种意义上节约了能量),提升了路径规划的效率,因此可以在类似场景中推广和应用此方案。5 结论 为实现移动巡检单元对中山站及其所在环境的数字化建模以及自主导航,特别是优化路径规划机制,本研究通过组建移动巡检单元、多类仿真实验以及南极现场的遥操作路径规划试验,在以下几个方面有所创新。1.设计了 1 种用于南极中山站自动巡检的移动巡检单元。2.设计并搭建了中心化网络结构,实现了1种联合优化本地模型参数机制。3.设计了卫星-地面网络耦合通讯链路模块。4.提出了 1 种改进的元启发式栅格地图路径规划算法和两种路径规划结合边缘计算的联合优化机制。本研究实现了中山站移动巡检单元到兴趣点的自主规划,改进的灰狼算

50、法在各类优化算法解决路径规划问题上具有用时最短、路径规划长度最少、损失值最低的特点。现场试验证明了本研究设计方案的可行性,以及实现整个巡检任务的完整性。未来可继续尝试使用联邦优化机制,利用本地地图神经网络,提升自动化单元在南极考察站,乃至其他远景地区,如月球、火星等区域的自主导航和执行任务能力。参考文献 1 刘艳.电力设备状态人工巡检感知信息数字化方法研究D.武汉:华中科技大学,2019.第 3 期 王煜尘等:基于联邦学习的中山站移动传感单元启发式路径规划算法研究 403 2 蔡自兴,贺汉根,陈虹.未知环境中移动机器人导航控制研究的若干问题J.控制与决策,2002,17(4):385-390,

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服