收藏 分销(赏)

自主机器人的主动观察模式及软件实现架构.pdf

上传人:自信****多点 文档编号:606932 上传时间:2024-01-12 格式:PDF 页数:11 大小:4.41MB
下载 相关 举报
自主机器人的主动观察模式及软件实现架构.pdf_第1页
第1页 / 共11页
自主机器人的主动观察模式及软件实现架构.pdf_第2页
第2页 / 共11页
自主机器人的主动观察模式及软件实现架构.pdf_第3页
第3页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、h t t p:/ww wj s j k x c o mD O I:/j s j k x 到稿日期:返修日期:基金项目:国家自然科学基金()T h i sw o r kw a ss u p p o r t e db yt h eN a t i o n a lN a t u r a lS c i e n c eF o u n d a t i o no fC h i n a()通信作者:杨硕(y a n g s h u o n u d t e d u c n)自主机器人的主动观察模式及软件实现架构肖怀宇,杨硕毛新军,国防科技大学计算机学院长沙 湖南省复杂系统软件工程重点实验室长沙 国防科技大学系统

2、工程学院长沙 (x i a o h u a i y u n u d t e d u c n)摘要自主机器人运行在开放环境中,对环境信息的感知受限,难以获得有关环境完整、及时的信息.为有效完成任务,自主机器人需要主动地观察环境,即根据任务的需求,自发地决策、调度和执行观察行为,针对性地获取与任务相关的环境信息.主动观察的需求给自主机器人的观察模式以及软件系统构造提出了两方面的挑战:一方面,为支持任务的有效实现,需设计主动的观察模式,从机制层面确保自主机器人能够基于任务需求,观察所需的环境信息;另一方面,主动的观察模式导致自主机器人观察、决策等软构件的功能抽象和数据交互更为复杂,需要针对上层复杂机

3、制的实现设计适配的软件架构.为应对上述挑战,文中将自主机器人的行为定义为任务行为和观察行为两类,针对开放环境中两类典型的环境信息受限场景 片面观察场景和过时观察场景,提出了两类主动观察模式来构建观察行为与任务行为的协同机制,并基于这两类主动观察模式设计了观察行为的决策和调度算法.另外,还设计了一个基于多智能体系统的自主机器人软件架构,实现了所提出的主动观察模式.最后,为验证所提出的主动观察模式的有效性,选取开放环境中一个典型的任务 图书馆服务机器人的图书传送任务开展实验验证.该任务中,自主机器人对图书的位置信息受限,容易导致图书传送任务失败.文中选取当前自主机器人领域主流的反应式观察和伴随观察

4、模式作为对比方法,通过从行为执行过程、行动轨迹和时间消耗方面进行对比,验证了所提方法的有效性.关键词:自主机器人;开放环境;观察行为;主动观察模式;自主机器人软件中图法分类号T P A c t i v eO b s e r v a t i o nS c h e m e sa n dS o f t w a r e I m p l e m e n t a t i o nA r c h i t e c t u r eo fA u t o n o m o u sR o b o tX I AO H u a i y u,YAN GS h u oa n dMAOX i n j u n,C o l l e g

5、 eo fC o m p u t e rS c i e n c ea n dT e c h n o l o g y,N a t i o n a lU n i v e r s i t yo fD e f e n s eT e c h n o l o g y,C h a n g s h a ,C h i n aK e yL a b o r a t o r yo fS o f t w a r eE n g i n e e r i n gf o rC o m p l e xS y s t e m s,C h a n g s h a ,C h i n aC o l l e g eo fS y s t e

6、 m sE n g i n e e r i n g,N a t i o n a lU n i v e r s i t yo fD e f e n s eT e c h n o l o g y,C h a n g s h a ,C h i n aA b s t r a c t A u t o n o m o u sr o b o t so p e r a t e i nt h eo p e ne n v i r o n m e n t,t h e i rp e r c e p t i o no f e n v i r o n m e n t a l i n f o r m a t i o n i

7、 s l i m i t e d,a n d i t i sd i f f i c u l t t oo b t a i nc o m p l e t ea n dt i m e l y i n f o r m a t i o na b o u t t h ee n v i r o n m e n t I no r d e r t oe f f e c t i v e l yc o m p l e t e t a s k s,a u t o n o m o u s r o b o t sn e e dt oa c t i v e l yo b s e r v e t h e e n v i r

8、 o n m e n t,t h a t i s,a c c o r d i n g t o t h e r e q u i r e m e n t s o f t a s k s,t om a k ed e c i s i o n s,s c h e d u l e a n de x e c u t eo b s e r v a t i o nb e h a v i o r ss p o n t a n e o u s l y,a n do b t a i nt a s k r e l a t e de n v i r o n m e n t a l i n f o r m a t i o

9、n T h ed e m a n df o ra c t i v eo b s e r v a t i o np o s e st w oc h a l l e n g e s t o t h e o b s e r v a t i o ns c h e m eo f a u t o n o m o u s r o b o t s a n d t h e c o n s t r u c t i o no f s o f t w a r e s y s t e m s O n t h eo n eh a n d,i no r d e r t os u p p o r t t h ee f f e

10、 c t i v e i m p l e m e n t a t i o no f t a s k s,a c t i v eo b s e r v a t i o ns c h e m e ss h o u l db ed e s i g n e dt oe n s u r et h a ta u t o n o m o u sr o b o t sc a no b s e r v et h er e q u i r e de n v i r o n m e n t a l i n f o r m a t i o nb a s e do nt a s kr e q u i r e m e n

11、 t sf r o mt h em e c h a n i s ml e v e l O nt h eo t h e rh a n d,t h ea c t i v eo b s e r v a t i o ns c h e m e sm a k e t h e f u n c t i o na b s t r a c t i o na n dd a t a i n t e r a c t i o no f t h e s o f t w a r e c o m p o n e n t s s u c ha so b s e r v a t i o na n dd e c i s i o n

12、m a k i n go f a u t o n o m o u sr o b o t sm o r ec o m p l i c a t e d,s o i t i sn e c e s s a r yt od e s i g nas o f t w a r ea r c h i t e c t u r es u i t a b l e f o r t h e i m p l e m e n t a t i o no f t h ec o m p l e xm e c h a n i s mo nt h eu p p e r l e v e l I no r d e r t od e a l

13、w i t ht h ea b o v ec h a l l e n g e s,t h i sp a p e rd e f i n e s t h eb e h a v i o r so f a u t o n o m o u s r o b o t s a s t a s kb e h a v i o r s a n do b s e r v a t i o nb e h a v i o r s T w ok i n d so f a c t i v eo b s e r v a t i o ns c h e m e sa r ep r o p o s e dt oc o n s t r

14、u c t ac o l l a b o r a t i v em e c h a n i s mb e t w e e no b s e r v a t i o nb e h a v i o r sa n dt a s kb e h a v i o r s,a i m i n ga t t h e t w ot y p i c a ls c e n e sw i t hl i m i t e de n v i r o n m e n t a l i n f o r m a t i o ni nt h eo p e ne n v i r o n m e n t:o n e s i d e do

15、 b s e r v a t i o na n do u t d a t e do b s e r v a t i o ns c e n e s,a n dt h ed e c i s i o na n ds c h e d u l i n ga l g o r i t h m s o f o b s e r v a t i o nb e h a v i o r a r ed e s i g n e db a s e do n t h e s e t w oa c t i v e o b s e r v a t i o ns c h e m e s I na d d i t i o n,a n

16、a u t o n o m o u s r o b o t s o f t w a r e a r c h i t e c t u r eb a s e do n t h em u l t i a g e n t s y s t e mi sd e s i g n e d t o i m p l e m e n t t h ep r o p o s e da c t i v eo b s e r v a t i o ns c h e m e s F i n a l l y,i no r d e r t ov e r i f yt h ee f f e c t i v e n e s so f

17、t h ep r o p o s e da c t i v eo b s e r v a t i o ns c h e m e s,at y p i c a l t a s k i nt h eo p e ne n v i r o n m e n t:t h eb o o kt r a n s f e rt a s ko ft h el i b r a r ys e r v i c er o b o t i ss e l e c t e dt oc a r r yo u te x p e r i m e n t a lv e r i f i c a t i o n I nt h i st a

18、s k,t h e l o c a t i o n i n f o r m a t i o no f t h eb o o k i s l i m i t e db y t h e a u t o n o m o u s r o b o t,w h i c he a s i l y l e a d s t o t h e f a i l u r eo f t h eb o o k t r a n s f e rt a s k I nt h i sp a p e r,t h er e a c t i v eo b s e r v a t i o na n dt h ea c c o m p a

19、n y i n go b s e r v a t i o ns c h e m e so f t h ec u r r e n tm a i n s t r e a mi nt h ef i e l do fa u t o n o m o u sr o b o t sa r es e l e c t e da s t h ec o m p a r i s o nm e t h o d,a n dt h ee f f e c t i v e n e s so f t h ep r o p o s e dm e t h o d i sv e r i f i e db yc o m p a r i

20、n gt h eb e h a v i o re x e c u t i o np r o c e s s,m o t i o nt r a j e c t o r ya n dt i m ec o n s u m p t i o n K e y w o r d s A u t o n o m o u sr o b o t,O p e ne n v i r o n m e n t,O b s e r v a t i o nb e h a v i o r,A c t i v eo b s e r v a t i o ns c h e m e,A u t o n o m o u s r o b o

21、 t s o f t w a r e引言近年来,越来越多的自主机器人被应用于人类社会的各类开放服务型领域,与开放环境持续交互,通过自主决策和执行行为完成任务.开放环境的动态性和部分可观察性导致自主机器人对环境信息的感知受限,从而无法获得有关环境完整、及时的信息,也因此难以决策产生有效的行为实现任务.例如,在图书馆服务场景下,自主机器人需要根据读者的需求,导航至图书位置为读者取书.然而,该场景下图书位置可能发生变动,自主机器人无法全面、及时地获知目标图书的位置情况,导致决策的行为无法有效传送图书.自主机器人受限的环境信息成为制约任务有效实现的关键因素.在任务执行过程中,自主机器人通过观察结果来更

22、新环境信息,并基于这些环境信息决策产生行为以完成任务 .然而,在大部分工作中,自主机器人采取的观察模式缺乏主动性,即自主机器人在任务过程中无法自发地根据任务需求决策、调度和执行观察行为,难以按需、高效地获得与任务相关的环境信息.同样以图书馆服务场景为例,自主机器人往往在面临图书位置信息缺失而无法完成抓取的情况时,才会触发搜索图书位置的观察行为.这使得自主机器人在片面、过时的环境信息下进行决策,决策出的行为序列难以有效地完成任务.因此,自主机器人需要更加主动地对环境进行观察:即在明确观察动机的前提下,自发地决策、调度和执行观察行为,使自主机器人能够在合适的时机和地点,进行针对性的观察,全面、及时

23、地获取与任务相关的环境信息,减少环境信息受限这一限制性因素对任务实现的影响.主动观察的上述需求给自主机器人的观察模式和软件架构设计带来了挑战.一方面,主动观察要求自主机器人明确开放环境中会导致环境信息受限的场景.在此基础上,需要进一步明确自主机器人应当观察的目标,以及决策、调度和执行观察行为的时间和地点,这使得自主机器人观察模式的设计变得更加复杂和困难.另一方面,主动的观察模式带来的复杂机制要求自主机器人软件系统提供支持观察、决策等功能的软构件,并支持这些软构件之间的灵活交互,这使得抽象和设计一个有效适配主动观察模式的自主机器人软件架构变得复杂.针对上述挑战,本文首先分析开放环境下两类典型的、

24、自主机器人环境信息受限的场景,提炼出两类观察的动机:片面观察导致的信息缺失需要自主机器人进行观察;过时观察导致的环境信息与当前环境不一致需要自主机器人进行观察.在此基础上,本文将自主机器人行为明确定义为任务行为和观察行为两类,并提出针对片面观察和过时观察的两类主动观察模式,显式定义这两类行为间的协同机制,明确了观察行为的观察目标和执行地点.其次,本文基于上述主动观察模式提出了二阶段的观察行为决策算法和在线评估的观察行为调度算法,明确观察行为的产生和执行时机,有效实现观察结果的及时反馈和行为的自适应调整.另外,本文基于多智能体系统设计和开发了一个自主机器人软件架构,用于实现上述主动观察模式.最后

25、,本文设计了一个图书传送实验,分别选取了反应式观察和伴随观察模式进行对比,从行为执行过程、行动路径和时间消耗方面验证了所提模式的有效性.本文第章介绍了相关工作;第章介绍了自主机器人的主动观察模式以及相关决策和调度算法;第章介绍了基于多智能体系统的自主机器人软件架构;第章分析了实验结果;最后总结全文.相关工作近年来,机器人和软件工程领域涌现出了许多工作,共同致力于提高开放环境下自主机器人任务实现的健壮性和有效性.一方面,机器人研究学者围绕如何增强自主机器人的观察能力,从行为控制方面,研究自主机器人的观察模式;另一方面,软件工程领域从功能抽象、软件构造等角度考虑软件系统对自主机器人观察的支持.本章

26、将从自主机器人的观察模式和软件架构两个方面介绍现有工作进展,并分析和讨论其优势和不足.自主机器人的观察模式 领域相关的观察模式领域相关的观察模式指自主机器人针对具体领域问题,采取的特殊观察模式.在抓取领域中,对物体的抓取高度依赖于环境状态,需要自主机器人对当前环境有一个全面、清晰的认知,并基于该认知进行大量的计算.因此,自主机器人通常遵循着“s e n s e p l a n g r a s p”的观察模式.在导航领域中,自主机器人需要实时监控环境信息,避免发生碰撞.因此,自主机器人往往采取持续性的观察模式 .在搜索领域中,自主机器人需要排除环境中的干扰项,以获得更佳的观察视野,自主机器人常常

27、采取“a c t t os e e,s e et oa c t”的观察模式.领域相关的观察模式在其专注的领域具有优秀的性能,但是由于其太过聚焦于具体领域的特征,难以泛化到其他问题中.反应式观察模式反应式观察模式指自主机器人根据用户设定的规则触发观察的一类观察模式.反应式观察模式被广泛应用于需要应急处理的任务.在陪护任务中,当陪护人员的位置信息丢失时,自主机器人触发观察行为,搜索陪护人员的位置.在导航任务中,当环境模型与感知数据出现偏差时,自主机器肖怀宇,等:自主机器人的主动观察模式及软件实现架构人触发观察行为,观察周围环境修正环境模型.在文献 中,当高速移动的物体接近人们时,自主机器人触发观察

28、行为,持续检测和跟踪物体的运动情况,帮助人们安全移动.文献 提出了一种基于深度强化学习的反应式观察模式,当自主机器人发现环境中存在未观察的部分时,将会触发环顾四周的观察行为,减少环境的不确定性.R O S P l a n 提供了一个实现反应式观察模式的软件框架,开发者可以单独编写观察行为节点,当满足观察行为的触发规则时,自主机器人能够取消当前行为,转而执行观察行为.反应式观察模式能够使自主机器人快速地对环境变化做出反应,具有很强的实时性.但是其缺乏从长远角度考虑观察行为的决策和执行.主动观察模式主动观察模式要求自主机器人明确进行观察的目的,进而选定观察的目标,并确定进行观察的时间、地点和方式.

29、基于主动观察模式的自主机器人进行观察时具有鲜明的自发性.在文献 中,为了确保任务的可行性和可信性,自主机器人在行为规划过程中,决策产生观察行为来验证动作的可操作性.在文献 中,为提高基于P l a n n i n gD o m a i nD e f i n eL a n g u a g e规划系统任务执行的健壮性,自主机器人将会针对动作的前提条件和执行效果决策和执行观察行为.文献 针对开放环境带来的不确定性问题,提出了伴随观察模式监控任务的执行情况,以确保任务健壮的完成.主动观察模式赋予了自主机器人内在的观察动机,使自主机器人能够根据任务需要,自发地决策、调度和执行观察行为,针对性地获取与任务

30、相关的环境信息.这为解决开放环境下自主机器人环境信息感知受限的问题提供了参考方案.自主机器人的软件架构自主机器人的软件架构描述了软件的组成部件以及部件间的交互方式,反映了自主机器人的行为决策逻辑.围绕这一研究课题,逐步形成了审慎式架构和基于行为的架构两类自主机器人软件架构.审慎式架构在审慎式架构中,自主机器人将其获取到的环境信息存储到知识库中,并通过推理来决定执行的行为.其软件通常包含传感部件、环境模型部件、规划部件以及执行部件.审慎式架构使自主机器人能够基于当前信息做出合理的规划,适用于环境建模准确的场景,而这样的要求在真实环境中是难以满足的.因此,大量工作通过扩展审慎式架构来满足实际任务需

31、求.在文献 中,在审慎式架构的基础上,增加了学习部件,使自主机器人在任务执行过程中能以符号表示学习到的技能.在文献 中,通过将审慎式架构与反应式架构结合,构造自主机器人集群控制软件,以反应性个体的相互作用,从群体层面体现审慎性.虽然审慎式架构被广泛应用于自主机器人软件,但是其观察行为被限制在固定的环节,导致自主机器人难以灵活地执行观察行为.基于行为的架构在基于行为的架构中,行为是一个包含了诸多约束、用于实现和维护某一目标的软件模块.基于行为的架构的自主机器人软件呈现出了分布性的 特点.与 审慎 式架 构 相比,其不具备中心化的世界模型.B r o o k s 提出了一个基于行为的层次式架构,用

32、于构造移动机器人软件,通过设置行为层次和引入仲裁机制来协调行为的执行,提高了自主机器人任务执行的反应性和健壮性.自此,大量的工作基于行为的架构设计和开发自主机器人软件.文献 基于行为的架构设计无人机控制软件,并基于优先级的方式调度行为,通过设置不同的运行模式,使无人机能够快速适应环境.文献 提出了一个基于行为的人形机器人安全部署框架,通过遵循一些通用的指导,将保障机器人安全运行的行为分为覆盖、临时覆盖以及主动覆盖类,以满足不同情况下的安全需求,有效提高了自主机器人运行的安全性.虽然基于行为的架构具有较强的反应性,但是由于行为之间的独立性过强,从全局的角度看,难以协调观察行为的执行.自主机器人的

33、主动观察模式开放环境下自主机器人的主动观察模式要求探索会影响自主机器人任务实现的环境信息受限的场景,进而明确观察的动机,并基于该动机明确观察的目标、地点和时机.本章在定义自主机器人系统后,分析图书传送任务下片面观察和过时观察这两类环境信息受限的场景,明确自主机器人观察的动机.基于上述动机,针对性地提出两类主动观察模式,明确自主机器人观察的目标和地点,并进一步提出了观察行为的决策和调度算法,明确观察行为的产生和执行时机.自主机器人系统定义(自主机器人系统)自主机器人系统可以使用一个元组来描述:S,K,s,v.其中,S表示环境状态的集合,K表示自主机器人的知识集合,表示完成特定任务步骤的任务行为的

34、集合,表示获取环境信息的观察行为的集合.两类行为以行为目标为主要区分,任务行为用于完成某一具体子任务,而观察行为用于获取环境信息.两类行为的详细定义如下.定义(任务行为)由自主机器人控制效应器和传感器,完成特定任务步骤,实现环境或自身状态转移的一类行为.例如,当自主机器人需要完成传送图书任务时,自主机器人将会决策产生前往目标书架、抓取图书、前往传送目的地以及放置图书等任务行为,这些任务行为控制自主机器人的效应器和感知器,实现某一具体子任务.一个任务行为可以使用一个二元组表示,即,其中,表示前置条件,表示执行效果.任务行为的执行可表示为:kK:(k()(k k()()这表示任务行为在执行时,其前

35、置条件应蕴含于自主机器人知识k中;在执行完成后,更新执行效果,知识状态从k转移到k.定义(观察行为)由自主机器人控制效应器和传感器来获取特定环境信息的一类行为.同样以传送图书任务为例,当自主机器人因缺乏目标图书位置信息而无法执行抓取图书的任务行为时,自主机器人需要以缺失的图书位置信息为目标,控制效应器和感知器观察环境,获取所需的环境信息.一个观察行为可以使用一个三元组表示,即,C o m p u t e rS c i e n c e计算机科学V o l ,N o ,S e p 其中,表示触发事件,表示观察目标,表示观察结果.观察行为的执行可表示为:sS:(s()(,s)()这表示,当环境s满足

36、观察行为的触发条件()时,观察行为基于观察目标观察环境s,并返回观察结果.主动观察模式本节通过一个常见的图书传送案例探索环境信息受限的场景,进而明确自主机器人的观察动机.基于该动机,针对性地构建出自主机器人的主动观察模式,以明确观察目标和观察地点.图书传送案例如图所示,图书馆环境开放,环境随机变化.例如,图书可能被读者移动到其他位置.在该环境下,自主机器人需要根据读者需求,导航至目标图书位置,抓取图书,并将其传送至指定位置.图现实的图书馆场景F i g R e a l i s t i c l i b r a r ys c e n e)片面观察场景.当自主机器人接收到传送图书的任务时,自主机器人

37、需要导航到图书所在位置,抓取图书进而传送图书至指定位置.然而,由于开放环境的部分可观察性,自主机器人获得的环境信息是片面的,只能反映部分环境状态.当自主机器人未获取到目标图书的位置信息时,其产生的导航、抓取等任务行为无法执行.在这种情况下,自主机器人需要执行观察行为来搜索图书,为任务行为的执行提供必要的图书位置信息.)过时观察场景.在运行过程中,自主机器人通过对环境的观察,逐渐获取图书的位置信息.基于这些环境信息,决策和执行任务行为完成传送任务.而在开放的图书馆环境中,环境具有动态性.随着环境的变化,图书的位置可能会发生变化.例如,读者阅读完图书后将其放置到了其他的书架,这造成自主机器人的观察

38、结果过时.当自主机器人基于过时的观察结果进行决策时,其决策的任务行为难以完成任务.在这种情况下,自主机器人需要执行观察行为,验证已观察到的环境信息是否与当前环境保持一致,确保任务行为能够有效完成任务.针对片面观察的主动观察模式定义(针对片面观察的主动观察模式)s表示针对片面观察而采取的一类主动观察模式,这类模式旨在获得任务行为缺失的环境信息.给定任务行为,其前置条件()不存在于知识状态k中.观察行为将()作为观察目标,搜索相关的环境信息(见图).针对片面观察的主动观察模式s(,)可以表示为:sS,kK,()k:(),s)()(k k()()这表示自主机器人知识状态k中缺失任务行为的前置条件()

39、时,观察行为将以()为观察目标进行搜索,基于观察结果初始化(),并更新至k 中.在s中,由于自主机器人不具有()的先验知识,因此的执行涉及对整个空间的搜索,其观察地点为环境空间,观察目标可能出现的所有地方.图针对片面观察的主动观察模式F i g A c t i v eo b s e r v a t i o ns c h e m e f o ro n e s i d e do b s e r v a t i o n 针对过时观察的主动观察模式定义(针对过时观察的主动观察模式)v表示针对过时观察而采取的一类主动观察模式,这类模式旨在验证自主机器人已经获知的环境信息是否与当前环境状态一致.给定任务行

40、为,其前置条件()存在于知识状态k中.观察行为将()作为观察目标,通过观察结果验证其与当前环境状态一致(T)与否(F)(见图).针对过时观察的主动观察模式v(,)可以表示为:sS,kK,()k:(),s)()?T:F()图针对过时观察的主动观察模式F i g A c t i v eo b s e r v a t i o ns c h e m e f o ro u t d a t e do b s e r v a t i o n在v中,由于自主机器人具有()的先验知识,因此的执行只涉及对部分空间的验证,其观察地点为环境空间中先验知识指向的地方.两类模式在观察目标和观察地点方面的对比如表所列.表两

41、类主动观察模式的观察目标和观察地点对比T a b l eC o m p a r i s o no fo b s e r v a t i o nt a r g e t sa n do b s e r v a t i o ns i t e sb e t w e e nt w oa c t i v eo b s e r v a t i o ns c h e m e s观察目标观察地点针对片面观察的主动观察模式任务行为 缺 失 的 前置条件环境空间中,观察目标可能出现的所有地方针对过时观察的主动观察模式任务行为 可 能 过 时的前置条件环境空间中,前置条件指向的地方 观察行为的决策和调度算法基于上述两

42、类主动观察模式,本文进一步提出了观察行为的决策以及调度算法,明确观察行为的产生和执行时机.二阶段的观察行为决策算法观察行为不仅随着任务行为离线决策产生,也在执行肖怀宇,等:自主机器人的主动观察模式及软件实现架构过程中随在线决策产生,其决策流程具有显著的二阶段性(见图).离线阶段,自主机器人决策产生任务行为序列s e q,n,实现从当前状态到目标状态的转移.产生s e q后,自主机器人基于主动观察模式s和v决策产生观察行为集合s e t,m.设观察行为的决策函数为o b s e r v a t i o n P l a n(x,y),其中x表示主动观察模式,y表示观察目标.给定主动观察模式x和观察

43、目标y,o b s e r v a t i o n P l a n(x,y)将会产生相应的观察行为.给定s e q中的某一任务行为和自主机器人知识状态k,当k中未包含任务行为的前置条件()时,基于s决策产生针对片面观察的观察行为s;当k中包含(),但()的置信度c o n f低于阈值t h r e s时,基于v决策产生针对过时观察的观察行为v.离线阶段的观察行为决策如算法所示.图二阶段的观察行为决策流程F i g D e c i s i o n m a k i n gp r o c e s so f t w o s t a g eo b s e r v a t i o nb e h a v i

44、 o r算法离线阶段的观察行为决策输入:(s e q,k)输出:s e t初始化:s e t F o r,i ns e q;I f()i sn o t i nk;o b s e r v a t i o n P l a n(s,();A d di n t os e t;E l s e i f()sc o n f t h r e s;o b s e r v a t i o n P l a n(v,();A d di n t os e t;E n d;E n d;R e t u r ns e t在线阶段,当针对过时观察的观察行为v执行后,其观察结果显示()与当前环境状态s不一致时,()缺失.此时自主

45、机器人基于s,以()为观察目标产生针对片面观察的观察行为s(见算法).随着任务的执行,的前置条件()的置信度c o n f将会逐渐降低,当低于阈值t h r e s时,自主机器人将基于v产生针对过时观察的观察行为v(见算法).算法在线阶段针对片面观察的观察行为决策输入:(,v)输出:s I fvv e r i f i e s()i s i n c o n s i s t e n tw i t ht h ee n v i r o n m e n t;so b s e r v a t i o n P l a n(s,();E n d;R e t u r ns算法在线阶段针对过时观察的观察行为决策输

46、入:(,t h r e s)输出:v I f()sc o n ft h r e s;vo b s e r v a t i o n P l a n(v,();E n d;R e t u r nv 在线评估的观察行为调度算法在执行过程中,任务行为和观察行为都将控制自主机器人的物理设备,可能出现资源冲突的情况.通常,任务行为具有最长执行时间,这在现实世界中是常见、合理的.例如,自主机器人需要在规定时间内将书本传送至指定位置.因此,执行观察行为带来的时间消耗不应造成超时.这需要自主机器人在线评估执行带来的时间消耗c o s t是否小于剩余的执行时间r e s i d u a l_t i m e,从而决

47、定是否调度观察行为.在线评估的观察行为调度算法如算法所示.算法在线评估的观察行为调度输入:(,)输出:d i s p a t c hr e s u l t Wh i l e i sn o td o n e;I fsc o s t s r e s i d u a l_t i m e;S u s p e n da n dd i s p a t c h;R e t u r nt r u e;E n d;E n d R e t u r nf a l s e 基于多智能体系统的自主机器人软件架构本文设计了一个基于多智能体系统的软件架构,用于实现上述主动观察模式.在主动观察模式中,观察行为的决策、执行等模

48、块功能独立,行为之间通过交流协作的方式完成对自主机器人物理部件占用的协商.多智能体系统包含多个高内聚、具有独立行为能力的智能体,通过智能体之间的交流协作解决问题,适用于开发复杂的分布式系统 .基于多智能体的自主机器人软件架构如图所示.图基于多智能体系统的自主机器人软件架构F i g A u t o n o m o u s r o b o t s o f t w a r ea r c h i t e c t u r eb a s e do nm u t l i a g e n t s y s t e mC o m p u t e rS c i e n c e计算机科学V o l ,N o ,S

49、e p 软件架构的智能体组成本文主要定义了如图所示的类智能体,智能体的角色定义如下.)观察行为决 策智 能体.观 察 行 为 决 策 智 能 体 实 现了观察行为决策函 数,其 接收 来 自知 识管 理智 能体、任务行为执行智能体的观察行为决策请求,基于主动观察模式产生观察行为,并将观察行为信息发送给相应的观察行为执行智能体.)知识管理智能体.知识管理智能体负责自主机器人内部知识的管理,其接收任务行为以及观察行为智能体的知识更新信号,定期广播环境信息,并评估其是否过时.)任务行为决策智能体.任务行为决策智能体负责任务行为的决策,其根据当前环境信息和任务目标产生任务行为序列,并将任务行为序列发送

50、至行为调度智能体和相应的任务行为执行智能体.)行为调度智能体.行为调度智能体实现了在线评估的调度算法,其接收任务行为决策智能体发送的任务行为序列,调度任务行为;接收观察行为执行智能体的调度请求,评估是否挂起任务行为而执行观察行为,并返回调度信号.)观察行为执行智能体.每一个观察行为执行智能体对应一类具体的观察行为,其接收观察行为决策智能体发送的观察行为信息,决策观察行为的调度时机.当环境满足触发事件时,向行为调度智能体发送调度请求;当调度请求得到允许时,控制自主机器人执行观察行为.)任务行为执行智能体.每一个任务行为执行智能体对应一类具体的任务行为,其接收任务行为决策智能体发送的任务行为信息,

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服