收藏 分销(赏)

DoS攻击下基于观测器的多智能体系统一致性控制.pdf

上传人:自信****多点 文档编号:521873 上传时间:2023-11-06 格式:PDF 页数:9 大小:2.44MB
下载 相关 举报
DoS攻击下基于观测器的多智能体系统一致性控制.pdf_第1页
第1页 / 共9页
DoS攻击下基于观测器的多智能体系统一致性控制.pdf_第2页
第2页 / 共9页
DoS攻击下基于观测器的多智能体系统一致性控制.pdf_第3页
第3页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、南通大学学报渊自然科学版冤圆园23 年南通大学学报渊自然科学版冤允燥怎则灶葬造 燥枣 晕葬灶贼燥灶早 哉灶蚤增藻则泽蚤贼赠 渊晕葬贼怎则葬造 杂糟蚤藻灶糟藻 Edition冤灾燥造援 22晕燥援 2Jun援 圆园23第 22 卷 第 2 期圆园23 年 6 月收稿日期院 2022-11-28接受日期院 2023-03-15基金项目院 国家自然科学基金青年基金项目渊62103103冤曰江苏省自然科学基金青年基金项目渊BK20210223冤第一作者简介院 钟叶渊1997要 冤袁 女袁 硕士研究生遥*通信联系人院 曹阳渊1991要 冤袁 男袁 副研究员袁 博士袁 主要研究方向为多智能体系统遥 E-m

2、ail院doi院 10.12194/j.ntu.20221128001引文格式院 钟叶袁 曹阳.DoS 攻击下基于观测器的多智能体系统一致性控制J.南通大学学报渊自然科学版冤袁 2023袁 22渊2冤院66-74.DoS 攻击下基于观测器的多智能体系统一致性控制钟叶袁 曹阳*渊东南大学 网络空间安全学院袁 江苏 南京211189冤摘要院研究了在拒绝服务渊denial-of-service袁DoS冤攻击下部分状态可测的线性多智能体系统的一致性问题遥 首先袁提出一种新的事件触发控制策略袁通过引入一类基于输出信息对智能体状态进行估计的观测器袁有效减少了控制器更新的频率曰然后袁在存在攻击的情况下袁建立

3、数学模型袁获得了关于攻击允许的攻击频率和持续时间的充分条件袁在此条件下系统可以保持一致曰接着袁利用 Lyapunov 稳定性理论对所提出的控制策略进行了严格的验证袁并且在闭环系统中排除了芝诺渊Zeno冤行为曰最后袁给出一个仿真算例验证了所提方法的有效性遥 仿真结果表明院在存在 Dos攻击的情况下袁系统仍能渐进地实现一致性遥关键词院多智能体系统曰拒绝服务攻击曰一致性控制曰事件触发控制曰观测器中图分类号院 TP181文献标志码院 A文章编号院 员远苑猿原圆猿源园渊圆园23冤园2原园园66原园9Observer-based event-triggered consensus control forl

4、inear multi-agent systems under DoS attacksZHONG Ye,CAO Yang*(School of Cyber Science and Engineering,Southeast University,Nanjing 211189,China)Abstract:This paper considers consensus problem of linear multi-agent systems(MASs)under denial-of-service(DoS)attacks and partial measurable states.A novel

5、 event-triggered control strategy is developed,where a class ofstate observer is incorporated to estimate the agent忆s state based on output information.Sufficient conditions are estab鄄lished for the allowable attack frequency and attack duration of DoS attacks,under which consensus can be preserved.

6、The proposed control strategy is rigorously proved by virtue of Lyapunov theory,and the Zeno behavior can be ex鄄cluded in the closed-loop system.Finally,a simulation example is presented to verify the effectiveness of the proposedmethod.The simulation study show that the consensus can be achieved gr

7、adually when it is under the attack of DoS.Key words:multi-agent systems;denial-of-service(DoS)attacks;consensus control;evet-triggered control;observer近些年来袁多智能体系统渊multi-agent systems袁MASs冤吸引了众多学者的关注袁其具有广泛的应用领域袁如无人机编队尧电力系统尧传感器网络等1-3遥其中袁一致性控制是 MASs 相关研究的一个基本问题袁该研究的核心是提出一种一致性控制协议袁系统中所有智能体都遵循该协议与邻居智能体进

8、行交流通信袁最终达成相同的状态遥 近年来有关一致性问题的研究根据是否具有参考智能体渊领导者冤分为两种类型院领导者跟随一致性问题4-5和无领导者一致性问题6-7遥 在大多数文献中袁智能体之间的通信通常都会假设是在安全网络环境中进行的曰但在现实世界中袁通信网络是很容易受到网络攻击的遥大规模网络攻击通常可以分为两类遥一类是攻击智能体本身袁这种情况下袁闭环系统通常会被视为交换系统进行处理8曰另一类是攻击智能体之间的通信信道袁导致通信中断或数据被破坏遥 后一类攻击的典型模型是 DoS 攻击9遥 文献10假设攻击是周期性发生的袁且攻击周期能被系统检测到袁在此基础上研究了连续线性时不变系统的弹性一致性问题遥

9、文献11将该结论从单个系统扩展到多智能体系统袁并采用周期性采样控制的方法讨论了两种攻击下的安全一致性问题遥 文献12采用随机马尔可夫过程捕获 DoS 攻击袁建立了混合随机安全控制框架遥 但实际应用中袁人们很难去证明攻击者的攻击模式是按照给定的某一类概率分布的遥从防御者的角度来看袁假设能够获得与攻击相关的信息也是不太可行的遥文献13提出了一个只对DoS 攻击频率和持续时间进行约束的攻击模型袁该模型更具有普适性袁其结果可进一步推广到具有多个传输通道的系统14遥值得注意的是袁大多数文献都是在计算资源充足尧通信网络保持通畅的假设条件下进行讨论的遥而在实际应用中袁MASs 中的每个智能体通常仅配置了微处

10、理器袁能用于计算和通信的资源是十分有限的遥 为了进一步提高系统资源利用率和减轻网络负载袁事件触发控制理论取代经典的时间触发制14-15袁成为 MASs 领域一项快速发展的研究遥 事件触发控制策略的核心在于院设计出某种触发条件袁只有触发条件被违反的情况下袁系统才会进行通信或更新控制器渊或两者都发生冤袁从而减少不必要的网络流量14遥 文献15提出了单个系统的事件触发控制策略袁并将其结果推广到多智能体系统16-18袁针对集中式和分布式两种情况袁给出触发函数及实现系统一致性的条件袁同时排除了芝诺渊Zeno冤行为渊即在有限的时间里无限次触发事件冤袁这一结果对该领域的研究具有重大的推动作用遥文献16提出的

11、一致控制协议中袁智能体控制输入的更新不仅发生在其自身的事件触发时刻袁同时也发生在其邻居的事件触发时刻袁这无疑增加了控制器的更新频率遥 为了解决这个问题袁文献17提出了一种基于组合测量方法的事件触发控制方案袁在此方案中袁每个智能体的测量误差是由其相邻智能体状态的凸组合决定的袁而不只是由智能体自身的测量状态决定遥 事件触发方案是一种高效的控制策略袁它在保证闭环系统性能的同时袁能有效提高系统计算效率和网络资源利用率遥考虑到系统环境存在 DoS 攻击的情况袁 设计一种事件触发控制策略来保证 MASs 的一致性是本文的首要动机遥另一方面袁在大多数已有的结论中袁状态反馈控制器的设计通常会要求邻居智能体的状

12、态信息是可用的遥 然而袁在实际应用中袁智能体的内部状态信息并不总是可测的遥 在这种情况下袁上述结论中提出的控制策略可能会失效遥 文献19提出了龙贝格观测器袁在每个智能体中部署了观测器袁将控制输入和系统的输出值作为观测器的输入袁由此设计了一致性控制协议遥文献20提出了基于观测器的分布式控制器袁首先假设领导者是不合作的袁没有可用的通信链路将其状态或控制输入传输给跟随者袁证明了在其设计的控制器下跟随者状态能够收敛到领导者的状态遥 因此袁考虑到实际应用中系统状态不可测的现实因素袁在已有的输出信息和输入信息的基础上袁采用基于观测器的控制策略对系统状态信息进行估计具有重要意义袁这是本研究的另一个动机遥受上

13、述研究的启发袁本文研究了一类部分状态信息不可测的线性多智能体系统袁考虑到系统网络环境中存在 DoS 攻击的情况袁基于 Lyapunov 稳定性理论和代数图论袁提出一种新的基于观测器的事件触发控制策略袁实现了 MASs 的一致性袁同时袁排除了 zeno 行为遥 本文的主要贡献如下:1冤与文献10-12中假设攻击具有周期性且周期可预测的攻击模型不同袁 本文假设对 MASs 的DoS 攻击是随机的遥 同时袁基于文献13中提出的对DoS 攻击频率和持续时间的约束假设袁 得到了能使系统保持一致的充分条件遥2冤不同于文献14-16控制策略与系统状态直接关联的方法袁本文采用观测器袁利用输出信息重构智能体内部

14、状态信息袁在此基础上进一步设计事件触发控制策略袁有效地减少了智能体之间的通信及控制器更新的频率遥钟叶袁 等院DoS 攻击下基于观测器的多智能体系统一致性控制67窑窑南通大学学报渊自然科学版冤圆园23 年1准备工作和问题描述本文使用标准符号如下院RN渊R逸0冤和 RN 伊 N分别表示 n 维欧氏空间及 N 伊 N 维实矩阵院1 表示元素均为 1 的适当维数的列向量曰IN表示 N 伊 N 维单位矩阵曰D=diaga1袁噎袁aN表示对角矩阵袁其元素为 ai袁i=1袁噎袁N曰茚表示克罗内克乘积曰椰 窑 椰表示向量或矩阵的范数曰实对称矩阵 A 的最小特征值和最大特征值分别表示为 姿min渊A冤和 姿ma

15、x渊A冤遥1.1代数图论智能体之间通信拓扑由图 G=渊V袁E冤表示袁其中袁V=v1袁v2袁噎袁vN表示节点集袁E哿V 伊 V 表示边集遥 图 G 被称为无向图袁当且仅当任意边满足渊vi袁vj冤沂E 且渊vj袁vi冤沂E遥 节点 i 的邻居节点集合由 Ni=j沂V渊i袁j冤沂E 表示遥 A=aij沂RN 伊 N为图 G 的邻接矩阵袁当节点 vi能接收到来自节点 vj的信息袁即渊vi袁vj冤沂E 时袁aij=1袁否则 aij=0遥如果图中任意两个节点之间均存在无向路径袁则该图被称为无向连通图遥 图的拉普拉斯矩阵表示为 L=lijN 伊 N袁其中lij=-aij袁i屹j袁lii=移k=1Naik袁i

16、=1袁2袁噎袁N遥 对于连通图袁拉普拉斯矩阵 L 的特征值满足 0=姿1渊L冤 姿2渊L冤 0 被称为代数连通度遥1.2多智能体系统描述考虑由 N 个智能体组成的同构线性多智能体系统袁智能体 i渊i=1袁噎袁N冤的动力学模型为x觶i渊t冤=Axi渊t冤+Bui渊t冤袁t沂R逸0袁yi渊t冤=Cxi渊t冤袁其中院R逸0表示大于等于零的实数集合曰xi渊t冤沂Rn袁yi渊t冤沂Rm分别表示在 t 时刻第 i 个智能体的状态向量及输出向量曰ui渊t冤沂Rl表示控制输入曰A沂Rn 伊 n袁B沂Rn 伊 l袁C沂Rp 伊 n表示适当维数的常矩阵遥假设 1对于多智能体系统渊1冤袁其通信拓扑图G 是无向且连通

17、的遥假设 218渊A袁B冤是可控的袁渊A袁C冤是可观的遥考虑到在实际应用场景中袁智能体的内部状态并不总是可测的袁采用状态观测器对系统内部状态进行重构袁状态观测器的设计为窑x赞i渊t冤=Ax赞i渊t冤+Bui渊t冤+G渊yi渊t冤-y赞i渊t冤冤袁y赞i渊t冤=Cx赞i渊t冤袁其中院x赞i渊t冤沂Rn为 xi渊t冤的状态估计值曰y赞i渊t冤沂Rp为观测器的测量输出曰G沂Rn 伊 p为待设计的增益矩阵遥1.3DoS 攻击模型DoS 攻击目的在于阻塞通信信道袁从而使得智能体与邻居之间的信息传输失败遥 在大多数现有关于 DoS 攻击问题的研究中袁通常假设攻击是周期性发生的袁相较而言袁本文考虑的非周期攻

18、击更具有普适性遥 假设攻击能量有限袁一旦发起攻击后袁需要休眠一段时间来为下一次攻击积累能量遥 因此袁可以将整个攻击的时间段划分为两部分院攻击时间段和休眠时间段袁如图 1 所示遥 受到攻击的时间序列可以表示为t軇nn沂N袁t軇0逸0袁t軇0为受攻击的初始时刻曰第 n 次攻击表示为 Hn=t軇n袁t軇n+驻n冤袁t軇n+1t軇n+驻n袁n沂N袁其中 驻n 0袁表示第 n 次攻击的持续时间遥假设在初始时刻不会发生 DoS 攻击袁对任意的t 子袁在渊子袁t冤内受到攻击的时间集合及能成功进行通信的时间集合分别为桩a渊子袁t冤=胰Hn疑子袁t袁渊3冤桩s渊子袁t冤=子袁t桩a渊子袁t冤遥渊4冤关于攻击的持

19、续时间和频率给出以下假设院假设 3渊攻击持续时间冤13假设初始时刻为 t0袁对于任意的 t t0袁在t0袁t冤内受到 DoS 攻击的总时间定义为 Ta渊t0袁t冤遥 存在 装0逸0袁0 渊1/子a冤 t0袁在t0袁t冤内受到 DoS 攻击的总次数定义为 Nf渊t0袁t冤遥 存在 Ef 0袁使得Nf渊t0袁t冤臆Ef窑 渊t-t0冤遥渊6冤注 1假设 3 和 4 保证了 DoS 攻击的总持续时间不能超过一定上限遥 如果 MASs 多次受到 DoS攻击袁且攻击持续时间不受限制袁可能会导致系统一直处于不稳定状态袁而这种攻击需要持续的能量供给袁在实际应用中发生的可能性并不大遥1.4控制目标本文的控制目

20、标是在网络环境存在 DoS 攻击的情况下袁通过设计一种基于观测器的事件触发控制协议袁使得无领导跟随的 MASs渊1冤能实现一致性遥 下面给出了系统一致性的定义遥定义 1对于任意的初始状态 x渊0冤=x1T渊0冤袁x2T渊0冤袁噎袁xNT渊0冤T袁如果满足limt寅肄椰xj渊t冤-xi渊t冤椰=0袁i袁j=1袁2袁噎袁N袁渊7冤那么多智能体系统渊1冤被称为达成一致遥2主要结论2.1控制器设计定义 t0=t0i袁t1i袁噎袁tki袁为智能体 i 的事件触发时间序列袁定义 qi渊t冤=移j沂Niaij渊x赞j渊t冤-x赞i渊t冤冤为组合测量值遥当 t沂tki袁tk+1i冤时袁设计一种分布式事件触发一

21、致性控制方案ui渊t冤=Kqi渊tki冤袁渊8冤其中院K=子BTP沂Rl 伊 n袁P 0袁子逸1/姿2渊L冤为待设计的增益矩阵曰tki为最后一次成功进行通信的时刻遥为了进一步明确事件触发的时间序列袁定义智能体的测量误差 ei渊t冤和观测误差 eoi渊t冤为ei渊t冤=qi渊tki冤-qi渊t冤袁渊9冤eoi渊t冤=x赞i渊t冤-xi渊t冤遥渊10冤事件触发的时间序列tki由以下事件触发条件确定院tk+1i=infl tikl:椰ei渊t冤椰逸茁i椰qi渊t冤椰袁坌t沂渊tki袁l袁渊11冤其中 茁=v1姨渊姿min渊Q冤-k0v1冤/2姿N渊L冤 1袁v1钟叶袁 等院DoS 攻击下基于观测器的

22、多智能体系统一致性控制69窑窑南通大学学报渊自然科学版冤圆园23 年0袁Q 0袁S 0 满足代数里卡提方程渊ARE冤袁则PA+APT-PBBTP+Q=0袁渊16冤SA+AST-浊S 0渊17冤将会成立袁其中 浊 是一个给定的正常数遥引理 121假设通信拓扑图连通袁拉普拉斯矩阵 L 是对称且半正定的袁 则总存在一个正交矩阵追沂RN 伊 N袁它具有以下性质追T追=IN袁LM=ML=L袁追TL追=diag0袁姿i渊L冤遥定理 1根据假设 1要3袁在使用基于观测器的事件触发控制策略渊8冤的条件下袁如果存在常数 浊*沂渊0袁琢1冤袁使得 DoS 攻击的频率和持续时间满足Nf渊t0袁t冤/渊t-t0冤臆浊

23、*/渊2ln滋+渊琢1+浊冤驻*冤袁渊19冤同时存在正常数 子a袁使攻击持续时间常数 T0逸0且满足1/子a 0曰琢1=-姿N渊L冤渊姿min渊Q冤-k0v1冤/2姿2渊L冤姿min渊P冤曰滋=max姿N渊L冤姿max渊P冤/姿min渊S冤袁姿max渊S冤/姿2渊L冤姿min渊P冤遥证明院分别考虑系统没有受到 DoS 攻击渊情况1冤及系统遭受 DoS 攻击渊情况 2冤两种情况遥情况 1当系统网络环境没有受到 DoS 攻击时袁考虑如下李亚普诺夫函数院V1渊t冤=啄T渊t冤渊L茚P冤啄渊t冤袁渊21冤从式渊1冤袁渊6冤和渊9冤中袁可以计算得到e觶o渊t冤=A渊x赞渊t冤-x渊t冤冤+GC渊x渊t冤

24、-x赞渊t冤冤=渊A-GC冤eo渊t冤遥渊22冤由于矩阵 G 的选择满足 A-GC 是 Hurwitz 稳定的袁eo渊t冤最终会衰减为 0遥 由此袁计算 V1渊t冤的导数得到V觶1渊t冤=啄T渊t冤L茚渊ATP+PA冤啄渊t冤-2啄T渊t冤渊L2茚PBK冤啄渊t冤+2啄T渊t冤渊L茚PBK冤e渊t冤遥渊23冤令啄軌渊t冤=渊追T茚IN冤啄渊t冤袁根据 K=子BTP袁子逸1/姿2渊L冤袁能得到啄T渊t冤L茚渊ATP+PA冤-2啄T渊t冤渊L2茚PBK冤啄渊t冤臆啄軌T渊t冤渊J茚ATP+PA冤啄軌渊t冤-2子姿2渊L冤啄軌T渊t冤渊J茚PBBTP冤啄軌T渊t冤臆姿N渊L冤啄軌T渊IN茚渊ATP+

25、PA-PBBTP冤冤啄軌渊t冤臆-姿N渊L冤姿min渊Q冤移i=2N啄iT渊t冤啄i渊t冤遥渊24冤令e軇o渊t冤=渊追T茚IN冤eo渊t冤袁e軇渊t冤=渊追T茚IN冤e渊t冤遥由式渊10冤和杨氏不等式 xTy臆籽/2xTx+1/2籽 yTy可以得出2啄T渊t冤渊L茚PBK冤e渊t冤臆姿N渊L冤k0渊自1椰啄軌渊t冤椰2+椰e軇渊t冤椰2/自1袁渊25冤其中院k0=椰PBK椰曰椰啄軌渊t冤椰臆椰追T茚IN椰窑椰啄渊t冤椰臆椰啄渊t冤椰曰椰e軇渊t冤椰臆椰追T茚IN椰窑椰e渊t冤椰臆椰e渊t冤椰曰椰追T茚IN椰=1遥 结合式渊22冤和渊23冤袁计算得到V觶1渊t冤臆-姿N渊L冤姿min渊Q冤移i

26、=2N啄iT渊t冤啄i渊t冤+姿N渊L冤k0渊自1椰啄渊t冤椰2+椰e渊t冤椰2/自1冤臆-渊姿min渊Q冤-k0自1冤姿N渊L冤/2椰啄椰2臆-琢1V1渊t冤袁渊26冤其中 琢1=姿N渊L冤渊姿min渊Q冤-k0自1冤/2姿2渊L冤姿min渊P冤 0遥 由此袁可以得出V觶1渊t冤 0袁可以得到V渊t冤臆e渊琢1+琢2冤渊T0+驻*冤e-浊2渊t-t0冤V渊t0冤袁渊34冤式渊34冤中的不等式表明 V渊t冤是有界的袁这就意味着闭环系统渊12冤能够实现稳定遥2.3可行性分析由于采用事件触发控制策略可能会产生芝诺行为袁从而导致所采用一致性控制方案失效袁所以袁通过分析排除芝诺行为是很有必要的遥 芝诺

27、行为是指在有限的区间内存在无限次触发遥 由式渊10冤可以得到d椰e渊t冤椰/dt臆椰q觶渊t冤椰臆椰IN茚A椰椰q渊t冤椰+椰L茚BK椰椰q渊t冤椰+椰L茚BK椰椰e渊t冤椰+椰L茚GC椰椰eo渊t冤椰袁渊35冤根据椰q渊t冤椰臆姿N椰啄渊t冤椰+姿N椰eo渊t冤椰袁由式渊20冤和渊24冤袁容易得到椰q渊t冤椰臆姿N渊L冤V1渊t0冤/渊姿2渊L冤姿min渊P冤冤姨+姿N渊L冤椰eo渊t冤椰袁其中 V1渊t冤和椰eo渊t冤椰是严格递减的袁由此可知袁椰qi渊t冤椰也是递减的遥根据上面的分析袁可以得到d椰e渊t冤椰/dt臆椰L茚BK椰椰e渊t冤椰+赘袁渊36冤其中赘=渊椰IN茚A椰+椰L茚BK椰冤

28、 窑姿N渊L冤渊V1渊t0冤/渊姿2渊L冤姿min渊P冤冤姨+姿N椰eo渊t冤椰冤+椰L茚GC椰姿N椰eo渊t冤椰遥根据触发条件渊11冤袁下一次触发时刻 tk+1i满足椰e渊tk+1i冤椰 茁椰q渊tki冤椰袁渊37冤结合式渊29冤袁如果椰q渊tki冤椰屹 0袁可以得到tk+1i-tki逸ln渊茁椰L茚BK椰椰q渊tki冤椰/赘+1冤/椰L茚BK椰 0袁渊38冤这意味着事件之间的时间间隔严格为正遥 由此可以说明袁芝诺行为不存在于任何智能体中遥猿仿真分析在本节中袁给出一个算例来验证所提控制协议的有效性遥例 1考虑一个由 4 个智能体组成的多智能体系统袁第 i 个智能体的动力学描述如下院A=-0-

29、1-1-0蓘蓡袁B=01蓘 蓡袁C=11蓘蓡袁可以验证渊A袁B冤袁渊A袁C冤分别是可控的和可观的袁通信拓扑图的拉普拉斯矩阵可以表示为钟叶袁 等院DoS 攻击下基于观测器的多智能体系统一致性控制71窑窑南通大学学报渊自然科学版冤圆园23 年L=-2-1-0-1-1-2-1-0-0-1-2-1-1-0-1-2杉删山山山山山山山山山山山山山山煽闪衫衫衫衫衫衫衫衫衫衫衫衫衫衫袁根据式渊16冤和渊17冤袁可以计算得到P=-1.912 3-0.414 2-0.414 2-1.352 2蓘蓡袁S=1001蓘蓡袁K=-0.414 2-1.352 2蓘蓡遥给定事件触发条件的参数 茁=0.125袁基于定理1袁可以

30、计算出 琢1=0.441 6袁琢2=0.758 4袁滋=8.528 8袁选择 驻=0.827 5袁浊*=0.158 4袁可以得到攻击的持续时间和频率分别为 子a逸2袁Fa臆0.03遥图 2 描述了在 DoS 攻击的情况下袁攻击发生的时间序列遥 图 3 描述了在 DoS 攻击下智能体的状态轨迹袁由图中可以观察出袁即使网络环境存在攻击袁采用文中提出的控制策略袁系统仍渐进地实现了一致遥 图 4 和图 5 描述了智能体的状态分量 xi1和 xi2的变化过程袁从图中可以看出袁在受到攻击时状态值会有小范围的波动袁但没有对系统的一致性造成破坏遥 图 6 描述了智能体的事件触发时刻及时间间隔袁不同于时间触发策

31、略袁智能体仅在触发时刻进行信息传输和控制器更新遥 显然袁这更能有效地节约系统计算资源和网络通信资源遥 同时袁验证了所设计的事件触发条件能有效排除芝诺行为遥 图 7 描述了控制器 ui渊t冤的变化过程袁当网络环境遭受 DoS攻击时袁控制信号会被置为 0遥图 8 给出了智能体状态估计误差袁估计误差最终趋近于 0袁可见袁观测器能够准确地对智能体的状态进行估计遥图 3在 DoS 攻击下智能体的状态轨迹 xi渊t冤Fig.3State trajectories xi渊t冤 of i忆agent under DoS attacks图 4在 DoS 攻击下智能体的状态分量 xi1渊t冤Fig.4State

32、trajectories xi1渊t冤 of i忆agent under DoS attacks3210-1-2-305101520t/sAgent1Agent2Agent3Agent4图 5在 DoS 攻击下智能体的状态分量 xi2渊t冤Fig.5State trajectories xi2渊t冤 of i忆agent under DoS attacks43210-1-2-3-405101520t/sAgent1Agent2Agent3Agent4图 6各智能体的事件触发时刻Fig.6Triggering instant of four agents4321020t/s51015Agent1

33、Agent2Agent3Agent4图 2DoS 攻击的时间序列Fig.2Sequence of DoS attacks1002468attackt/s420-2-4420-2-405101520Agent1Agent2Agent3Agent472窑窑4结论本文研究了在网络环境存在 DoS 攻击下部分状态可测的线性多智能体系统的一致性问题遥 与已有的一些结果中假设为周期性和可预测的攻击不同袁本文的 DoS 攻击假设只对 DoS 攻击的频率和持续时间进行了约束遥 通过引入一种基于观测器的事件触发控制策略袁解决了系统资源有限及部分状态不可测的问题袁在该控制方案下袁利用 Lyapunov 稳定性理论

34、给出了保证系统一致性的充分条件遥 同时袁排除了事件触发可能会导致的芝诺现象遥 最后袁通过数值算例验证了上述理论结果的有效性遥参考文献院 1 CUI J J袁 LIU Y W袁 NALLANATHAN A.Multi-agent rein鄄forcement learning-based resource allocation for UAV net鄄worksJ.IEEE Transactions on Wireless Communications袁2019袁 19渊2冤院729-743.2 QIN J H袁 MA Q C袁 SHI Y袁 et al.Recent advances inco

35、nsensus of multi-agent systems院a brief surveyJ.IEEETransactions on Industrial Electronics袁 2017袁 64 渊6冤院4972-4983.3 GE X H袁 HAN Q L袁 ZHANG X M袁 et al.Distributedevent-triggered estimation over sensor networks院a surveyJ.IEEE Transactions on Cybernetics袁 2020袁 50 渊3冤院1306-1320.4 GAO R袁 HUANG J S.Leade

36、r-following consensus of un鄄certain strict feedback multiagent systems subject to sensorand actuator attacksJ.International Journal of Robust andNonlinear Control袁 2020袁 30渊17冤院7635-7654.5 HUANG X袁 DONG J X.Reliable leader-to-follower for鄄mation control of multiagent systems under communicationquant

37、ization and attacksJ.IEEE Transactions on Systems袁Man袁 and Cybernetics院Systems袁 2020袁 50渊1冤院89-99.6 JIA X C袁 GAO S S袁 YOU X袁 et al.Output consensus ofheterogeneous multi-agent systems with a multisensory mul鄄ti-rate sampling mechanismJ.Journal of the Franklin In鄄stitute袁 2020袁 357渊17冤院12640-12669.7

38、DING L袁 HAN Q L袁 GE X H袁 et al.An overview of recentadvances in event-triggered consensus of multiagent sys鄄temsJ.IEEE Transactions on Cybernetics袁 2018袁 48渊4冤院1110-1123.8 ZENG W T袁 CHOW M Y.Resilient distributed control inthe presence of misbehaving agents in networked controlsystemsJ.IEEE Transact

39、ions on Cybernetics袁 2014袁 44渊11冤院2038-2049.9 PAN R Q袁 TAN Y S袁 DU D S袁 et al.Adaptive event-trig鄄gered synchronization control for complex networks withquantization and cyber-attacksJ.Neurocomputing袁 2020袁382院249-258.10 SHISHEH FOROUSH H袁 MART魱NEZ S.On event-trig鄄gered control of linear systems und

40、er periodic denial-of-service jamming attacksC/Proceedings of the 2012 IEEE51st IEEE Conference on Decision and Control 渊CDC冤袁December 10-13袁 2012袁 Maui袁 HI袁 USA.New York院IEEE Xplore袁 2013院2551-2556.11 FENG Z袁 HU G Q.Distributed tracking control for multi-agent systems under two types of attacksJ.IF

41、AC Pro鄄ceedings Volumes袁 2014袁 47渊3冤院5790-5795.12 FENG Z袁 WEN G H袁 HU G Q.Distributed securecoordinated control for multiagent systems under strategicattacksJ.IEEE Transactions on Cybernetics袁 2017袁 47渊5冤院1273-1284.图 7控制器输入的状态轨迹Fig.7Trajectories of control input ui151050-5-10-1550101520u1u2u3u4t/s图

42、8状态估计误差轨迹Fig.8Trajectories of observation error eo渊t冤0.0200.0150.0100.0050-0.005-0.010-0.015-0.020Agent1Agent2Agent3Agent450101520t/s钟叶袁 等院DoS 攻击下基于观测器的多智能体系统一致性控制73窑窑南通大学学报渊自然科学版冤圆园23 年Acme院a research framework for distributed reinforcementlearningEB/OL.渊2020-06-01冤2022-11-02.https院/arxiv.org/abs/2

43、006.00979.13 HU J袁 SHEN L袁 SUN G.Squeeze-and-excitation networksC/Proceedings of the 2018 IEEE/CVF Conference onComputer Vision and Pattern Recognition袁 June 18-23袁2018袁 Salt Lake City袁 UT袁 USA.New York院IEEE Xplore袁2018院7132-7141.14 PUTERMAN M L.Markov decision processesM/HEYMAND P袁 SOBEL M J.Handbo

44、oks in operations research andmanagement science.Amsterdam院Elsevier袁 1990院331-434.15 WATKINS C J C H袁 DAYAN P.Q-learningJ.MachineLearning袁 1992袁 8渊3冤院279-292.16 梁天新袁 杨小平袁 王良袁 等.基于强化学习的金融交易系统研究与发展J.软件学报袁 2019袁 30渊3冤院845-864.LIANG T X袁 YANG X P袁 WANG L袁 et al.Review on fi鄄nancial trading system based

45、on reinforcement learningJ.Journal of Software袁 2019袁 30渊3冤院845-864.渊in Chinese冤17 MNIH V袁 KAVUKCUOGLU K袁 SILVER D袁 et al.Playingatari with deep reinforcement learningEB/OL.渊2013-12-19冤2022-11-02.https院/arxiv.org/abs/1312.5602.18 SUTTON R S袁 MCALLESTER D袁 SINGH S袁 et al.Policygradient methods for re

46、inforcement learning with functionapproximationC/Proceedings of the 12th InternationalConference on Neural Information Processing Systems袁November 29-December 4袁 1999袁 Denver袁 CO.New York院ACM袁 1999院1057-1063.19 SUTTON R S.Learning to predict by the methods of tem鄄poral differencesJ.Machine Learning袁

47、 1988袁 3渊1冤院9-44.20 MNIH V袁 BADIA A P袁 MIRZA M袁 et al.Asynchronousmethods for deep reinforcement learningEB/OL.渊2016-02-04冤2022-11-02.https院/arxiv.org/abs/1602.01783.渊责任编辑院张燕冤渊上接第 49 页冤13 DE PERSIS C袁 TESI P.Input-to-state stabilizing controlunder denial-of-serviceJ.IEEE Transactions on Auto鄄matic C

48、ontrol袁 2015袁 60渊11冤院2930-2944.14 FAN Y袁 FENG G袁 WANG Y袁 et al.Distributed event-triggered control of multi-agent systems with combinationalmeasurementsJ.Automatica袁 2013袁 49渊2冤院671-675.15 JOHAN 魡STR魻M K袁 BERNHARDSSON B.Comparison ofperiodic and event based sampling for first-order stochasticsystems

49、J.IFAC Proceedings Volumes袁 1999袁 32渊2冤院5006-5011.16 TABUADA P.Event-triggered real-time scheduling of sta鄄bilizing control tasksJ.IEEE Transactions on AutomaticControl袁 2007袁 52渊9冤院1680-1685.17 DIMAROGONAS D V袁 FRAZZOLI E.Distributed event-triggered control strategies for multi-agent systemsC/Pro鄄c

50、eedings of the 2009 47th Annual Allerton Conference onCommunication袁Control袁andComputing渊Allerton冤袁Septem鄄ber 30-October 2袁 2009袁 Monticello袁 IL袁 USA.New York院IEEE Xplore袁 2010院906-910.18 ZHAO Y袁 LIU Y F袁 LI Z K袁 et al.Distributed averagetracking for multiple signals generated by linear dynamicalsys

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      联系我们       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号  |  icp.png浙ICP备2021020529号-1 浙B2-2024(办理中)  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服