收藏 分销(赏)

基于改进演化博弈模型的网络防御决策方法.pdf

上传人:自信****多点 文档编号:326397 上传时间:2023-08-15 格式:PDF 页数:11 大小:4.05MB
下载 相关 举报
基于改进演化博弈模型的网络防御决策方法.pdf_第1页
第1页 / 共11页
基于改进演化博弈模型的网络防御决策方法.pdf_第2页
第2页 / 共11页
基于改进演化博弈模型的网络防御决策方法.pdf_第3页
第3页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、基于改进演化博弈模型的网络防御决策方法马润年张恩宁王刚*马宇峰翁江(空军工程大学信息与导航学院西安710077)(国防科技大学通信学院试验训练基地西安710106)摘要:针对网络防御决策的误差干扰和实时响应问题,该文提出一种改进演化博弈模型(IEGM)和网络防御决策方法。首先,借鉴经典伺服系统模型,用微分假设量化表示防御方对攻击策略的短期预测效应,加快模型收敛速度,提升防御决策效率。其次,分析攻防博弈中的误差产生机理,量化定义网络防御中的观测误差,提出改进复制动力学方程,加强模型对信息偏差的容忍度。在此基础上,建立改进演化博弈模型,证明了模型能够收敛至纳什均衡解的微小-邻域,给出了相应的稳定性

2、分析,并设计了一种网络防御决策方法。理论分析和仿真结果表明,所提模型能够克服观测误差影响,给出偏差数量级在0.01%的最优防御纯策略,且在强干扰环境下,防御决策的响应速度相较于其他3种经典决策模型最高可以提升64.06%。改进模型和防御决策方法能够有效提升防御决策的响应时效性和对观测误差的适应性。关键词:网络防御;决策方法;误差容忍;短期预测;改进复制动态中图分类号:TN915.08;TP399文献标识码:A文章编号:1009-5896(2023)06-1970-11DOI:10.11999/JEIT220585Network Defense Decision-making Method Ba

3、sed onImproved Evolutionary Game ModelMARunnianZHANGEnningWANGGangMAYufengWENGJiang(Institute of Telecommunication Engineering,Air Force Engineering University,Xian 710077,China)(Information and Communication Institute Experimental Training Base,National University of Defense Technology,Xian 710106,

4、China)Abstract:Fortheproblemthattheexistingnetworkdefensedecision-makingmethodischallengingbyerrorinterferenceandreal-timeresponse,anovelnetworkdefensedecision-makingmethodbasedonanImprovedEvolutionaryGameModel(IEGM)isproposed.Firstly,usingtheclassicalservosystemmodelforreference,theshort-termpredic

5、tioneffectofthedefensesideontheattackstrategyisquantifiedbydifferentialhypothesistoacceleratetheconvergenceofthemodelandimprovetheefficiencyofdefensedecisions.Secondly,themechanismoferrorgenerationinattack-defensegameisanalyzed,thentheobservationalerrorinnetworkdefenseisdefinedquantitatively,andthei

6、mprovedreplicationdynamicsequationisproposedtostrengthenthetoleranceofthemodeltoinformationdeviation.Onthisbasis,animprovedevolutionarygamemodelisestablished,andthecorrespondingstabilityanalysisandmathematicalproofaregiventoprovethatthemodelcanconvergetothe-neighborhoodoftheNashequilibriumsolution.T

7、heoreticalanalysisandsimulationresultsshowthattheproposedmodelcanovercometheinfluenceofobservationerror,andtheoptimalpuredefensestrategywithdeviationorderof0.01%isgiven.Besides,underthejammingenvironment,theresponsespeedofdefensedecision-makingcanbeimprovedby64.06%comparedwiththeotherthreedecisionmo

8、dels.Theimprovedmodelanddecision-makingmethodcaneffectivelyimprovetheresponsetimelinessofdefensedecisionsandtheadaptabilitytoobservationerror.Key words:Networkdefense;Decision-makingmethod;Errortolerance;Short-termprediction;Improvedreplicatordynamics收稿日期:2022-05-10;改回日期:2022-07-16;网络出版:2022-07-21*通

9、信作者:王刚基金项目:国家自然科学基金(61902426)FoundationItem:TheNationalNaturalScienceFoundationofChina(61902426)第45卷第6期电子与信息学报Vol.45No.62023年6月JournalofElectronics&InformationTechnologyJun.20231 引言机器学习、大数据分析等技术加速了人类社会的智能化变革,也给网络安全和隐私防护带来新的挑战。高级可持续威胁(AdvancedPersistentThreat,APT)和动态目标防御等新型网络攻防理论技术的快速发展,使得网络安全态势和攻防博弈

10、行为日趋复杂。网络防御决策是网络防御的重要环节,在攻强守弱的大背景下,实现主动防御的关键是打破攻击方的杀伤链1,在运用入侵检测等手段捕获攻击方行为信息的基础上,预测攻击策略,提前部署防御,通过地址动态跳变、操作系统迁移等手段使得对手设计的攻击策略无效或者成本太高而不可行。在防御决策过程中,需要综合考虑对手攻击技战术能力、己方防御操作代价、环境干扰等因素,在量化分析的基础上,依据科学的决策理论和方法优选防御策略,在有限资源条件下实现防御效用的最大化2。当前制约主动防御效能的短板主要有两方面:一是防御态势感知能力不足。攻击方为了提升攻击效果,会运用技战术手段使得防御方感知到不完整信息甚至是虚假信息

11、。与此同时,防御方也无法从根本上解决入侵检测系统的误报和漏报问题,预测偏差客观存在2。二是防御决策效率不高。防御决策的速度依赖于信息条件、计算水平以及攻防博弈策略的复杂度等因素。在有限的信息条件下,经典模型的算法时间复杂度较高,预测攻击策略的耗时较长,容易导致主动防御部署滞后,难以阻止杀伤链形成2,3。因此,如何进一步推动防御决策方法的科学有效性是当前网络防御理论研究中亟需解决的问题。网络攻防中参与方具有目标对立,策略依存和非合作型关系的本质属性,可以运用博弈论提供的数学框架开展科学研究。其中,演化博弈模型可以在不完全信息条件下模拟网络攻防双方策略的互动演化过程,得到稳定的纳什均衡策略,为优选

12、网络防御策略提供参考4,5。经典演化博弈模型描述了采用相同决策方式的同质博弈群体的自我演化过程,但是实际网络攻防中双方决策具有显著差异性。例如,在决策标准方面,防御方要权衡防护节点的资源重要程度,安防部署成本和防御操作代价;攻击方则需要考虑攻击成本,攻击失败的惩罚等因素。决策标准的差异性会反映到攻防双方收益的量化方式上,并进一步影响攻防双方的决策偏好,这种基于不同决策范式的异质博弈群体的非合作演化过程是当前研究的热点3。总体来看,时效性和误差容忍度是当前网络防御决策需要重点关注的两个问题,也是基于经典演化博弈模型的网络防御决策方法面临的两大挑战:一是网络防御的敏捷反应需求和模型复杂决策过程的内

13、在矛盾。经典演化博弈模型采用复制动态描述防御策略的演化优选过程,本质上是一种具有结果承继性的重复博弈。环比其他博弈模型,演化博弈模型使用的算法的时间复杂度较高,敏捷适应性相对不足,直接影响网络防御方响应攻击事件的速度。因此,亟需设计有效的优化方法以提升模型演化稳定解的收敛速度。二是获取态势信息的过程中可能存在的观测误差导致模型和决策的可信性存疑。高级可持续威胁攻击,采用信号诱导的方式欺骗防御方的入侵检测系统6,隐藏真实的攻击窗口及攻击时间,造成防御方的观测误差,入侵检测中无法避免的虚警和漏警就是这一现象的真实体现。基于上述问题与挑战,本文对改进演化博弈模型构建及防御决策方法展开研究。演化博弈的

14、动态演化过程可以看作系统受到扰动后恢复稳态的进程,具有离散逻辑决策和连续时间控制的特点,是伺服系统中典型的反馈控制流程7。在反馈控制流程中,已有多种方法被证明可以有效加速循环速度,例如在生物运动控制模型中,学者采用微分假设模拟生物学中主动神经介导节段的反射延迟减弱现象,有效提升了仿生模型的运动控制效果8。受此启发,本文使用博弈信念的微分假设表示防御方对攻击策略的短期预测,加速模型的演化速度,并在每一轮演化迭代过程中,将形式化表达的观测误差纳入决策动力学模型中,进一步研究博弈模型在信息偏差下的稳定性和准确性。在此基础上,搭建仿真实验环境,开展模型稳定性验证实验以及改进模型和经典模型的性能对比实验

15、,进一步论证模型的敏捷适应性和可信性。2 相关工作将博弈理论迁移应用于网络信息安全已成为该领域的一个热点。学者从行为者完全理性,完全信息条件和单阶段静态假设出发,建立网络攻防博弈模型9,以此为基础过渡到有限理性,不完全信息条件下的多阶段网络攻防博弈。由于在实际网络对抗中,攻防双方会根据态势信息不断改进行为策略的内在驱动,因此使用演化博弈中的复制动态方程,刻画策略选择的动力学规律是解决具体问题的有效方法。如在传感器网络中引入基于信任值的复制动态,分析网络节点间信任关系的动力学方程和演化趋势10;结合军事信息网络的确定性决策特点,构建纯策略演化博弈模型,扭转被动防御态势11;引入可信第三方动态惩罚

16、策略,分析入侵策略对演化复制动态方程的影响,提升边缘雾计算的安全第6期马润年等:基于改进演化博弈模型的网络防御决策方法1971性12。但和随机博弈13、信号博弈等6方法相比,演化博弈由于其复制动态特性,需要不断迭代才能输出稳定结果,其时敏性相对不足。目前已有学者在提升演化博弈模型速度的问题上进行探索,如参考社交网络中行为人的模仿特性,构建以模仿为信息交互模式的改进复制动态模型14;或者从群体中策略激励机制和反思学习机制角度入手,考虑优势策略在博弈群体中的扩散现象15,提出改进复制动态方程。上述模型能够有效提升演化博弈的求解速度,但是均认为防御方具备理想态势感知能力,即在对攻击方的情报获取中不考

17、虑干扰诱骗或误报漏报,使得模型的应用价值受限。在抗干扰防诱骗方面,博弈框架下目前有两种解决思路,一种是结合动态目标防御技术和马尔可夫(Markov)决策理论,将动态博弈过程离散化处理,分析上一阶段诱骗、误差信号对下一阶段决策的影响6;另一种是在群体进行复制动态演化的过程中添加随机扰动,将个体之间的认知能力差异16或者入侵检测系统的虚警漏警现象17模型化,分析干扰误差对演化稳定结果的影响。总结相关工作可知,如何在实际网络防御中态势感知能力和决策时间有限的条件下,构建兼具误差容忍度和决策时效性的演化博弈模型,使得防御策略可行可信,是当前研究中亟待解决的难题。3 改进演化博弈模型3.1 改进演化博弈

18、模型构建参考文献1821中演化博弈模型的形式化定义,提出网络攻防博弈基本假设和改进演化博弈模型。假设1网络攻防博弈的信息环境是不完全信息环境。在不完全信息条件下,攻防双方能够观测到对手的博弈信念,但无法获知策略的收益。假设2网络攻防博弈是对称博弈,所有博弈参与者根据其自身属性分为网络攻击方和网络防御方。假设3网络攻防博弈的博弈参与者遵循有限理性原则。所有博弈参与者的目的是策略收益最大化。假设4网络攻防博弈以异质群体演化博弈的形式进行。博弈中群体代表同一攻防属性博弈参与者的集合;子群体代表在同一群体中选择相同博弈策略的博弈参与者的集合。(N,S,P,PA,U,P)定义1改进演化博弈模型(Impr

19、ovedEvolu-tionaryGameModel,IEGM)可表示为7元有序组,其中N=(N1,N2,.,Nm)N=(NA,ND)NANA=(NA1,NA2,.,NAj)NA1,NA2,.,NAjND(1)为异质群体博弈参与者空间。结合假设2,可设定。其中,是攻击方博弈参与者总空间,,是攻击方博弈参与者子群体;是ND=(ND1,ND2,.,NDi)ND1,ND2,.,NDi防御方博弈参与者总空间,,是防御方博弈参与者子群体。S=(SA,SD)SASA=(SA1,SA2,.,SAj)SA1,SA2,.,SAjSDSD=(SD1,SD2,.,SDi)SD1,SD2,.,SDi(2)为攻防博弈参

20、与者群体的混合策略空间。其中,是攻击方参与者纯策略总空间,是攻击方参与者子群体选择的纯策略;是防御方参与者纯策略总空间,是防御方参与者子群体选择的纯策略。P=(PA,PD)PAPA=(PA1,PA2,.,PAj)PAjSAjPDPD=(PD1,PD2,.,PDi)PDiSDi(3)为实际博弈信念空间。其中,是攻击方实际博弈信念集合,是实际选择策略的概率;是防御方实际博弈信念集合,是实际选择策略的概率。PA=(PA1,PA2,.,PAj)PAjSAj(4)为攻击方经验博弈信念空间,是防御方判断攻击方选择策略的概率。U=(UA,UD)UAUA=(UA1,UA2,.,UAj)UAjNAjSAjUAU

21、A=jm=1PAm UAm(1 m j)UDUD=(UD1,UD2,.,UDi)UDiNDiSDiUDUD=in=1PDn UDn (1 n i)UDi=1UDi 1UDi 0)e(t)0PQe(t)=0定义9-邻域是以理想纳什均衡点为圆心,为半径的闭区间。当时,由于短期预测是根据历史经验的反馈调节,不影响经典复制动态方程的稳定性。此时,博弈模型收敛至理想纳什均衡解集。当时,根据函数的柯西收敛准则,提出以下定理:|e(t)|k(PAj(t0),PDi(t0)k(PAj,PDi)kk定理1存在实数,当时,对于任意都有落在的-邻域内。(PAj,PDi)e(t)|e(t)|t0(PAj(t0),PD

22、i(t0)(PAj(t0),PDi(t0)e(t)0(PAj,PDi)(PAj,PDi)k(PAj,PDi)kk(PAj(t0),PDi(t0)kk minkkk(PAj,PDi)k(PAj,PDi)k(PAj(t0),PDi(t0)kk|e(t)|e(t)|k(PAj(t0),PDi(t0)k(PAj,PDi)kk证明对于任意初始博弈信念对,当其存在观测误差()时,经过时间 以及式(6)对应的演化过程,都会得到实际博弈信念输出 解,且落 在时对应的理想纳什均衡解的-邻域内。则对于可列举的,必有对应的,;选 取,由于和,一一对应,因此当时,处于所有内部,此时都落在的-邻域内。证毕(PA(t0)

23、,PD(t0)k根据收敛的定义,可以认为此时模型收敛,所得实际解是稳定可信的。4.2 网络防御决策方法经典演化博弈的纳什均衡解中一般包含纯策略表 1 原子攻击策略序号原子攻击动作名称所利用漏洞编号感染概率Acost攻击成本a1Web资源管理漏洞攻击CNNVD-202104-9890.780.20a2Oracle数据库输入验证攻击CNNVD-202107-14240.890.15a3Word插件路径遍历攻击CNNVD-202109-7010.930.10a4MicrosoftEdge跨站脚本攻击CNNVD-202109-1060.730.25表 2 原子防御策略序号原子防御动作名称防御动作描述D

24、cost操作代价防御效果b1设置黑洞路由利用防火墙修改路由表到不可达IP0.300.59b2丢弃可疑数据包利用IDS进行包过滤0.100.25b3限制用户活动限制可疑用户的权限及活动0.500.83b4格式化硬盘格式化硬盘去除所有恶意代码0.800.991974电子与信息学报第45卷纳什均衡和混合策略纳什均衡。在混合策略纳什均衡中,不同防御策略以概率的形式出现,这种不确定性使得混合策略纳什均衡解在实际网络防御行动决策中的可操作性不强3。基于确定性决策原则,设计了一种最优防御纯策略选择算法,如算法1所示。(x)5O(m+n)4)O(mn)O(n4)O(n2)nSD(Best)算法的时间复杂度主要

25、取决于步骤(4)。在步骤(4)中,算法借助MATLAB中的ode45函数求解微分方程,ode45函数采用4阶-5阶Runge-Kutta算法,截断误差为,时间复杂度为。算法的空间复杂度主要取决于步骤(2),攻防博弈收益矩阵占用了。考虑到本文中攻防博弈的对称关系,本算法整体的时间复杂度为,空间复杂度为。在实际计算中,可选防御策略的数量 是决定算法复杂程度的关键因素。算法所得最优防御纯策略集合可以为确定性网络防御决策提供科学依据,提升防御决策的可信度。5 仿真分析5.1 实验环境描述参考经典网络攻防博弈实验环境设置22,部署一个实验网络系统。其拓扑结构如图2所示。实验环境包括网络防御设备、Web服

26、务器、数据库服务器、文件服务器和用户终端。实验系统划分为3个区域:外网、隔离区(DeMilitarizedZone,DMZ)和内网,防火墙的访问控制策略是非内网用户只能访问隔离区的Web服务器,内网用户可以访问数据库服务器,文件服务器和Web服务器。5.2 模型及算法仿真验证Qe(t)P(t0)借鉴本领域仿真算例分析的一般做法,以下以22对称博弈为例,开展仿真演绎,首先给出理想纳什均衡解集的演化求解过程,再分析观测误差存在时实际解集的收敛稳定性,最后通过和经典模型的比较分析本文所提算法和模型在时间复杂度上的优势。NA1NA2ND1ND2SA1SA2SD1SD2在22对称博弈中,攻防双方各含有两

27、个子群体,;,,对应纯策略为,;,。以博弈防御方为例,标准化收益矩阵可以表示为UD=u100u2(10)u1SA1是攻击方采取纯策略时,防御方采取纯策略算法1最优防御纯策略选取算法SD(N,S,P,PA,U,P)N=(NA,ND)S=(SA,SD)P=(PA,PD)PA=(PA1,PA2,.,PAj)U=(UA,UD)e(t)1,1P=(PA,PD)(n=1;n i;n+)(m=1;m j;m+)UD=Vr DcostUA=Vr AcostDcost输入:国家信息安全漏洞库CNNVD输出:最优防御纯策略集合优防御纯策略集合(Best)BEGIN(1)/*初始化改进演化博弈模型*/Initial

28、izeIEGM=;(a)Construct;/*构建网络攻防异质群体博弈参与者空间*/(b)Construct;/*根据表1、表2构建混合策略空间*/(c)Construct;/*创建待赋值的实际博弈信念空间*/(d)Construct;/*根据历史数据构建攻击方经验博弈信念空间*/(e)Construct;/*创建待赋值的博弈收益空间*/(f)Assign;/*为观测误差赋值随机数*/(g)Construct;/*创建待赋值的短期预测集合*/(2)/*计算攻防博弈收益*/ForForCalculate;CalculateUD=in=1PDn UDn,1 n iUA=jm=1PAm UAm,1

29、 m j(n=1;n i;n+)(m=1;m j;m+)PDi=(PAj(t)+e(t)+PAj(t)in=1PDn(t)UDn(t)PDi=(PAj(t)+PAj(t)+e(t)in=1PDn(t)UDn(t)(n=1;n i;n+)PPDi=1SD(Best);(3)/*构建改进复制动态方程*/ForForConstruct;(4)/*模型求解*/Definefunction/*定义微分方程求解函数*/function=(t);Assignt;/*为计算时长T赋值*/Forode45(function,T,);/*利用MATLABode45函数对方程进行求解*/WhenReturn;/*当

30、防御方博弈信念为1时输出最优防御纯策略*/ElseReturn0;END第6期马润年等:基于改进演化博弈模型的网络防御决策方法1975SD1u2SA2SD2获得的相对收益;是攻击方采取纯策略时,防御方采取纯策略获得的相对收益。代入式(6)可得相应的防御方和攻击方的改进复制动态方程PA1=u1(PD1(t)+PD1(t)+e(t)(u1 PD1(t)+u2 PD2(t)/2PD1=u1(PA1(t)+PA1(t)+e(t)(u1 PA1(t)+u2 PA2(t)/2PA2=PA1,PD2=PD1(11)e(t)0Q实验1验证时博弈模型稳定收敛至。u1,u2|u1|=0.4,|u2|=0.6,e(

31、t)0PA1,PD1(0,1)运用MATLAB实验工具分析博弈演化趋势。实验中,多次调整数值,发现并不影响演化稳定解的收敛结果。参考文献4,设定,初始博弈信念为的随机数,图3对应300次蒙特卡罗仿真实验结果。u1 u2 0PA1(t)=u2/(u1+u2)PD1(t)=u2/(u1+u2)u1,u2u1 u2 0e(t)0QQ分析图3(b)和图3(d)可知,当时,博弈信念在状态空间内不改变符号,从状态空间内部任意初始位置开始,博弈双方的总体状态都会收敛到严格占优纯策略。分析图3(a)和图3(c)可知,当时,博弈有两个严格纯策略纳什均衡和理想混合策略纳什均衡。结合式(8),可知当博弈收敛到理想混

32、合策略纳什均衡时,,。由此可知博弈的混合策略纳什均衡点不稳定,会随着数值的变化而发生改变,且由于混合纳什均衡点是鞍点,没有实际解轨迹经过,因此在实际计算中博弈结果不会收敛到混合策略纳什均衡点。综上所述,当时,博弈收敛至两个稳定的严格纯策略纳什均衡。仿真结果表明,时博弈模型稳定收敛至,且中的所有解都是确定性解,即在没有观测误差的理想状态下,博弈模型可以输出稳定可信的纯策略,为网络防御决策提供支撑。e(t)=0Q实验2验证时,博弈模型稳定收敛至的-邻域。u1=0.22,u2=0.26PA1=0.6,PD1=0.41=12=0.1 3=0.01|e(t)|(0,e(t)0根据式(12)的攻防收益量化

33、结果,设定,分别设立,3组对照实验组。每组中是的随机数,且为更清晰地观察实验结果,组中设置的对照曲线,图4给出了仿真结果示例。1(0,0)0.01ite 0ite=300 0.01Q对比图4(a)图4(c)可知,随着 数量级的减小,模型演化初期的震荡现象逐渐减弱,但当观测误差存在时,模型需要更多次演化迭代才能达到稳定收敛的状态。在 可取的范围内()内,无论 值的大小,模型都能稳定收敛至演化均衡解的-邻域内()。需要特别说明的是,仿真结果表明在演化代数时,。但由于网络防御的时敏性特点,本文需要在有限时间窗口内输出有效防御策略,因此本文中选用,此时,博弈模型稳定收敛至的-邻域。理论分析和仿真实验表

34、明,所提模型在观测误差存在的条件下,仍然能稳定输出近似纯策略的演化结果。在合理的时间窗口内,误差数量级可以控制在0.01%,在网络攻防的激烈对抗态势下,可以认为所提模型结果是可行可信的1。实验3干扰环境下不同防御决策模型的性能对比分析。本文所提模型与一些经典网络防御决策模型都是基于复制动力学模拟决策过程,只是在决策标准和目标应用场景方面有所区别。因此,在干扰环境下,本文选取3种经典防御决策模型与本文所提模型进行对比,分析不同模型使用的算法在时间性能上的差异。首先,给出选取模型的基本情况。改进演化博弈模型IEGM(本文):基于经典复图2网络信息系统的拓扑环境1976电子与信息学报第45卷e(t)

35、PSD(Best)制动力学决策模型,面向干扰环境和决策时效性需求,对演化博弈模型进行了复杂适应性改进。量化定义了观测误差和对博弈信念的短期预测,采用最优防御纯策略选取算法,输出最优防御纯策略集合。网络攻防演化博弈模型(Attack-DefenseEvo-lutionaryGameModel,ADEGM)4:基于有限理性约束,模拟攻防双方非合作演化博弈过程,提出演化稳定的最优防御策略选取算法。算法的优势在于严密的防御策略稳定性分析,使得算法输出的演化均衡策略ESS具有较强的稳定性和预测能力。网络攻防博弈模型(NetworkAttack-DefenseGameModel,NADG)11:基于不完全

36、信息条件,针对军事信息网络特点,提出一种基于攻防博弈的主动防御策略选取算法,输出最优防御纯策略。算法的优势在于以纯策略的形式进行主动防御策略选取,有效解决以概率形式进行防御策略选取不便于理解和操作的问题,且由于不需要求解所有的纳什均衡解,在效率上也有一定优势。ij改进复制动态攻防演化博弈模型(ImprovedAttack-DefenseEvolutionaryGameModel,IADE-GM)15:在经典复制动态方程基础上,量化防御群体之间的策略依存效应,引入激励系数,提出改进复制动态攻防演化博弈模型。算法的优势在于通过提高防御群体的激励系数,可以加快策略选取的速度。e(t)0图3时演化稳定

37、解的收敛轨迹e(t)=0Q图4时博弈模型稳定收敛至的-邻域第6期马润年等:基于改进演化博弈模型的网络防御决策方法19771=1 2=0.1 3=0.01设立,3组干扰实验环境,在每个实验环境中,设置实验参数如表3所示。SD1SD221=1由于本文中的两种防御策略,不存在依存关系,因此设定激励系数。实验仿真结果如图5及表4所示。=0.01=0.1分析图5(a)图5(c)可知,无论 数量级大小,本文所提模型IEGM输出演化稳定结果所需的演化代数均小于其他对比模型。当时,IEGM的收敛速度相较于其他模型提升幅度在3.29%28.57%;当时,IEGM的时效性可以提升4.26%=141.49%;当时,

38、IEGM演化速度的提升幅度可以达到22.39%64.06%。由此可见,随着环境干扰的增强,IEGM的性能优势更明显。但在低干扰条件下,NADG和IADEGM等模型的时效性和IEGM十分接近。需要说明的是,由于本文中的可用防御策略之间不存在依存关系,因此IADEGM模型中的激励效用无法得到很好体现。仿真结果表明本文所提模型在强干扰环境下相对ADEGM,NADG,IADEGM等经典模型能够更快地输出演化稳定防御纯策略,更能满足网络攻防博弈的时敏性需求。6 结束语 0.01本文主要得出以下3点结论:一是观测误差为0时,改进演化博弈模型能够精确收敛至纯策略纳什均衡,一定程度上提升了网络防御的可操作性。

39、二是考虑观测误差的改进网络安全演化博弈模型,其演化稳定解虽不能收敛至纯策略纳什均衡,但会落在纳什均衡解的-邻域内。且在选定的时间窗口内,所得结果的可行可信性较高。三是在给定的误差范围内,模型表现出对不同数量级误差的较好适应性,并且在响应速度上相较于其他经典模型具有一定优势。论文在模型求解和算例分析中,假设可选择策略数目为2,后期研究可考虑多维博弈策略空间的情况下改进演化博弈模型的稳定性和适用性。除此之外,本文中短期预测的步长为固定值1,后续工作中可以研究时变的步长调整方法,在初期加大最优解的搜索范围,后期提升最优解的稳定精度。参 考 文 献ALPCANTandBAART.NetworkSecu

40、rity:ADecisionandGame-TheoreticApproachM.Cambridge:CambridgeUniversityPress,2010:2034.1刘小虎,张恒巍,马军强,等.基于攻防博弈的网络防御决策方法研究综述J.网络与信息安全学报,2022,8(1):114.doi:10.11959/j.issn.2096-109x.2021089.LIU Xiaohu,ZHANG Hengwei,MA Junqiang,et al.Research review of network defense decision-makingmethodsbasedonattackand

41、defensegameJ.ChineseJournal of Network and Information Security,2022,8(1):114.doi:10.11959/j.issn.2096-109x.2021089.2DOCT,TRANNH,HONGC,et al.GametheoryforcybersecurityandprivacyJ.ACM Computing Surveys,2018,50(2):30.doi:10.1145/3057268.3黄健明,张恒巍,王晋东,等.基于攻防演化博弈模型的防御策略选取方法J.通信学报,2017,38(1):168176.doi:10

42、.11959/j.issn.1000-436x.2017019.4表 3 实验3参数设置模型u1u2PA1PD1其他参数IEGM0.220.260.60.4|e(t)|=(0,ADEGM0.220.260.60.4NADG0.220.260.60.4IADEGM0.220.260.60.421=1图5不同量级观测误差下模型时间复杂度对比表 4 实验3中模型收敛至最优解所需演化代数模型|e(t)|1|e(t)|0.1|e(t)|0.01IEGM679491ADEGM82104115NADG9913394IADEGM110981171978电子与信息学报第45卷HUANGJianming,ZHAN

43、GHengwei,WANGJindong,et al.Defensestrategiesselectionbasedonattack-defenseevolutionarygamemodelJ.Journal on Communications,2017,38(1):168176.doi:10.11959/j.issn.1000-436x.2017019.SANDHOLM W H.Evolutionary game theoryM.SOTOMAYOR M,PREZ-CASTRILLO D,andCASTIGLIONEF.ComplexSocialandBehavioralSystems.New

44、York:Springer,2020:573608.5蒋侣,张恒巍,王晋东.基于多阶段Markov信号博弈的移动目标防御最优决策方法J.电子学报,2021,49(3):527535.doi:10.12263/DZXB.20191070.JIANGLv,ZHANGHengwei,andWANGJindong.Amarkovsignalinggame-theoreticapproachtomovingtargetdefensestrategyselectionJ.Acta Elctronica Sinica,2021,49(3):527535.doi:10.12263/DZXB.20191070.

45、6SHAMMAJSandARSLANG.Dynamicfictitiousplay,dynamicgradientplay,anddistributedconvergencetoNashequilibriaJ.IEEE Transactions on Automatic Control,2005,50(3):312327.doi:10.1109/TAC.2005.843878.7MASSAQUOISG.Modelingthefunctionofthecerebelluminscheduledlinearservocontrolofsimplehorizontalplanararmmovemen

46、tsD.Ph.D.dissertation,MassachusettsInstituteofTechnology,1999.8林旺群,王慧,刘家红,等.基于非合作动态博弈的网络安全主动防御技术研究J.计算机研究与发展,2011,48(2):306316.LINWangqun,WANGHui,LIUJiahong,et al.Researchonactivedefensetechnologyinnetworksecuritybasedonnon-cooperativedynamicgametheoryJ.Journal of ComputerResearch and Development,20

47、11,48(2):306316.9WANGKun,DUMiao,YANGDejun,et al.Game-theory-basedactivedefenseforintrusiondetectionincyber-physicalembeddedsystemsJ.ACM Transactions onEmbedded Computing Systems,2016,16(1):121.doi:10.1145/2886100.10王增光,卢昱,李玺.基于不完全信息博弈的军事信息网络主动防御策略选取J.兵工学报,2020,41(3):608617.doi:10.3969/j.issn.1000-10

48、93.2020.03.022.WANGZengguang,LUYu,andLIXi.ActivedefensestrategyselectionofmilitaryinformationnetworkbasedonincompleteinformationgameJ.Acta Armamentarii,2020,41(3):608617.doi:10.3969/j.issn.1000-1093.2020.03.022.11SUNYan,LINFuhong,andZHANGNan.AsecuritymechanismbasedonevolutionarygameinfogcomputingJ.S

49、audi Journal of Biological Sciences,2018,25(2):237241.doi:10.1016/j.sjbs.2017.09.010.12杨峻楠,张红旗,张传富.基于随机博弈与改进WoLF-PHC的网络防御决策方法J.计算机研究与发展,2019,56(5):942954.doi:10.7544/issn1000-1239.2019.20180877.13YANGJunnan,ZHANGHongqi,andZHANGChuanfu.Network defense decision-making method based onstochasticgameandi

50、mprovedWoLF-PHCJ.Journal ofComputer Research and Development,2019,56(5):942954.doi:10.7544/issn1000-1239.2019.20180877.DUJun,JIANGChunxiao,CHENKC,et al.Community-structuredevolutionarygameforprivacyprotectioninsocialnetworksJ.IEEE Transactions on InformationForensics and Security,2018,13(3):574589.d

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 自然科学论文

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服