1、第 56 卷 第 9 期2023 年 9 月通信技术Communications TechnologyVol.56 No.9Sep.20231036文献引用格式:马增起,罗屹洁,周浩,等.导频污染下的智能反射面辅助无人机传输方法 J.通信技术,2023,56(9):1036-1042.doi:10.3969/j.issn.1002-0802.2023.09.003导频污染下的智能反射面辅助无人机传输方法*马增起,罗屹洁,周 浩,王润升,胡宏达,王嘉琦(中国人民解放军陆军工程大学,江苏 南京 210007)摘 要:被动窃听或主动干扰会给空地通信网络带来严重的安全威胁。智能反射面因其可以智能调控电
2、磁环境,能够有效对抗这类恶意攻击者。在导频污染下,研究通过智能反射面辅助来提升空地通信网络的物理层安全性能具有现实意义。在斯坦伯格博弈、机器学习和分层优化理论与方法的指导下,利用多天线发射机的主动波束成型、智能反射表面的被动波束成型等手段,削弱了主动窃听者导频干扰带来的影响,提升了空地通信网络的传输安全性。关键词:导频污染;智能反射面;无人机通信;机器学习中图分类号:TN929.5 文献标识码:A 文章编号:1002-0802(2023)-09-1036-07IRS-Assisted UAV Transmission with Pilot PollutionMA Zengqi,LUO Yiji
3、e,ZHOU Hao,WANG Runsheng,HU Hongda,WANG Jiaqi(Army Engineering University of PLA,Nanjing Jiangsu 210007,China)Abstract:Passive eavesdropping or active jamming could pose a serious security threat to air-ground communication networks.Due to the ability of programming electromagnetic environment intel
4、ligently,it is available for IRS(Intelligent Reflecting Surface)to defeat such malicious attackers.It is of practical significance to study the improvement of physical layer security performance of air-ground communication networks through IRS assistance with pilot pollution.Based on Stackelberg gam
5、e,machine learning and hierarchical optimization theories and methods,this paper employs active beamforming of multi-antenna transmitters and passive beamforming of IRS to weaken the impact of pilot interference brought by active eavesdroppers,and improve the transmission security of air-ground comm
6、unication networks.Keywords:pilot pollution;intelligent reflecting surface;UAV communication;machine learning0 引 言近年来,无人机(Unmanned Aerial Vehicle,UAV)通信由于部署方便、灵活机动、成本较低、存在视距通信链路等多种优势1,引起人们的广泛关注。无人机通信增大了空地视距传输的可能性,从而提升了传输性能,但也增加了其被窃听和被干扰的风险。因此,如何实现无人机通信过程中的安全可靠传输是一个迫切需要解决的问题。智 能 反 射 面(Intelligent Ref
7、lecting Surface,IRS)由大量的无源反射单元组成,每一个反射单元都能够改变入射信号的反射特性(包括信号的振幅和相位),从而达到控制反射信号的目的。到目前为止,有许多研究者从不同角度对使用 IRS 辅助无人机通信以增强通信安全性和可靠性进行了有益探索2-13。*收稿日期:2023-06-18;修回日期:2023-07-29 Received date:2023-06-18;Revised date:2023-07-291037第 56 卷第 9 期马增起,罗屹洁,周浩,王润升,胡宏达,王嘉琦:导频污染下的智能反射面辅助无人机传输方法文献 2 通过联合优化 UAV 飞行轨迹、IRS
8、 相移和系统传输功率,提出了一种 IRS 辅助无人机通信的物理层安全传输方案。文献 3 通过联合优化无人机轨迹、发射波束成形和 IRS 相移,最大限度地提高了IRS辅助无人机网络的平均安全可达速率。文献 4 将搭载着 IRS 的无人机当作移动中继,主要是通过联合优化无人机的位置和 IRS 的相移来最大化系统的安全速率。文献 5 考虑空地通信网络中存在空中的窃听者,通过联合优化发射功率、主动波束成形、IRS 的相位矩阵和无人机的 3D 轨迹来改进安全性能。文献 6 在之前研究的基础上,考虑了多个地面用户的场景,联合优化用户调度、发射机功率控制、IRS 相位和无人机轨迹来最大化被动窃听下的安全可达
9、速率。文献 7 通过联合优化 UAV 的位置、基站波束成形和 IRS 相移最大化系统的最小安全速率,实现 IRS 辅助的无人机中继系统的安全通信性能。文献 8 通过利用 IRS 动态地加强回传链路,以及通过协作无人机引入人工噪声干扰非法窃听者,从物理层提高无人机通信系统的安全性。文献 9 利用 IRS 和方向调制的手段研究了基于毫米波通信的无人机辅助无线网络的物理层安全机制。在抗干扰研究方面,文献 10 将 IRS 部署在基站附近,探讨了无人机通信中上行链路和下行链路的抗干扰方法,通过无人机的发射功率控制和 IRS的被动波束设计来提升空地通信的抗干扰性能。文献 11 和文献 12 都在主动干扰
10、者信道状态信息不完美的情况下,利用 IRS 的辅助提升了无人机通信系统的抗干扰能力。其中,文献 11 将 IRS 部署在地面用户附近,通过联合优化地面用户的发射功率、IRS 的被动波束和无人机的航迹,提升了上行链路的传输性能。文献 12 通过联合优化无人机的飞行轨迹、飞行速度和 IRS 的相移矩阵来提升系统的能量效率。文献 13 在用户接收信干噪比约束和连续相移约束的条件下,提出了对应的解决算法,并且仿真结果表明该算法在抗干扰方面具有显著的作用。综上所述,IRS 的辅助可以有效提高无人机通信的安全性和可靠性。不过以上研究分别是在被动窃听或主动干扰下进行了 IRS 辅助无人机传输方法研究,没有考
11、虑主动窃听对无人机通信的影响。所谓主动窃听,是在信道估计阶段发射干扰信号,引入导频污染,然后在数据传输阶段窃听合法用户的信号14,其带来的危害更大。因此,本文主要聚焦导频污染下的 IRS 辅助无人机传输方法研究,利用IRS 智能调控无线环境,联合优化 IRS 的被动波束成形和发射机的主动波束成形,有效缓解导频污染带来的影响,提升无人机通信的物理层安全性能。受文献 15 的启发,本文建立了导频污染下的IRS 辅助无人机通信的系统模型。与文献 15 不同的是,本文考虑的导频污染在不同时隙不是恒定不变的,而是根据主动窃听者的效用动态变化。因此,利用博弈模型建立了合法用户和主动窃听者之间的对抗关系,分
12、析了信道估计阶段的导频污染对传输阶段的合法用户传输性能的危害,并研究了主动窃听者干扰功率的动态变化对信道估计的影响。同时,合法用户也具有一定的智能性,采用机器学习算法对发射机的波束成形和 IRS 的相位进行调整,从而降低导频污染的危害,提升空地通信系统的传输安全性。1 系统模型假设系统中存在一个多天线的基站、多个单天线的无人机用户和固定在建筑物外墙上的 IRS。合法通信链路包括基站到无人机的直连链路和通过IRS 的反射链路。系统中还存在一个单天线的主动窃听者,其在信道估计阶段主动干扰合法用户以影响信道估计,并在信息传输阶段窃听合法用户信息。系统模型如图 1 所示。图 1 系统模型2 问题描述2
13、.1 传输过程描述假设系统工作在时分双工(Time Division Duplex,TDD)模式下,上下行信道是互易的,也就是说,可以认为上行的估计信道与下行的传输信道是一样1038通信技术2023 年的。用户在传输过程中经历上行训练阶段和下行传输阶段,在训练阶段进行信道估计,然后根据上行信道估计的值调整下行传输时基站的预编码和 IRS的相位偏移,实现安全可靠的通信15。如图 2 所示,假设信道估计阶段时长为Te,包括直连链路估计时长Td和反射链路估计时长MTr,其中,M为 IRS 反射单元的数目,Tr是启用每个反射单元的时间,数据传输阶段时长为Tc。TdMTrTcM1信道估计阶段数据传输阶段
14、1图 2 信道估计因为既有直连链路,又有反射链路,都需要进行信道估计,因此假设信道估计的过程如下:(1)首先在符号周期Td内,将 IRS 关闭,第k个用户发射导频信号uk,然后用基站接收到的信号来估计直连链路的信道增益;(2)在Td+(m-1)Tr+1 的符号周期内,依次打开第m个 IRS 单元,第k个用户发射导频信号vk,m,基站依次接收信号;(3)基站通过将接收到的信号投影到导频序列,并减去直连链路的信道增益,就可以得到等效反射链路的信道增益。假设在信道估计阶段,导频都是彼此正交的,对于第k个用户,导频序列表示为,1,kkk muvv,其中,uk CTd1表示直连链路的导频信号,vk,m
15、CTr1表示反射链路的导频信号,它们彼此是正交的,并且对于所有用户都已知,包括主动窃听者。为了使问题可解,假设在信道估计阶段噪声的影响可以忽略。假设接收机能收到两条链路的信号:一条是直连链路,一条是经过 IRS 反射的链路。因此,假设基站在数据传输阶段发射信号x CN1,那么第k个用户收到的信号为:drkkkkyyyn=+(1)式中:nk为满足均值为 0,方差为2的加性高斯白噪声;ykd为通过直连链路收到的信号;ykr为通过IRS 反射链路收到的信号。ykd的表达式为:ykd=hkTx(2)式中:hkT CN1是从第k个用户到基站的直连链路的信道增益。ykr的表达式为:rTTTTTTdiagk
16、kkky=a U xaU x F x(3)式中:ak CM1为从用户到 IRS 的上行链路增益;U CNM为从 IRS 到基站的上行链路增益;=diag;为M维向量,是 IRS 的反射系数,第m个元素为:exp jmmm=(4)式中:m 0,1 是 IRS 单元的幅度,要么为 0,要么为 1,表示是否启用该单元;m表示第m个 IRS单元的相位偏移。Fk=Udiagak(5)式中:Fk为用户通过 IRS 发射到达基站的等效反射信道增益。同样地,窃听者收到的信号为:ye=yed+yer+ne(6)式中:ne为满足均值为 0,方差为2的加性高斯白噪声。对应地,yed=heTx(7)式中:heT CN
17、1是从窃听者到基站的直连链路的信道增益。rTTTTTTeeeeydiag=a U xaU x F x(8)式中:aeCM1是从窃听者到IRS的上行链路增益。同样地,从窃听者到 IRS 再到基站的等效反射链路增益为:Fe=Udiagae(9)2.2 导频干扰的影响在信道估计的第 1 阶段,主动窃听者在第l个用户信道上发射干扰信号,因此在信道估计阶段Te时隙基站收到的信号为:dTT1KkkkeelkPP=+Qh uh u(10)式中:Pk和Pe表示第k个无人机用户和主动窃听者的发射功率。利用收到的信号,基站估计直连链路hk信道增益为:d*d1kkkP T=hQ u(11)根据导频信号之间的正交性,
18、对于kl,可以得到hk=hk,而对于第l个无人机用户的直连信道估计为:1039第 56 卷第 9 期马增起,罗屹洁,周浩,王润升,胡宏达,王嘉琦:导频污染下的智能反射面辅助无人机传输方法 ellelPP=+hhh(12)在信道估计的第 2 阶段,在每一个子帧,基站收到的信号为:()()rTT,1Kmkkk mk meee ml mkPP=+Qhfvhfv(13)式中:fk,m和fe,m表示第k个无人机用户和主动窃听者到第m个反射单元再反射到基站的转发信道增益。根据这个信号,得到的转发信道的估计值为:rr*,1k mmk mkkP T=fQ vh(14)对于kl,可以得到fk,m=fk,m,而对
19、于第l个无人机用户的转发信道估计为:,el ml me mlPP=+fff(15)综合考虑以上直连链路和反射链路,对于除了被窃听的无人机用户,信道估计都是准确的,而对于被窃听的无人机用户,其信道估计表示为:()di()(ag)elleelPP=+g g hUa(16)式中:U CNM表示从智能反射表面到基站的信道矩阵;ae CM1表示从窃听者到智能反射表面的信道;表示智能反射表面的相位偏移向量;gl()=hl+fl包含直连和反射链路;gl()是总的信道增益(包含直连和反射)的估计值。在数据传输阶段,假设信号通过线性预编码再发射,则通过基站发射出去的信号可以表示为:1Kkkks=xw(17)式中
20、:sk为需要发送给第k个无人机用户的信息符号;wk为发射给第k个无人机用户的波束向量,满足|wk|2=PT。在这种情况下,第k个无人机用户收到的信号表示为:TT1,()()Kkkkkjjjkjj kyssn=+g wg w(18)定义第k个无人机用户获得的传输速率为:()2T2T21,()(),log 1kkkkKjjjj kR=+g ww g w(19)而对于窃听者来说,假设它可以根据收到的基站发送的信道状态信息抵消其他用户对它的干扰,则其窃听速率可以表示为:2T2()(),log 1ekekkR=+g ww (20)则安全可达速率可以定义为:,max(,0)()()()sekkkkkkRR
21、R=w w w (21)3 博弈模型对于主动窃听者来说,在信道估计阶段可以通过调整其干扰功率来误导合法用户对信道进行错误估计,由此在数据传输阶段提升其窃听速率。对于合法用户来说,可以在数据传输阶段通过调整基站的预编码波束向量和智能反射表面的相位偏移来提升其安全可达速率。基于以上的分析,定义主动窃听者的效用函数为:T1()(),eKekekekuc P=w g w(22)同时,定义合法用户的效用函数为:T1()(,)1Kkekku=wgw(23)因此,可以将这部分的优化问题建模为斯坦伯格博弈G,博弈的参与者是主动干扰者和合法用户,主动窃听者的目标是最大化窃听速率并尽量减小干扰代价,合法用户的目标
22、是最大化其安全传输的能力。主动窃听者的策略是调整其干扰功率的大小,合法用户的策略是设计基站的预编码波束向量和调整智能反射表面的相位偏移。根据策略实施的时序性,将它们之间的对抗关系建模为斯坦伯格博弈,然后根据基于机器学习的分层迭代算法,求解所提斯坦伯格博弈的混合策略,获得稳定的基站预编码波束向量和智能反射表面的相位偏移策略,提升不完美信道信息下空地通信网络的物理层安全性能。因为主动窃听者在信道估计阶段是要发射信号的,可以假设基站能够获知其信道状态信息(Channel State Information,CSI),但是无法获知主动窃听者的干扰功率。如果只是被动窃听,能够完美获得窃听的 CSI,合法
23、用户可以采用安全广义迫零(Secure Regularized Zero Forcing,SRZF)准则实现预编码,较好地压制信息的泄露16。SRZF 预编码的基本思想是将窃听信道考虑到发射机预编码的过程中,本质上是通过额外获得的窃听信道状态信息来提升安全传输的能力,相比于广义迫零预编码来说,系统1040通信技术2023 年的安全传输速率有了较大的提升。根据 SRZF 准则设计的预编码为:()()()srzfsrzf,TP =wA(24)式中:()()()Hsrzf1,tr,N =AA,A(,)=(HHH+GHG+IN)-1HH,其中,H是合法用户的信道,G是窃听信道,和是可以调整的参数。考虑
24、合法用户和窃听者的信道都包括直连链路和反射链路,所以H=(h1+F1,hK+FK),G=ge+Fe。如果没有引入导频污染,根据安全广义迫零预编码可以获得完美信道状态信息条件下最佳的编码矩阵。而加入了导频干扰,基站在不知道干扰功率的情况下,就会对信道估计存在误差,因此,干扰功率会对合法用户的防窃听效果造成一定影响。另外,主动窃听者在最大化窃听的情况下,还要考虑干扰功率的消耗,因此存在一个最佳的干扰功率;合法用户根据安全广义迫零原则可以获得完美信道条件下最佳的预编码矩阵,然后再采用分层学习算法优化 IRS 的相位,通过在和主动窃听者的不停博弈过程中,最终获得博弈的均衡解。因此,在斯坦伯格博弈模型的
25、建模中,假设主动窃听者基于 Q 学习的算法来更新每个信道估计阶段的干扰功率大小,合法用户在主动窃听者干扰功率变化的情况下,采用分层迭代优化算法来更新发射机的主动波束成形和 IRS 的相位矩阵。具体地,合法用户首先固定 IRS 的相位矩阵,其次根据SRZF 准则优化基站的预编码矩阵,在此基础上,再根据随机学习算法更新 IRS 的相位矩阵,直到算法收敛。具体的算法描述如下。算法 1:IRS 辅助无人机传输的分层优化算法初始化:智能反射单元数目M、IRS 相位偏移集 ik、智能反射单元相位选择概率Pr_ik、干扰功率集 Pe、干扰选择概率Pr_e、干扰代价因子ce循环:1.主动窃听者根据其功率选择概
26、率选定干扰功率;2.合法用户根据接收到的信号进行信道估计;3.智能反射单元根据选择概率确定其相位偏移;4.发射机根据式(24)准则计算发射波束;5.根据式(23)计算合法用户的效用函数,并根据效用函数更新反射单元的相位选择概率;6.根据式(22)计算主动窃听者的效用函数,并根据其效用函数更新其干扰功率的选择概率;7.结束循环;8.计算系统获得的平均安全可达速率。4 仿真结果及分析在仿真部分,假设系统中只存在一个无人机用户,并且从基站到无人机用户的信息被主动窃听者窃听。为了简化分析,假设 IRS 的相位离散分布,并且每个反射单元的相位调整是彼此独立的,主动窃听者的干扰功率也取离散值。假设发射机天
27、线数目为 8,IRS 包含 8 个智能反射单元。合法通信链路包括基站到无人机的直连链路和通过 IRS 的反射链路。假设发射机的发射总功率设定为PT=1 W,主动窃听者干扰功率集合为 0,0.2,0.4,0.6,0.8,1 W,主动窃听的干扰代价因子ce=0.000 1,背景的高斯加性白噪声功率水平设为N0=10-17 W。假设发射机到无人机用户之间的距离为 20 m,发射机到主动窃听者之间的距离为 50 m。图 3 是一次仿真中某个智能反射单元的相位选择收敛曲线,图 3 中的p1到p8是某个反射单元选择 8 种相位的概率。从图中可以看出,使用本文所提的相位选择算法时,智能反射单元选择离散相位在
28、 30 次左右达到收敛,收敛速度较快。图 4 是主动窃听者干扰功率选择概率的收敛曲线,图 4 中的p1到p6是主动窃听者选择 6 种档位的功率的概率。从图中可以看出,基于 Q 学习的主动窃听者干扰功率选择算法中,主动窃听者选择离散干扰功率值在20 次左右达到收敛,收敛速度较快。p1p2p3p4p5p6p7p8图 3 某个 IRS 反射单元相位选择概率收敛曲线图 5 和图 6 是仿真结果为 103次独立实验的平均值。图 5 是安全可达速率随着发射机功率变化的曲线。从图中可以看出,安全可达速率随着发射机总功率的增大而增大,这一方面是由于发射机总功率的增大,会增大合法用户的传输速率,另一方面是由于发
29、射机总功率增大,主动窃听者发射干扰功率带来的信道误差就相对较小,从而进一步提升了合法用户的安全可达速率。同时还可以1041第 56 卷第 9 期马增起,罗屹洁,周浩,王润升,胡宏达,王嘉琦:导频污染下的智能反射面辅助无人机传输方法看出,本文联合发射机预编码和 IRS 相位选择算法的方法优于联合基于最大比传输(Maximum Ratio Transmission,MRT)的预编码和 IRS 相位选择算法的方法。图 6 是安全可达速率随着智能反射单元数目变化的曲线。从图中可以看出,随着智能反射单元数目的增多,系统的安全可达速率增大,并且采用 IRS 辅助的无人机通信比没有引入 IRS 的方法具有更
30、高的安全可达速率。p1p2p3p4p5p6图 4 主动窃听者干扰功率选择概率收敛曲线发射机发射功率/W安全可达速率/(bit/s/Hz)图 5 安全可达速率随着发射机功率变化曲线安全可达速率/(bit/s/Hz)图 6 安全可达速率随着智能反射单元数目变化曲线5 结 语本文提出了一种利用多天线发射机的主动波束成型、IRS 的被动波束成型等功能削弱主动窃听者导频干扰带来的影响,从而提升空地链路被污染情况下的安全可靠传输性能的通信方法。在斯坦伯格博弈、机器学习和分层优化理论与方法的指导下,通过建立系统模型分析合法用户和主动窃听者之间的交互关系,将原问题分解为两个子问题进行求解。最后的仿真结果表明,
31、本文所提方法可以有效缓解导频污染对空地安全传输的影响,提升无人机通信的安全性。参考文献:1 陈新颖,盛敏,李博,等.面向 6G 的无人机通信综述 J.电子与信息学报,2022,44(3):781-789.2 代秋香,肖海林,张中山,等.智能反射面辅助无人机的物理层安全传输方案 J.计算机应用研究,2023,40(9):2273-2280.3 PANG X W,ZHAO N,TANG J,et al.Joint trajectory and beamforming optimization for secure UAV transmission aided by IRSC/2021 13th I
32、nternational Conference on Wireless Communications and Signal Processing(WCSP),2021:1-6.4 FANG J H,YANG Z H,ANJUM N,et al.Secure intelligent reflecting surface assisted UAV communication networksC/2021 IEEE International Conference on Communications Workshops(ICC Workshops),2021:1-6.5 CHENG T H,WANG
33、 B H,CAO K R,et al.IRS-enabled secure G2A communications for UAV system with aerial eavesdroppingJ.IEEE Systems Journal,2022:1-12.6 YE Z S,SU G C,CHEN B,et al.Secrecy rate optimization for secure communication in IRS-aided UAV systemsC/2022 31st Wireless and Optical Communications Conference(WOCC),2
34、022:6-11.7 卢为党,曹明锋,高原,等.基于智能反射面辅助的无人机中继系统安全通信方法 J.电子与信息学报,2022,44(7):2273-2280.8 李子能,胡智群,肖海林,等.智能反射面和协作干扰的无人机安全通信算法 J.北京邮电大学学报,2023,46(1):69-76.9 赵晖.基于毫米波通信的无人机辅助无线网络物理层安全研究 D.邯郸:河北工程大学,2021.10 PANG X W,MEI W D,ZHAO N,et al.Intelligent reflecting surface assisted interference mitigation 1042通信技术2023
35、 年for cellular-connected UAVJ.IEEE Wireless Communications Letters,2022,11(8):1708-1712.11 JI Z,GUAN X R,TU J,et al.Robust trajectory and communication design in IRS-assisted UAV communication under malicious jammingC/2022 IEEE International Conference on Communications Workshops(ICC Workshops),2022
36、:1023-1028.12 ZHAO H,HAO J J,GUO Y J.Joint trajectory and beamforming design for IRS-assisted anti-jamming UAV communicationC/2022 IEEE Wireless Communications and Networking Conference(WCNC),2022:369-374.13 孙艺夫,安康,朱勇刚,等.基于智能反射面的无线抗干扰通信方法 J.电波科学学报,2021,36(6):877-886.14 KAPETANOVIC D,ZHENG G,RUSEK F.
37、Physical layer security for massive MIMO:An overview on passive eavesdropping and active attacksJ.IEEE Communications Magazine,2015,53(6):21-27.15 BEREYHI A,ASAAD S,MLLER R R,et al.Secure transmission in IRS-assisted MIMO systems with active eavesdroppersC/2020 54th Asilomar Conference on Signals,Sy
38、stems,and Computers,2021:718-725.16 ASAAD S,BEREYHI A,MLLER R R,et al.Secure regularized zero forcing for multiuser MIMOME channelsC/2019 53rd Asilomar Conference on Signals,Systems,and Computers,2020:1108-1113.作者简介:马增起(2002),男,本科生,主要研究方向为无人机通信、智能反射面辅助通信;罗屹洁(1981),女,博士,副教授,主要研究方向为无人机通信、智能反射面辅助通信;周 浩(2002),男,本科生,主要研究方向为无人机通信、智能反射面辅助通信;王润升(2002),男,本科生,主要研究方向为无人机通信、智能反射面辅助通信;胡宏达(2003),男,本科生,主要研究方向为无人机通信、智能反射面辅助通信;王嘉琦(2000),男,本科生,主要研究方向为无人机通信、智能反射面辅助通信。