收藏 分销(赏)

基于迁移学习的超表面设计.pdf

上传人:自信****多点 文档编号:2337075 上传时间:2024-05-28 格式:PDF 页数:7 大小:2.42MB
下载 相关 举报
基于迁移学习的超表面设计.pdf_第1页
第1页 / 共7页
基于迁移学习的超表面设计.pdf_第2页
第2页 / 共7页
基于迁移学习的超表面设计.pdf_第3页
第3页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、现代计算机Modern Computer第 29 卷 第 13 期2023 年 7 月 10 日基于迁移学习的超表面设计骆文浩,王宜颖,莫锦军*(桂林电子科技大学信息与通信学院,桂林 541004)摘要:超表面因具有独特的操控电磁波的功能被广泛使用。但超表面设计需要优化单元结构以产生所需相位分布,这需要大量的时间和计算资源。提出了一种基于迁移学习的超表面设计方法,该方法可以预测复杂超表面单元的相位。使用ResNet34作为预训练模型的迁移学习网络,其中仅使用20000个样本进行训练网络,其准确率达到90%以上。模型实现了预测21010不同结构的超表面单元的相位,与深度学习网络相比,减少训练样本

2、且提升了准确率。为了验证该方法的有效性和可行性,在实际设计需求下成功设计了一个异常反射在45角度的相位梯度超表面,并进行了仿真和实验验证。为超表面设计提供了一种新颖高效的方法,并为迁移学习在电磁领域内其他问题上的应用提供了参考。关键词:迁移学习;残差网络;数字超表面;双线性插值文章编号:10071423(2023)13003207DOI:10.3969/j.issn.10071423.2023.13.005收稿日期:20230313修稿日期:20230327基金项目:广西无线宽带通信与信号处理重点实验室主任基金(GXKL06200111)作者简介:骆文浩(1998),男,广东惠州人,硕士研究生

3、,研究方向为超表面应用;王宜颖(1982),男,河南开封人,博士,讲师,研究方向为可穿戴天线;*通信作者:莫锦军(1974),男,广西桂平人,博士,副教授,研究方向为电磁辐射与散射,Email:0引言超表面由周期性的亚波长结构阵列组成,可以灵活地调控电磁波1。超表面对电磁波的调制不依赖于空间累积,而依赖于强共振或空间取向引起的突然相变。因此,超表面可用于控制反射或透射波的相位、振幅和偏振24。近年来,许多具有独特功能的超表面被用于控制电磁波。由于超表面在操纵电磁波方面具有很大的自由度,因此在工程中具有很大的应用价值,并因此引起了极大关注。文献 5 提出了“数字超材料”的概念,其单元图案被离散化

4、并编码。文献 6 提出了不同的超表面单元编码序列,以实现不同的电磁响应。具有不同相位响应的元原子在设计具有聚焦、偏振转换等功能的超表面方面具有很大的应用价值7。希望能够快速预测不同编码序列的电磁特性,以便于快速设计超表面。然而,传统的超表面设计通常需要专业人员参与,并且非常耗时。需要确定基本结构、模拟扫描参数、寻找最优结构等步骤。这些步骤都非常复杂且耗时,设计周期也很长。对此,一种更有效且易于使用的设计方法是使用人工神经网络作为逆设计方法89。但是深度学习对数据和计算能力有很大要求,并且训练和部署模型也需要大量时间。为了解决上述问题,本文使用ResNet34作为预训练模型的迁移学习网络,快速完

5、成超表面设计,并建立起超表面结构和相位之间关系。迁移学习是一种利用在其他任务上训练得到知识,在新任务上更快地收敛,并减少训练所需数据和计算能力的机器学习方法1013。本文将该方法应用于最典型功能超表面相位梯度超表面实现波束偏转能力,验证其可靠性,并展示该方法将其他领域知识转移到超表面设计中可能对学术研究人员具有启发意义。32骆文浩等:基于迁移学习的超表面设计第13期1超表面单元设计与收集处理1 1.1 1超表面单元设计超表面单元设计考虑到设计图案能更好地被计算机所理解,我们选择了数字超表面的编码模式,图案由1010正方型的离散格子组成,图1表示了所设计的超表面的离散化编码。超表面的表面金属用编

6、码序列所表示,其中“1”表示金属,“0”表示没有金属。中间层为间距介电层,底层为金属底板。金属的厚度为0.015 mm。顶层金属图案打印在商用介电衬底FR4上,厚度h=1.0 mm,介电常数r=4.4,损耗tan=0.025。图 1超表面单元结构及图案编码顶层的图案有不同的编码序列,采用均匀分布离散随机格作为编码序列。二维平面上的超表面单元尺寸均为L1=6.0 mm。为了减小相邻超表面单元之间的相互耦合,将超表面单元上的图案外尺寸设为 L2=5.0 mm。我们将内平面均匀划分为 1010 的格,每个格为边长 u=0.5 mm 的正方形。为了设计超表面的多样性,采用1010编码序列作为矩阵。超表

7、面单元的图案编码序列等于一个矩阵,我们可以计算出这个矩阵对应的相位,如图 1所示。将矩阵和相对应的相位加入到训练数据集中。1010 矩阵有210 10种可能的模式,约1.26 1030,在实践中相当巨大。我们使用MatlabCST联合仿真来准备20000个训练数据集。首先,利用Matlab生成均匀分布离散随机格作为编码序列矩阵。其次,利用CST Microwave Studio 计算该编码序列的反射相位。然后,存储编码序列矩阵和相应相位,并加入到训练数据集中。反射相位可以在 1,360 范围内归一化。因此,这个问题可以简化为一个分类问题,数字超表面上的拓扑结构可以看作一个图像,超表面的相位预测

8、也可以看作是一个360类的分类问题。在这样的考虑下,我们将图像分类转化为相位预测。基于此,我们对ResNet进行预训练,并使用更少的数据传输模型。超表面的特征提取可以类似于图像的特征提取。将不同类别的图像识别转化为 1,360 相位预测。这样,可以把图像分类的经验转化为相位预测。1 1.2 2双线性插值双线性插值双线性插值是图像预处理方法之一,常常应用于图像增强以提高深度学习算法的特征学习能力14。双线性插值法也称二次线性插值法,实质是在图像的相邻两个像素点行列方向各进行一次线性插值,通过利用已知像素产生未知像素的方法来引入不同的图像边缘效果,提高图像分辨率。设图片像素位置在Q11=(x1,y

9、1)、Q12=(x1,y2)、Q21=(x2,y1)以及Q22=(x2,y2)上,若想得到插值后的P=(x,y)上的位置。首先,在 x轴方向上进行两次线性插值;然后,以R1和R2为已知数据,在y轴上进行一次线性插值,如图2所示。图 2双线性插值过程超表面单元的图案分辨率为1010,对于预训练模型可能无法从中学习到足够多的有用信息,所以使用双线性插值进行数据增强。33现代计算机2023年2模型介绍ResNet 是一种深度神经网络架构,主要用于图像分类。它由 He 等15于 2015 年提出,主要用于解决深度神经网络中的梯度消失问题。ResNet 通过使用残差连接(residual connect

10、ions)来解决这个问题,这使得较深层的训练变得容易。在 ResNet 中,残差连接直接将较浅层的输出与较深层的输入相加,从而使得较深层的训练变得容易。残差网络的核心思想是使用残差连接(residual connection)来解决深度神经网络训练时的梯度消失问题。如图 3 所示,在残差网络中,每一层都是一个残差模块,它包含一些卷积层和激活函数层。残差模块的输入是上一层的输出,输出是残差模块中的输出加上上一层的输出。这样,如果残差模块中的输出是上一层输出的线性变换,那么残差模块的输出就是上一层的输出。这意味着,即使在多层深度网络中,梯度仍然能够流动,从而解决了梯度消失问题。Weight lay

11、erWeight layer+XXidentityF(X)ReLuReLuF(X)+X图 3残差块结构ResNet34架构由 34个卷积层组成,如图 4所示,并在大型图像分类基准ImageNet数据集上进行训练。ResNet34被广泛应用于图像分类、目标检测和语义分割等计算机视觉任务。它能够有效地解决梯度消失问题和在图像识别任务中实现高准确率。ResNet34的表征能力和学习能力较高目模型参数较少,是图像分类领域研究的热点方同,所以我们采用 ResNet34作为迁移学习的预训练模型。在进行迁移学习时,通常会使用一个预训练的 ResNet34模型作为初始化。这个模型可以在大型数据集(ImageN

12、et)上训练好,然后解冻一部分参数,重新训练用于新的问题。ImageNet数据集包含1000类约120万张图片,使用在如此大的数据集上预训练好的网络模型,可以有效迁移到各种不同的图像分类任务中,如图5所示。使用这种方法,可以大大减少训练新模型所需的时间和计算资源。此外,使用预训练的模型可以获得更好的性能,因为这个模型已经在大型数据集上进行了训练,从先前任务中学到了知识,并且可以为新的问题提供有用的特征,仅需要进行微小的改动即可应用到相关的任务中,对于一些基本的规则,模型无需重新学习,大大降低了时间成本。本研究使用在 ImageNet数据集上训练好的ResNet34残差网络进行超表面图像的特征提

13、取。输入数据33卷积层,64通道残差块33卷积层,128通道残差块33卷积层,256通道残差块33卷积层,512通道残差块平均池化层全连接输出层77卷积层 346333卷积层BatchNorm2dReLU33卷积层BatchNorm2d+ReLU图 4ResNet34的整体架构首先使用预训练模型作为特征提取器,冻结所有层并且更改最后一层,只训练最后一层,然后使用这些特征来训练一个新的分类器。因为这是一个分类问题,我们使用softmax函数作为激活函数。然后计算输入数据的损失,并对网络参数进行调整。softmax函数也是将每个类别的网络输出转换为概率值的分类器。而引入指数函数使得分类的概率更大,

14、从而使得损失函数对网络输出更敏感,更有利于分类。3结果分析与实际设计3 3.1 1实验结果分析实验结果分析我们将迁移学习网络与传统深度学习网络进行比较,深度学习网络模型也是 ResNet34,经过 200 个 Epoch 训练后,比较结果如图 5 所 34骆文浩等:基于迁移学习的超表面设计第13期示。与传统深度学习相比,迁移学习有效地减少了训练数据,使得在样本较少的情况下表现更好。0204060801001201401601802000.00.10.20.30.40.50.60.70.80.91.0Accuracy RateEpochTransfer LearningDeep learning

15、图 5迁移学习与深度学习识别准确率为了探究深度学习在测试数据集上表现不佳的原因,图 6给出了深度学习模型训练过程中的损失曲线和准确率曲线。如图 6(b)所示,因为深度学习模型对训练数据存在过拟合问题,在验证集上的损失上升,因此深度学习的性能较差。传统的深度学习模型由于样本数量太少,需要调整的参数较多,收敛速度较慢。因为在ImageNet中有超过1400万的样本,所以深度学习模型在 ImageNet 数据集上具有很好的性能。因此,如果我们想要得到更好的结果,需要更大的数据量。在相同的条件下,迁移学习模型的性能远优于传统的深度学习模型。相比之下,迁移学习需要的数据更少,性能更好,因为迁移学习是基于

16、大数据的ImageNet训练的。迁移学习方法是一种实现超表面单元相位预测有效的方法,可以有效减少训练数据量。如图 7所示,训练集的准确率达到 99%左右。验证集的最高准确度达到90%左右。交叉熵计算的损失值收敛到0.03,相比于传统深度学习准确率提升了一倍,同时降低了对样本数0204060801001201401601802000.00.20.40.60.81.0Accuracy RateEpoch Train Eval0204060801001201401601802000.00.10.20.30.40.50.6LossEpochTrain_lossEval_loss(a)准确率(b)损失值

17、图 6深度学习训练准确率和损失值0204060801001201401601802000.00.20.40.60.81.0Accuracy RateEpochEval_accTrain_acc0204060801001201401601802000.00.10.20.30.40.50.60.7EpochLossEval_lossTrain_loss(a)准确率(b)损失值图 7迁移学习训练准确率和损失值 35现代计算机2023年量的依赖。我们只使用了 2万个样本进行训练,但训练结果反映了该模型具有很高的预测精度和泛化能力。我们在测试集中随机选择 100个样本来验证模型的准确率,结果如图 8所示

18、,模型有着较好的准确性。三角形表示预测超表面单元的相位,圆圈表示全波电磁计算得到超表面单元的相位。020406080100050100150200250300350 Simulated PredictedPhaseSample图 8随机100个样本的预测和实际结果此外,为了进一步证明迁移学习模型在训练超表面单元样本方面的有效性,我们额外测试了一些有代表性的网络,包括AlexNet网络、VGG网络和MobileNet网络。表 1不同神经网络的性能网络AlexNetVGGMobileNet(TLN)ResNet34(TLN)测试集准确率/%6.831.073.090.0交叉熵0.6410.1240

19、.0190.002从表 1可以看出,由于提取的特征不匹配导致欠拟合的情况,AlexNet网络和VGG网络在测试精度上远不及迁移学习模型。通过对比这两个简单模型,我们发现ImageNet预训练模型的特征提取层能够有效地提取超表面单元图案的特征,并能更好地拟合数据集。我们也使用了一个轻量级网络MobileNet模型作为训练的对比。在ImageNet的源数据集上,MobileNet的性能稍低于ResNet。因此,在超表面单元分类方面MobileNet也略逊于ResNet。对比表明迁移学习框架可以有效地处理超表面单元分类问题。3 3.2 2实际设计实际设计为了进一步验证训练好的迁移学习模型,在针对复杂

20、引用设计时,我们运用模型辅助设计了一个相位梯度超表面。利用CST MicrowaveStudio对超表面进行了全波电磁模拟和验证。相位梯度超表面是一种非均匀周期结构。如图 9所示,当一束电磁波入射到一个不同介质的分界面(上方是空气,下方是介质)上时,波矢量为ki的电磁波以i入射便会有一束反射角为r的反射波(波矢量为kr)。当在分界面上放置相位梯度超表面时,相位梯度超表面的不同位置处的反射相位皆不相同,从而引入一个相位梯度,假设该相位梯度超表面只在x方向上存在较大的相位梯度。相位梯度会产生一个附加波矢,使得入射波的波矢与反射波的波矢不再相同,从而改变反射波的反射方向,如图9所示,入射角为i的入射

21、波会产生一个反射角为ar的异常反射波,异常反射波的波矢为kar,且karx=karsinar由广义Snell 定律:karsin ar=kisin i =kisin iL(1)其中:为相位梯度超表面相邻单元之间的相位差,L为相邻单元的间距,在空气中电磁波的波矢,都为已知。图 9相位梯度超表面异常反射示意图设计一个异常反射角为45的相位梯度超表面,如图10所示。图 10超表面设计目标 36骆文浩等:基于迁移学习的超表面设计第13期根据广义 Snell 定律公式(1),电磁波垂直入射超表面i=0,超表面的单元长度为L=6 mm,反射电磁波角度为r=45,计算得=76。所以超表面单元目标相位为 0,

22、76,152,228,304,20,96,172。随机生成一组数字超表面单元,利用训练好的分类网络寻找所需目标相位对应数字超表面单元结构,结果如图11所示。图 11相位梯度超表面结构在设计频率 12 GHz 处,根据图 12所示。(a)(b)(a)三维方向图(a)(b)(b)二维方向图图 12相位梯度超表面方向图所设计的超表面通过表面反射系数相位补偿对反射波前的调整,可在预定设计的45观察角度上产生一个明显的散射波瓣。结果如图12所示,仿真在45有明显的散射波瓣。因此,借助ResNet34网络模型和超表面设计中反射系数相位梯度的调节灵活性,对于其他的入射与反射情形,轻易地实现所需的反射系数相位

23、梯度,进而将主散射波瓣重定向于预定的观察角度上,由此达到雷达散射截面增强的设计目标。4结语综上,本文提出了一种基于ResNet34网络模型迁移学习的超表面逆设计方法。我们将ResNet34模型应用于超表面设计,并成功地将图像识别的模型应用转移到相位预测,准确率约为90%,相比于传统深度学习模型准确率提升,同时降低了对样本数量的依赖。为了验证迁移学习模型,我们利用训练模型设计了梯度超表面,并通过全波仿真验证了该设计。在设计超表面方面提供了一种新的方法学习。参考文献:1 BOLTASSEVA A,ATWATER H A.Lowloss plasmonic metamaterials J.Scien

24、ce,2011,331(6015):290291.2 LUO X.Principles of electromagnetic waves in metasurfaces J.Science China Physics,Mechanics&Astronomy,2015,58(5):594201.3 YU N,GENEVET P,KATS M A,et al.Light propagation with phase discontinuities:generalized laws ofreflection and refractionJ.Science,2011,334(6054):333337.

25、4 HUANG L,CHEN X G,MHLENBERND H,etal.Dispersionless phase discontinuities for controllinglight propagationJ.Nano Letters,2012,12(11):57505755.5 张磊,崔铁军.时空编码数字超材料和超表面研究进展 J.中国科学基金,2021,5:694700.6 WAN X,QI M Q,CHEN T Y,CUI T J.Fieldprogrammable beam reconfiguring based ondigitallycontrolled coding meta

26、surfaceJ.ScientificReports,2016,6:20663.7 LI Y,ZHANG X Q,CHEN H Y,et al.Widebandradar cross section reduction using twodimensionalphase gradient metasurfacesJ.Applied Physics Letters,2014,104:221110.8 PEURIFOY J,SHEN Y F,JING L,et al.Nanophotonic particle simulation and inverse design using arti 37现

27、代计算机2023年ficial neural networks J.Science Advances,2018,4(6):e4206.9 张强,李娜.机器学习设计各向异性数字编码超表面 J.先进理论与模拟,2019,2(3):1800132.10 SIMONYAN K,ZISSERMAN A.Very deep convolutional networks for largescale image recognitionEB/OL.arXiv:1409.1556,2014.11 SCHMIDHUBER J.Deep learning in neural networks:an overview

28、 J.Neural Networks,2015,61:85117.12 LECUN Y,BENGIO Y,HINTON G.Deep learning J.Nature,2015,521(7553):436444.13 ZHANG C,BENGIO S,HARDT M,et al.Understanding deep learning(still)requires rethinking generalization J.Communications of the ACM,2021,64(3):107115.14 KRIZHEVSKY A,SUTSKEVER I,HINTON G E.Image

29、net classification with deep convolutional neural networksJ.Communications of the ACM,2017,60(6):8490.15 HE K,ZHANG X,REN S,et al.Deep residuallearning for image recognitionCProceedings ofthe IEEE Conference on Computer Vision and Pattern Recognition,2016:770778.Metasurface design based on transfer

30、learningLuo Wenhao,Wang Yiying,Mo Jinjun*(School of Information and Communication,Guilin University of Electronic Technology,Guilin 541004,China)Abstract:Metasurface is widely used for its unique ability to manipulate electromagnetic waves.However,metasurface design requires optimization of the cell

31、 structure to generate the desired phase distribution,which requires a lot of time and computational resources.Therefore,a metasurface design method based on transfer learning is proposed,which can predict the phase ofcomplex metasurface elements.ResNet34 was used as the transfer learning network of

32、 the pretraining model,in which only 20000samples were used for the training network,and the accuracy rate reached more than 90%.The model can predict the phase of21010metasurface units with different structures,reducing training samples and improving the accuracy compared with deep learning network

33、s.In order to verify the effectiveness and feasibility of this method,a phase gradient metasurface with abnormal reflection at 45angle is successfully designed under the actual design requirements,and the simulation and experimental verification arecarried out.It provides a novel and efficient method for metasurface design,and provides a reference for the application of transferlearning to other problems in the electromagnetic field.Keywords:transfer learning;deep learning;residual network;digital metasurface;bilinear interpolation.38

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服