收藏 分销(赏)

基于GPU的多模式SAR成像加速研究.pdf

上传人:自信****多点 文档编号:633049 上传时间:2024-01-19 格式:PDF 页数:6 大小:2.61MB
下载 相关 举报
基于GPU的多模式SAR成像加速研究.pdf_第1页
第1页 / 共6页
基于GPU的多模式SAR成像加速研究.pdf_第2页
第2页 / 共6页
基于GPU的多模式SAR成像加速研究.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 21 卷 第 8 期2023 年 8 月Vol.21,No.8Aug.,2023太赫兹科学与电子信息学报Journal of Terahertz Science and Electronic Information Technology基于GPU的多模式SAR成像加速研究白澜1,3a,魏仁乐*2,3a,郭拯危3a,3b,3c,赵建辉3a,3b,3c,李宁3a,3b,3c(1.郑州科技学院 信息工程学院,河南 郑州 450064;2.中共开封市委党校,河南 开封 475001;3.河南大学 a.计算机与信息工程学院;b.河南省大数据分析与处理重点实验室;c.河南省智能技术与应用工程技术研究中

2、心,河南 开封 475004)摘要:针对多模式合成孔径雷达(SAR)成像处理中存在的计算效率不足问题,提出了一种基于 GPU 的多模式 SAR 统一成像并行加速方法。为充分利用 GPU 的显存资源,提高算法的运算效率,利用共享内存对矩阵转置、矩阵相乘等部分进行大规模数据并行计算。实验结果表明,该算法大幅度提升了多模式 SAR 成像的计算效率,最高加速比达到 55.62,解决了 GPU 显存空间利用率较低的问题。关键词:合成孔径雷达;图形处理器;多模式;并行加速中图分类号:TN958 文献标志码:Adoi:10.11805/TKYDA2021142Multi-mode SAR imaging a

3、cceleration based on GPUMulti-mode SAR imaging acceleration based on GPUBAI Lan1,3a,WEI Renle*2,3a,GUO Zhengwei3a,3b,3c,ZHAO Jianhui3a,3b,3c,LI Ning3a,3b,3c(1.College of Information Engineering,Zhengzhou Institute of Science and Technology,Zhengzhou Henan 450064,China;2.CPC Kaifeng Municipal Party S

4、chool,Kaifeng Henan 475001;3a.College of Computer and Information Engineering;3b.Henan Key Laboratory of Big Data Analysis and Processing;3c.Henan Engineering Research Center of Intelligent Technology and Application,Henan University,Kaifeng Henan 475004,China)AbstractAbstract:In view of the problem

5、 of low computational efficiency in multi-mode Synthetic Aperture Radar(SAR)imaging processing,a parallel acceleration method is proposed for multi-mode SAR imaging based on Graphic Processing Unit(GPU).In order to make full use of GPUs memory resources and improve the efficiency of the algorithm,in

6、 the parallel computing part of the algorithm,the large-scale data parallel is carried out in the matrix transposition and matrix multiplication by using shared memory.The experimental results show that the algorithm greatly improves the efficiency of multi-mode SAR imaging,and the maximum accelerat

7、ion ratio reaches 55.62,which solves the problem of low utilization of GPU.KeywordsKeywords:Synthetic Aperture Radar;Graphic Processing Unit;multi-mode;parallel acceleration合成孔径雷达(SAR)在军事和民生领域应用广泛。为满足不同的观测需求,要求 SAR 图像具有不同的分辨力和场景覆盖范围,越来越多的 SAR 都具备多种工作模式。此时,大数据量的快速处理成为多模式 SAR 成像的主要需求之一1。近年来,图形处理器(GPU)

8、的浮点运算能力和存储带宽得到大幅提升,为多模式 SAR 高效处理提供了很好的平台。统一计算架构(Compute Unified Device Architecture,CUDA)的推出,极大促进了 GPU 在海量数据、高性能计算领域的发展。文献2提出了基于 GPU 的针对较大数据量的 SAR 成像方案,突破了 GPU 显存不能容纳一景SAR 数据的限制,满足大多数情况下的实时性要求。文献3利用 GPU 提高了线性调频尺度变换(Chirp Scaling,CS)成像算法处理速率,但该方法的 GPU 显存占用较大。2018 年,张帆等4利用云计算方法对多模式 SAR 成像进行加速,运行效率提高了近

9、 40 倍。本文提出一种基于 GPU 的多模式 SAR 统一成像并行加速方法,利用共享内存对矩阵转置、相位相乘等进行文章编号:2095-4980(2023)08-1037-06收稿日期:2021-04-07;修回日期:2021-05-12基金项目:国家自然科学基金资助项目(61871175);河南省高等学校重点科研资助项目(19A420005;21A520004),河南省科技攻关计划资助项目(192102210082;212102210093;212102210101);河南省青年人才托举工程资助项目(2019HYTP006)*通信作者:魏仁乐 email:.太赫兹科学与电子信息学报第 21

10、卷并行加速,大幅提高成像效率及 GPU 显存利用率。1多模式 SAR 统一的成像算法在星载 SAR 多模式成像技术上,国内外对条带模式、滑动聚束模式、Scan SAR 模式和滑动扫描(Terrain Observation with Progressive Scans SAR,TOPS SAR)模式有了很多研究5-7。多模式 SAR 的统一成像流程如图 1所示。1.1 去斜预处理本文使用 2 步式预处理算法去除方位向的频谱混叠8。将需要进行预处理的 SAR 回波信号与去斜因子H11进行相位相乘后进行方位向傅里叶变换,再与去斜因子H12进行相位相乘完成去斜处理。H11=exp(j2Vr2cos3

11、()c()iD2Rref)i=-I/2I/2(1)H12=exp(j2Vr2cos3()c()nD2Rref)n=-P/2P/2(2)式中:I 和 P 分别为原始数据采样点数和输出数据采样点数;Vr为卫星速度;c为波束中心指向;Rref为参考距离;为慢时间变量;=1/B,B为信号带宽。azimuth FFTrange FFTrange IFFTChirp Scaling range scalingbulk RCMC range compressionH2H3Chirp Scaling corestripmapraw dataslidingspotlightraw dataTOPSraw dat

12、aScanraw datastripmap imagesSPECAN derampH5azimuth FFTslidingspotlight imagesScanimagesTOPS imagesazimuth FFTderamp factor 1H11deramp factor 2H12azimuth IFFTazimuth compression(stripmap,spotlight spotlight)azimuth Scaling(Scan,TOPS)H4pre-processingpost-processingFig.1 Unified imaging process of mult

13、imode SAR图1 多模式SAR的统一成像流程 1038第 8 期白 澜等:基于GPU的多模式SAR成像加速研究1.2 CS 核心处理首先进行方位向傅里叶变换,将回波信号与H2进行相位相乘。H2(f;Rref)=exp-jKr(f;Rref)Cs(f)(-ref(f)2(3)式中:Kr为发射信号调制频率;为距离时间;f为方位频率;Cs()f为该信号轨迹与开普勒频率之间的关系;ref为回波中心,ref=2cRref()1+Cs()f,c为光速。然后进行距离向傅里叶变换,并与H3相位函数进行相位相乘,完成距离压缩、二次距离压缩和补余距离徙动校正。H3(ff;Rref)=exp jf2Kr()f

14、;Rref1+Cs()f exp j4fRrefCs()fc(4)式中f为距离频率。再进行距离向傅里叶逆变换,在距离多普勒域与相位函数H4进行相位相乘。H4(f;R)=exp j4RD()f(5)式中:R为目标与雷达之间的距离;D(f)=1-cosc(f),(f)=1-()f2v2,为工作波长,v 为平台航速。在成像算法的最后进行方位向傅里叶逆变换转换到时域,CS 算法完成。1.3 SPECAN(Spectral Analysis)后处理为了解决方位输出时的混叠问题,将进行 CS 核心处理后的回波信号与去斜函数H5进行相位相乘,最后进行方位向 FFT 将方位信号聚焦在频域9。H5(t;r)=e

15、xp()-jKrt2-Ta2tTa2(6)式中:r为目标与载机飞行轨迹之间的最短距离;t 为采样时间;Ta为合成孔径时间。2多模式 SAR 实时成像的 GPU 实现2.1 GPU 成像优化策略2.1.1 共享内存共享存储器是 GPU 上的高速存储器,在物理上,它属于流处理器簇(Streaming Multiprocessors,SM)可见的内存,能够被同一个线程块内的所有线程进行读写操作,以便数据同步和通信;在速度上,共享内存访问速度比全局内存访问速度快 100 倍。2.1.2 基于共享内存的原址矩阵转置加速在多模式 SAR 成像算法中,需要进行多次矩阵转置。本实验利用共享内存进行数据转置,以

16、实现数据的合并访问,避免存取延迟过大。线程之间通过调用CUDA 自带的_syncthreads()函数进行同步,保证 tile 数据块中数据的一致性。如图 2 所示,基于共享内存的原址转置 tile 操作步骤如下:1)首先从全局内存中读取数据至共享内存,此时访存满足合并访问;2)由于 NVIDIA GPU 中共享内存较小,将数据划分AtiletileBACC(a)(b)Fig.2 Schematic diagram of matrix transpose图2 矩阵转置示意图1039太赫兹科学与电子信息学报第 21 卷成多个方阵块;3)如图 2(a)所示,将 tile_A 和 tile_B 的数

17、据,按列和行从共享内存读出后,放入与其对角线对称的位置,得到转置矩阵数据。当需要转置的 tile 块正好在对角线上,如 tile_C,将其数据从显存中按行写入共享内存,再按列读入,按行写入在显存的原始位置即可,如图 2(b)所示。将数据维度设为BLOCK_DIMBLOCK_DIM+1,相同列上的数据位于不同的 bank 中,很好地避免了 bank conflicts。2.1.3 基于共享内存的相位复乘加速多模式 SAR 成像算法大多数操作部署在 GPU 上,依赖于点乘实现,因此需对点乘操作进行优化。由于 SAR 原始数据像素间的复数乘法运算互不相关,矢量的每个元素可以由一个线程并行实现。本文基

18、于共享内存对回波数据进行分块点乘操作。2 个二维矩阵的点乘运算如图 3 所示,矩阵 A 为雷达数据,矩阵 B、C 为尺度变换函数,Ha为矩阵 A、C 的行数,Hb为矩阵 B 的行数,Wa为矩阵 A 的列数,Wb为矩阵 B、C 的列数。按照 GPU线程块数对回波数据进行分块,使子数据块数与线程块对应。雷达数据分块后的距离向和方位向的点数分别为Nr和Nsub_a。本文实验的共享内存参数大小设为:M=Mdim(Mdim+1)(7)式中Mdim为共享内存一个维度的大小。在 CUDA 中每个 block 有一块共享内存,线程块中的每个线程可以访问共享内存,这样能提高数据的利用率。把 A、B 矩阵按照 B

19、LOCK_SIZE 划分为子矩阵,把 2 个小矩阵加载到共享内存,则小矩阵本身的乘法就不需要再存取任何外部的内存。A 被读 了(Wb/BLOCK_SIZE)次,同 时 B 被 读 了(Ha/BLOCK_SIZE)次。一个线程载入一个矩阵元素,使得一个线程计算乘积的一个元素。2.2 基于 GPU 的 CS 统一成像算法实现首先将回波子数据块传入 GPU 的 CUDA 流中,采用 CUDA 同步技术。在进行方位向或距离向 FFT前需进行转置操作,分别沿距离向和方位向划分子数据块,使用上文构造的转置 kernel,进行下一次转置前需将分块数据由 GPU 传回 CPU 端进行数据拼接,再将整体数据进行

20、统一矩阵转置。接着二维FFT 与 IFFT 调用 CUDA 自带的 CUFFT 函数。在做方位 向 FFT 时,每 块 数 据 方 位 向 为Na,距 离 向 为MsubNr;做距离向 FFT 时,距离向则设为Nr,方位向设为MsubNa。在完成方位向和距离向处理时,还需调用上文构造的相位相乘 kernel,加速雷达数据与相位因子的多次相位相乘。最后将结果异步写回主机,进行数据拼接后即可输出处理后的聚焦图像。流程图如图 4 所示。CWbHbHaBAWaBLOCK_SIZEBLOCK_SIZE Fig.3 Matrix multiplication using shared memory图3 使

21、用共享存储器的矩阵相乘GPUblock along rangeCPUazimuth FFTazimuth IFFTtransposetransposetransposeblock along azimuthblock along rangetransposepre-processingpost-processingSAR imaging algorithmdata splicingdata splicingdata splicingdispose of range,azimuth SAR imaging algorithmsliding spotlight,TOPSstripmap,ScanS

22、can,TOPSstripmap,sliding spotlightraw dataSAR imagesFig.4 Flow chart of CS unified imaging algorithm based on GPU multimode SAR图4 基于GPU多模式SAR的CS统一成像算法流程图 1040第 8 期白 澜等:基于GPU的多模式SAR成像加速研究3实验结果与分析本文设计多模式 SAR 成像算法并行化程序,进行加速策略的结果验证。实验采用的显卡型号为 Nvidia TITAN Xp,显存大小为 8 G;CPU 型号为 Intel(R)Xeon(R)CPU E5-1603。

23、本实验的仿真参数如表 1 所示。由本文实验得出GPU并行前后的图像如图5所示,图5(a)为输入图像,图5(b)为条带模式GPU加速后的输出图像。可以看出,成像结果保留了原始图像的大量详细信息,细节信息也能从如图 6 所示的局部成像图中呈现出来。本实验中各工作模式的成像运算时间如表 2 所示。传统的 GPU 加速方法仅使用 GPU 的线程操作对矩阵转置和相位相乘部分进行加速,并没有使用共享内存进行存储和计算。本文计算了传统 GPU 方法与 CPU 方法的加速比以及本文方法与 CPU 方法的加速比。由测试结果可知,本文提出的利用 CUDA 实现的基于 GPU的多模式 SAR 成像算法具有极高的效率

24、,相比传统的基于 CPU 的 SAR 成像算法,效率得到了显著提升。4结论本文提出了一种基于 GPU 的多模式 SAR 成像加速算法,并给出了算法的详细流程,主要包括回波数据划分方法以及多模式 SAR 统一成像算法的 CUDA 实现方法。为了让算法更高效,本文利用共享内存的特性、原址操作对矩阵转置和相位相乘进行加速,充分发挥了 GPU 并行计算的优势。最后在 GPU 并行平台上进行了多模式 SAR 成像实验,从而验证算法并行加速的正确性。参考文献:1 张彦彬,丁晟,高雁,等.基于CPU+GPU混合架构的实时成像系统设计与实现J.太赫兹科学与电子信息学报,2019,17(1):146-151.(

25、ZHANG Yanbin,DING Sheng,GAO Yan,et al.Design and implementation of a real-time imaging system based on CPU+GPU hybrid architectureJ.Journal of Terahertz Science and Electronic Information Technology,2019,17(1):146-151.)dol:10.11805/TKYDA201901.0146.2 孟大地,胡玉新,石涛,等.一种基于 GPU 的 SAR 高效成像处理算法J.雷达学报,2013,2

26、(2):210-217.(MENG Dadi,HU Yuxin,SHI Tao,et al.Efficient algorithm for processing SAR data based on GPUJ.Journal of Radars,2013,2(2):210-217.)Fig.5 Input image is parallel to the GPU and then output图5 输入图像与GPU并行后输出图像Fig.6 Multi mode output image after GPU parallel图6 GPU并行后多模式输出图像表1 仿真参数Table1 Simulat

27、ion parametersparameterspulse duration/sbandwidth/MHzsampling rate/MHzPRF/Hzdistance from center of scene to radar/kmplatform velocity/(m s-1)center frequency/GHzvalue45 240 2663 711 8237 568 5.45表2 多模式SAR成像耗时统计Table2 Time consuming statistics of multimode SAR imagingwork modestrip SARsliding spotli

28、ght SARscan SARTOPS SARCPU/s181.89233.64217.88247.12classical GPU/s9.5412.3611.4713.17improved GPU/s3.274.424.015.03acceleration19.05/55.6218.90/52.8618.99/54.3318.76/49.131041太赫兹科学与电子信息学报第 21 卷 3 DENHAM M,ARETA J,TINETTI F G.Synthetic aperture radar signal processing in parallel using GPGPUJ.Journa

29、l of Supercomputing,2016,72(2):451-467.4 ZHANG Fan,YAO Xiaojie,TANG Hanyuan,et al.Multiple mode SAR raw data simulation and parallel acceleration for Gaofen-3 missionJ.IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2018(99):1-12.5 ZHANG Fang,LI Guojun,LI Wei,et al.A

30、ccelerating spaceborne SAR imaging using multiple CPU/GPU deep collaborative computingJ.Sensors,2016,16(4):494.6 ZHANG Yueting,CHEN Hongzhen,DING Chibiao,et al.A novel approach for shadow enhancement in high-resolution SAR images using the height-variant phase compensation algorithmJ.IEEE Geoscience

31、 and Remote Sensing Letters,2013,10(1):189-193.7 唐禹,王岩飞,张冰尘.滑动聚束 SAR 成像模式研究J.电子与信息学报,2007,29(1):30-33.(TANG Yu,WANG Yanfei,ZHANG Bingchen.A study of sliding spotlight SAR imaging modeJ.Journal of Electronics&Information Technology,2007,29(1):30-33.)8 韩晓磊.星载SAR Mosaic模式及斜视聚束技术研究D.北京:中国科学院大学,2013.(HAN

32、 Xiaolei.Study on spaceborne SAR mosaic mode and squint spotlight technologyD.Beijing:University of Chinese Academy of Sciences,2013.)9 XU W,HUANG P P,WANG R,et al.TOPS-mode raw data processing using chirp scaling algorithmJ.IEEE Journal of Selected Topics in Applied Earth Observations and Remote Se

33、nsing,2014,7(1):235-246.作者简介:白 澜(1995-),女,硕士,助教,主要研究方向为 SAR 图像处理.email:.魏仁乐(1990-),男,硕士,助教,主要研究方向为网络技术与室内定位.郭拯危(1963-),女,学士,教授,主要研究方向为 SAR 图像信息处理和生态环境 SAR 遥感应用.赵建辉(1980-),男,博士,副教授,主要研究方向为 SAR 图像处理.李 宁(1987-),男,博士,教授,主要研究方向为多模式 SAR 成像及其应用技术.9 高立兵,苏军德.基于自相似业务流的有限缓冲区以太网模型的研究J.工业仪表与自动化装置,2019(3):123-128

34、.(GAO Libing,SU Junde.The research on limited-buffer Ethernet model based on self-similar traffic flowJ.Industrial Instrumentation and Automation,2019(3):123-128.)10 罗丽献,宾志燕,王春霞,等.基于动态业务下的WDM网络阻塞率J.电子技术与软件工程,2020(5):1-3.(LUO Lixian,BIN Zhiyan,WANG Chunxia,et al.Blocking rate of WDM network based on dynamic serviceJ.Electronic Technology&Software Engineering,2020(5):1-3.)作者简介:李 飞(1982-),男,硕士,高级工程师,主要从事电力计量技术工作.email:.申洪涛(1969-),男,学士,教授级高级工程师,主要从事电力系统及电力计量技术工作.史 轮(1972-),男,学士,教授级高级工程师,主要从事电力计量技术工作.王鸿玺(1986-),男,硕士,高级工程师,主要从事电力计量技术工作.高 波(1989-),男,硕士,工程师,主要从事电力计量技术工作.(上接第1001页)1042

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服