收藏 分销(赏)

基于K-means聚类分析...的南海声速剖面估计方法研究_欧圳翼.pdf

上传人:自信****多点 文档编号:246009 上传时间:2023-05-07 格式:PDF 页数:6 大小:1.84MB
下载 相关 举报
基于K-means聚类分析...的南海声速剖面估计方法研究_欧圳翼.pdf_第1页
第1页 / 共6页
基于K-means聚类分析...的南海声速剖面估计方法研究_欧圳翼.pdf_第2页
第2页 / 共6页
基于K-means聚类分析...的南海声速剖面估计方法研究_欧圳翼.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 41 卷第 6 期2022 年 12 月Vol.41,No.6Dec.,2022声学技术Technical Acoustics基于K-means聚类分析与单经验正交函数回归法的南海声速剖面估计方法研究欧圳翼,屈 科(广东海洋大学电子与信息工程学院,广东湛江 524000)摘要:基于遥感参数和Argo历史数据对水体声速剖面(Sound Speed Profile,SSP)进行重构,对单经验正交函数回归(single Empirical Orthogonal Function-regression,sEOF-r)法在南海的适用性进行了研究。由于南海动力活动的复杂性,SSP扰动相对复杂,同时海域

2、内SSP样本稀疏,相关的SSP统计学估计方法在南海区域还难以有效应用。文章基于K-means对样本进行聚类分析,讨论南海海域正交经验函数模态的一致性。通过扩大重构实验网格解决样本稀疏的问题。利用经典的sEOF-r对南海SSP进行反演,对重构SSP的误差分析说明了该方法在南海海域应用的有效性。SSP重构的均方根误差为2.341 1 ms-1,较大误差主要出现在深度40200 m,其原因是海域内混合层深度发生变化。实验证明在南海区域内利用遥感参数可以有效地估计SSP。关键词:声速剖面;聚类分析;海面遥感参数;南海;单经验正交经验函数(sEOF-r)中图分类号:TB556 文献标志码:A 文章编号:

3、1000-3630(2022)-06-0821-06Sound speed profile inversion in the South China Sea based on K-means cluster analysis and single empirical orthogonal function regressionOU Zhenyi,QU Ke(College of Electronic and Information Engineering,Guangdong Ocean University,Zhanjiang 524000,Guangdong,China)Abstract:T

4、he sound speed profile(SSP)is reconstructed by remote sensing parameters and Argo previous data in the South China Sea,and the applicability of single empirical orthogonal function regression(sEOF-r)in the South China Sea is studied.Due to the complexity of hydrodynamic activities in the South China

5、 Sea,the corresponding SSP disturbance is relatively complex,and meantime the SSP samples in the sea area are so sparse that the related SSP estimation methods are still difficult to be effectively applied.Based on the K-means cluster analysis of samples,the consistency of the orthogonal empirical f

6、unction modes is discussed in this paper.Expanding the inversion grid can solve the problem of sparse samples.The classic sEOF-r is used to invert the SSP in the South China Sea,and the error analysis of the reconstructed SSP is used to prove the effectiveness of the method.The root mean square erro

7、r of the SSP reconstruction is 2.341 1 ms-1,and the larger error mainly occurs at the depth of 40200 m.The reason is that the depth of the mixed layer changes in the sea area.The experiment demonstrates that the SSP in the region of the South China Sea can be estimated efficiently by use of remote p

8、arameters.Key words:sound speed profile;cluster analysis;satellite remote sensing;South China Sea;signle empirical orthogonal function-regression(sEOF-r)0引 言声速剖面(Sound Speed Profile,SSP)是重要的海洋波导参数,在水下声学识别、定位、通讯等重要的作用。获取SSP最直接的方法是现场测量,但是费时费力,且只能逐点测量,无法实时获取大面积三维声速分布。卫星遥感能够对大面积海域进行持续及高分辨率观测,可以满足大范围和即时性

9、的需求。基于遥感获得的海面参数,可以对水体SSP进行估计,以满足大范围和即时SSP获取的需求。由于声速是温盐的函数,而温度和盐度剖面可以利用遥感获取的海面高度数据(Sea Level,SL)和引用格式:欧圳翼,屈科.基于K-means聚类分析与单经验正交函数回归法的南海声速剖面估计方法研究J.声学技术,2022,41(6):821-826.OU Zhenyi,QU Ke.Sound speed profile inversion in the South China Sea based on K-means cluster analysis and single empirical or-th

10、ogonal function regressionJ.Technical Acoustics,2022,41(6):821-826.DOI:10.16300/ki.1000-3630.2022.06.005收稿日期:2021-07-08;修回日期:2021-08-08作者简介:欧圳翼(1999),男,广东河源人,硕士研究生,研究方向为海洋环境声学探测。通信作者:屈科,E-mail:2022 年声学技术海表温度数据(Sea Surface Temperatures,SST)来估计,进而用经验声速公式可以获得SSP1。在估计过程中为了降低未知参数的维数,通常利用正交经验函数(Empirical

11、Orthogonal Function,EOF)来表示剖面LeBlanc证明了EOF是重构SSP时误差最小的基函数2。Carnes在墨西哥湾流通过统计的方法证实了遥感参数 SL 和 SST 与 EOF 投影系数存在关系3,随后在西北太平洋和西北大西洋海域,基于海面遥感参数和EOF投影的关系估计了温度剖面,该方法即单经验正交回归函数(single Empirical Orthogonal Function-regression,sEOF-r)4。随后该方法被美国海军应用于海洋预报系统5。sEOF-r被不断地补充和运用到不同海域,比如通过模块化海洋数据同化系统(Modular Ocean Data

12、 Assimilation System,MODAS)获取动态气候剖面,进而获取水下结构6-7。近年来,机器学习方法也被引入相关问题的研究中。由于机器学习可以提取参数之间的非线性关系,并且无需对水体的垂直结构进行预设,可以有效提高剖面重构的精度。Hjelmervik使用K-means聚类和梯度搜索通过海面参数估计水下剖面8-9。Charantonis利用自组织神经网络基于水下滑翔机的测量实现了温盐剖面的重构10。与经典的回归方法相比,机器学习方法在大量的水下剖面的重构应用中,在不预设回归关系式的情况下可以有效提高重构的精度11-13。在大量的应用中已证实SSP的直接重构是可行的14。无论是线性

13、回归还是机器学习,都需要大量样本进行统计学处理15。样本的数量和质量都会影响重构的准确性和可靠性16-17。上述方法在全球大洋的应用获得了较好的结果,但是相关统计学估计方法在南海的应用还有可以改进之处。南海位于北纬2337 以南的低纬度地区,是一个半封闭的断陷海盆,最大深度超过5 000 m。南海处在亚洲大陆南部的热带和亚热带区域,与其他海区比较,其特点是热带海洋性气候显著,海洋动力活动非常复杂,给SSP重构带来了困难。同时,由于政治和经济的原因,该区域的Argo样本稀疏,统计学估计方法的精度难以保证。本文基于sEOF-r方法对遥感参数估计水下剖面在南海的有效性进行了研究。采用南海2007-2

14、018 年 Argo 数据,通过 K-means 对南海的EOF类型进行了聚类分析,讨论EOF的一致性。基于2007-2017年Argo剖面、海面温度、海面高度建立回归关系式。利用 2018 年的数据进行验证,通过重构误差分析证实了sEOF-r方法在南海应用的有效性。1方 法1.1sEOF-r方法介绍本文考虑了经典的sEOF-r方法。在SSP问题中,深度z和时间t处的声速C(z,t)可表示为18C(z,t)=C0(z)+s=1s(t)ks(z)(1)式中:C0(z)是背景剖面,是声速中稳定的、不变的部分,通常可以用平均剖面去近似;ks(z)是经验正交函数EOF,随时间变化;s(t)是EOF的投

15、影系数。图1为sEOF-r的流程图。通过实测SSP减去背景SSP得到声速剖面异常样本矩阵,对其进行经验正交分解,分离出 EOF 和 EOF 投影系数。建立Argo剖面投影系数与遥感参数回归关系数据集,建立EOF的投影系数和遥感参数间的回归关系式,将实测的遥感系数带入回归关系式即可获得投影系数以重构SSP。最后求其重构误差,验证其有效性,讨论其重构效果。声速剖面异常表示为矩阵W,为qp维矩阵,其中q为每个剖面有q个离散深度,p为样本总数。通过经验正交分解法对矩阵W进行分解,求其协方差矩阵:R=WW(2)Rk=k(3)其中:R是W的协方差矩阵,特征值为,k为经验正交矩阵,维数为qq维。根据大量的样

16、本的回归分析,发现海面参数与EOF投影系数呈线性关系4。通过回归分析获得海平面异常(Sea Level Anomaly,SLA)、海表温度异常(Sea Surface Temperatures Anomaly,SSTA)与EOF系图1 sEOF-r重构声速剖面流程图Fig.1 Flowchart of the sEOF-r method to reconstruct sound speed profile822第 6 期欧圳翼等:基于K-means聚类分析与单经验正交函数回归法的南海声速剖面估计方法研究数之间的回归关系,EOF的各阶投影系数可以表示为i(t)=Ai,0+Ai,1ASL(t)+A

17、i,2ASST(t)+Ai,3ASL(t)ASST(t),i=0,1,2G(4)其中:Ai是通过大量样本拟合的系数,0(t)代表常数值。通过对样本数据进行回归分析得到Ai后,可将ASL和ASST输入式(4),计算出EOF投影系数。然后通过式(1)获得SSP。1.2基于K-means聚类分析的南海声速剖面EOF一致性分析由于政治和经济原因,南海区域Argo浮标布放相对稀疏,SSP样本数量较少,难以满足回归分析的需要。例如,2008-2018年在北纬1819,东经118119的11的网格里,仅有147条声速剖面,且测量月份集中,导致了样品的缺乏和不均匀的分布,给结果带来了不确定性。当样本不足时可以

18、通过扩大重构面积来增加剖面数量,以解决样本稀疏的问题。但扩大面积意味着EOF的一致性难以保证。基于EOF的sEOF-r估计法的应用前提,是保证重构区域内EOF一致。因此这里采取K-means聚类方法对投影系数进行聚类分析,讨论EOF的一致性。为了探究南海EOF的一致性,研究引入太平洋剖面数据,在处理Argo声速剖面时统一选用深度超过1 000 m的Argo剖面数据。经过处理后得到27 620条SSP,使用K-mean聚类分析EOF模态一致性。以EOF投影系数为训练集,训练数据向量的第i个元素为第k阶 EOF 投影系数ai,计算其均值A(k)i:A(k)i=1Nkn=1Nkna(n)i(5)其中

19、:A(k)i表示第k个聚类集群的i阶EOF投影系数的均值。n表示样本序号,Nk表示第k个聚类集群的样本总数,a(n)i表示第n个样本的第i元素,kn用来判断样本n是否属于k集群的函数,若属于kn=1,否则kn=0。基于A(k)i可以计算出所有集群的欧氏距离:=n=1NkKkni=1G()a(n)i-A(k)i2(6)其中:G是用于用于重构的EOF阶数,N表示样本总数。越小表示所有集群的标准偏差越小,表示聚类效果越好。采取快速K-means算法进行100次独立并行运行,确保聚类结果收敛于最优。图2即为本次聚类分析的结果。将全部样本分为5类,南海样本基本同属一类,与大洋样本类别明显不同,表明了南海

20、EOF具有一定的一致性。南海的样本具有相似的动力学特征,其中南海集群的聚类中心可以用来作为所有样本的背景剖面。2数据分析2.1数据来源本研究主要使用了三种数据,分别是Argo浮标数据,卫星遥感数据,World Ocean Atlas 2013(WOA13)数据。国际Argo计划实施于2000年,多国家合作在全球的海洋中部署了超过15 000个自动剖面浮标,主要测量温度和盐度剖面。本文的SSP样本来自于Argo数据,研究所使用的Argo数据取自中国Argo资料中心的全球海洋Argo散点资料集(ftp:/ m为采样间隔,对01 000 m的深度进行线性插值,将数据插值到标准深度,经处理后得到 3

21、881 条剖面。研究所使用的卫星遥感数据有SST和SL,其中SST数据来自美国国家海洋大气管理局(National Oceanic and Atmospheric Administration,NOAA)数据中心,SL来自AVISO数据集(Archiving,Validation,and Interpretation of Satellite Oceanography data,AVISO)。其时间分辨率为 1 d,空间分辨率0.250.2520。WOA13数据是一种整合了全球各海域的温度、盐度、密度等多种数据集和实测数据的气候态平均数据产品,分为年、季、月平均数据,空间分辨率图2 EOF投影

22、系数聚类为五类时的聚类样本分布,聚类中心用星号标出Fig.2 The distribution of cluster samples when the EOF pro-jection coefficients are clustered into five categories,with an asterisk at the center8232022 年声学技术有0.25,1,5三种21。WOA13数据取自美国海洋资料研究中心(National Oceanic Data Research Center,NODC)的气候态的海洋水文数据。选用了20072018 年的年平均数据,其空间分辨率为1

23、1。2.2EOF分析根据矩阵处理的需要,保留测量深度超过1 000 m的数据样本,共计获得3 881条SSP做为研究样本。对样本进行三次样条插值,在01 000 m的深度范围内,每5米一个深度采样点。图3为所获得的全部SSP,其中灰线是2007年至2017年间的SSP共计3 757条,用于获得遥感参数与EOF的投影系数的回归关系式;红线是2018年间的SSP共计124条,用于测试回归关系式的有效性;黑虚线是背景剖面是由WOA13数据处理后所得的平均剖面。为了对重构剖面进行分析,利用重构声速剖面的均方根误差X对重构效果进行讨论:X=1NS1NY(CArgo-C)2NSNY(7)其中:NS是深度的

24、离散点数,NY是样本总数。图4为EOF前五阶模态,EOF的幅值在1,1范围内。从EOF振幅分布来看,声速扰动主要发生在100 m深度范围内,在1 000 m深度附近,声速扰动的振幅接近于0。表1为前5阶EOF重构剖面的方差贡献率和重构误差。前5阶特征值占全部特征值的96.5%,说明五阶EOF模态可以解释数据的大部分变化,也证实了南海EOF的一致性。前五阶重构误差的平均值为0.67 m s-1,表明5阶EOF模态可以较为准确地重构剖面,且不会引入过多噪声,因此本研究选择五阶EOF模态来估计SSP。3结 果图5为各个样本的重构声速误差。误差平均值为2.20 m s-1。最大值为5.02 m s-1

25、。误差波动较大是因为基于遥感参数重构SSP的sEOF-r方法,需要大量样本回归分析,因此个体特征与统计特征之间的差异较大者重构误差较大。图中样本的误差出现了3个峰,查询发现,误差的3个峰均处于夏季和冬季。这都是因为混合层变化导致误差,夏季混合层变浅,冬季混合层变深,与全年均值相差较大。表1前五阶EOF重构声速的方差贡献率及误差Table 1Variance contribution rates and errors in the first five-order EOF reconstructing sound speedEOF阶数12345方差贡献率/%70.7216.244.673.301

26、.57累计贡献率/%70.7286.9691.6394.9396.50重构声速误差/(ms-1)1.943 81.297 11.038 90.808 40.671 9图3 实测声速剖面样本和背景剖面Fig.3 Measured sound speed profile samples and background profiles图5 各个样本重构声速误差Fig.5 Error in the reconstructed sound speed for each sample图4 EOF的前五阶模态Fig.4 The first five modes of EOF824第 6 期欧圳翼等:基于K-

27、means聚类分析与单经验正交函数回归法的南海声速剖面估计方法研究图6为误差在不同深度的大小。温度是在浅海影响声速的主要因素,浅海040 m处海面参数可以直接影响声速,因此误差较小。位于海域100 m处的混合层因为季节、昼夜、生物集群、船等因素的影响温度变化较大,导致误差较大,最大值为4.6 m s-1。这与图4中5阶EOF模态扰动范围一致。在200 m以下的海域误差随深度逐渐变小。声速误差平均值为1.97 m s-1。图7为重构剖面与实测剖面对比图。图7(a)中在040 m处,重构剖面与实测剖面吻合,均方根误差为0.44 m s-1;在40200 m处误差较大,声速误差最大值为10.70 m

28、 s-1,均方根误差为8.12 m s-1;200 m以下均方根误差为2.43 m s-1。图7(b)中在误差较大的40200 m处,声速误差最大值为2.78 m s-1,均方根误差为1.32 m s-1。sEOF-r方法重构SSP虽然有个别样本在浅海有较大误差,但整体均方根误差为2.34 m s-1,重构效果较好,尤其在200 m以下水域的重构效果最好,因此可以说明基于遥感参数和sEOF-r方法重构SSP效果较好。4结 论本文基于K-means聚类,对南海声速剖面的EOF重构的一致性进行了分析,聚类结果表明可以通过扩大重构面积解决样本稀疏的问题。通过实测的南海Argo数据,建立遥感参数与前五

29、阶EOF投影系数的回归关系式,将遥感参数输入回归关系式对SSP进行估计。结果表明,该方法在深度200 m以下的海域误差不超过1.5 m s-1,在40200 m的海域误差较大,最大误差出现在100 m左右的深度。误差来源为混合层深度的大幅度变化。但从整体来看,均方根误差为2.34 m s-1,仍有较高的精度。基于遥感参数和Argo数据估计的SSP在深海海域重构效果显著,虽在40200 m误差较大,但从整体来看,均方根误差不大,仍具有较高的精度,可以较好地还原声速剖面。分析结果说明sEOF-r方法在南海海域是可行的,可以满足南海海域大面积,获取近实时声速剖面的需求,为声呐系统的应用提供支持。参考

30、文献1LOVETT J R.Merged seawater sound-speed equationsJ.The Journal of the Acoustical Society of America,1978,63(6):1713-1718.2LEBLANC L R,MIDDLETON F H.An underwater acoustic sound velocity data modelJ.The Journal of the Acoustical Society of America,1980,67(6):2055-2062.3CARNES M R,MITCHELL J L,DE WI

31、TT P W.Synthetic temperature profiles derived from Geosat altimetry:compari-son with air-dropped expendable bathythermograph profilesJ.Journal of Geophysical Research Atmospheres,1990,95(10):17979.4CARNES M R,TEAGUE W J,MITCHELL J L.Inference of subsurface thermohaline structure from fields measurab

32、le by satelliteJ.Journal of Atmospheric and Oceanic Technolo-gy,1994,11(2):551-566.5FOX D,BARRON C,CARNES M,et al.The modular ocean data assimilation systemJ.Oceanography,2002,15(1):22-28.6MEIJERS A J S,BINDOFF N L,RINTOUL S R.Estimating 图7 重构声速剖面与实测声速剖面对比图Fig.7 Comparison of reconstructed and measu

33、red sound speed profiles图6 声速误差与深度的关系Fig.6 The relationship between sound speed error and depth8252022 年声学技术the four-dimensional structure of the Southern Ocean using satellite altimetryJ.Journal of Atmospheric and Oceanic Technology,2011,28(4):548-568.7Hasibur Rahamanet al.Impact of an upgraded mod

34、el in the NCEP Global Ocean Data Assimilation System:The tropical Indian OceanJ.Journal of Geophysical Research.Oceans,2016,121(11):8039-8062.8HJELMERVIK K T,HJELMERVIK K.Estimating tempera-ture and salinity profiles using empirical orthogonal functions and clustering on historical measurementsJ.Oce

35、an Dynam-ics,2013,63(7):809-821.9HJELMERVIK K,HJELMERVIK K T.Time-calibrated esti-mates of oceanographic profiles using empirical orthogonal functions and clusteringJ.Ocean Dynamics,2014,64(5):655-665.10 CHARANTONIS A A,TESTOR P,MORTIER L,et al.Com-pletion of a sparse GLIDER database using multi-ite

36、rative self-organizing maps(ITCOMP SOM)J.Procedia Computer Sci-ence,2015,51:2198-2206.11 LIU Y G,WEISBERG R H,SHAY L K.Current patterns on the west Florida shelf from joint self-organizing map analyses of HF radar and ADCP dataJ.Journal of Atmospheric and Oceanic Technology,2007,24(4):702-712.12 BAO

37、 S L,ZHANG R,WANG H Z,et al.Salinity profile esti-mation in the Pacific Ocean from satellite surface salinity ob-servationsJ.Journal of Atmospheric and Oceanic Technolo-gy,2019,36(1):53-68.13 SU H,YANG X,LU W F,et al.Estimating subsurface ther-mohaline structure of the global ocean using surface rem

38、ote sensing observationsJ.Remote Sensing,2019,11(13):1598.15 JAIN S,ALI M M.Estimation of sound speed profiles using artificial neural networksJ.IEEE Geoscience and Remote Sensing Letters,2006,3(4):467-470.16 FREDERICK C,VILLAR S,MICHALOPOULOU Z H.Sea-bed classification using physics-based modeling

39、and machine learningJ.The Journal of the Acoustical Society of America,2020,148(2):859.17 DEL GROSSO V A.New equation for the speed of sound in natural waters(with comparisons to other equations)J.The Journal of the Acoustical Society of America,1974,56(4):1084-1091.18 BIANCO M,GERSTOFT P.Dictionary

40、 learning of sound speed profilesJ.The Journal of the Acoustical Society of America,2017,141(3):1749.19 LI Z Q,LIU Z H,LU S L.Global Argo data fast receiving and post-quality-control systemJ.IOP Conference Series:Earth and Environmental Science,2020,502(1):012012.20 李佳讯,陈奕德,陈符森.AVISO卫星高度计新版产品改进对南海海洋

41、学研究的影响J.海洋预报,2016,33(2):74-80.LI Jiaxun,CHEN Yide,CHEN Fusen.Impact of the new ver-sion of AVISO satellite altimeter data on the study of physical oceanography in the South China SeaJ.Marine Forecasts,2016,33(2):74-80.21 屈科,朴胜春,朱凤芹.一种基于内潮动力特征的浅海声速剖面构建新方法J.物理学报,2019,68(12):124302.QU Ke,PIAO Shengchun,ZHU Fengqin.A noval method of constructing shallow water sound speed profile based on dy-namic characteristic of internal tidesJ.Acta Physica Sinica,2019,68(12):124302.826

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 自然科学论文

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服