1、2023.7电脑编程技巧与维护1概述现代声呐是舰艇、潜艇不可或缺的装备。水声环境是水下目标的探测距离和跟踪距离的关键影响因素之一。如何提高传播损失预报结果,是声呐研究近些年研究的热点和难点,而传播损失又受到海底底质、声梯、海况等海洋环境不确定性因素的影响,如何将这些因素综合分析、建立特征库、形成水文知识库是研究重点。模式识别是在信息获取前提下,数据预处理后抽取相关特征,按照提取的特征设计分类器,进行分类决策,对数据或图像进行识别的过程。随着模式识别理论发展,有关统计方法的应用已经广泛展开,句法识别在模式识别理论的应用中也占据了重要地位,是统计模式识别的补充。使用句法模式识别对图像进行分析后,构
2、建分类器,利用分类器进行分类识别。结合声速剖面的图线特性,采用句法识别理论构建水文知识库。2模式识别分类及介绍2.1统计模式识别统计模式识别是一种早期理论,经过多年的发展完善,已经形成了系统的理论体系。依据概率论和数理统计,通过将样本抽象成特征向量进行分析,在高维度样本空间中,该特征向量就是一个样本点,对于同一类别的样本点,其特征向量对应表现出的特性就是类内相互聚集,形成数据簇,非同类样本则表现出疏远,以此作为依据,得出判别分类的一种方法。在计算出所有有效数据的特征向量后,通过大量样本的统计和学习反复测试,便可训练设计出分类器。统计模式识别的关键流程其实包括信息或数据采集、数据预处理、分类器设
3、计和最后的决策判断4步。数据采集作为模式识别第一步,是进行识别验证的先验条件。没有良好的数据获取机制,就无法提供有用的特征信息,也不能够为后续的数据预处理、特征向量提取、分类器设计提供良好的数据支持。输入的数据中有大量的样本信息,但是这些样本信息有些属于冗余重复信息,特征提取的目的就是降低特征空间维度,提高分类器的效率。根据统计识别的原理和定义,各不同模式的类间距离大于相同模式的类间距离,决策判断就是将分类器得到的特征空间结果映射到具体的类,从而完成模式判断。决策方法的研究中有很多典型的方法,例如,Fisher、贝叶斯决策、支持向量机等。2.2句法结构理论句法结构理论是模式识别的一个重要分支,
4、根据器分类特点也称之为结构模式识别方法。传统统计方法识别方法的局限性在于无法将原始模式结构比较复杂的输入数据进行特征向量化,此时,模式的结构特征又比较明显,通过句法模式识别可以很好地弥补传统统计识别方法的不足。句法模式识别将图像或语句按照树形结构层层分解,分解到简单的不可再分,某些固定结构称为模式基元,将基元进行编码方式表述,突出了识别对象的结构信息。在此所描述的水文知识库构建方法,主要借鉴了句法模式识别的思想。3句法识别句法识别采用分层描述方法,模仿语言学的层次结构,将输入方式分为多个子模式,如图1所示,每个子模式中产生的不可分割部分即为基元,每个基元按照一定的机构组织输入方式,即组合抽取输
5、入方式为基元抽取,用表达式表示1。一种基于模式识别的水文知识库构建方法周俊,张烨,陈泓宇(中国船舶集团有限公司第七一五研究所,杭州310023)摘要:提出了一种基于句法结构识别的水文知识库构建方法,阐述了模式识别相关理论,提取水文图像结构信息分类特征,构建水文知识库。传播损失计算精度严重影响声呐性能,而传播损失计算精度又受不确定海洋环境影响,在此选取了不确定海洋环境参数主要影响因素,例如:海底底质、声梯等,将多维度的声速剖面提取特征点后编码,建立历史水文知识库索引,为传播损失计算精度的提高和后续作用距离预报提供数据支持。关键词:不确定海洋环境;句法模式识别;水文知识库;水文特征点图1句法模式识
6、别系统的原理框图输入模式识别分析预处理分割基元抽取模式基元识别句法分析分类和描述语法推断样本模式模式基元选择117DOI:10.16184/prg.2023.07.0432023.7电脑编程技巧与维护从图1和前文描述可知,句法分析、语法推断和基元的选取是关键步骤。下面就从句法辨识的过程开始,对相关内容进行介绍。3.1语句句法识别过程分析依据英文语句“The worker works hard.”,其中,“the”这个单词是冠词;“worker”这个单词是名词;“works”这个单词为动词,“hard”这个单词是副词,“The worker works hard”语句导出树如图2所示。文法是一个
7、四元表达式,即G=VN,VT,P,S,其中,G为规则集合,由起始符S、产生式集合P、终止符集合VT、非终止符集合VN组成。终止符是模式中分割到最后的最小单元,定义为基元。产生式是一种规则,这种规则由其他非终止符构成,或由终止符和非终止符组合构成,或由终止符构成2。下面继续分析该英语语句。VN=,图2为语句导出树。VT=the,worker,works,hard,其中,VT为基元,是模式中不可分割的部分,因此为单个单词。P:theworkerworkshard下面以这个模式为起始符展示模式分割及改写的过程。the worker works hard3.2图像句法识别过程这里用到的实际是针对图像的
8、句法识别,以次中性染色体的处理过程,作为例子进行说明。图像句法识别,首先将染色体图像作为输入对象,次中性染色体如图3所示,a,b,c,d依据其形状的不同,代表不同的基元,a为凸圆弧,c为凹圆弧,b为直线,中间凹陷处用d表示。基元在表达式中对应着一个终止符VT。起始符S即为输入的模式编码,得到文法表达式G=VN,VT,P,S,得出非终止符VN、产生式P,分析过程如下:G=VN,VT,P,VN=VT=a,b,c,dP:c cb bb babd假设输入编码为babcbabdbabcbabd,判断其是否为次中性染色体,过程如下,对编码根据上述产生式进行改写。babcbabdbabcbabdb bcbb
9、dbbcbbdbc bd bc bdcdcd d d4水文知识库构建选择水文特征的典型物理参数构建历史水文知识库。由于声呐探测和发现性能主要受传播损失影响,故图2“The worker works hard”语句导出树图3次中性染色体aaaabbbbccbbbbdd句子名词短语动词短语冠词名词动词副词Theworkerworkshard1182023.7电脑编程技巧与维护在此选择影响传播损失较大的特征参数作为水文特征建立数据库。传播损失受以下参数影响较大,例如,海底底质类型、声速剖面等;为便于检索,增加了测试地点(经纬度),以及对水文、声速剖面的插值特征点和声速剖面的编码等内容。插值水文、声速
10、剖面特征点、声速剖面编码等都需要在水文知识库中插入水文后进行计算。索引是数据库表中的特定字段或多个字段排序的结构,可快速查找数据库表中信息。根据需求,检索方式如下:(1)按时间索引试验数据;(2)按地点索引数据;(3)按水文数据特征点索引数据。数据库中存储的特征,除水文声速剖面外,均为单向度特征,在建库保管时,也较容易表现出来。将多维度声速剖面特征量化索引是难点,下面将着重进行介绍。声速剖面主要包括深海声道、正梯度、负梯度、等温、反深海等,实际海洋环境复杂多变,声速剖面也不是单一的,可能由多种声剖构成。将声速剖面抽象成曲线进行编码和归类可以匹配到正确的声速剖面。水文知识库构建流程如下。(1)得
11、到水文声速剖面、海底底质、海深以及时间、地点等参数。(2)提取水文特征点。(3)将提取到的水文特征点通过句法识别算法进行数字编码。(4)通过数字编码得到字母编码。(5)使用原始水文、插值水文、字母编码、声速剖面特征点、海底底质类型等参数构建知识库。(6)按照字典的索引顺序排序每条水文的字母编码。4.1水文特征点提取计算机图形学道格拉斯普克(D-P)算法,该算法是目前公认和使用最广泛地线条简化算法。目前研究的算法中,大多是在D-P算法上改进算法的基础过程和参数后实现。其优点在于,已知线形和设定的阈值,D-P算法得到的结果稳定可靠3。如果选择过高,则特征点数量少,最终曲线平滑是D-P算法比较关键的
12、问题;如果选择过低,则会获得较多的特征点,优化后的曲线和输入曲线较为相似。阈值为0时,结果等同于原曲线。经多次仿真,得出阈值设定为1.2时,将得到合理数量的特征点。D-P算法由于具有良好的递归性,首先输入声速剖面向量,计算曲线的采样点到初始起点与终点连接线的距离,如果大于阈值,则该点作为特征点,更新该采样点为起点和终点重新计算;若在阈值范围内,则遍历下一个采样点。终点序号的个数比起始序号大1,说明起始点和终点相遇,结束循环。为了简化计算,采用海伦公式,如公式(1)所示:其中,a、b、c 3边长度,p=(a+b+c)/2,di=2S/dse,dse为起点与终点的直线距离。声速剖面按照上述思路,将
13、其采样点提取出来,按照非闭合曲线进行处理,找出声速剖面中所有能够表现其特点的采样点。图5为输入的实际原始水文声速剖面,设定阈值为1.2后,提取声速剖面特征点,算法处理后的水文如图5所示,可以看出采用D-P算法平滑后的水文声速剖面能够表现出输入声速剖面的形状特点。4.2水文声速剖面编码对于得到的特征点,采用句法识别算法进行编码。典型声速剖面如图6所示,利用典型声速剖面作为声梯基元。图4原始水文图6典型声速剖面(a)深海(b)正梯度(c)负梯度(d)反深海(e)跃变(f)等温图5算法平滑后水文05001 0001 5002 0002 5003 0003 5004 000深度z/m声速剖面声速m/s
14、1 4701 4801 4901 5001 5101 5201 530声速剖面声速m/s1 4701 4801 4901 5001 5101 5201 53005001 0001 5002 0002 5003 0003 5004 000深度z/m1192023.7电脑编程技巧与维护3傅伟,涂刚,张贤龙.基于微信小程序的电子商城设计与实现J.电脑编程技巧与维护,2020(3):60-62.4解楠楠.基于微信公众平台的高校图书馆移动服务研究D.郑州:郑州大学,2019.5田宸之,徐德新,史顺昌.论计算机数据库系统在信息管理中的应用J.中国电子商务,2014(1):30-31.6丁宁宁.基于微信小程
15、序的移动图书馆信息服务平台功能初探J.信息与电脑(理论版),2020,32(18):96-98.7黄悦深.我国图书馆微信小程序应用调查J.图书馆学研究,2020(12):37-43.8ZHENG H.On the digital use of orphan works in pub-lic librariesthe Improvement of public library law(Draft for soliciting opinions)J.Library Work andStudy,2017,4(1):6-13.9陈国良.高校图书馆微信小程序的应用研究J.延安职业技术学院学报,2021,
16、35(4):13-18.为了便于编码,数字2表示声速梯度k1时的编码;数字1编码为梯度斜率1k;k-时,数字编码为0;-k-1时,数字编码为-1;-1k时,数字编码为-2。其中,k为声速梯度;为等温梯度阈值;1为编码是2的声速梯度阈值,其实就是把大斜率的线段和小斜率的线段分离开来。基元编码如图7所示3。按照句法识别的过程,下一步需要确定文法的产生下式。acfb acb aab acaabfc dbc dbd ddcbbfb ccfc efbf efcf4.3水文知识库构建根据上述内容,选取原始水文数据,插值水文数据,D-P算法提取特征点后的水文数据,句法模式识别后的编码、海底声速、海底地址、海
17、底衰减系数作为特征参数,在Matlab中构建水文知识库,如图8所示。5结语根据模式识别相关理论,在比较模式识别的基础上,根据水文自身的特点,选取模式识别中的图像句法识别方法进行水文知识识别,用D-P算法得出的给定曲线形状和阈值,不受外界因素的影响。对声速剖面进行特征点提取,并对提取特征点后的水文进行模式匹配和图像句法识别,以此为依托,建设历史水文知识库。采用句法识别理论构建水文数据库,具有以下优点:历史水文资料可以得到充分利用,为后续传播损失计算提供较好的数据支持;(2)对于工程类应用比较友好,适合简单计算;(3)多维度的声速剖面的入库索引是比较棘手的问题,相比于传统的数据库建库存储,介绍的方
18、法可以将声速剖面量化入库,建库存储时易于表示。参考文献1盛立东.模式识别导论M.北京:北京邮电大学出版社,2010.2傅京孙.模式识别应用M.北京:北京大学出版社,1990.3AKIMA H.A new method of interpolation and smoothcurve fitting based on local procedures J.Journal ofthe Acm,1970,17(4):589-602.图7基元编码(-1,1)(-1,0,1)(1)(1,0,1)(2)(2,0,2)(1,0,2)(2,0,1)(a)深海(b)正梯度(c)负梯度(d)反深海(-1)(-1,0,-1)(-2)(-2,0,-2)(-1,0,-2)(-2,0,-1)(1,-1)(1,0,-1)(f)等温(e)阶跃(0)(0,1,0)(0,-1,0)(0,2,0)(0,-2,0)图8水文知识库(上接第70页)120