1、CWT 中国水运 202308 59基于改进 DBSCAN 算法的船舶轨迹聚类与可视化应用 邱文轩,许志远,翟泽宇,曲胜,张晓鹏,许航DOI 编码:10.13646/ki.42-1395/u.2023.08.022(大连海洋大学,辽宁 大连 116023)摘要:随着数据挖掘在各个领域的广泛应用,船舶轨迹数据成为海上交通信息重要关注领域,对获取的 AIS 数据进行研究,针对 DBSCAN 聚类算法存在对数据进行重复区域查询的问题,改进 DBSCAN 的聚类算法减少样本邻域重复查询的时间,取得了减少算法时间消耗以及提升准确率的结果。实验结果表明:改进后的算法有较好的聚类效果,通过生成的轨迹点预测船
2、舶航行轨迹线,生成直观的信息可视化图像。关键词:AIS 数据;典型轨迹聚类;DBSCAN 算法;轨迹可视化中图分类号:U675.7 文献标识码:A 文章编号:10067973(2023)08-0059-03航运业作为庞大的基础性产业,不断产生海量数据存储在船舶识别系统(Automatic Identification System,AIS)中,涵盖船舶时空信息 1,为船舶轨迹预测提供丰富的数据源。刘涛2等人提出运用 DBSCAN 算法对船舶轨迹进行聚类,分析航域交通流的拥挤区域,通过交通流评判交通拥挤区域;潘家财3等利用船舶信息的空间分布来发掘通航环境状况,得出航速变化率空间分布;Pan4等人
3、对 DBSCAN 算法进行改进,提出基于密度的对不同线路进行分类,在宏观视图上没有进行可视呈现。Ide K5利用 AIS 数据计算船舶的港口吞吐量和全球海洋运输网络的拓扑结构。综上,专家学者在轨迹聚类领域做了很多工作,本文根据天津港水域解压清洗处理后的AIS 数据,改进 DBSCAN 算法细化聚类簇后进行时空信息可视化呈现。1 数据预处理1.1 属性选择AIS 收集的数据有用信息需要通过数据清洗来获取数据字段合理范围6,如表 1 所示。表 1 船舶轨迹数据字段合理范围1.2 数据清洗假设同一轨迹段上的点 pi-1,pi,pi+1为相邻点,pi对应的航行特征值(位置、航向、航速)为 xi,基于
4、pi,pi+1的航行状态预测 pi+1处对应的航行特征值为 xi+1,即xi+1=xi+f(xi,xi-1)。如果,表明数据发生漂移需要剔除7。(1)式 1 为数据漂移算子,(x,y)代表船舶位置特征,v 代表航速特征,c 代表航向特征,w1、w2、w3对应位置、航速向异常阀值8。2 改进 DBSCAN 算法2.1 DBSCAN 算法DBSCAN 算法原理如图 1 所示。图 1 DBSCAN 算法原理2.2 算法改进改进 DBSCAN 算法,通过查询核心节点以及未标记的点,从而减少查询次数。在 p 包含的对象数不小于 MinPts 时,建立新簇 C1,然后将点加入 N,检查N 中每个点 q,避
5、免重复查询从而提升算法聚类执行效率。输入:数据集 D,邻域半径 Eps,最小邻域点数MinPts;输出:基于密度的簇的集合。1:标记所有对象未 unvisited;60 CWT 中国水运 2023082:Do;3:随机选择 unvisited 对象 p;4:If p 包含的对象数不小于 MinPts;5:创建新簇 C1,把 p 添加到候选集 N;6:For N 中每个点 q;7:If 点 q 与对象 p 不重叠不存在核心节点;8:用新簇 C2 标记;9:Else if 点 q 与对象 p 重叠且存在核心节点;10:将对象 q 邻域内 unvisited 的点归入 C1;11:Else if 对
6、象 q 与其他标记的节点邻域重叠;12:将其中点加入候选集 N;13:End for;14:Else 标记为噪声。3 船舶典型轨迹相似性度量融合距离 MD(The Merge Distance)9表示融合后两条轨迹之间的最短距离,原理如图 2 所示。图 2 最短子轨迹通过假定 a 和 b 两条轨迹是二维空间内的一系列序列(a1,.,an),(b1,.,bm)构成,使用 d(ai,bj)表示两点之间在二维平面上的欧式距离,通过序列和 a 和 b 的最短超轨迹s(a,b)是长度最短的轨迹,a和b是s(a,b)的子序列,其长度用 L(a,b)表示。通过公式 2 从轨迹a和b的长度L(a),L(b)获
7、得融合距离MD(a,b)。(2)4 实验与分析选取渤海湾西端的天津港作为实验航道,如图 3 所示,公共泊位岸线长 14.5 千米是良好的实验航道。图 3 天津港段实验航道卫星图在运行 64 位 Windows10,InterICoreIi7-10700 CPU和 8G 内存的计算机硬件上操作。DBSCAN 算法依赖eps 和 MinPts 参数,实验需要迭代选择最优参数区间。当数据密度不均匀时,原始聚类轨迹如图 4 所示,效果较差信息呈现较片面且聚类过程耗时较长。图 4 天津港段船舶 AIS 轨迹原始聚类轨迹当 eps=0.0030、MinPts=5 时可以产生良好的聚类效果。改进后的聚类结果
8、如图 5 所示,聚类簇通过细化聚类特征明显入港轨迹聚类质量较高。图 5 天津港段船舶 AIS 轨迹改进聚类轨迹通过对 DBSCAN 经典算法和改进后的算法进行对比如表 2 所示,通过减少运行邻域样本点查询的次数和时间,从而提高效率减少计算时间消耗。表 2 两种算法对比结果实验中对 AIS 数据进行聚类,得出了渤海湾西端的天津港主要航道的四条典型轨迹,如图 6 所示,船舶航行的典型轨迹遵循航道的设置,数据聚类分析结果可信,具备参考价值。图 6 船舶入港典型轨迹参考文献:1 李晋超.船舶雷达和 AIS 大数据可视化研究中 Web 技术的应用 J.舰船科学技术,2021,43(04):109-111
9、.2 刘涛,胡勤友,杨春.水上交通拥挤区域的聚类分析与CWT 中国水运 202308 61DOI 编码:10.13646/ki.42-1395/u.2023.08.023广州市雁塔排涝泵站扩容重建工程设计研究 钟振宏(广东省源天工程有限公司,广东 广州 511340)摘要:本文通过分析雁塔排涝泵站目前现状及主要存在问题,得出随着城市经济发展,雁塔泵站出现排涝能力不足等运行问题,为了解决这一问题,对雁塔泵站进行扩容重建工程设计进行探讨。首先从泵站建设(规模),机电及金属结构,水情自动测报系统,电气设计进行阐述,在此基础上,对泵站电气主接线、自动控制和继电保护、通信及信息化设计方案进行分析。本工程
10、的建设能提高雁塔泵站的排涝能力和自动控制信息化能力,使雁塔泵站管理满足信息化、自动化控制管理要求,标准达到新的排水专项规划的要求,其防涝减灾及生态、社会效益显著,促进区域经济可持续发展。同时所采取工程设计,旨在为其他扩容水利工程设计提供一些参考。关键词:排涝泵站;重建;电气设计;自动控制和机电保护;通信及信息化中图分类号:TU992.25 文献标识码:A 文章编号:10067973(2023)08-0061-04识别 J.中国航海,2010,33(4):75-78.3 潘家财,邵哲平,姜青山.数据挖掘在海上交通特征分析中的应用研究 J.中国航海,2010,33.4Pan S,Yin J B.E
11、xtracting Shipping Route Patterns by Trajectory Clustering Model Based on Automatic Identification System DataJ.Sustainability,2018,10(7):23-27.5Ide K,Ponnambalam L,Namatame A,et al.Risk Analysis and Quantification of Vulnerability in Maritime Transportation Network Using AIS DataC/Springer Internat
12、ional Publishing.Springer International Publishing,2015.6 赵梁滨,史国友,杨家轩.基于 DBSCAN 算法的船舶轨迹自适应层次聚类 J.中国航海,2018,41(3):6.7 黄亮,刘益,文元桥,周春辉,张帆.内河渡船异常行为识别 J.大连海事大学学报,2017,43(01):8-13.8 周海,陈姚节,陈黎.船舶轨迹聚类分析与应用 J.计算机仿真,2020,37(10):7.9 丁兆颖,姚迪,吴琳,毕经平,赵瑞莲.一种基于改进的 DBSCAN 的面向海量船舶位置数据码头挖掘算法 J.计算机工程与科学,2015,37(11):2061-
13、2067.基金项目:辽宁省教育厅项目(QL201911)1 工程概况雁塔泵站位于广州市增城区,是增城区中心城区的重要组成部分。雁塔泵站是增城区雁塔围雁塔排水分区的唯一外排出口,该站原设计排涝标准为十年一遇24 小时暴雨形成的径流量 3 天排干,安装 4 台 ZLB800型立式轴流泵,设计排涝流量 7.2m3/s,总装机容量460kW。随着城市建设的发展,排涝标准需进行相应提高,雁塔泵站及自排水闸虽能正常运行,但其排涝能力严重不足,近年来暴雨发生时,上游万达广场及增城大道一带水浸街道的情况时有发生,为降低此分区在暴雨期间出现的内涝风险及减少涝灾损失,保证工商企业生产和人民群众生活正常进行,故对雁
14、塔泵站进行扩容重建迫在眉睫,也是十分必要的。2 工程现状及存在的主要问题2.1 雁塔排涝泵站现状雁塔围目前唯一的外排出口是位于增江右岸广汕公路桥下游约 80m 处的雁塔泵站。雁塔泵站重建工程主要工作任务为重建 1 座排涝泵站和排涝水闸,设计排涝流量为 Q=34m/s,总装机功率为 3030kw,规模为中型泵站,工程等别为 III 等1。雁塔排区的集雨面积为 3.35km2,雁塔泵站的主要任务是提高排涝能力,减少雁塔围内雁塔排水分区在暴雨期间出现内涝的风险和涝灾损失。雁塔泵站水文自动测报系统的建设可为满足泵站工程施工期安全度汛、运行期水库防洪排涝调度运用等管理工作提供重要的支持和保障。随着社会的发展和技术的进步,传统的人工采集、发报信息己经不能满足现代管理高效、快捷的要求,现代管理模式需要先进的技术、全面的信息、正确的决策和高效的工作。雁塔泵站的重建对于近期解决雁塔排区内涝有举足轻重的作用,可有效支撑当地经济快速发展。建设雁塔泵站水文自动测报系统,运用先进的技术,快速实时的收集流域内雨水情信息,并及时做出预报和排涝调度,为实现泵站工程安全建设和进行水库科学调