1、工程应用本栏目责任编辑:梁 书Computer Knowledge and Technology电脑知识与技术第19卷第18期(2023年6月)第19卷第18期(2023年6月)监控易在民航气象信息系统运维上的应用探析吕常胜,薄双录(民航东北空管局气象中心,辽宁 沈阳 110043)摘要:通过对民航气象信息系统运维现状以及监控易系统在设备监控上的应用分析,以改进监控手段、提高运维效率为目标,引进了监控易系统,并以实例详细介绍了监控易在民航气象信息系统监控运维上的应用。关键词:气象;信息;监控;应用中图分类号:TP311 文献标识码:A文章编号:1009-3044(2023)18-0085-03
2、开放科学(资源服务)标识码(OSID):1 民航气象信息系统民航气象信息系统包括民航气象数据库系统、民航气象信息服务系统以及相关的辅助支持系统等。主要负责民航气象信息的发布、接收、存储、交换,并对外提供气象信息的查询服务等1。民航气象信息资料包括有报文格式的实况报(METAR)和预报(TAF)2,图片格式的卫星云图、雷达图、重要天气预告图以及专有气象信息格式的自动观测资料等。民航气象信息的及时、准确发布与获取,不仅关乎民航空管系统的服务质量,也影响到民航运输的安全与高效,所以,保证民航气象信息系统的正常运行至关重要。2 民航气象信息系统的运维民航气象信息系统自开始运行以来,其间经历了多次的更新
3、改造,并且增加了其他一些相关辅助系统。虽然系统功能的逐步完善,服务质量也有了显著提高,但随着系统软、硬件的增加,系统的复杂程度也越来越高,相应的系统监控运维也越来越难,按原有方式的系统运维难以保障系统的稳定运行。目前,民航气象信息系统的运维与监控主要通过岗位日常监控与巡视及用户主动报告问题来完成。虽然民航气象信息系统的部分子系统有些自带了监控功能,但监控信息不够全面、深度不够、定位不准,而且相关系统的监控关联度不高,也给系统的运维造成一定的困难。另外,日常监控主要是维护人员在岗监控,如果是夜间或人员不在岗,则系统的运行状态及监控信息不能及时获得,则会延误解决问题的时间,影响系统的正常运行。如何
4、更好地整合各系统监控信息,及时准确定位故障原因,除了自行开发一套针对本系统的监控外,市面上也有许多成熟的相关监控产品可以采用,比如“监控易”。3 监控易监控易是美信时代自研的分布式、一体化数据采集与洞察管理平台。专注对局域网、广域网和互联网中的IT资源和网络的故障监测和性能管理,是集中式、跨平台的一体化IT监控运维管理软件。监控易打破了采用多种监控工具对数据中心进行离散式管理的模式,采用多TS架构,集中统一实现IT、动环、智能物联网等智能设备和软硬件系统的自动采集、监测、巡检、告警及展现,实现不同系统间的数据关联与共享,从全局视角把控系统运行态势,实现故障快速定位和根源诊断3。监控易系统为B/
5、S架构,采用底层分布式架构设计,各地数据中心可部署监控终端,设备监控指标的采集在监控终端完成,监控终端的状态数据和告警数据上传到集中管理控制台,所有监控内容通过集中管理控制台进行统一展示。监控易的逻辑结构如图1所示。在IT基础设施监控方面,监控易支持对上百家厂商的服务器、操作系统、数据库、中间件、应用、网络设备和存储设备的深入监控。除了支持自行研发的Agent 私 有 协 议 外,还 支 持 SNMP、HTTP/HTTPS、ICMP、ODBC、SSH、TELNET等公有协议4。并且有多种告警方式可供选择,如声音、短信、微信、邮件和脚本等,保证运维人员第一时间获得告警信息,及时排除系统故障,同时
6、,也减轻了运维人员的工作强度。收稿日期:2023-03-30作者简介:吕常胜(1969),男,高级工程师,学士,主要研究方向为民航气象应用开发;薄双录(1991),男,工程师,硕士,主要研究方向为民航气象应用开发。E-mail:http:/Tel:+86-551-65690963 65690964ISSN 1009-3044Computer Knowledge and Technology 电脑知识与技术Vol.19,No.18,June 202385DOI:10.14004/ki.ckt.2023.0848本栏目责任编辑:梁 书工程应用Computer Knowledge and Techn
7、ology电脑知识与技术第19卷第18期(2023年6月)第19卷第18期(2023年6月)4 监控易的部署监控易支持多种形式的部署方式,常用的有本地部署、分布式部署、混合云部署、多层级部署等,本次安装选择本地部署。监控易软件安装完成后,即可对监控对象进行配置操作,通常包括以下几个步骤。4.1 设备连接在设备管理界面选择添加设备,这里包括服务器、应用和业务、网络设备、存储设备、虚拟机监测等项目,每个项目下有各个系统及应用厂家的产品及连接方式可供选择,选择好连接方式后,即可按照该连接方式的要求提供连接参数,如选择Linux服务器的SSH Linux连接方式,需要填写服务器IP地址、端口号、登录名
8、和登录密码等,之后选择下一步,进行与监控设备的连接。4.2 添加监测点与监控设备连接成功后,系统出现基本监测点和高级监测点两个选项,每个选项下面列出了若干可供选择的监控项目,用户可以选择所需的监测项目并对其进行基本配置,以满足不同的监控需求。如选择监控CPU、物理内存、网卡、磁盘、进程等。4.3 编辑与测试通过以上设备连接和基本监测点的添加后,在设备管理界面上便有了该设备项目。在该设备项目下列有多个监测点,对每个监测点可以进行编辑、测试、禁止和删除等操作。通过选择编辑监测点,可以对该监测点的监测参数重新设置,以满足实际监控需求。如执行间隔时间、计划任务、危险阈值、故障阈值等,还可对该故障处理方
9、法进行描述,以提示用户如何处理。5 监控易在民航气象信息系统运维上的应用下面通过几个具体示例,简单描述监控易在民航气象信息系统监控方面的应用。5.1 网络设备的监控网络设备有各种品牌的交换机、路由器、防火墙、负载均衡、VPN等设备可供选择监控,如选择锐捷交换机产品,通过配置SNMP端口进行设备连接,监控项目有交换机的CPU、内存及各接口的连接状态等。5.2 服务器的监控可监控的服务器包括Windows服务器、Linux服务器、IBM AIX服务器,HP和SUN的服务器等,如通过选择IBM服务器类别、连接方式选择SSH IBM AIX,配置好IP地址、端口号22,登录名和密码后连接成功,可选监控
10、点CPU、交换分区、物理内存、网卡、磁盘和进程等。如对民航气象数据库通信系统进程rmqtxt的监控,该进程负责获取通信系统MQ本地队列LOCAL.TXT的报文数据,交由后续的进程处理,如果该进程down,则导致队列数据积压,影响报文数据的接收及处理。该监控点的监控参数可以选择5分钟监控时间间隔、故障阈值为小于1。如果该进程down,则系统监测到该进程运行个数小于1,满足故障阈值条件,监控系统提示警告。5.3 数据库的监控可监控的数据库类型包括 Oracle 数据库、IBM DB2 数据库、Sybase 数据库、MySQL 数据库、SQL Server 数据库等。民航气象数据库系统采用的是Ora
11、cle数据库,首先选择Oracle数据库连接,设置数据库用户名、密码、数据库SID、端口号、数据库IP地址后,连接成功5。监控点包括连接会话数、Oracle当前状态、逻辑读语句Top10、执行语句Top10、Oracle表空间等。另外,可以配置SQL自定义监测,通过查询数据库表信息内容,对数据库业务进行监控。如民航气象数据库系统会每分钟接收到本场的自动观测数据并处理入库,通过自定义SQL语句可监控自动观察数据是否按时收到。自定义SQL语句如下:select ROUND(TO_NUMBER(sysdate-(select OTIME from DBINFO.INFO_AWOS_RPT WHERE
12、 CCCC=ZYXX and RNO=06/24)*24*60)from dual其中:DBINFO.INFO_AWOS_RPT为自观数据表名CCCC=ZYXX选择查询本场数据OTIME为自观数据时间该SQL查询语句通过计算最新本场自观数据时图1 监控易的逻辑结构86工程应用本栏目责任编辑:梁 书Computer Knowledge and Technology电脑知识与技术第19卷第18期(2023年6月)第19卷第18期(2023年6月)间与系统时间的差值,再通过设置危险阈值和故障阈值的行数信息,得出自观数据是否收到的结果。如调试后设置故障阈值为行数60,当自定义SQL语句执行结果大于60
13、时,说明已有10分钟未收到本场的自观数据,监控系统随即警告。5.4 MQ的监控IBM MQ是消息传递中间件,用于简化和加速多个平台中各种应用和业务数据的集成。民航气象数据库系统使用了MQ(消息队列)进行数据的传输。可以通过添加监控点完成对MQ的监控。首先对MQ服务端进行配置,具体步骤如下:1)切换到系统 root 用户,在 MQ 服务器上创建SYSTEM用户,并添加到mqm组useradd SYSTEMpasswd SYSTEMchgrpmem-m+SYSTEM mqmgroups SYSTEM2)切换到MQ管理员mqm用户,查看MQ服务器上的队列管理器dspmqrunmqsc ZYXXDIS
14、PLAY CHANNEL(*)ALLDISPLAY LISTENER(*)ALLDISPLAY QMGR3)创建服务器连接通道,并指定为SYSTEM用户DEFINE CHANNEL(CH_ZYXX)CHLTYPE(SVRCONN)MCAUSER(SYSTEM)DISPLAY CHANNEL(CH_ZYXX)ALLSTART CHANNEL(CH_ZYXX)4)创建监听器,注意端口号(默认1414)DEFINE LISTENER(LISTENER_ZYXX.TCP)TRPTYPE(TCP)PORT(1416)CONTROL(QMGR)DISPLAY LISTENER(LISTENER_ZYXX.
15、TCP)START LISTENER(LISTENER_ZYXX.TCP)其中,ZYXX是MQ本地队列管理器名称。之后,在监控易上选择添加中间件设备的IBM MQ选项,输入MQ服务器IP地址、端口号、队列管理器名称、服务器连接通道后,完成IBM MQ中间件的连接,并对队列、通道、系统队列、系统通道及侦听器状态等指标进行监控。5.5 文件的监控通过安装监控易私有Agent插件,可以完成对文件信息的有效监控。1)文件大小的监控民航气象信息服务系统在Linux服务器安装了Web服务,可以通过添加监控点完成对文件大小的监控。首先下载安装监控易Agent Linux插件,完成对Linux 系统的 Age
16、nt 方式连接,Agent 端口号默认是2198。配置监测点选择高级监测点的 Linux File 选项,监控参数有要监控的文件名、危险阈值和故障阈值为文件的大小。如要监控 tomcat 日志文件/home/tomcat/tomcat1/logs/catalina.out大小,可设置危险阈值和故障阈值分别为2GB和4GB,当日志文件字节数大于4GB时,监控系统告警。2)新增文件的监控通过一些辅助的脚本编写,也可以完成对新增文件的监控。例如,气象雷达基数据每26分钟自动更新,而且数据会以不同的文件名存储在Windows服务器中。首先通过同步软件将最新获取的文件拷贝到其他目录,并更改为一固定文件名
17、如radar.new。再通过编写定时删除脚本将其删除,如设置10分钟定时删除radar.new文件。这样通过监控易监控是否存在radar.new文件,即可完成对新增文件的监控目的。首先下载安装监控易Agent Windows插件,完成对Windows系统的Agent方式连接,Agent端口号默认是2198。配置监测点选择高级监测点的Windows文件信息选项,监控参数有要监控的文件名、危险阈值和故障阈值为文件的大小。如要监控新增文件 D:DATARADARradar.new大小,可设置危险阈值和故障阈值为none,当未监控到该文件存在时,也就是监控周期内没有新增文件到达,监控系统告警。6 结束
18、语民航气象信息系统在空管服务及航空运输方面起着至关重要的作用,维护该系统的正常运行是提供保障的基础。监控易在民航气象信息系统监控运维上的应用,不仅提高了系统运维效率,也降低维护人员的工作强度。随着监控易系统在民航气象信息系统监控运维方面的不断开发与应用,必将在保障民航飞行安全,提高服务质量方面发挥更大的作用。参考文献:1 中国民用航空局.中国民用航空气象工作规则,CCAR-117R1 2005Z.2 民航局空管办,空管局.民用航空飞行气象情报发布与交换办法,AP-117-TM-2009-01R2Z.3 全国产、高性能、一体化、多层级的泛IT一体化智能运维管理 平 台 EB/OL.2021-10-21.https:/ 田平.Java Web开发的环境配置J.软件,2013,34(7):40.5 孟宪福.分布式对象技术及其应用M.北京:清华大学出版社,2008.【通联编辑:谢媛媛】87