收藏 分销(赏)

XIT运维监控管理平台建设专项方案参考.doc

上传人:精*** 文档编号:2880486 上传时间:2024-06-07 格式:DOC 页数:49 大小:414.54KB 下载积分:14 金币
下载 相关 举报
XIT运维监控管理平台建设专项方案参考.doc_第1页
第1页 / 共49页
XIT运维监控管理平台建设专项方案参考.doc_第2页
第2页 / 共49页


点击查看更多>>
资源描述
IT运维监控管理平台 建设方案 XXXXXXX 目录 第1章 概述 3 1.1 建设背景 3 1.2 建设目标 3 1.3 建设思绪 4 第2章 系统总体设计 5 2.1 总体架构 5 2.2 设计标准 6 2.3 运维管理体系架构设计 7 2.3.1 系统总体架构设计 7 2.3.2 监控采集层 8 2.3.3 数据处理层 8 2.3.4 运行展现层 8 2.4 系统技术路线 9 2.4.1 采取Java语言开发 9 2.4.2 采取J2EE框架 10 2.4.3 采取WebService进行数据互连互通 10 2.4.4 数据库技术 12 2.4.5 性能控制 13 2.4.6 开发、运行环境 13 2.5 应用接口总体设计 13 2.5.1 系统内部集成接口 13 2.5.2 和基础运维管理工具集成接口 14 2.5.3 和ITSM系统集成接口 14 2.5.4 和相关外部系统统一身份认证和单点登录接口 14 2.6 系统安全设计及布署 15 2.6.1 输入检验 15 2.6.2 GET请求和Cookie中敏感数据 15 2.6.3 防经过嵌入标识实现攻击 15 2.6.4 防口令猜测功效 16 2.6.5 页面和字段级权限控制 16 2.6.6 系统安全架构 16 第3章 系统功效设计 17 3.1 动环监控 17 3.1.1 配电柜监测 17 3.1.2 配电开关及电流监控 17 3.1.3 发电机监控 18 3.1.4 ATS监测 18 3.1.5 STS监测 18 3.1.6 UPS监控子系统 19 3.2 统一门户子系统 19 3.2.1 信息主管领导内容展示 20 3.2.2 运维人员内容展现 20 3.2.3 通常见户内容展现 21 3.3 IT运行监控子系统 21 3.3.1 基础平台功效 21 3.3.2 网络设备管理 23 3.3.3 服务器监控管理 26 3.3.4 存放监控管理 29 3.3.5 数据库监控管理 29 3.3.6 中间件监控管理 30 3.3.7 web和应用监控管理 31 3.3.8 虚拟化监控管理 32 3.3.9 IP地址管理管理 33 3.3.10 信息点管理 34 3.3.11 告警监控管理和转发处理 35 3.3.12 综合监控管理 36 3.3.13 综合报表管理 37 3.4 IT服务管理子系统 38 3.4.1 功效特点 38 3.4.2 服务台管理 41 3.4.3 服务目录管理 42 3.4.4 服务请求管理 42 3.4.5 事件管理 43 3.4.6 问题管理 43 3.4.7 变更管理 44 3.4.8 值班管理 44 3.4.9 公告管理 45 3.4.10 IT运维汇报 45 3.4.11 用户管理 46 第4章 培训方案 46 第5章 系统价值 47 第6章 售后服务 47 第1章 概述 1.1 建设背景 伴随多年来经济深入快速发展,企事业机关单位IT运行环境日趋复杂,运行监控工作难度加大,尤其是伴随信息化建设不停深入,信息系统越来越多,各类系统越来越复杂,系统关联度也越来越高。  数据处理量成倍增加,而伴随互联网应用发展,网上应用系统也越来越多,使IT 系统运行环境变得愈加复杂,造成了机房管理、系统监控、运行维护工作十分困难局面。  即使信息中心各科室对已经有各监控管理手段,但缺乏一个集中、统一监控平台,立即发觉和处理网络、硬件、安全设备、操作系统、数据库、中间件、应用系统、机房空调、UPS 等忽然出现问题。  因服务对象不一样,使用产品混杂。怎样很好地处理以上问题,把多种类型监控对象进行统一集中监控,并将其格式统一规范,并对其有效处理、分析,以直观界面展现给各科室管理员、领导,成为现在面临最大挑战。 1.2 建设目标 加强信息资源维护平台建设,提升信息资源运行管理水平,经过运维体系建设,结合构建集中式服务热线、运维步骤、系统监控和综合展示系统,经过系统联动,立即、正确、全方面反应和掌握信息系统运行状态,保障各业务系统正常运行,应达成以下目标: (1) 强化主动监控,实现集中管理。 以IT资源可用性监控为根本,构建统一集成IT资源及应用服务监控平台,能够主动、立即地发觉问题,并调度资源处理问题,形成IT运维管理主动服务新局面。 (2) 帮助定位故障,快速恢复系统运行。 建立集中告警分析及展现平台,提供灵活、自动化事件处理能力。当故障产生时,能够进行故障快速定位,发觉故障原因,调度资源快速恢复系统服务,从而缩短故障处理时间,降低维护成本,提升系统整体可用性。 (3) 掌握运行质量和效率,合理利用资源。 建立IT运维平台后,能够实时了解全部IT资源负载和使用情况,依据需要从整体角度考虑资源使用,同时能够依据业务高峰期不一样来调剂业务系统对资源使用。 (4) 规范运行管理,有序开展维护。 参考ITIL规范,对运维管理工作进行优化,对服务管理进行改善,将管理数据电子化,管理过程规范化。依据相关制度进行运行维护管理,对内完善步骤,对外提升服务,加强管理,使步骤更规范更合理,使技术人员含有更高工作效率,提升业务技术能力和处理实际问题能力。 (5) 共享运维经验,完善知识库。 把运维过程中产生丰富经验进行积累和总结,形成有效知识库,建立知识共享机制,提供信息共享和交流平台,提升运维人员工作效率。 1.3 建设思绪 IT运维管理理论、方法和标准,结合中心实际和建设需要,遵照立足需求、统一计划、保障关键、分步实施、务求实效标准,建立一套融合组织、制度、步骤、人员、技术IT运维管理体系,建立组织机构,制订规章制度,规范管理步骤,明确职责分工,强化技术支撑,实现对网络及信息系统综合管理监控和日常技术支持,快速响应和立即处理信息系统运行过程中出现多种问题和故障,确保所维护网络及信息系统正常、稳定、高效运行。 第2章 系统总体设计 2.1 总体架构 依据对IT运维管理体系建设经验,和对用户信息系统现实状况、需求分析,我们提出三位一体综合运维管理平台框架图以下: IT运维管理平台包含:“IT运行集中监控、IT运维步骤服务、统一运维门户”三个部分。底层基础平台关键实现对底层数据采集、存放、分析等工作,为上层监控及步骤系统提供基础数据;IT运行监控关键完成对基础设施故障、性能、配置等方面全方面监控管理,实现主动式IT管理;IT运维步骤服务关键依据IT服务管理国际标准ISO,并结合ITIL最好实践,梳理出了事件管理、问题管理、变更管理等运维步骤,实现对日常运维工作步骤化、计划范管理,提升IT服务质量。统一门户关键实现对监控信息、运维步骤信息进行集中展示。平台三个子系统关系以下: (1) 以IT运行监控为“基础” 这部分功效关键是对被管对象运行状态和其配置资产信息进行统一监控、管理、分析,实现对多种故障和性能异常立即报警,对系统运行性能进行实时监控,对系统运行多种状态信息进行汇总、分析和估计。另外,还包含对IT系统全部配置资产情况进行统一管理,对配置信息异动提供检验及告警。 IT监控管理除了实现网管告警、性能、配置几大基础功效以外,还从运维角度提供丰富数据综合分析和运维工具,比如综合报表、综合监控、信息点管理等。 (2) 以IT服务管理为“导向” 这部分功效关键依据ITIL架构进行建设,为IT系统维护服务提供电子化控制手段。系统经过事件管理、问题管理、变更管理、配置管理等功效,为IT维护人员提供以步骤为基础服务管理方法,规范管理模式,达成快速消除IT系统故障、处理潜在问题,降低不规范系统变更引发系统故障率和故障隐患等目标,实现对IT系统主动式服务,提升服务水平。 (3) 以统一运维门户为“表现” 即是整个系统对外界面,经过统一权限管理和统一风格B/S展现,为系统操作使用人员提供统一系统接口,做到一点接入,通观全局,能够以灵活组织数据展现方法,定义用户、角色、组织机构,并为每个不一样角色提供不一样功效模块,为每个用户分配不一样展现内容,方便用户进行企业整体运行维护管理。 2.2 设计标准 IT运维平台作为信息中心未来运维工作关键支撑系统,需要系统本身含有高可靠、易扩展、易维护等特点,而且在系统功效应用上要含有一定技术优异性和实用性。所以,此次项目标方案设计遵照以下设计标准: (1) 优异实用 平台重视优异性和实用性统一,以实用为目标,合理选择各类成熟、优异技术。在体系结构、功效算法等很多方面全部采取优异计算机技术和理论,应用功效表现实用性。 (2) 可靠性 在系统结构、设计方案、设备选择、技术服务等方面综合考虑,确保系统能够7*24安全无故障运行,系统有很好容错功效;对IT资源监测应确保不影响相关设备和系统正常良好运行,并实现最好响应效率及最小资源占用。 (3) 安全性 重视安全方面设计,确保IT运维监控管理平台稳定、安全运行。系统要确保数据安全,不会增加现有应用系统复杂性,更不会降低现有应用系统稳定性。 (4) 开放性 采取符合国际中国家标准准通用协议,为实现和其它系统监控软硬件互联或接入本系统进行监控提供接口,支持多种主流计算机平台、操作系统和数据库厂商各类软硬件产品。 (5) 可扩展、易集成 系统需含有很好扩展性,能适应不停发展业务需求。伴随IT资源种类和数量扩大,系统也应能适应新系统对IT运维管理需求。系统含有高度集成性,能够和第三方产品进行集成,进行功效扩展。系统提供开发工具和接口,方便其它监控系统集成和统一管理。 2.3 运维管理体系架构设计 和运维综合监控相关运维管理体系架构关键包含以下内容: 1)资源监控和操作管理体系:面向资源,以统一资源配置库(资产和配置、监控数据库)为基础,建设面向被管理资源监控管理和操作自动化管理体系。 2)数据综合分析体系:面向管理者,以统一资源配置库为基础,对资源监控和操作管理体系数据进行分析挖掘,建设辅助运行决议数据综合分析体系。 运维管理体系架构是一个完整IT系统运维管理架构,是IT综合运维管理较高目标。 2.3.1 系统总体架构设计 系统由监控采集层、数据处理层、服务管理层、运行展现层组成。 2.3.2 监控采集层 监控采集层关键由网络监控模块(NCC)、应用监控模块(BCC)组成,实现对IT基础支撑系统监控,包含:网络设备、业务服务器、存放设备、数据库系统、中间件系统、安全设备、业务应用系统、网络流量等。 同时,从第三方系统(如机房环境监控和视频监控系统等)抽取数据(包含资产配置数据、故障告警数据),实现对IT资源全方面监控。 2.3.3 数据处理层 数据处理层由统一事件平台(Arbiter)、数据指标抽取模块(Bridge)、监控指标库(RDB)、可视化展现视图(Live)等模块组成。 监控指标库(RDB)存放了全部监控对象目前运行情况、关键告警、关键KPI性能指标等数据,实现性能基线管理,并为监控对象可视化展现提供数据支持。CMDB和RDB数据库统计经过资源唯一标识ID(UUID)实现一一对应,并能够自动维护其相互关联关系。 数据指标抽取(Bridge)负责从底层监控工具和第三方系统抽取各类管理数据,如资产配置数据、性能数据、监控对象运行状态数据、故障告警数据等。其中故障告警数据送到统一事件平台进行处理,性能和状态数据进过处理后存放到RDB数据库中,资产配置数据经过数据清洗、调和处理后送到CMDB数据库中。 统一事件平台负责对起源不一样告警信息进行过滤、压缩和关联,和对不一样起源性能数据进行规范、汇聚、分析等,并经过根源问题发觉等功效,实现快速故障定位,确保业务系统监控运行。 灵动展现平台是一个个性化监控视图开发工具,能够依据管理需求,对各类资源进行灵活组合,生成各类资源展现监控视图。 2.3.4 运行展现层 运行展现层有运维门户(Portal)、用户管理(ACM)、报表开发工具(Report)组成。 运维门户(portal):向用户提供基于WEB统一运维管理访问入口,使用户能够在统一登录、统一认证情况下,实现对故障告警台、服务台、服务步骤管理、监控视图、统计报表访问。 报表开发工具能够依据管理需要抽取监控、操作、资产、步骤等各管理层面数据,并生成各类统计报表,为运行分析和管理提升提供支持。 用户管理实现组织架构管理、帐户管理、角色管理、授权管理等功效,实现整个运维平台统一帐户和授权管理。 2.4 系统技术路线 2.4.1 采取Java语言开发 系统采取JAVA和XML相结合技术进行网站设计开发,因为Java平台无关等特征,而在数据表示和传输方面,XML有着得天独厚优势。Java和XML组合提供了建立三层应用程序最好手段,开发系统含有跨平台运行能力,不管在windows环境下还是在其它主流操作系统环境下全部能运行。关键特点: 平台独立性 这是Java最吸引人地方。因为它采取先编译成中间码(字节码),然后装载和校验,再解释成不一样机器码来实施,即“Java虚拟机”思想,“屏蔽”了具体“平台环境”特征要求,使得只要能支持Java虚拟机,就可运行多种Java程序。 面向对象技术 面向对象技术是多年来软件开发中用得最为普遍程序设计方法,它经过把客观事物进行分类组合、参数封装、用组员变量来描述对象性质、状态,而用方法(组员函数)来实现其行为和功效。面向对象技术含有继承性、封装性、多态性等众多特点,Java在保留这些优点基础上,又含有动态联编特征,更能发挥出面向对象优势。 多线程 多线程机制使应用程序能并行实施,Java有一套成熟同时原语,确保了对共享数据正确操作。经过使用多线程,程序设计者能够分别用不一样线程完成特定行为,而不需要采取全局事件循环机制,这么就很轻易实现网络上实时交互行为。 动态性 Java设计使它适合于一个不停发展环境。在类库中能够自由地加入新方法和实例变量而不会影响用户程序实施。而且Java经过接口来支持多重继承,使之比严格类继承含有更灵活方法和扩展性。 安全性 Java有建立在公共密钥技术基础上确实定技术,指示器语义改变将使应用程序不能再去访问以前数据结构或是私有数据,大多数病毒也就无法破坏数据。所以用Java能够结构出无病毒、安全系统。 2.4.2 采取J2EE框架 考虑到系统跨平台性和未来良好移植性,而且考虑到系统能够未来很好地和其它业务子系统集成,本系统采取J2EE平台,而且依据J2EE中间件规范进行产品开发,本系统采取J2EE平台集成标准中间件,并在数据交换和数据导出上支持XML标准。 平台比较 现在,可作为开放式数据应用集成规范和平台技术主流有两种,一个是微软企业Windows DNA平台,另一个是SUN企业J2EE平台。即使这两种集成平台和分布式计算技术全部能满足实施开放式数据应用集成需求,不过从规范开放性、支持异构性、可移植性、支持广泛性、对现有系统数据继承性和技术优势等方面比较, J2EE比Windows DNA含有优势。 平台优势 J2EE是一个利用Java 2平台来简化很多和多级企业处理方案开发、布署和管理相关复杂问题体系结构。J2EE技术基础就是关键Java平台或Java 2平台标准版,J2EE不仅巩固了标准版中很多优点,比如“编写一次、四处运行”特征、方便存取数据库JDBC API、CORBA技术和能够在Internet应用中保护数据安全模式等等,同时还提供了对 EJB(Enterprise JavaBeans)、Java Servlets API、JSP(Java Server Pages)和XML技术全方面支持,能够愈加好地和其它分布式应用系统集成。所以J2EE是一个更理想集成平台和规范。 2.4.3 采取WebService进行数据互连互通 Web服务是一个或一组应用程序,向外界提供一个能够经过Web进行调用API。Web服务关键目标是在现有多种异构平台基础上构筑一个通用和平台无关、语言无关技术层,多个不一样平台上应用依靠这个技术层来实施相互连接和集成。 1.Web服务模型 Web服务体系结构是基于三种角色之间交互,分别是服务提供者、服务注册中心和服务请求者。其中:(1)服务提供者:创建Web服务实体,为能实现一组特定任务软件提供服务接口;(2)服务请求者:发觉和调用软件服务,请求者通常会调用服务提供者公布远程方法,把参数数据发送给提供者并接收对应结果;(3)服务注册表:管理和公布服务。当服务请求者需要调用服务时,它首先到UDDI注册中心搜索该服务,得到怎样调用该服务信息,然后依据这些信息去调用服务提供者公布服务。在Web Service服务体系中,使用WSDL来描述服务,UDDI来公布、查找服务,而SOAP用来实施服务调用。下图显示了这些操作、提供这些操作组件及它们之间交互。 公布WSDL, UDDI 服务注册 服务请求者 服务提供者 服务描述 服务 服务描述 查找WSDL, UDDI 绑 定 2.Web服务相关标准 在Web服务协议栈中,包含了数据、消息、服务和注册库描述定义,这些要用到具体标准技术,包含XML、SOAP、WSDL、UDDI等。其中XML用来描述不一样层次数据,它使得不一样平台、不一样环境中数据和消息得以互通;SOAP协议用来交换XML消息;WSDL用来统一描述服务;UDDI提供了统一框架和编程接口,和WSDL、SOAP相互结合来管理Web服务,提供服务公布和服务发觉能力。 (1)扩展标识语言(XML) (2)简单对象访问协议(SOAP) (3)Web服务描述语言(WSDL) (4)统一描述、发觉和集成协议(UDDI) 3.Web服务协议栈 为了实现上述Web服务模型中公布、查找、绑定等操作,需要定义一系列分层协议规范。 服务发觉:这一层用来发觉Web服务,来满足自己需求。由UDDI来处理。 服务描述:对Web服务进行自我描述。它使用WSDL来进行服务描述。 服务调用:这一层实质是基于XML消息传输。目前基于XML消息传输行业标准是SOAP。SOAP是一个简单、轻量级基于XML机制,用于应用程序之间进行结构化数据交换。SOAP能够和多种网络协议相结合使用。当然我们能够使用其它基于XML消息如XML-RPC等。 传输层:用来传送用户端和服务器之间消息。这一层使用协议通常是HTTP协议。理论上,我们能够使用任何网络协议,如FTP,SMTP,IIOP等,但现在使用最广泛是HTTP协议 2.4.4 数据库技术 数据库(Database)是根据数据结构来组织、存放和管理数据仓库,它产生于距今五十年前,伴随信息技术和市场发展,尤其是二十世纪九十年代以后,数据管理不再仅仅是存放和管理数据,而转变成用户所需要多种数据管理方法。数据库有很多个类型,从最简单存放有多种数据表格到能够进行海量数据存放大型数据库系统全部在各个方面得到了广泛应用。 在选择数据库时,成本原因是关键要考虑问题。采取J2EE作为系统开发平台,在开发上使用ORM(Object/Relation Mapping)技术和JDBC技术,尽力去缩小数据差异性,实现跨数据库平台。系统数据库初步采取Oracle 11g。 2.4.5 性能控制 采取Jmeter做web系统压力测试,经过优化程序、优化数据库等方法实现系统性能要求。 2.4.6 开发、运行环境 操作系统支持:Linux、Window Server / 浏览器支持:IE6、IE7、IE8、Firefox 3.5 开发平台及语言: J2EE平台、采取JAVA语言 设计工具: ProwerDesigner 15.0 开发工具: Eclipse 3.1、Maven 3.0 版本控制: SVN 1.5 项目管理: Microsoft Project 缺点管理工具: Bugzilla 3.2 web测试工具: Jmeter 2.3、IETester 2.1 Web服务器支持: Weblogic 10.3、Tomcat 6.0 2.5 应用接口总体设计 IT系统监控管理平台在实现IT运维监控管理等信息采集、存放、处理、加工、传输、统计分析、应用、系统管理同时,和相关外部系统有着亲密联络,包含:基础运维管理工具、机房动力环境监控系统、ITSM系统、短信平台等系统有着紧密联络。 2.5.1 系统内部集成接口 (1)接口功效设计 本接口实现分级情况下支撑系统之间告警、性能等数据交互。 (2)接口实现设计 1)接口服务:利用应用支撑层数据交换接口服务来实现接口功效。 2)接口技术:Web Service、SOAP、文件、码流等。 2.5.2 和基础运维管理工具集成接口 (1)接口功效设计 该接口对基础运维管理工具网管、安管、主机管理、存放管理、机房动力环境监控等系统之间事件、性能、告警等关键数据进行抽取、汇聚,以支持对监控数据预警、统一展现。 (2)接口实现设计 1)接口服务:利用应用支撑层数据交换接口服务来实现接口功效。 2)接口技术:Web Service、SOAP、文件、码流等。 2.5.3 和ITSM系统集成接口 本接口实现IT系统监控管理平台和原有ITSM(运维服务管理)系统之间数据交互,满足监控数据实时抽取、汇总、预警、统一展现需求。 (1)接口功效设计 1)运维监控数据抽取、汇聚、展示 该接口对IT系统监控管理平台网络监测和管理、业务系统监测告警、性能等关键数据进行抽取、汇总、预警、统一展现。 2)生成基于故障告警事件信息故障工单信息 ITSM系统依据IT系统监控管理平台所产生故障告警事件信息自动生成对应故障工单信息。 3)故障工单数据和处理状态同时 该接口辅助两边系统保持故障工单数据和处理状态同时。 (2)接口实现设计 1)接口服务:利用应用支撑层数据交换接口服务来实现接口功效。 2)接口技术:Web Service、SOAP、文件、码流等。 2.5.4 和相关外部系统统一身份认证和单点登录接口 本系统将对IT系统监控管理平台和基础运维管理工具、ITSM系统、机房动力环境监控系统等相关外部系统进行门户集成,从而在统一运维管理门户中实现这些系统统一身份认证和单点登录,形成统一运维管理运行机制,从而有效集成并利用各类运维管理资源。 1)统一身份认证:对IT系统监控管理平台和基础运维管理工具、ITSM系统、机房动力环境监控系统等相关外部系统用户进行管理集成,纳入到统一运维管理门户访问控制体系中,实现对IT系统监控管理平台用户统一身份认证。 2)单点登录:对IT系统监控管理平台各模块,和该系统和基础运维管理工具、ITSM系统、机房动力环境监控系统等相关外部系统在统一运维管理门户中单点登录控制,使用户登录一次便可访问全部授权应用资源。 2.6 系统安全设计及布署 采取Web技术实现,在含有方便实用优点同时,存在部分安全威胁和隐患,在系统平台上构建应用时应充足考虑以下安全问题。 在系统平台设计时充足考虑下列安全问题: 脚本语言安全性问题,尤其是用SQL查询时所书写语句。 访问文件、数据库或其它网络连接时不应该接收未经检验用户输入。 2.6.1 输入检验 输入检验包含对来自外部数据源(非置信数据源)数据进行语法检验,有时还要进行语义检验。依据应用关键程度和其它原因,对输入检验结果采取安全过滤处理。 2.6.2 GET请求和Cookie中敏感数据 就像CGI协议所定义,把请求数据从用户端传输到服务器端最简单方法是GET请求方法。假如要在用户请求中传输敏感数据,我们应该使用POST方法,再加上一个适宜加密机制(比如,经过SSL连接)。 2.6.3 防经过嵌入标识实现攻击 这种攻击通常包含一个由用户提交病态脚本,或包含恶意HTML(或XML)标识,JSP引擎会把这些内容引入到动态生成页面。这种攻击可能针对其它用户进行,也可能针对服务器。要预防出现这种问题要靠输入检验和输出过滤。 2.6.4 防口令猜测功效 当用户试图数次猜测时,系统会不停增加响应时延,并最终拒绝为用户提供服务。另外,提议对系统口令长度加以限制,而且不能取尤其熟悉单词,深入提升猜中难度。 2.6.5 页面和字段级权限控制 在提议系统中,我们将在每一个页面中包含权限检验代码,检验用户是否有权限访问该页面。假如没有权限(如通常见户访问系统管理页面),则转到错误信息页面。假如没有登录,则转到系统登录界面,请求用户登录。 另外,还能够结合平台安全控制能力,使系统安全性深入增强。对于一些复杂页面,需施加字段级安全控制,使得一些字段只有含有权限人才能察看或修改,为应用程序提供愈加细粒度安全控制。 2.6.6 系统安全架构 从安全方针策略、信息安全管理、用户行为安全、数据信息安全、应用系统安全、系统平台安全、网络平台安全、物理环境安全等多个方面给予计划考虑,并和行业相关信息系统安全体系建设要求亲密结合。 以完整安全体系结构模型为依据,确保整个安全体系完备性、合理性和适应性,为提供全方面、多方位和合理安全服务,切实满足各方面各层次安全需求,在合理代价下将多种安全风险降低到能够接收水平,最终达成确保正常可靠运行和使用目标。 第3章 系统功效设计 3.1 动环监控 3.1.1 配电柜监测 3.1.1.1 监控对象 各楼层市电输入柜、其它配电柜。 3.1.1.2 监控实现 每一个串口总线回路配电柜电量采集设备采取手拉手接法将 监控信号接起来连至区域汇总采集箱,最终接至监控主机。监控主机经过实时不间断轮询采集将信息传送给监控平台进行显示、报警。 3.1.1.3 监控性能 实时监测配电柜输出相电压、电流、频率、最大千伏安、输出功率(有功、无功、视在)、谐波率、功率原因等;监测输出电压、电流、频率超限,过载,负载不平衡,交流电源失效等告警信息,监测到报警时主系统发出报警。 3.1.2 配电开关及电流监控 3.1.2.1 监控对象 配电柜开关、输出配电柜支路电流。 3.1.2.2 监控实现 将每一个串口总线回路配电柜开关及电流采集设备采取手拉手 接法将监控信号接起来连至区域汇总采集箱,最终接至监控主机。监控主机经过实时不间断轮询采集将信息传送给监控平台进行显示、报警。 3.1.2.3 监控性能 经过配电柜厂家提供协议,实时监测配电开关状态及各路开关 电流值。实时判定开关是否跳闸及各路电源负载情况,当开关跳闸或负载越限时,系统诊疗为有故障(报警)事件发生,监控主系统发出报警。 3.1.3 发电机监控 3.1.3.1 监控对象 发电机。 3.1.3.2 监控实现 设备已经带有串行接口。将发电机组分为两组,每组智能接口采取手拉手接法将监控信号接起来连至区域汇总采集箱,最终接至监控主机。监控主机经过实时不间断轮询采集将信息传送给监控平台进行显示、报警。 3.1.3.3 监控性能 实时显示并保留各发电机通讯协议所提供能远程监测运行参数和各部件状态。实时判定发电机部件是否发生报警,当发电机某部件发生故障或越限时,监控主系统发出报警。实时监测内容包含:输出相电压、输出相 电流、功率、油压、水压等;电池是否充电、电池工作模式、系统报警等。 3.1.4 ATS监测 3.1.4.1 监控对象 ATS 柜。 3.1.4.2 监控实现 设备已经带有串行接口。按楼层、房间划分区域,将每一个房间内 ATS 采取手拉手接法将监控信号接起来连至区域汇总采集箱,最终接至监控主机。监控主机经过实时不间断轮询采集将信息传送给监控平台进行显示、 报警。 3.1.4.3 监控性能 实时显示 ATS 柜两路输入三相电压、频率、相序、切换开关位置及告警状态等。设定告警条件,当监测超出设定许可值时,系统诊疗为有故障(报警)事件发生,监控主系统发出报警。 3.1.5 STS监测 3.1.5.1 监控对象 STS 柜。 3.1.5.2 监控实现 设备已经带有串行接口。按楼层划分区域,将每个楼层内 STS 采取手拉手接法将监控信号接起来连至区域汇总采集箱,最终接至监控主机。 监控主机经过实时不间断轮询采集将信息传送给监控平台进行显示、报警。 3.1.5.3 监控性能 实时显示 STS 柜三相电压、频率、功率、电能、负载率、旁路状 态、开关状态及告警状态等。设定告警条件,当监测超出设定许可值时,系统 诊疗为有故障(报警)事件发生,监控主系统发出报警。 3.1.6 UPS监控子系统 3.1.6.1 监控对象 UPS。 3.1.6.2 监控实现 设备已经带有串行接口。将每一个串口总线回路 UPS 智能接口 采取手拉手接法将监控信号接起来连至区域汇总采集箱,最终接至监控主机。 监控主机经过实时不间断轮询采集将信息传送给监控平台进行显示、报警。 3.1.6.3 监控性能 实时监测各 UPS 通讯协议所提供能远程监测运行参数和各部 件状态。实时判定 UPS 部件是否发生报警,当 UPS 某部件发生故障或越限时, 监控主系统发出报警通知。实时监测内容包含:输入相电压,输出相电压,旁路 相电压,输入相电流,输出相电流,旁路相电流,电池电压,电池电流,输出频 率,系统负载,电池充电程度,电池后备时间等,过载,电池工作模式,旁路工 作模式,电池电压高/低,系统报警,整流器报警,逆变器报警,系统关机,旁 路电压超限等。 3.2 统一门户子系统 提供一个统一综合运维平台入口,将使运维人员能够基于统一整合管理界面,进行运维管理信息查看和相关操作: 1) 用户管理:实现用户集中管理、单点登陆功效;可为每个不一样角色提供不一样功效模块,用户经过统一登录页面进入系统,访问权限范围内功效模块。 2) 门户展现:提供基于WEB灵活多样信息公布形式,将各功效(如监控、步骤、知识库)产生管理信息进行统一公布。改善运维人员使用体验,提升日常运维管理效率。 3) 门户管理:提供动态灵活展现模型编辑工具,用户可根据本身需要随意拖动并保留最终布局。 3.2.1 信息主管领导内容展示 1) 运行维护统计报表,资源监控统计报表。 2) 重大故障信息、升级来故障信息展示。 3) 关键业务系统拓扑展现。 4) 主管领导其它展示需求。 3.2.2 运维人员内容展现 1) 门户针对不一样小组(如:网络、业务、安全等),展示不一样管理内容和操作配置界面,如网络维护人员查看网络web拓扑;业务系统维护人员查看业务系统拓扑;安全管理员查看安全系统拓扑;机房管理人员查看机房方位图进行监控。监控图除了能够反应设备状态外,还实时反应监控到事件,在拓扑图上监控到事件根据设备进行归类。 2) 各组维护人员能够查看自己类别知识库统计,能够经过事件查看关联到知识库统计,也能够直接经过搜索关键字来查找知识库统计。 3) 在维护人员登录界面,醒目标位置提供公告信息。 4) 维护人员处理事件时,展现维护界面,维护界面包含维护人、维护时间、维护设备、事件内容、维护过程、维护结果、是否处理、转发给第三人处理等等,对事件处理完成后能够对事件置状态,表示事件已经处理完成,在维护人员事件处理窗口,维护人员能够以灰色显示或不显示。 3.2.3 通常见户内容展现 1) 提交设备、业务系统服务请求,能够跟踪服务请求处理进度。 2) 能够检索知识库,能够自助处理问题,查询知识库能够根据关键字进行查询,显示知识库编码、专题、故障现象、处理方法、联络人等内容。 3) 能够查询历史服务请求统计。 4) 在一般用户登录界面,在醒目标位置提供系统公告信息。 3.3 IT运行监控子系统 IT运行监控系统功效包含故障、性能、配置等基础功效,和面向网络设备、主机、存放、数据库、中间件、基础应用、IP地址、信息点等监控管理功效。针对以上各个功效模块具体说明以下: 3.3.1 基础平台功效 (1) 故障管理 故障管理关键实现对IT资源故障监视功效,包含对告警信息进行采集、配置、处理、展现及相关统计分析等功效。经过故障管理功效,用户可对网络中告警进行实时监控,对告警信息进行处理和查询统计等相关操作。系统提供了故障智能诊疗功效,经过此功效,用户能够对网络中故障进行实时监控,提升故障发觉、故障处理效率,减小故障对网络造成影响,愈加有效保障网络安全运行;在故障诊疗基础上,系统提供网络预警功效,经过对现有网络进行性能分析,依据预先设定门限值,以预警形式进行提醒,使网络维护工作由被动转为主动,从而实现网络运行维护高级管理功效。故障管理应包含以下功效。 另外,故障管理支持对Unix、liunx、Windows服务器、多种网络设备syslog关键字告警功效,能够自定义日志消息告警关键字,一旦在日志消息中发觉有自定义关键字,如Interface Down、UP等关键字,可经过告警快速通知运维人员进行处理。 (2) 配置管理 IT运行监控系统提供参数化配置功效,如配置历史数据在系统中保留期限等,提供对系统资源配置管理功效。 本系统配置数据采集支持自动采集、手工采集和数据导入等三种方法。 配置数据管理关键包含: 配置基础信息:包含配置内部标识、名称、类型、IP地址、物理地址、厂商等基础信息; 配置管理信息:包含配置管理分类、用途分类、管理部门、管理人、安装位置、购置时间、终止使用时间等; 配置属性信息:配置附加配置属性,不一样类型配置配置属性有所不一样,比如网络设备固件版本、设备模块组成、端口种类、服务器操作系统类型、硬件配置、存放设备、软件配置Licence、服务端口、模块组成等; 配置维护信息:包含资产编号、资产责任人,资产集成商,和产品支持厂商、目前质保期、历次故障统计、历次购保统计、历次维护统计,为资产维护提供数据支持。对于立即过保设备配置进行告警通知。 (3) 性能管理 IT运行监控系统性能数据处理和分析功效,提供了用户立即发觉关键点异常情况,从而有效保障系统正常运行,并为分析优化工作提供必需依据。 本系统支持多个协议、标准和接口方法采集多种性能数据,如SNMP、Agent、Telnet、JDBC、FTP、CORBA等。性能数据采集处理能够支持以下2种方法: 定时模式:采取循环定时主动式采集,定时时间间隔可配置;系统对性能数据进行数据库保留,保留时间可定制;系统采集到性能数据能够依据配置定义,以多个方法进行显示。实现对数据定时采集和展现。 实时模式:由使用者经过界面操作,有针对性地(选择对象、数据内容等)对被管对象性能数据进行即时主动采集,取得对象目前性能数据,采集数据立即送回用户界面,由用户界面处理。 3.3.2 网络设备管理 (1) 设备自动发觉 系统支持思科、华三、华为、北电、锐捷、迈普等业界主流厂商网络设备自动发觉和性能采集,系统经过SNMP、ICMP、ARP等协议自动发觉设备基础信息、设备接口配置信息、设备之间物理连接关系等,对于不一样厂商不一样型号设备,系统可自动标识不一样图标。对于无法自动识别生产厂家及产品类型网络,提供手工方法加以定义。对于网络设备提供设备面板视图管理。 系统支持SNMP V1、V2、V3拓扑自动发觉功效,对于不支持SNMP设备,提供经过telnet方法,进行拓扑发觉。对于路由时延、抖动等异常情况监控和告警,提供路由监测功效,可由监控管理系统自动计算出任意两点间最短路径。采集指标包含支持网络设备CPU利用率、内存利用率、网络端口吞吐量和丢包率、接收和发送ICMP包率,端口ARP包率、单播包率、出入带宽利用率、出入丢包率、出入错包率、出入
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 通信科技 > 监控/监视

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服