1、用户IT管理规划方案建议书中国惠普有限公司二二四年五月目 录第一章 管理需求分析与方案设计311管理需求分析312 方案设计原则6第二章 用户IT管理方案821系统管理结构822 分级管理、集中监控923 管理功能具体实现112.3.1 网络拓扑管理112.3.2 网络故障管理152.3.3 网络性能管理192.3.4 网络故障诊断212.3.5 Internet服务管理252.3.6 系统事件管理262.3.7 系统性能管理272.3.8 数据库管理292.3.9配置管理332.3.9报表管理372.3.10服务流程管理3924总结42第三章 项目实施与服务4231 概述4232 管理功能的
2、实施方案43项目实施组人员组织结构43项目实施管理47项目实施进度安排4933 技术支持服务5234 保修期内软件支持与维护服务54第四章 产品培训5641 培训方案特点综述5742 培训实施计划5743 培训质量控制5844 课程介绍59第五章 产品模块配置及被管设备要求63第一章 管理需求分析与方案设计11管理需求分析用户的IT建设经过持续的投入,基础设施已经颇具规模,管理的需求日益迫切,现在的具体情况如下:具体情况分析说明我们通过用户的专家与技术人员的交流沟通,认为当前的IT管理需求突出在以下几方面:网络管理拓扑管理:对各种类型的网络设备、网络链路进行必要的监控,实现对全国范围网络的有效
3、管理,包括拓扑的自动发现,设备状态的监控,资源信息的汇总管理等。故障管理:收集网络设备、网络链路的故障,并可通过定制的过滤策略实现对故障的管理,同时,可形成历史记录供今后管理员参考故障再次发生时的解决方法。如条件允许,可建立帮助台系统,对故障解决进行流程化管理。性能管理:实时监控网络设备的各性能状态,并采集网络设备性能数据、网络接口流量、网络链路延时等性能参数、并形成历史记录,供分析和上报使用。2)系统管理系统事件管理:对服务器的运行状况进行监控,使系统管理人员及时了解服务器的重要资源和参数运行状况,出现故障时迅速报警,并可自动采取措施排除故障,保证关键服务器的可用性和可靠性。系统性能管理:能
4、够实时连续的收集主机系统和网络系统运行的相关数据,以图形、图表等方式显示主机系统的运行状况,并可形成历史数据记录,供趋势分析使用。数据库管理:对数据库的资源使用进行监控,对资源的溢出提前报警,并对数据库的性能指标进行采集,并形成相应的统计图表,供性能监测和趋势分析使用,对数据库的日志进行有效监控,出现异常时及时报警。提供数据库管理工具,可从管理工作站对数据库进行管理操作。配置管理:管理了软件和其它数字资产的整个生命周期,其中数字资产包括:操作系统、补丁、应用、目录、个性化设置、用户权限(用户在PC、Server、无线设备、ATM、POS等设备上面的权限)。报表管理:对网络的资产信息,网络的故障
5、信息,网络设备的性能信息按时间、设备、用户自动形成相应报表,提供各种统计方式,供分析报告使用。互联网服务管理:对提供的WWW、EMAIL、FTP、SMTP、POP3等相关协议进行监控管理,提供其可用性。3)IT服务综合管理事件管理(Incident Management):对用户提请的、或者由网络系统管理软件发现而自动提请的事件进行有效的管理,使出现的网络故障能够快速的解决,并形成规范流程,为以后的出现的类似问题提供有力的参考。同时,形成知识库,使其它用户可方便的进行查询,提高解决问题的效率。配置管理(Configuration Management):对整个网络环境的资产进行统计,并对其更新
6、变更进行记录,为处理问题,系统变更提供基础的支持。变更管理(Change Management):当计算机环境需要相应的变化时,控制、监视、记录变化过程,将变化对本行业务的影响控制在最小。通过网管工具及管理流程的使用,实现对系统变更的控制。服务等级管理(Service Level Management):网络系统对于其它部门而言,是提供的一种服务,服务等级管理可记录所有的服务水平协议,相应的维护合同以及支持的时间等等。例如,在录入服务请求(Service Call)时,可自然地根据请求的相关信息,如用户号、请求时间、相关资产等,联系相应的服务水平协议,设置服务的优先等级;最后计算服务的完成时间
7、,评价服务水平状况。对于用户计算机网络系统的管理是一项复杂的系统工程,要根据当前的网络现状和今后发展的实际情况,对实现功能、实现步骤进行科学的规划,从而达到管理需求,满足用户计算机网络系统的正常运行。12 方案设计原则网络及系统管理系统将成为用户信息系统企业级系统管理平台,为信息系统整个计算机系统及业务应用提供全面的和高效的管理和监控。 HP公司在进行设计时将充分考虑以下原则:集成性:提供的统一管理平台工具,可以对信息系统中所有的资源:包括网络设备、服务器、客户机、数据库、应用软件等进行集中统一的管理。这包括统一的管理界面,集中的数据分析、报表生成和事件处理等。企业级的系统管理软件应该对系统内
8、的被管理对象、管理功能提供一致的管理平台和管理规范。管理员可通过系统管理软件提供的统一界面,在管理中心完成对分布式、跨平台、跨系统的网络、服务器/客户机、数据库、应用软件的集中和集成管理。提供针对IT系统综合故障处理能力,包括整个计算机系统所发生的网络SNMP事件、系统事件、数据库事件、应用事件等的收集及自动响应能力,包括对整个信息系统中所发生故障类型的判断、故障处理人员的指定、故障处理过程的记录及解决方案知识库的生成,为信息系统提供一套完善的故障分析、处理及查询系统。兼容性: 由于信息系统是一个环境复杂,多系统、多数据库和多应用平台,多厂商网络的复杂管理环境,而且信息系统的网络环境随业务发展
9、不断扩大。没有那一家供应商能够满足大型IT机构的所有管理需求, 实际上,多数IT机构只能采用来自多家供应商的产品和服务,才能实现他们所需的灵活性和全部的功能性。为此,具有集成已有的或将来的管理软件的能力是必需的。管理软件能够提供标准的和开放的应用接口及开发工具,以便集成现有的管理软件和将来的管理软件。系统管理软件需具有广泛的第三方硬件、软件厂商的合作及支持,随IT技术发展不断吸收新的管理技术。企业级系统管理软件必须适合当今企业复杂的计算机系统,能够完整实现跨平台、跨系统地端对端节点管理;支持多种局域网、广域网协议(如TCPIP、DDN、X.25、Frame Relay、ATM),管理桌面机、工
10、作站、NT、UNIX(HPUX、Solaris、IBM AIX、SGI IRIX、Windows NT、Linux等)等客户机/服务器平台,支持主流关系数据库系统(ORALCE、SYBASE、INFORMIX等) 以及Lotus Domino/Notes、 Microsoft IIS及Netscape 等多种应用系统。安全性: 企业级IT管理系统应建在相对安全、可靠的平台之上,确保其稳定和高效性。由于增加了安全管理设置,必将一定程度上影响网络和系统的性能,包括对网络传输速率的影响,对系统本身资源的消耗等。因此需要平衡利弊,提出最为适当的IT管理系统解决方案,建议尽量降低对原有网络、系统性能的影
11、响。要求增加的管理系统应不影响现有系统的正常运行,也不能对现有应用系统提出太多的限制,更不能对应用程序造成破坏,在项目设计和实施过程中,不能因为新增软件的存在而影响到整个网络和应用的正常运行。企业级系统管理软件不仅要管理系统中的安全问题(和安全产品集成),更应保障管理信息本身的安全。先进性:在构建庞大的企业级IT管理体系时,不仅仅要注重解决用户在IT管理中实际存在的问题,而且解决问题的流程必须有完整而且标准的规范,这样才能面向未来,实施有针对性的按服务等级解决问题,提高对最终用户的服务质量,增加IT内部员工工作的满意度,并能降低个别“高手”的流失对整个IT管理的影响。可扩性: 企业级系统管理软
12、件应有很强的扩充性和扩展性,用户可根据当前系统状况灵活选取所需模块,当系统或管理任务增加时可通过选取新的功能模块简单完成管理功能的扩张,而无需更改放弃原来已有的系统管理软件,保护已有的投资。另系统管理软件还需符合信息系统实际的管理结构及业务的运行规则,如实现系统内的分层次管理、分角色管理等。简单易用、界面友好:系统管理员可通过简单易用的图形界面,用鼠标拖拉对象就可完成各种系统资源的复杂管理工作,不必去记不同平台、不同系统上的复杂操作命令,降低管理难度和管理工作量。同时简单易用的图形界面使用户易于掌握,能快速实施系统管理任务。面向业务服务的IT资源管理一方面IT系统对于核心业务起着决定性的作用,
13、因此IT服务的可用性以及服务的质量越来越引起重视,基于服务等级协议SLA(Service Level Agreement)的要求越来越迫切;另一方面,IT系统所面对的管理工作的范围也越来越大,从核心的网络、服务器、应用系统到桌面系统和移动终端。从而IT服务部门的组织结构也随之扩大,明确的人员职责分配和标准流程的设置成为势在必行的要求。企业级系统管理软件不仅要管理信息系统企业网中复杂的计算环境,更重要的帮助用户从业务管理的角度管理IT环境。如在管理过程中,构造与业务相关的观察视图或报告,描述组成服务的各组件的关系,及其对服务的影响级别;帮助分析计算机资源的使用情况,及时反映影响业务正常运行的故障
14、,提供真正的面向业务管理的解决方案。第二章 用户IT管理方案21系统管理结构2.1.1全用户网络管理结构用户全局网络拓扑结构为树型结构。其中广域网组成一级骨干网,总厂和分厂各有自己的局域网。对于这样一个地域分布广的网络,单靠管理中心的单点管理是很难满足对全网进行有效监控的需求的。因此,必须进行有效的划分,通过合理的配置,实现管理的要求。根据以上实际情况,我们建议在用户通过HP OpenView的分布式管理实现其管理需求;同时,本着节省投资的原则建议如下:1)总厂中心建立网络系统综合管理平台总厂中心建立网络系统综合管理平台,实现对网络系统的综合管理,包括网络资源管理、网络故障管理、网络性能管理、
15、系统事件管理、系统性能管理、数据库管理、报表管理等管理工作,实现对全国的骨干网络监控和总厂中心主机的监控。考虑到其为全国的管理中心,配置为管理工作站或中端服务器,及相应Windows报表工作站。2)各省建立分管理平台建议主要在各分厂建立分管理平台,实现对各分厂的网络管理,监控各分厂的网络运行。本着节省投资的原则,同时根据HP公司网络管理实施的经验,可作如下考虑:为了节省投资,建议使用Windows工作站实现对各分厂的网络管理。其管理结构如下图所示:总厂综合网络管理平台分厂网络管理平台分厂网络管理平台22 分级管理、集中监控中心的管理平台和各分厂的管理工作站分工协作,结构分明,其主要特点和实现的
16、功能如下:拓扑上传:各分厂管理各分厂的网络结构、网络设备的状态设置为定期上传到中心管理平台,这样,中心管理工作站不必要对各分厂的网络设备进行轮询监测,而是通过分管理平台的管理,而获得汇总的网络设备状态。这样可大大节省网络带宽的占用。同时各地的管理工作主要由各地进行,中心进行集中监控,从而实现对全网网络拓扑、网络设备状态的监控。事件上传:各分厂的网络故障主要由各分厂本地进行管理,同时对于重要的网络故障,设置上报到总厂中心管理平台。这样,一般的故障事件由本地人员处理,职责明确;重要事件汇报到总厂网管中心,重要故障和事件总厂网管中心可以监控到,从而可以协助本地网管人员进行管理。同时,总厂管理中心对各
17、分厂起到监控作用。数据上传:对于本地的网络性能数据和网络链路数据由各分厂进行采集,并可通过本地报表工具进行统计分析;同时可设置相应策略对各分厂的网络性能数据定期汇总到总管理中心,由管理中心生成所需要的全网范围的管理报表。同时各分厂的资产信息,事件信息也可汇总到总管理中心,由管理中心汇总处理。2.2.2 分权管理,明确职责对于各种管理工作和众多的管理设备,需要不同的管理员进行分工合作的管理。为了满足不同的管理员操作需求,可设置多种权限(管理员、操作员、监控员),多种方式的客户端设置(仿真终端、JAVA 终端、Web登录),HP OpenView支持多种客户端方式实现监控,主要如下所示:UNIX管
18、理站直接登录管理:全面管理功能,实现各方面管理设置X WINDOWS模拟登录:实现全面管理,便于管理员操作NT/2000客户端:网络管理终端,程序运行于本地,读取管理站数据,保证效率,方便操作。JAVA Console: 全面事件监控,集中调用不同管理工具。Web登录:方便管理员远程登录监控。同时,不同管理员可设置不同管理权限,不同管理员登录后,监测到的管理界面不同,实现的管理功能不同,使用的菜单不同。其管理结构如下图所示: 23 管理功能具体实现从用户本期网管的具体需求出发,主要在网络拓扑管理、网络故障管理、网络性能管理、系统故障管理、系统性能管理、数据库管理、报表管理等几方面,HP Ope
19、nView在以上几方面均可出色的满足其需求,具体如下。 2.3.1 网络拓扑管理建议采用OpenView Operation(包含 Network Node Manager)完成拓扑管理功能。用户网络是一个复杂的、分布式网络结构,单靠人工进行管理是很难了解整个网络系统配置及分布的,当前的网络系统中都有哪些节点,它们运行状态如何,有哪些是新增加的节点,是否有非法节点加入等都是难于解决的问题。OpenView Network Node Manager的自动发现和监控机制能够发现网络节点 (包括路由器,交换机和第二层的交换设备如网桥等),检测网络网络连接,生成和保持TCP/IP网络图,通过色彩确定网
20、络设备的运行状态,使用 OpenView Windows 的Pan和Zoom的功能在保持总图象的同时将视点着重于大型子图的关键区域。 通过MIB浏览器了解外围设备的工作状况,对不能监视的外设,可通过在被管节点上扩展SNMP子代理,在管理站上装载其MIB的方式对其进行监视。使用预定义的MIB应用或创建MIB查询应用监视网络连接的通信速率,信息流量等。OpenView Network Node Manager的这种特点使得具有多厂家系统平台、网络、计算机等复杂环境的管理变得更加真实、直观和简便。通过相应客户化工作,可对网络拓扑视图进行规划处理,可形成和物理地区一致的网络拓扑节点结构。可如图所示:1
21、)网络拓扑生成OpenView Network Node Manager可以发现网络上的TCP/IP、和Level2设备,支持 DHCP (动态主机配置协议), 并将这些信息以直观的图形格式表示出来 (Level2发现功能包括支持Bridge、Repeater/802.3、或者MAU MIBs的设备) 。Network Node Manager持续地监控网络上新的设备和网络设备状态。发现和监控功能还可以探测到位于广域网上的设备。OpenView Network Node Manager可以动态地自动更新网络拓扑图和事件信息。网络拓扑是以图形或者表格的格式表现的,提供了最大程度的灵活性。另外,S
22、NMP Data Presenter令用户可以查询网络的SNMP数据,例如接口流量、CPU负荷或者通讯路由(traffic routing)等,以帮助进行网络诊断和计划。OpenView Network Node Manager对于所搜集到的信息具有简化功能,提供发现过滤,拓扑过滤,图象过滤功能,使企业可以根据自己的需要,选择要发现监控的对象,定制MAP的显示内容,通过这些功能可以减少网络流量的负担,更能让管理人员集中注意力于重要和密切关心的网络部分。OpenView Network Node Manager支持Cisco Discovery Protocol (CDP View) , 可以形
23、成针对Cisco 设备的拓扑结构图。并可方便的查询Cisco 设备的配置信息,包括Cisco 设备中的VLAN设置,以及和此设备连接的设备信息。OpenView Network Node Manager提供强大的过滤功能 (Node View) ,可根据节点的类型,设备的厂家,网段的划分以及当前节点的状态进行过滤显示, 从而帮助管理员更好的了解所管理的网络,更快的发现问题。同时,NNM的扩展功能提供更多的拓扑视图,对网络环境进行更为细化的拓扑管理。主要包括:物理连接视图:真实表现网络设备物理连接VLAN视图:表现VLAN划分的详细信息OSPF视图:表现OSPF域及相关路由设备视图动态过滤视图:
24、当前指定设备的动态视图网络路径视图:端到端网络设备路径视图等等通过使用NNM,我们可以实现正确表示用户全国骨干网的以及各个分厂的网络拓扑图,真实反映网络的实际连接状况,实现全国和分厂骨干网的主副链路拓扑图和拨号网络拓扑图,建议将主要网络设备的Trap指向各个网管机,这样可以在第一时间获取网络设备的信息,实时监控这些网络设备的状态。2)图形用户界面OpenView Network Node Manager的图形用户界面操作方便,易于配置和使用。大多数的管理功能均可以通过鼠标的点击和拖放操作完成。从OpenView Network Node Manager主管理界面的菜单能够调用所有管理工具。Op
25、enView Network Node Manager支持管理员根据自己的使用习惯对管理界面进行客户化,设置过滤器屏蔽不关心的网段和节点,将最常关心的网段和节点添加到特定文件夹,以及向拓扑图中加入背景地图等。OpenView Network Node Manager的Pan和Zoom的功能使用户在保持对网络拓扑结构的总体把握的同时也能够将视点着重于的关键区域。OpenView Network Node Manager支持Java界面,允许管理员通过Web浏览方式远程登录网络管理系统。当通过Web方式执行管理任务时,采用SSL协议保证管理数据传输的安全性。OpenView Network Nod
26、e Manager支持管理员根据自己的使用习惯对管理界面进行客户化,设置过滤器屏蔽不关心的网段和节点,将最常关心的网段和节点添加到特定文件夹,以及向拓扑图中加入背景地图等。OpenView Network Node Manager是事实上的网络管理平台标准。目前有超过300种第三方管理软件支持与OpenView Network Node Manager进行紧密集成。OpenView Network Node Manager可以与集成的第三方管理软件之间能够方便地进行管理界面的切换。在NNM的网络拓扑结构图中能够直接进行管理对象的定位,并通过菜单等方式调用第三方管理软件,实现对特定网络设备或其它
27、管理对象进行深入的监控和配置,扩展了OpenView Network Node Manager的管理功能。第三方管理软件所收集的信息均能够在OpenView Network Node Manager中进行统一管理。管理对象的状态变化能够在OpenView Network Node Manager的网络拓扑结构图中通过颜色变化等方式表示。第三方管理软件所收集的事件和消息能够集中到OpenView Network Node Manager的警告浏览器(Alarm Browser),并与OpenView Network Node Manager自身所收集的事件一起通过事件分组、分级、自动处理及事件关
28、联等机制进行统一管理。OpenView Network Node Manager也提供完整的应用开发接口(API),允许用户针对自己的特殊功能要求进行二次开发。 2.3.2 网络故障管理建议采用 OpenView Operations(包含 Network Node Manager)实现其故障管理。2.3.2.1 网络设备故障监控对网络故障的监控分为主动轮询和接收Trap方式,OpenView可通过相应设置实现所有基于SNMP的网络事件的监控。同时,对于网络设备的故障及各种信息的变更都会记录在syslog中,所以对于syslog的监控也是保证网络正常运行的关键。1)Trap事件和轮询事件NNM
29、可对所有SNMP的trap事件进行收集和显示,同时可设置相应的轮询时间对相应网络的连接进行监控和报警。其中,对于主流的网络设备NNM已经提供了完备的MIB库和事件对照,对于特殊的网络设备,可加载相应的MIB库并设置相应报警。主要基本报警举例如下:线路故障的中断报警。线路达到一定门限值的性能报警。逻辑链路(PVC)的中断报警。逻辑链路达到一定门限值的性能报警。网络设备板卡、端口的硬件故障报警。网络设备的CPU、内存、端口流量达到一定门限值的性能报警。网络协议、应用端口(UCP、TCP)严重超出正常流量的报警。2)报警的关联与方式OpenView Operation网络管理解决方案提供了强大的网络
30、故障处理功能。OpenView Operation能对设备和链路运行状态进行监测,设置相应参数的阈值,当某个参数超过阈值时能自动报警;系统提供自动的事件关联功能,使用户可迅速定位产生故障的根本原因;当网络中路由器,交换机等主要网络设备的某一事件发生时,能根据预先定义的操作自动执行以排除故障或响应网络设置的变化,并以email或BB机等各种方式通知网络管理人员。3)直观的事件发现和表示OpenView Operation运行后能自动对网络进行监测,自动轮询网络状态,搜集网络中的故障和报警信息。网络中的故障和报警事件显示在统一的浏览器窗口中,并根据报警事件的重要级别分为五种颜色显示,用户可以很直观
31、地了解报警事件的紧要性。同时显示出事件的来源、时间和相关的信息,以帮助管理人员深入了解报警事件。对于数值型的网络参数,用户可以自行设定相应的阈值及对应的报警级别。用户设定的报警与Openview自行产生的报警同样显示在统一的报警窗口中。另外用户可以设定报警过滤器和排列顺序,以集中精力于重要的网络报警事件。4)事件关联功能使得问题得到更快的解决事件关联技术使得当故障发生时,网管人员能够更快地定位原因、排除故障。通过高级事件关联引擎,OpenView可以更快地识别故障。这个引擎将把事件与高层次报警关联起来,并立即查找网络故障的根本原因。深入分析(drill-down)功能令网络管理人员能够看到与每
32、一个报警有关的所有事件。事先定义好的关联逻辑已包含一些常见的网络故障管理,例如:连接设备失效,定期的维护,重复的网络报警、成对的报警事件等关联逻辑。预先定义的关联逻辑是基于最新的网络信息,使得网络轮巡效率更高。2.3.2.2 故障事件的统一处理1)完整的事件管理OpenView Operation综合事件管理可以对网络设备发出的SNMP Trap,syslog的事件信息、主动轮询的事件进行全面的管理监控。2)事件的集中管理可以通过定义对事件传递进行重定向,把所有或某一类事件转发到特定的事件主控台,从而实现以统一界面集中管理事件。用户可以在事件主控台上看到所收到得事件的发送源系统名,用户名等详细
33、信息。事件主控台的设置有很强的灵活性,可根据用户的不同要求而改变,以适应用户业务的需要。3)事件的过滤与分类可以通过定义对事件主控台所收到的事件进行过滤,只显示用户所关心的信息,同时可对所显示信息进一步分类,对不同级别的事件信息以不同的颜色表示。通过这种方法可以提高系统操作员的工作效率,增强系统的可维护性。4)事件的自动处理OpenView事件管理可以定义事件触发器, 当主控台收到某一条或一组特定事件信息时, 系统自动执行一组动作 (Action) ,这组动作可包括发送一条报警信息,执行一个命令,启动一个进程或一个批处理业等。如监视用户的网络设备运行参数超标,可执行相应命令触发相应报警方式,通
34、知管理员。5)与第三方厂商的管理软件相集成OpenView的事件管理支持标准的SNMP协议,可接收第三方厂商的管理软件所发送的符合SNMP标准的事件信息,从而实现与第三方厂商的管理软件相集成。6)事件管理执行动作的多种通告方式可以通过电子邮件,有声报警将事件通知系统管理员,甚至可以呼系统管理员的寻呼机。对于报告了严重问题的事件可以对其进行强化处理。这可以是将消息用高亮度显示在屏幕上或生成滚动的字符显示,或者将事件显示放在显示保留区中显示直到系统管理员确认信息。还可以自动生成问题,提交给OpenView问题管理程序处理。7)事件的数据统计对同一类事件,或同一设备、端口发出的相同事件,可进行计数统
35、计,实现事件压缩,使管理人员可更快的了解当前的网络事件。同时,OpenView的事件管理会记录所有收集到的事件信息,并每天生成一个事件日志文件,还可对事件信息进行统计。2.3.2.3 故障处理流程及知识库的建立作为统一的事件处理平台,OpenView 网管系统提供了故障处理流程的管理,当网络出现问题报警,系统会自动分配给相应监控员,提示其问题,管理员对其可解决的问题,发出派工单,或打电话,发MAIL通知相关管理员,使其解决问题,对于解决不了的问题,可转发给相应专家解决,同时作相应问题处理状态记录。当问题的解决方法提出,并解决相应问题。监控员把其实现方法填入记录系统,并形成知识库,供以后其它人员
36、查阅。对于网络管理员,可通过OpenView的监控功能实现对网络故障的实时监控,从而提前发现网络问题,快速消除网络故障对用户的影响。对于网络用户,可通过电话、MAIL或WEB等方式提交处理问题请求,当问题解决后,可通过MAIL得到问题解决的确认。作为统一的事件处理平台,系统提供了在线自助式服务支持体系,作为前端的用户来说,可以从本地客户端浏览网络的知识库和专家帮助系统,随着应用的开展和扩充,系统知识库的价值不断增长,数据挖掘模型的建立,从而使网络问题减少到最少,保证网络业务的正常运行。2.3.3 网络性能管理2.3.3.1 基本网络性能管理建议采用OpenView Oprations实现网络性
37、能管理。网络性能的各项指标大部分可通过SNMP获得,对于SNMP的基本网络性能数据OpenView实现功能如下:1)网络性能实时监测OpenView Operation支持通过SNMP协议对网络性能进行管理。OpenView Operation支持SNMP v1、SNMP v2c和SNMPv3,能够管理的内容包括网络设备的性能(如CPU、Memory等)、端口流量、错误率等。同时,管理员可定制自己的管理菜单,对自己关心的网络性能参数进行菜单定制,实现方便的调用监测。OpenView Operation提供对网络性能进行实时监测的工具,能够以最小为1秒的间隔对网络性能数据进行收集,并即时生成曲线
38、图,供管理员对网络性能进行观察和分析。OpenView Operation可对网络设备的端口流量进行实时监控和历史采集,包括端口的流入流出量、端口的错误率、丢包率等一系列网络参数进行统计。同时这些采集数据都可存入相应数据库中,并可进行计算,得出各项百分比统计。通过对压缩前的流量采集和压缩后的流量采集的计算即可得到相应的压缩百分比。2)网络性能历史采集对于网络性能的历史采集主要从以下四个方面体现:1)数据采集2)数据存储3)数据管理4)数据报告通过OpenView Operation采集报告的信息,管理员可了解当前的网络性能状况,并根据此来优化网络结构,并为将来的网络系统升级提供决策支持。作为一
39、个完整的解决方案,OpenView Operation提供从数据采集到数据报告的所有工具,使管理员可轻松完成对采集数据的管理和报告。 1) 数据采集OpenView支持基于标准SNMP来采集MIB数据,如RFC1213;或者设备厂商提供的私有MIB。用户可以方便的加载不同厂家的MIB库到TREND系统中,以供管理员对自己网络中的各种设备进行性能采集。2) 数据存贮 对于采集的历史数据,通常需要保持几个月或几年,甚至更长时间;用来为管理员提供日报、月报、年报等。这样采集的数据如果不用数据库存储,将会对管理和维护带来很大问题,使数据整合、报告生成很难进行。所以,作为一个成熟的性能管理软件,Open
40、View从一开始就使用数据库对其数据进行存贮和处理,并支持多种开放形式供开发人员对其数据进行进一步处理。3) 数据管理 原始数据采集后,OpenView按小时、天、星期、月对原始数据进行整合处理,对于不同时间间隔的采集数据自动的存贮在不同的表中。同时包括其统计的最大、最小、平均值等统计信息都进行相应的存贮。这样在对大量数据生成报表的时候,效率就不会因为数据量的增大而受到影响。同时也为报告的生成提供了更大的灵活性,可以根据不同的统计数据生成相应的服务级别报告。 同时,OpenView的数据处理是可预定义并自动完成的,管理员可以选择采集数据进行处理的时间间隔,数据在数据库中的保留时间等,系统将按管
41、理员定义的时间进行自动处理。 4) 数据报告 OpenView Operation提供丰富工具,可为管理员生成各种格式的报告,如:-HTML-On demand HTML-JAVA Applet/Application-Printed Hard-copiesOpenView Operation提供几十种报告模板,管理员可通过图形界面方便的定义和生成各类报告。其中,报告可基于MIB-II或基于设备的私有MIB。管理员可通过对相应报告模板的增加和修改生成自己所需要的性能报告。并可以通过定义,定时生成报告,然后输出到WEB界面或打印以及输出到用户目录。 总之,通过OpenView Operation
42、的管理,可对用户网络的网络性能进行详细的采集记录,从而使管理员方便的统计分析和上报。2.3.4 网络故障诊断很明显,我们需要能随时随地提供端到端网络路径分析的工具,而HP OpenView NNM 就提供这些工具,它们负责监控端到端Internet和内部网络路径。 与HP OpenView解决方案的紧密集成大大增强了监控和管理网络服务的能力。提高网络管理效率HP OpenView NNM使您无需再花费数小时收集和分析数据,因而能大大提高操作员和工程师的生产率。它能快速回答最重要的网络问题:此问题是否由网络引起?网络的瓶颈在哪里? 哪条路径正被使用?网络问题的原因在哪里?停机时间的减少有助于快速
43、获得投资回报。HP OpenView NNM支持对基于Internet的服务和应用的管理,这是因为它能向Openview Operations和Openview Service Navigator 提供路径的性能/状态数据。对于由Netpath 探针监控的路径,NNM提供:端点间的所有路径表, 包括:每条(当前和以前使用的) 路径的状态最后使用日期和时间, 跳转次数每条路径的使用时间比率详细路径分析表,包括:每一跳的响应时间历史数据(最近、最低、最高、平均)节点、节点状态、接口地址路径的可视图,包括:每台3层路由设备的节点类型、状态和接口信息针对选定接口或设备启动实用程序的能力 :探测、跟踪路
44、径、设备状态用户可配置的实用程序对于Network Node Manager动态发现的路径,NNM提供:当前路径的可视图, 包括:每台3层路由设备的节点类型、状态和接口信息Network Node Manager已知的中间2层设备(集线器、交换机等)的节点类型、状态和接口信息详细的节点和接口表针对选定接口或设备启动实用程序的能力:探测、跟踪路径、设备状态用户可配置的实用程序从Netpath 探针了解详细的路径数据Netpath 探针为 OpenView NNM执行路径监控和历史数据收集。另外,它还为Openview Operations 和Service Navigator 提供路径状态和性能
45、监控。路径监控能够根据使用的应用和协议进行相关路径分析。它支持重复的IP和防火墙环境。探针的资源消耗很少,安装在路径的一个端点。其安装和配置可由Openview Operations完成。NNM显示终端节点间使用路径的列表。用户可以选择显示某条路径。NNM显示来自Netpath探针的路径图。要选择动作,只需右击鼠标即可。NNM显示来自Netpath探针的详细路径数据。2.3.5 Internet服务管理建议采用HP OpenView Internet Service 进行用户总厂Internet服务的管理。HP OpenView Internet Services 的服务水平度量显示板、可用性
46、和响应时间刻度盘以及大规模Web报告都由软件探测器更新,软件探测器定期模拟用户的服务请求,例如HTTP,FTP,SMTP,WAP(见表1)。告警可被转发到HP OpenView Operations,HP OpenView Network Node Manager(NNM)或任何通用的SNMP管理站上。主动软件探测器 说明DHCP*动态主机配置协议DIALUP*拨号接入服务DNS域名服务FTP文件传输协议HTTP 网页HTTPS安全Web网页ICMP 基于Ping的连接IMAP4*Internet信息访问协议LDAP*轻型目录访问协议NNTP收集新闻标题、文章POP3从服务器接收邮件RADIUS远端认证SMTP向服务器发送邮件TCP*传输控制协议WAP无线访问协议2.3.6 系统事件管理建议采用HP OpenView Operation 进行用户总厂主机的管理。利用OpenView Operations 可以对用户中的服务器的运行状况进行监控,使系统管理人员及时了解服务器的重要资源和参数运行状况,出现故障时迅速报警,并可自动采取措施排除故障,保证关键服务器的可用性和可靠性。OpenView Operations 是Manager/Agent管理结构