资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2021/12/26,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2021/12/26,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2021/12/26,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2021/12/26,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2021/12/26,#,网络管理与维护,项目一,IT,资源与业务的关系识别,知识目标,熟悉企业典型,IT,业务应用,熟悉常见的企业,IT,资源,理解,IT,资源与企业业务之间的关系,掌握基本的,IT,资源关系结构图,技能目标,能够正确分类和识别,IT,资源,根据,IT,资源关系结构图,可以利用,IT,资源支持企业业务,素养目标,能够理解现在学习的知识与企业岗位是如何对应,了解未来的就业目标,明确现阶段学习的价值,【,学习目标,】,IT,运维的职责,IT,运维工程师要保障和维护整个公司的,IT,资源,IT,部门为整个公司的业务提供辅助和支撑,IT,运维工程师,实时了解网络环境中的各项网络、系统服务器、数据库、业务应用以及他们之间的关联关系,学习和了解企业网络中各种,IT,业务以及,IT,服务的层次与关系,【,项目导读,】,【,任务,IT,资源与业务的关系识别,】,认识,IT,资源。,了解企业信息化的意义。,理解,IT,资源与企业业务之间的关系。,撰写“企业,IT,系统资源梳理表”。,任务描述,企业有哪些主要的,IT,资源?,IT,运维就是装操作系统?教业务部门同事使用打印软件?为相应的用户添加入网信息?为上网用户分配,VLAN,接口?,IT,运维对于企业业务的重要性和价值有哪些?,问题引导,“,OBASHI,”模型,知识学习,某企业的业务和,IT,图(,B&IT,),企业,IT,业务资源,OA,系统,ERP,系统,HIS,系统介绍,企业,IT,数据资源,Mysql,系统,SQL server,系统,Oracle,系统,DB2,系统,企业,IT,基础设施资源,路由器,交换机,防火墙,数据中心资源,小型机,存储系统,网络线路资源,ADSL,E1,MSTP,(,Multi-Service Transfer Platform,),BSM,业务服务管理(,Business Service Management,,,BSM,)是,IT,与业务管理手段的一种整合与互补,实现,IT,管理与业务服务的融合。,企业,IT,运维管理的三个层次,基础设施管理,流程化的管理,BSM,任务描述,公司竞标成功了某企业的,IT,运维管理改造项目,部门经理要求小,P,作为助理人员参与此项目,并配合完成“企业,IT,系统资源梳理表”。,工作内容,组织项目启动会,配合用户填写,IT,资源梳理表,配合用户填写业务系统梳理表,用户相关文档收集整理,任务实施,“,OBASHI,”模型可以帮助企业,IT,人员与非,IT,人员的沟通,一共分为,6,个层次。,企业的,IT,资源包括,IT,业务资源、,IT,数据资源、,IT,基础设施资源等,在网络运维管理实施过程中首先应该填写“,IT,资源梳理表”和“用户业务系统梳理表”等文档,正确梳理企业的,IT,资源与业务的关系。,业务服务管理(,Business Service Management,,,BSM,)是一种,IT,运维管理的方法论,在本单元仅要求了解即可。,【,单元总结,】,项目二,网络的简单运维管理,知识目标,掌握常见的运维排错方法,熟悉,SNMP,协议原理及作用,了解网络运维管理人员的基本职责,技能目标,利用常见的排错方法排除简单的网络故障,能够在网络中配置,SNMP,协议,进行网络监控,能够安全合理的应用,SNMP,协议,能够撰写简单的运维排错解决方案,素养目标,培训学生的沟通交流能力,培养学生的责任心和耐心,培养学生的团队精神,【,学习目标,】,网络运维工作可以外包给专业技术公司,一线运维工程师,主要完成简单网络故障排除、设备监控管理、日常巡检等工作,在全网开启,SNMP,,通过网管软件对网络设备进行监控,使用监控软件画出网络的拓扑。,【,项目导读,】,【,任务,2-1,日常运维排错,】,作为一线运维工程师,需要能够根据,IT,环境的实际情况,对网络故障快速发现、定位、以及完成故障解决方案。,及时发现网络故障。,准确定位网络故障原因。,完成排错。,任务描述,如何及时发现网络故障?,如何准确定位故障原因?,问题引导,分层故障排除法,层次化的故障排除思路,各层次的排障关注点,物理层,数据链路层,网络层,知识学习,物理层,关注电缆、连接头、信号电平、编码、时钟和组帧这些导致端口处于,down,状态的因素。,数据链路层,封装协议的不一致导致数据链路层故障的最常见原因。,链路的利用率与额数据链路层有关,端口与协议是正常的,但链路带宽可能被过度使用,从而引起间歇性的连接中断和网络性能下降。,网络层,地址错误和子网掩码错误是引起网络层故障常见的原因,路由协议是网络层的一部分,也是排错重点关注的内容。,排除网络层故障的基本方法是,沿着从源到目的地的路径查看路由器上的路由表,检查路由器接口的,IP,地址是否正确,分块故障排除法,判断故障点是网络设备时使用,查看设备的配置文件的组织结构,管理部分(路由器、口令、服务、日志等),端口部分(地址、封装、,cost,、认证等),路由协议部分(静态路由、,RIP,、,OSPF,、,BGP,、路由引入等),策略部分(路由策略、策略路由、安全配置等),接入部分(主控制台、,telnet,登录或哑终端、拨号等),其他应用部分(语言配置、,VPN,配置、,QoS,配置等),分段故障排除法,当一个故障涉及的范围较大,可以通过分段故障排除法来将故障范围缩小。,例,两个路由器跨越电信部门提供的线路不能相互通信时,主机到路由器,LAN,接口的这一段,路由器到,CSU/DSU,接口这一段,CSU/DSU,到电信部门接口这一段,WAN,电路,CSU/DSU,本身问题,路由器本身问题,替换法,一线工程师在检查硬件是否存在问题最常用的方法,任务描述,学校在实训楼新建了一个,40,台计算机的机房,购买了一台新的,48,口二层交换机作为接入,并连接到实训楼的汇聚交换机上。发现新机房所有电脑均不能从校园网的,DHCP,服务器上自动获得,IP,地址。,工作内容,利用分层故障排除法,物理层及数据链层检查,网络层检查,利用分段故障排除法,利用替换法,任务实施,【,任务,2-2,设备监控管理,】,网络中安装网管软件来监控和管理整个网络,降低运维工作难度,提高运维工作效率。及时发现网络故障。,在全网设备上开启,SNMP,服务。,通过网管软件对网络设备进行监控。,使用监控软件画出网络的拓扑。,任务描述,如何自动监控网络状态?,SNMP,的工作原理是怎样的?,除了,SNMP,还有哪些其他的监控手段?,问题引导,简单网络管理协议,SNMP,是一个标准的用于管理,IP,网络上结点的协议,包括:,管理基站,管理代理,管理信息库,网络管理工具,知识学习,SNMP,获取信息的方式,SNMP,存取的信息以管理信息库(,MIB,,,Management Information Base,)的方式来描述,管理信息库,MIB,指明了能够被管理进程查询和设置的信息,给出了一个网络中所有可能的被管理对象的集合的数据结构,SNMP,的管理信息库采用和域名系统,DNS,相似的树型结构,SNMP,安全性,默认通信字符串是,public,(只读)和,private,(读,/,写),SNMP2.0,和,SNMP1.0,的安全机制比较脆弱,通信不加密,所有通信字符串和数据都以明文形式发送,SNMP3.0,比以前的版本提供了更多的安全特性,如果配置不当,其实际效果仍旧有限,先禁用,SNMP,,直到确实需要使用,SNMP,时才启用它,SYSLOG,协议,SYSLOG,常被称为系统日志或系统记录,是一种用来在网络中传递记录档讯息的标准协议。,SYSLOG,通常被用于信息系统管理及信息安全审核。,SYSLOG,能将来自许多不同类型系统的日志记录整合到集中的存储库中,运维人员的工作职责,根据网络运维特点和运维需求,拟定网络运维管理的方针、政策、保障计划等提供领导决策,并组织实施。,贯彻公司关于网络管理的各项规章制度,担负网络执勤、监控工作,掌握网络运行状况,及时处理网络故障。,在部门领导的领导下,根据需求严密、科学、合理地掌控网络的各项资源,如,IP,地址、域名分配等。,定期分析讨论网络运行状态与运行质量,对比各项参数,排除潜在故障隐患,提出网络改进意见。,保障公司网络系统的正常运行,并为各分公司、项目部提供网络应用的技术支持。,负责公司邮件服务器数据及其他重要数据的备份管理。负责公司网络技术文档资料的管理。,收集和反映公司网络使用人员的意见和建议,完善网络功能、改进网络性能,为公司人员提供满意的服务。,任务描述,在网络中配置,SNMP,协议,,NMS,服务器地址为,10.10.1.6/24,,并使用,SiteView NNM,软件。,工作内容,在网络设备及主机中开启,SNMP,代理,配置,NMS,服务器,关闭不必要的,SNMP,,提高网络安全性,提高,SNMP,安全性,任务实施,SNMP,的主要配置任务包括:,设置团体名。,设置系统信息。,允许或禁止发送,Trap,。,设置,Trap,目标主机的地址。,配置本地或远端设备的名字。,配置一个,SNMP,的组。,指定发送,Trap,的源地址。,为一个,SNMP,的组添加一个新用户。,创建或者更新视图的信息。,设置,Agent,能接收,/,发送的,SNMP,消息包的大小。,提高,SNMP,安全性,加载,SNMP,服务的补丁,保护,SNMP,通信字符串,过滤,SNMP,本单元介绍了常见的网络故障排错思路。通过分层故障排除法、分块故障排除法、分段故障排除法、替换法等排错方法,根据,IT,环境的实际情况,对网络故障快速发现、定位和排除。,简单网络管理协议,SNMP,是一个标准的用于管理,IP,网络上结点的协议,在网络中应用非常广泛。重点掌握其中,NMS,、,Agent,、团体名等概念,以及如何在服务器和网络设备上开启,SNMP,功能,以及如何提高其安全性。,【,单元总结,】,项目三,典型运维管理软件使用,知识目标,了解,IIS,、,Net Framework,的作用,了解典型运维软件的工作原理和安装方法,了解网络设备和服务器的监测原理,掌握网络设备和服务器的主要监测指标,技能目标,熟练掌握,IIS,、,Net Framework,的安装方法,熟练掌握运维软件的安装方法,能够对网络设备和服务器进行运维监控,素养目标,培养学生的责任心和耐心,培养学生的团队精神,培养学生举一反三解决问题的能力,【,学习目标,】,一般网络管理软件,也要时刻通过人工交流的方式去了解当前的网络运行情况,对人力资源占用较大,增加了信息维护的开销和费用。,装专业的,IT,运维管理系统软件,实现对网络设备和网络服务器的规范监测和管理。同时协助用户组建,IT,技术支持部门,【,项目导读,】,IT,技术支持部门,一般包括如下角色,IT,经理:负责协调每个岗位的之间的协同工作,对每个岗位中的工程师进行工作任务的监督与评判;,服务台:负责用户的请求的受理、初步处理、请求跟踪、重大事件通知、故障确认、故障关闭、客户满意度调查等工作。,终端服务人员:主要负责终端的日常维护工作,包括终端的联网、维修、应用软件维护等工作。,网络管理员:负责网络故障的维护与支持,新增网络设备的报备与调试。,机房管理员:负责机房环境设备的维护、故障处理、日常支持工作。,服务器管理员:负责服务器的硬件维护、故障处理、系统维护等工作。,应用管理员:负责业务系统的故障处理、系统维护、技术支持等工作。,开发人员:负责用户需求的分析、开发、测试等工作,并协助应用管理员故障处理,【,任务,3-1,安装运维管理系统,】,由技术一线工程师或用户方工程师在服务器上的安装网智运维系统。,熟读安装手册及安装步骤。,在服务器上操作安装,IIS,、,Net Framework,等功能。,成功安装一次网智运维系统。,安装完成后正常登陆系统。,任务描述,什么是,IT,运维?,IT,运维的意义何在?,技术人员做,IT,运维的第一步工作是什么?,问题引导,一个合格的,IT,运维系统的目标应该包括如下要求:,有效监控。实现由被动响应向主动监控转变,系统化管理。实现由单项分散运维向系统科学运维转变,提高效率。实现由人工执行向系统自动转变,知识学习,IT,运维管理系统的功能需求,具 体 需 求,需 求 描 述,IT,资产及配置管理,建立,IT,资产的档案和配置模型,实现资料健全的管理基础。,整合、统一的系统管理,系统能集中管理企业的各种计算资源,兼容各种不同的,IT,设备,业务影响分析,系统管理能够将,IT,管理与业务的运行联系起来。,流程化管理,将,IT,服务管理的整体工作目标分解为岗位职责并落实在流程上,形成一个日常工作可遵循的有序机制。,IT,运维基本流程,IT运维管理系统的价值:,价值一:运维基于,CMDB,通过,IT,资源配置信息整合管理,为,IT,运维管理工作打下数据信息的地基。,价值二:整合监测、统一管理通过整合式监测打破异构化的管理,形成整合式统一管理中心。,价值三:业务服务管理通过业务服务管理,将业务的可靠性及容量要求与,IT,系统的运行状态,使得,IT,系统规划有据可依。,价值四:,IT,服务管理系统面向业务需求的,IT,服务管理系统,整合供应商管理到,IT,业务管理。,任务描述,在,Windows 2008 R2,系统的服务器上安装,IT,运维管理系统,作为公司网络的监测服务器,其,IP,地址为,10.10.129.198,。,工作内容,监测服务器系统配置,监测服务器运维管理软件安装,监测服务器运维系统发布,安装完成后测试,任务实施,监测服务器系统配置,安装环境确认,硬件要求,监测设备数量,监视服务器,数据库服务器,磁盘空间,(3,月,),1-50,台,4,核,4G,内存,4,核,4G,内存,100GB,50-100,台,4,核,4G,内存,4,核,8G,内存,150GB,100-200,台,4,核,4G,内存,8,核,16G,内存,300GB,200-400,台,4,核,4G,内存,16,核,16G,内存,500GB,400-1000,台,16,核,16G,内存,16,核,16G,内存,2TB,1000,台以上,16,核,16G,内存,16,核,32G,内存,2TB,实施项目:,IIS,安装,.NET F,ramwork 3.5,安装,.NET Framework 4.0,安装,安装完成后重启监测服务器,监测服务器运维管理软件安装,安装网智运维管理系统,安装路径尽量不要在,C,盘,安装路径也不要有中文路径,系统默认会添加一个操作系统用户,NIManager,(连接软件服务所用用户),,2,个服务,SmartDB9,(数据库服务)和,SmartSvr9,(软件服务),监测服务器运维系统发布,配置,IIS,“,ISAPI,和,CGI,限制”,把限制都改为允许,网站物理路径选择,IT,运维系统安装路径,应用程序池为“,ASP.Net v4.0 Classic,”,右击网站目录,在快捷菜单中选择“转换为应用程序”,安装完成后测试,浏览器中输入服务器,IP,地址,即可登录网智运维系统,WEB,版,默认用户名为“,admin,”,默认密码为“,system,”,通过“自动发现及配置向导”可完成所有的自动化配置,如果出现未识别的,IP,设备,是由于设备未开启,SNMP,协议导致,可以人为的将其修改为所确认设备类型,【,任务,3-2,监测网络设备,】,在监测服务器上安装好运维管理软件后,对不同厂商的网络设备进行有效的监测,并对故障部分进行记录,加以排除,出具有效的监测报告。,运维系统服务器查看,告警。,网络设备查看,查找问题。,协助运维系统解决问题。,解决问题后加以验证。,任务描述,如何利用,IT,运维系统监测网络设备?,网络设备应该监测哪些指标?,问题引导,网络设备监测的作用,网络设备监测是指对路由器、交换机、防火墙、负载均衡、,IPS,、,IDS,、流控设备、,HUB,等不同类型的网络设备,通过监测与管理网络环境中存在的设备来判断当前设备的可用性与容量信息。,对网络设备的各项指标如,CPU,使用率、硬盘空间、存储器空间、吞吐量、访问次数、设备温度等进行监控,一旦达到预先设定的告警阈值,即启动相应的预防故障措施,监测并保障每个网络设备的运行状态是保障整体网络稳定的基础,监测并保障网络中每台设备的可用性和处理容量,是保障整体网络系统稳定运行的基础,知识学习,设备资源监测,通过“网络设备面板”功能,查看单个网络设备的部件信息,单台网络设备的监测保障分为三个层面,网络设备的控制层面,网络设备的数据层面,网络设备的基础环境层面,单台网络设备监测指标,网 络 设 备,层,面,监,视,器,路由器,交换机,安全设备,负载均衡,控制层面,CPU,内存,路由表(核心交换),并发连接数(防火墙、负载均衡),数据层面,接口状态,接口流量,接口丢包率,接口速率,广播、组播、单播率,基础环境层面,温度,电源状态,风扇状态,网络故障监测,网络的用途是有效传输业务数据,任何网络的问题都有可能对信息系统造成严重影响,可以通过网络监测来定位网络系统中的故障。,路由器的监测,交换机的监测,任务实施,网络故障监测,丢包检测,登录,IT,运维管理系统,单击左上角的“开始”,选择“拓朴”功能。,拓朴视图中双击要进行故障监测的网络设备,设备视图中单击“传输质量检测”,通过,IT,运维管理系统中的“传输质量检测”功能,对设备链路的丢包进行检验,分析丢包的原因和趋势,路由器的监测,配置路由器,SNMP,Cisco,路由器,SNMP,协议配置,华为路由器,SNMP,协议配置,在,IT,运维管理系统中添加路由器监测,在开始界面中选择“整合监测”,添加,IT,组件,输入要监测的路由器的管理,IP,地址,设备类型列表中选择对应的产品类型,输入路由器上配置的,SNMP,团体名,添加监视器,在开始界面中选择“整合监测”,选择要监视的路由器,右击选择“自动扫描并配置监视”,添加成功后,双击路由器可以看到监测内容,交换机的监测,交换机,SNMP,配置,添加交换机监测,在开始界面中选择“整合监测”,添加,IT,组件,输入要监测的交换机的管理,IP,地址,设备类型列表中选择对应的产品类型,输入交换机上配置的,SNMP,团体名,添加监视器,选择“开始”菜单中的“整合监测”。,选择要监视的交换机,右击选择“自动扫描并配置监视”。,添加成功后,双击交换机,选择“网络设备背板”,【,任务,3-3,监测服务器,】,服务器所涉及的品牌也是各种各样的,如:,IBM,、,HP,、联想、浪潮等。网管人员也需要把它们纳入监测的范围。,运维系统服务器查看,告警。,服务器主机状态查看,查找问题。,协助运维系统解决问题。,解决问题后加以验证。,任务描述,如何监测服务器?,服务器应该监测哪些指标?,问题引导,服务器监测,指将远程服务器运行数据通过各种方式记录下来,并在需要时可以随时调用监控记录进行查看。,知识学习,对,Windows,服务器监测可以通过两种方式,SNMP,协议:需要进行,SNMP,服务配置,WMI,协议:,WMI,默认服务是开启的,且采用的是用户名与密码方式,无需进行任何配置。,对,L,inux,服务器监测可以通过两种方式,Telnet,协议,SSH,协议,telnet,和,SSH,采用的都是用户名与密码方式,且需要对配置文件进行配置,配置完成后开启相应服务。,Windows,服务器监测指标,AIX,服务器监测指标,Windows,服务器监测,Linux,服务器监测,任务实施,Windows,服务器监测,配置,Windows,服务器,SNMP,协议,在监测服务器上添加对,Windows,服务器的监测,选择“开始”中的“整合监测”。,选择“添加,IT,组件”。,打开如图所示的对话框,管理地址:要监测的,Windows,服务器的,IP,地址。,设备类型:选择,Windows,类型。,凭证:输入,Windows,服务器上配置的,SNMP,团体名。,添加监视器,选择“开始”菜单中的“整合监测”,选择要监视的,Windows,服务器,右击选择“自动扫描并配置监视”,添加成功后,单击可以看到监测内容,Linux,服务器监测,配置,Linux,上的,Telnet,、,SSH,协议,添加,Linux,的,Telnet,、,SSH,监测方式,登录网智运维系统,选择“开始”中的“整合监测”。,选择“添加,IT,组件”。,打开对话框。,输入管理地址:要监测的,Linux,服务器的,IP,地址。,设备类型:选择,Linux,类型。,凭证:添加用户名与密码,用户名与密码需要具备管理员权限。,添加监视器,选择“开始”菜单中的“整合监测”。,选择要监视的,Linux,服务器,右击选择“自动扫描并配置监视”。,添加成功后,单击,Linux,服务器可以查看监测内容。,本单元通过一个典型运维管理软件的安装和配置,介绍了在网络环境中安装运维管理软件,以及如何监测各种网络设备和服务器的基本方法。,网络监测中需要对网络设备的各项指标如,CPU,使用率、硬盘空间、存储器空间、吞吐量、访问次数、设备温度等进行监控,一旦达到预先设定的告警阈值,即启动相应的预防故障措施,避免更大问题的发生。,【,单元总结,】,项目四,IT,运维系统管理,知识目标,掌握,IT,资源配置管理的作用及方法,理解事件管理流程的业务用途,掌握构成事件管理的状态组成,理解职能角色在流程中的位置,理解问题管理流程的业务用途,【,学习目标,】,技能目标,能够通过用户需求进行基础的需求分析,能够根据用户描述简单规划职能角色,能够设计通用的流程状态,能够设计各个状态下的相关活动,能够将活动与角色相关联,素养目标,与用户交流时,可以分析哪些是与流程相关的数据信息,针对配合,IT,的企业业务,培养基础业务分析能力,能够自学探索,学习更深层的运维运维管理知识,随着网络规模的扩大,原来的管理模式,已经适应不了新的高集中、高密度,不同种类的网络环境,因此需要学习和掌握通过,ITIL,规范中的事件管理、问题管理等来解决,IT,运维的问题。,【,项目导读,】,【,任务,4-1 IT,资源及配置管理,】,规范的,IT,运维管理,首先要梳理好,IT,资源以及,IT,资源与业务的关系。,利用,IT,运维管理系统梳理出该企业,IT,资源与业务之间的关系图,并完成资源及配置管理工作,运维系统自动扫描,IT,组件。,在运维系统中添加,IT,组件。,将,IT,组件形成逻辑关系。,将,IT,组件与业务之间连成关系。,形成完整的,IT,资源与业务的逻辑关系图。,任务描述,为什么要识别,IT,资源?,为什么要梳理,IT,资源与业务之间的关系?,什么是,CMDB,配置管理?,问题引导,ITIL,简介,ITIL,即信息技术基础架构库(,Information Technology Infrastructure Library,),用来管理信息技术(,IT,)的架构设计、研发和操作的一整套概念和思想,主要精神为:和谐推动及持续改善,将服务对象视为客户,强调端到端(,End-to-End,)的服务。,ITIL,为企业的,IT,服务管理实践提供了一个客观、严谨、可量化的标准和规范。,知识学习,ITIL,已经发展到了第三个版本,即,ITIL Foundation v3,通过,5,个生命周期来诠释整个,IT,服务管理的过程,服务战略,服务设计,服务运营,服务转换,服务持续改进,两个,ITIL,的基本概念:,过程(,Process,),过程是通过一组相互关联,相互影响的工序,将输入转化为输出的增值过程。并不像流程一样强调每一个工序之间的顺序。,流程(,Flow,),流程是预先设定好了顺序,然后按照预先设定好的顺序执行下去,上一个环节没有执行,则下一个环节必须等待。,在,ITIL,架构中,一个企业的,IT,部门具体角色分工如下:,服务台:用来收集客户需求,并转化成技术语言提交给技术部门(是技术部门与业务部门的唯一连接点),技术一线:用户方工程师或主场工程师(距离问题最近的技术人员),技术二线:资深工程师(多数是项目组的高级技术人员),部门经理:协调部门资源,并对重要变更进行变更审批(在真实环境下应该是企业的,CIO,),资源及配置管理的目标,能够定义并控制服务和基础架构的组件,并维护设备的配置信息。,IT,系统资源及配置管理反映了哪些,IT,组件出现故障将会影响哪些业务和客户的信息。,配置管理数据库是业务服务管理的基础,配置管理数据库中记录了,IT,组件和业务应用系统之间的逻辑关系,计量组织和服务中所使用的所有,IT,资产和配置项的价值。,配置管理,描述、跟踪、控制和汇报所有,IT,基础架构中设备或系统的管理流程,提供,IT,基础架构精确信息,处于,IT,服务管理核心位置,实施,IT,系统资源配置管理数据库(,CMDB,)是配置管理的核心,IT,运维管理系统方案中的,IT,系统资产及配置管理模块,通过自动识别形成的配置管理数据库首先极大提高了配置管理数据库的构建效率及识别的准确度,同时在需要配置管理信息的时候可以做到联动查询,IT,系统资产管理和配置管理的区别:,IT,系统资产管理主要面向资产类信息的管理,而配置管理主要面向运维信息的管理。可以通过,IT,运维系统做两类信息的整合管理。,IT,系统资产管理中记录了,IT,组件以及,IT,设备的资产属性,例如,IT,组件的生命周期、购买价格和维护费用信息、,IT,组件的位置等。,IT,配置管理中记录了该,IT,组件在运维过程中的一系列运维属性,例如、,IT,组件与,IT,组件之间的关系、,IT,组件的故障处理记录、,IT,组件的变更记录、,IT,组件的发布记录、,IT,组件的软硬件配置等。,IT,运维系统的资产及配置管理范围:,各个生命周期中的,IT,组件,包括在线使用中的、备件、保修、订购及开发中的。,各个生命周期中的,IT,服务,例如各类业务应用系统。与,IT,服务有关的人员和机构,包括,IT,服务的客户和供应商,以及,IT,部门。,与,IT,服务运维有关的文档,包括受控文档、质量文档、手册等。,IT,运维系统可实现,40%,到,80%,的,IT,组件自动识别和归类,任务描述,在,IT,运维系统中,实现,IT,组件的识别与控制,工作内容,自动发现网段配置信息,自动识别,IT,组件及类型,手动添加,IT,组件,添加,IT,组件的监视项,组织机构管理,人员角色管理,图形化呈现,IT,资产及业务关系,识别,IT,组件关系,任务实施,自动发现网段配置信息,登录网智运维管理系统,在主页中单击“自动发现及配置向导”,根据实际情况配置多个,SNMP,团体名,系统可自动匹配共同体名称,选择扫描的方式和要扫描的网段,设备扫描完成后将会进行网络拓扑自动发现,拓扑分析完成后,将进行“链路计算”,接着进行“监视项自动发现及配置”,自动配置各个,IT,组件的监视项,自动识别,IT,组件及类型,“自动发现及配置向导”完成后,系统可自动发现,IT,组件,并识别和归类,IT,组件类型,以便确定对,IT,组件的监测方式,在“开始”中单击“整合监测”,选择“列表模式”,可以分类显示所有,IT,组件的基本信息,手动添加,IT,组件,某些,IT,组件因为临时故障或,SNMP,没有正确配置的原因,可以无法进行自动识别,网智,IT,运维系统在支持自动化构建配置管理数据库的同时也支持手动添加,IT,组件,并配置相应的管理凭证和类别,添加,IT,组件的监视项,在“整合监测”窗口中,右击任意,IT,组件,选择“自动扫描并配置监视”,系统可自动扫描识不同,IT,组件的监视项,确定不同监视项对业务影响程度的重要性,组织机构管理,包括服务实体和用户两大类。,服务实体是专门对应某功能模块服务的一个人或者一个团队。,用户是,IT,服务的最终使用者,用户不参与,IT,系统的具体运行维护工作而更加关注,IT,系统的使用性和功能,人员角色管理,人员管理,在“配置管理数据库”窗口左侧单击“人员”,可以打开人员管理界面。,人员管理功能用于在系统中添加和管理系统内的网络用户,角色管理,在“配置管理数据库”窗口左侧单击“角色”,可以打开角色管理界面。,角色管理功能用于在系统中添加和管理系统内不同人员所在的岗位,包括负责网络设备、服务器、数据库、应用、中间件维护等岗位,为人员指定角色,在“角色管理”界面的详情栏中右击某个角色,选择“属性”,指定用户的角色,图形化呈现,IT,资产及业务关系,系统会自动识别,IT,软硬件之间的关系,最后通过图形化方式呈现。,IT,运维系统关系管理全景图,可以显示整个公司网络从部门机构到网络层之间纵向依赖关系。,在网智运维管理系统“开始”菜单中,单击“关系管理”,识别,IT,组件关系,自动化识别,IT,组件关系,将提高,IT,组件关系准确度和构建配置管理数据库的效率。,通过识别,IT,组件关系,形成配置管理的基础关系数据。,IT,组件关系为两部分:,物理关系:“组成关系”、“连接关系”、“使用关系”。,逻辑关系:“复制关系”、“涉及关系”、“被用于关系”。,【,任务,4-2,事件管理,】,IT,管理者从原来的技术导向,向服务导向转移,其任务和在任务中的角色也发生了改变。,通过事件管理解决网络中出现的问题,事件管理的目标是快速的回复业务。,按领导需求,将运维系统整体上线。,在现有的工作习惯基础上,加入科学的运维管理方法。,设计一套“事件管理”流程。,对流程加以验证并实施。,任务描述,什么是事件管理?,事件管理关注重点是什么?,为什么要有事件管理流程?,问题引导,事件(,incidents,)的定义,在某一服务中不属于标准操作的,并能导致或可能导致这个服务的中断或服务质量下降的任何事情。,事件不仅包括了与软件和硬件有关的错误,还包括服务请求,事件管理流程涉及服务的整个生命周期,如果被请求的服务不是事先已经定义好的标准服务,而是将改变,IT,基础设施的状态,那么这就不是事件管理,应该作为变更请求来处理。,知识学习,事件管理流程的目标,减小突发事故对业务的影响。,最优化支持资源,提高工作效率。,根据业务轻重缓急解决事故,保障有效,IT,运营。,加强有形监控和及时反馈。,提升用户满意度。,提供管理信息。,事件管理流程设计,当一个事件输入的时候,首先要对事件进行检查、定位。,检查事件的时候要与它不断交互,明确它的影响范围和紧急程度,进行初步的归类评估。,服务台,(ServiceDesk),是事件的唯一入口,它接收事件后,操作人员通过查阅,CMDB,(配置管理数据库)进行处理。,事件管理流程设计,首先要规划好流程作用范围,事件管理包括任何导致服务中断或可能导致服务中断的事件。主要来源包括:,用户通过服务台直接报告的事件,通过事件管理流程工具中,事件管理界面报告的事件,由技术人员报告或记录。,事件管理的主要任务,及时识别并跟踪发生的事件,对事件进行分类并提供初步支持,对事件进行调查分析,识别引发事件的潜在原因,解决事件并恢复服务,跟踪和监督所有事件的解决过程,并随时进行沟通。,事件管理流程设计,要确定处理的时限,根据服务级别(,SLA,)中规定的整体事件响应与解决目标,在不同事件处理阶段,必须具体处理时限,在运营级别协议(,OLA,)和支撑合同(,UC,)中进行明确规定。,所有支撑小组必须清楚理解这些处理时限,服务管理工具用于自动执行处理时限,并根据预定义的规则升级事件。,事件管理流程设计,要定义事件模型,把一件之前已经发生过,今后还可能再发生的事物定义成事件。事件模型包括如下内容。,处理事件的步骤。,时间顺序和依赖关系。,职责如何各司其职。,措施完成的时间表和阀值。,事件升级程序。,何时升级及升级给谁处理。,证据保留活动等。,事件管理流程设计,要确定重大事件,重大事件需要采取独立的、时间表更短、紧急度更高的程序。,组织必须对哪类事件构成重大事件做出明确定义,并将其完整映射到整个事件优先级系统中,以便相关事件能够通过重大事件流程进行处理。,重大事件和问题的区别:,问题是导致一个或多个事件的根本原因,事件管理流程活动方法与技巧,事件确认,事件记录,事件分类,事件分级,初步诊断,事件升级,调查诊断,解决恢复,事件关闭,根据事件管理流程设计要求,结合企业,IT,运维管理需求,尝试建设一个本企业的,IT,运维管理事件管理流程,并利用网智运维管理系统完成事件管理工作。,任务实施,事件流程设计思路,流程的输入是什么。,流程的输出是什么(价值体现方式)。,相关活动细节。,流程的长度。,事件流程设计,打开流程设计向导,事件流程状态组成设计,开始,已提交,已受理,已退回,已分级,已分类,处理中,待验证,重打开,已解决,结束,事件管理操作,打开事件管理界面,可以查看当前有哪些事件及其所处的状态。,可以单击工具栏中的“,+,”图标,在系统中添加新事件,属性对话框,可以在其中输入事件的各种信息,相关受理人员可以单击事件,查看事件的当前处理状态,受理人员处理事件后,可以单击“解决”按钮注明事件已解决或未解决,并分配给下一流程的人员,或者直接把事件“转给其他人”处理,对于“已解决”的事件,可以单击后,选择“关闭”事件,【,任务,4-3,问题管理,】,事件管理是为了快速的恢复业务,但不能避免问题的再次发生。,问题管理(,Problem Management,)确定引起事件发生的真正的原因所在,从而得以解决问题。,问题管理的具体任务是设计一套“问题管理”流程,然后在,IT,运维系统中加以验证和实现。,任务描述,什么是问题管理?,问题管理关注重点是什么?,为什么要有问题管理流程?,问题引导,问题管理(,Problem Management,),调查基础设施和所有可有信息,包括事件数据库,来确定引起事件发生的真正的潜在原因以及提供的服务中可能存在的故障。,事件管理强调速度,问题管理强调质量,问题管理是负责管理所有问题生命周期的流程,IT,运维软件系统上所有的流程都与问题管理有接口。,知识学习,问题管理流程的主要目标,是防止问题的发生,避免问题重复发生,以及通过主动的预防手段最大限度的减少不可避免的问题的影响。,将由,IT,基础架构中错误引起的事件和问题对业务的影响减少到最低程度,查明事件或问题产生的根本原因,制定解决方案和防止事件再次发生的预防措施,实施主动问题管理,在事件发生之前发现和解决可能导致事件产生的问题。,问题管理的价值,价值一:提高,IT,服务可用性和质量。,价值二:提高解决突发事件的效率。,价值三:减少无效的规避或修补措施的开支。,价值四:减少救火或解决重复故障的工作成本。,问题管理流程,问题管理的输入,通过事件管理流程中未解决的事件发起,问题管理的活动,主要活动包括问题记录、分类、处理、派发、问题支持、寻求解决方案和关闭问题,问题管理的输出,问题管理的输出包括由于问题处理引起的变更请求,问题处理完成关闭后产生的解决方案,流程的接口与依赖性,问题管理与事件管理的接口,问题管理与配置管理之间的接口,根据问题管理流程设计要求,结合企业,IT,运维管理需求,尝试建设一个本企业的,IT,运维管理问题管理流程,并利用网智运维管理系统完成问题管理工作。以下流程以基础蓝图为例进行说明,任务实施,问题管理流程设计思路要思考如下几个方面:,流程的输入是什么,流程的输出是什么(价值体现方式),相关活动细节,流程的长度,问题管理流程设计,打开流程设计向导,问题流程状态组成设计开始,开始,已提交,已分级,已退回,已分类,处理中,已解决,已评价,结束,问题管理操作,打开问题管理界面,可
展开阅读全文