资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,事件管理、问题管理,信息管理部服务台,2011.7.17,1,目录,事件管理,问题管理,2,2025/4/30 周三,事件管理定义,定义,事件管理(,incident management,)是一个,被动式,的任务,也就是减少或消除存在或可能存在于,IT,服务中的干扰因素给,IT,服务带来的影响,以确保用户可以尽快恢复自己的正常工作。,3,2025/4/30 周三,事件管理内容,内容:,、,将,事件记录下来并分类,再分配给适当的专业人员去,处理,、,需要,监控事件的发展,在事件得到解决之后将其终止。,4,2025/4/30 周三,事件管理目标,目标:,、,事件管理的目标是要在给用户和公司正常的业务活动带来最小影响的情况下,尽快恢复到,SLA,中定义的正常服务级别。,、,事件管理需要保留事件的有效记录以便能够权衡并改进处理流程,给其他的服务管理流程提供合适的信息,以及正确报告进展情况,5,2025/4/30 周三,基本术语,事件:,事件(,incidents,),在某一服务中不属于标准操作的并能导致、或可能导致这个服务的中断或服务质量下降的任何事件。,6,2025/4/30 周三,基本术语,影响度、紧急度和优先级,优先级是根据错误对用户和正常业务带来的影响的严重程度来确定的。服务台通过与用户进行协商,并根据服务级别协议(,SLA,)确定事件的优先级。优先级决定了事件得到处理的先后顺序。,优先级主要基于紧急度和影响度来决定。而对于具有同样优先级的事件,可按解决他们需花费的精力的多少来安排顺序。,7,2025/4/30 周三,基本术语,升级,分为职能性升级和结构性升级,职能性升级,(Functional escalation,,又称为水平升级、技术升级,),:职能性升级意味着需要具有更多时间、专业技能或访问权限,(,技术授权,),的人员来参与事件的解决。这种升级可能会超越部门界限而且可能会包括外部支持者。,结构性升级,(Hierarchical escalation,,又称为垂直升级、管理升级,),:结构性升级意味着当经授权的当前级别的机构不足以保证事件能及时、满意地得到解决时,需要更高级别的机构参与进来。,8,2025/4/30 周三,基本术语,1,线、,2,线和,N,线支持,1,线支持通常由服务台提供,2,线支持通常由管理部门提供,3,线支持则多由软件开发人员和系统结构人员提供,4,线支持由供应商提供,9,2025/4/30 周三,事件管理流程,10,2025/4/30 周三,事件管理意义,意义:,整个业务:,更及时地解决事件可减少事件对业务的影响,提高用户的工作效率,独立的、面向用户的事件监控,IT,部门:,改善监控,对,SLA,的执行情况可进行更为准确的评测,更好地更有效地使用人力,避免事件和服务请求的丢失或被不正确地记录,提高用户和顾客的满意度,11,2025/4/30 周三,问题管理定义,定义一:,问题管理(,problem management,)调查基础设施和所有可用信息,包括事件数据库,来确定引起事件发生的真正的潜在原因以及提供的服务中可能存在的故障。,12,2025/4/30 周三,问题管理定义,定义二:,消除引起事件的深层次根源以防止事件再次发生,包括主动性问题管理和被动型问题管理。,被动型问题管理(,reactive problem management,)的目标是找出导致以前的事件发生的根本原因,以及提出解决措施或纠正建议;,主动性问题管理(,proactive problem management,)的目标是通过找出基础设施中的薄弱环节来阻止事件的再次发生,以及提出清除这些薄弱环节的建议。,13,2025/4/30 周三,与事件管理之间的关系,与事件管理之间的关系,事件管理通过提供应急措施和对事件的临时修复来支持事件管理的工作,但不负责解决事件。事件管理的目标是采取任何可能的方法,包括一个应急措施来快速地解决事件;而问题管理则注重确定并消除引起事件和问题的深层原因。在创建事件记录的同时也要创建问题记录。同时,对一些仍处于待解决状态的事件来说,对相关问题的调查可能解决这些事件。,14,2025/4/30 周三,问题管理目标,目标:,将由,IT,基础架构中错误引起的事件和问题对业务的影响减少到最低程度;,查明事件或问题产生的根本原因,制定解决方案和防止事件再次发生的预防措施;,实施主动问题管理,在事件发生之前发现和解决可能导致事件产生的问题,15,2025/4/30 周三,概念区分,事件管理,/,问题管理,问题管理的主要目的是查明事件发生的潜在原因并找到解决此事件的方法或防止其再次发生的措施;,事件管理的主要目标是在事件发生后尽可能快地恢复客户服务,即使采用的是一些应急措施而不是永久性的解决方案;,事件管理强调速度,问题管理强调质量,把速度放在第二位;,为了发现事件原因和防止事件再次发生,问题管理可能需要花费更多的时间解决事件且可能推迟恢复服务,16,2025/4/30 周三,问题管理意义,意义:,提高,IT,服务质量和管理水平(故障记录、消除),提高用户的效率(提高服务质量),提高支持人员的效率(事件的解决方案被记录),提升,IT,服务的声誉(服务的稳定性提高),加强管理,增加操作知识,提高学习能力(问题管理保存的历史信息可用于确定事件或问题发展的趋势,因此可阻止发生新的可避免事件。),更高的一线支持解决率(知识库),17,2025/4/30 周三,主要活动,问题控制,建立已知错误,错误控制,关闭已知错误,主动问题管理,化被动为主动,18,2025/4/30 周三,问题控制,如何确定问题?,对某一事件进行分析表明该事件可能再次发生,或者有大量发生并且加重的趋势;,对于基础架构进行分析可以找到可能会产生事件的薄弱环节;,服务级别可能会受到威胁(能力、成本等),记录下来的事件不能与一个现有的问题或已知错误发生关联,19,2025/4/30 周三,问题控制,如何分类?,范畴:确定问题的相关领域,如是硬件还是软件问题;,影响度:主要指对业务流程的影响;,紧急度:也包含多长时间的延期可以接受,优先级:紧急度、影响度、风险和所需资源的结合,状态:如问题、已知错误、已解决、已关闭等,20,2025/4/30 周三,错误控制,如何错误控制?,确定问题产生的根本原因,把问题转为已知错误或与某现有已知错误相关联;,问题管理人员和支持组一起评估解决问题或已知错误的所需资源,根据多种因素,比较不同的方案;,一旦确定合适的解决方案,提交,PBC,,通过变更管理负责方案的实际执行;,用于解决问题、已知错误及相关事件的变更一旦实施后,必须进行评审。,21,2025/4/30 周三,主动问题管理,根据对,IT,基础架构进行分析,问题管理可以找到可能出现问题的薄弱环节,在事件发生前发现和解决有关问题和已知错误,以尽量减少问题和已知错误对业务的影响,趋势分析:,找出,IT,基础架构中不稳定的组件,分析其原因以便采取措施降低配置项故障对业务的影响,分析已发生的事件和问题,研究其变化趋势,通过其他方式和途径分析,比如系统管理工具,用户反馈等,22,2025/4/30 周三,主动问题管理,制定预防措施,提交变更请求,提交有关测试、规程、培训和文档方面的反馈信息,进行客户教育和培训,对服务支持人员进行教育和培训,确保遵守问题管理和事件管理的规程,改进相关的流程和程序,23,2025/4/30 周三,谢谢!,24,2025/4/30 周三,
展开阅读全文