1、 事件管理流程设计手册 文档信息项目名称:项目编号:项目经理:项目阶段:文档名称:文档编号:文档起草人:起草日期:当前版本编号:版本日期:相关文档:分发名单来自 From日 期电话/传真/Email给 To行 动*截止日期电话/传真/Email*:行动类别:批准,复审,告知,存档,修改,其它(请指明)版本记录版本号版本日期修改者说 明文献名目 录1.文档介绍51.1文档简介51.2文档用途51.3文档结构51.4术语62.事件管理流程简介72.1流程基本概念72.2流程目的82.3流程范围92.4流程重要内容92.5流程业务价值103.事件管理流程设计103.1流程执行原则103.1.1.流程
2、常规原则103.1.2.责任制原则113.1.3.事件分派原则113.1.4.事件重分派原则123.1.5.反复/复发事件原则123.1.6.事件关闭原则123.1.7.事件通报原则133.1.8.事件升级原则143.1.9.流程关联原则143.2流程相关定义153.2.1.事件信息项153.2.2.事件来源183.2.3.事件性质193.2.4.事件分类193.2.5.事件优先级203.2.6.事件时限213.2.7.事件状态223.2.8.事件结束代码223.3流程角色和职责定义233.3.1.事件流程负责人233.3.2.事件流程经理243.3.3.服务台支持人员(含1线、1.5线)25
3、3.3.4.二线支持人员263.3.5.三线支持人员263.3.6.四线支持人员263.4流程概要设计273.5流程具体设计293.5.1.事件检测与记录293.5.2.事件分类和初步支持303.5.3.事件调查和诊断323.5.4.事件解决和恢复333.5.5.事件关闭343.6与其他流程的关系363.7流程衡量指标及报表374.附录384.1事件管理流程相关表格38图目录图 31 XXX事件管理流程概览3图 32 事件检测和记录3图 33 事件分类和初步支持3图 34 事件调查和诊断3图 35 事件解决和恢复3图 36 事件关闭3图 37 XXX服务管理流程关系图3表目录表 31 事件升级
4、机制3表 32 事件信息项3表 33 事件来源3表 34 事件性质3表 35 事件分类3表 36 事件紧急限度3表 37 事件优先级矩阵3表 38 事件时限3表 39 事件状态3表 310 事件结束代码3表 311 事件管理KPI列表31. 文档介绍1.1 文档简介本文档XXX事件管理流程设计手册,是XXX信息技术总部(以下简称XXX)团队制定的事件管理流程文档。通过制定该流程,可以帮助XXX信息技术总部团队对积极监控发现以及用户上报的故障和服务请求进行快速响应和快速解决, 尽快恢复中断或受影响的用户业务。通过该流程的规范,可进一步改善XXXIT服务向用户提供的服务水平和服务质量,保证用户对服
5、务价值的认同和肯定。本文档是依据目前XXX的IT服务状况而制定的事件管理流程,进一步的流程更新将移交由XXX服务团队负责。1.2 文档用途本文档既是本次IT服务管理项目事件管理流程的交付物,也可作为XXX服务团队进一步改善事件管理流程的蓝本,读者对象为与事件管理流程相关的所有管理与技术人员.本文档所描述的流程在IT服务管理中有许多作用,列举如下:q 减小突发事件对业务的影响;q 最优化支持资源,提高工作效率;q 屏蔽错误事件和服务请求;q 根据影响业务轻重缓急安排资源解决事件,保障有效IT运营;q 加强有形监控和及时反馈;q 提高用户对服务的认知度和满意度;q 提供管理信息;1.3 文档结构本
6、文档作为XXX事件管理流程设计手册,重要包含针对XXX服务运营中对用户故障及用户请求解决等相关人员及活动的定义和描述。各章节中内容概要如下:q 文档介绍重要对文档的目的、用途及结构进行简要描述,并就文档当中出现的术语进行了说明。q 事件管理流程简介重要对事件管理流程的基本概念、目的和范围进行了介绍。同时简朴梳理了事件管理流程中包含的重要活动内容,最后对事件管理流程对组织及用户的业务价值进行了相关阐述。q 事件管理流程设计该部分为本文档的重点章节。在该章节中,一方面对事件管理流程的相关执行原则和代码进行了描述;另一方面,对事件流程相关角色的职责和技能规定进行了说明;基于流程原则和角色定义,进而对
7、事件管理的概要设计流程及具体设计流程进行了充足定义,并给出了事件管理流程的关键衡量指标,以保证对流程运营的监控、管理和改善。q 附录与事件管理流程相关的附属内容,都将在附录中进行补充说明。1.4 术语q 服务台在ITIL中, 服务台从主线上来说提供了用户和IT部门的唯一接口。此项功能经常通过集中的服务台进行体现。服务台的主线目的是提供一线支持,并通过变通方法、解决方案或升级到二线支持等手段帮助用户恢复到正常工作状态。q 事件管理ITIL流程,是负责解决所有的IT事件、问题和用户请求等的管理流程。它的目的是尽快恢复被中断或受到影响的IT服务,所以它的特点往往是以解决表征现象为目的,而不在于查找主
8、线因素。q 问题管理ITIL流程,是负责对事件进行进一步分析,找出主线因素并提供解决方案的管理流程。它的目的是积极防御,找出主线因素并对其根除,所以它与事件管理流程有显著的不同,以“治本”为最终目的。q 变更管理ITIL流程,是负责对生产环境中支持IT服务的各种基础架构设备和应用系统的变更操作进行记录、分类、评估、计划和协调的流程。它的目的是在权衡“风险”和“效率”的前提下,对变更操作进行有效的控制,以保证任何变更对IT环境和其所支撑的IT服务的影响最小。q 发布管理ITIL流程,是负责相应用系统上线过程的全局管理和控制。管理范围涉及测试环境、预发布环境和生产环境等,旨在通过对发布单元的生命周
9、期各个阶段的控制保证其安全稳妥的进入生产环境,而不引入新的缺陷或故障。q 配置管理ITIL流程,配置管理负责描述,跟踪和报告所有IT基础架构中的每一个设备或系统的管理流程。这些设备和系统被称为配置元素(CI)。每一个CI必须有效管理,跟踪和控制以支持IT服务和基础设施成功运营。q 配置管理数据库(CMDB)是在配置管理流程中用于记录公司所有IT相关配置元素信息及其互相关系而建立的数据库。q ITIL IT Infrastructure Library,是英国政府在1987年制定的有关IT服务管理的方法论,现已成为事实上的IT管理标准。2. 事件管理流程简介2.1 流程基本概念事件管理流程通过提
10、供服务台作为平常IT支持接口,由IT支持人员根据流程定义,快速响应和解决IT用户的服务请求、突发事件、投诉反馈等,最大化地减少突发事件对用户业务活动的影响,最终保证SLA目的的实现。事件管理流程相关的几个关键词汇解释如下:“平常支持接口”:即服务台,该接口将采用集中服务方式,向所有IT用户提供唯一服务窗口,按照业务需求,提供相应级别的支持服务。“IT用户”:指的是指XXX服务的使用者,他们使用XXX提供的IT服务来支持相关平常业务。“IT支持人员”:指的是XXX 服务团队中IT运维和支持人员的统称,涉及一线人员和二线人员等,也许涉及XXX体系中的相关的开发、支持和运维等团队。 “一线支持”:指
11、服务台的通用座席,向IT用户提供一线支持服务,以下提到的服务台人员即一线支持人员。“1.5线支持”:指机房值班人员(交易系统故障时)和桌面维护人员(桌面故障时),在桌面类和机房交易系统相关事件解决过程中实行IT支持服务; “二线支持”:重要由各职能小组运维工程师组成,协助服务台一线人员参与事件解决,相对一线支持人员,二线支持具有更高更专业的技能。“三线支持”:指各职能小组组长,在复杂度较高事件或二线支持无法解决事件时负责协调小组内部人员进行事件解决,三线支持更多的强调管理协调职能。“四线支持”:指XXX开发团队和供应商等。“事件”:指XXX在用户IT环境中发现的所有非正常事件,对现有的服务导致
12、影响或中断。例如:服务器宕机、网络中断、应用不可用等。历来源上来分,重要涉及由信息技术总部内部人员发起的事件以及有用户报告的事件等。 “服务请求”:指用户提出的关于标准服务、培训、文档、信息等方面的请求,以及针对IT服务使用的征询等,通常并没有发生IT组件方面的故障。例如:请求培训、寻求征询等。服务请求是一种特殊类型的事件。 “投诉反馈”:指由用户提出的对于IT服务质量或服务方式的抱怨或改善建议,通过服务台统一接受,并进行相应解决。2.2 流程目的事件管理流程的重要功能是尽快解决出现的事件,保持业务支撑系统的稳定性,其目的涉及: q 在成本允许的范围内尽快恢复IT服务- 快速响应故障及服务请求
13、- 用户在线获得帮助- 沟通事件解决的状态 - 和用户确认事件的解决q 进行事件控制- 按规范记录事件- 就事件的优先级,影响度 进行分类- 分析,诊断,必要时进行升级- 监视并结束事件- 进行定期服务流程回顾q 提供IT管理信息- 人力资源运用情况- 故障解决情况- 支持效率2.3 流程范围XXX事件流程管理范围涉及所有用户与XXX信息技术总部内部的事件、服务请求和投诉反馈等。其中:q 不涉及现有应用系统新增功能需求q 不涉及用户对于信息类设备和应用系统的新需求q 不涉及新系统开发需求2.4 流程重要内容事件管理流程始于事件的接受和报告,结束于事件的解决。该流程包含下述重要内容:q 事件接受
14、和记录 这个环节是事件管理流程的起点。所有监控系统或用户报告的IT 事件必须由此环节开始。此环节的目的是在事件发生时快速准确地发现,以协助事件的诊断和解决并告知相关人员。在此环节中将会收集创建事件记录所需的信息。该环节的关键是信息的准确性和完整性。q 分类和初步支持对于每个事件,需要确立优先级和分类。若没有现成的解决方案(Solution)或变通方法(Workaround),该事件将分派给合适的支持人员对此进行调查。q 调查和诊断 若支持人员无法运用现成方案解决事件,可运用自身技能、知识库、诊断工具等进行更加进一步的分析以找到恢复服务的临时措施,必要时可调用多名支持人员以寻求解决措施。q 解决
15、和恢复支持人员实行事件的解决方案,并将解决完毕的事件转回服务台,由服务台告知用户解决的结果,并得到用户的确认。q 事件升级对于高优先级的事件,服务台应立即上报给事件经理和相关的管理层,由事件经理决定事件的解决方式,保证其得到最快速的解决。当事件解决超过预期解决时限,应告知相关解决人员和管理层,以引起解决人员和管理人员的重视和参与。q 结束事件当用户确认事件解决后,可结束该事件。2.5 流程业务价值XXX事件管理流程将在多个方面对“XXX服务”业务产生积极作用,具体表现在以下几个方面:单一联系点 通过在团队内部建立服务台,作为与用户沟通联系的单一联系点。对用户方发生的故障及用户上报的服务请求进行
16、快速响应和统一管理,对内部服务支持资源进行合理协调和调配。同时,服务台作为IT服务窗口,也进一步维护和加强了与用户的关系,为提高用户体验和满意度起到了重要作用。用户业务尽快恢复 通过合理调配资源,使用知识库等相关支持工具,对不同级别事件选择各自的解决时限,对用户被中断或受影响的业务进行快速响应和恢复。内部团队协作加强 为服务支持团队成员分派角色,并清楚界定职责。通过事件管理流程将团队成员进行有效的连接,加强内部团队协作和沟通的有效性和工作效率。服务质量控制和改善 通过定期提交流程相关指标和报表至管理层,以实现对流程的监控和管理,同时为服务质量的改善奠定基础。3. 事件管理流程设计3.1 流程执
17、行原则3.1.1. 流程常规原则q 所有在流程范围内发生的事件,都应当被完整准确的记录下来,记录的信息应足够具体,涉及事件解决交互过程,具体的解决方案和相关的附件等。q 事件解决过程中,在需要寻求第三方的情况下,遵循下述原则:- 根据事件实际解决情况,各二线或三线支持寻找相应供应商- 在供应商参与解决事件的过程中,事件当前解决责任仍保存在二线或三线人员处q XXX服务支持体系是由信息技术总部全体人员共同组成的,事件的解决过程中必须加强一线和二线的沟通,沟通的方式优先使用工具(服务管理平台),在需要的时候必须辅助电话、短信、邮件等手段。q 所有支持人员优先解决优先级较高的事件。q 对于来自于服务
18、台转入的事件(涉及故障/服务请求/征询/投诉建议),初次接听电话并进行支持的服务台人员负责在系统中进行登记,并由该员工成为该事件在XXX范围内的负责人,保证事件在在XXX内部得到有效跟踪、解决,并将解决结果反馈给服务台。q 每月定期产生事件管理报表,分析服务质量,对重大事件、反复发生的事件或者运用变通方法解决的事件,应提交问题管理流程进行问题定义分析和解决,并定期对这些事件进行评估跟踪。q 建议每三个月对流程进行回顾,涉及流程执行效率和流程支持工具的有效性,以改善和优化事件管理流程。3.1.2. 责任制原则责任制原则用来保证每个事件在任何时段都有适当的人员负责。q 由监控系统上报的事件,对故障
19、进行辨认并在系统中记录的服务台人员是该事件的负责人,保证事件得到有效跟踪与解决,并负责事件单的关闭q 由用户电话上报的事件,初次接听电话并进行支持的服务台人员负责在系统中进行登记,并由该员工成为该事件的负责人,保证事件得到有效跟踪与解决,并负责事件单的关闭q 服务台员工换班时,由服务台值班经理进行事件重新分派,事件负责人也由此转移q 事件被服务台人员转至二线人员或第三方后,二线人员/第三方成为该事件的当前负责人,但服务台人员仍然是事件的整体负责人,有义务对事件解决状态按相应策略进行监控,并及时反馈给用户,保证事件的解决过程对用户充足透明。3.1.3. 事件分派原则事件分派原则是保证事件在服务目
20、的时段内解决和解决的重要因素。q 服务台一线支持人员在规定的一线解决时限内,可按情况选择转给其他在值服务台一线支持人员进行解决q 服务台一线支持人员在规定的一线解决时限内不能解决事件时,原则上根据事件分类分派到相应二线支持人员。q 在特定情况下,比如二线支持人员的非工作时间内,服务台一线支持人员在派单后运用电话方式告知二线人员相关事宜。q 桌面类故障导致事件直接由1.5线桌面运维小组进行解决q 开市期间交易系统故障,直接由1.5线机房座席接听解决。q 服务台一线支持人员在判断事件为交易系统故障后,应第一时间按策略通报机房解决,不能明确界定是否是交易系统故障,亦应交机房解决。3.1.4. 事件重
21、分派原则q 二线支持接受服务台分派事件后,假如该事件不属于本人支持范围或者自身能力无法解决,二线人员需一方面注明因素,然后将事件返回到服务台,由服务台重新分派。q 为提高事件解决效率,应当尽量减少事件单重分派的几率。事件单的重分派次数不应当超过2次。q 同组的事件单再分派不被监控;q 任何跨组的事件单再分派将会报告给事件经理;q 事件再分派超过2次,事件单将升级给事件经理;3.1.5. 反复/复发事件原则反复事件 假如被报告的事件与某个已经创建且尚未解决的事件单症状相同,则该事件被认为是反复的。将会为此反复的事创建新的事件单,并标注此单为“反复”并与原始事件单相关联。原始事件将被标注为“主事件
22、”复发事件(3天内同一用户,同一件事)假如报告的事件与已经关闭的事件相同,该事件被认为是“复发”的事件单。这意味着为了解决事件而采用的解决措施失败了(或失败或误再报)。此时,应当创建一个新的事件单,复制原始事件单的内容,并说明这是复发的事件。3.1.6. 事件关闭原则q 事件单的关闭必须由服务台相应1.5/1线支持人员完毕,但是事件经理可以超越此规则。其别人无权关闭事件单。二线支持人员拟定解决方案并解决事件后,必须把事件返回到服务台。q 事件单的用户可以规定关闭此事件单,例如:误报、错报事件。关闭事件单由事件单相应一线支持人员负责。q 服务台人员关闭事件前,需获得客户对解决方案的确认和反馈。q
23、 关闭事件时,根据实际解决情况填写事件的结束代码。q 已关闭的事件单不允许重开。假如事件反复发生,则创建一个新的事件单,并标记为复发事件。q 对于以“变通方法解决”或 “不能重现”结束代码关闭的事件,需告知问题经理对此类事件进行分析并在必要时生成问题,通过问题流程对问题进行根源分析并提供解决方案。 q 所有优先级为最高的事件在关闭后,需告知问题经理对此类事件进行分析并在必要时生成问题,通过问题流程对问题进行根源分析并提供解决方案。q 对于未及时取得用户反馈的已解决事件,系统将对其保存3日。3日内服务台人员应至少天天积极与用户联系1次。若3日后仍未得到用户有效反馈,系统将自动关闭事件,并标记结束
24、代码为“自动关闭”字样。3.1.7. 事件通报原则对于监控系统自动发现的告警信息,服务台人员有责任对其进行辨认。如确认为一条事件,则应一方面在第一时间通报相应用户和事件经理,然后在服务管理平台中进行记录。通报策略具体如下:通报方式q 用户工作时间内采用正式的告知方式进行通报q 用户非工作时间采用邮件方式进行通报q 与用户通报相关的其他方式参考与用户签订的SLA中的具体定义q 采用邮件的方式告知事件经理; q 假如由于用户因素第一时间无法完毕通报,应一方面在服务管理平台中登记一条事件,并置于“挂起”状态,相关服务台人员有责任在开单后每隔5分钟积极尝试联系用户3次。若3次后仍无法取得联系,则应在事
25、件工作日记中注明“无法联系到用户”的字样,并进行后续解决;若3次内取得联系,则在与用户确认故障后,取消事件“挂起”状态并进行后续解决。通报对象q 依照事件分类表中定义,向用户部门相关人员通报q 最后通报事件经理通报内容q 事件简要描述q 也许受到影响的用户方业务(或范围)q 确认是否为用户方运维操作导致q 也许导致事件的因素q 预计解决事件的时间点3.1.8. 事件升级原则制定升级原则的目的是保证事件在规定的解决时限内可以及时告知相关技术人员和管理人员,引起足够的重视,协助提供合适的资源,从而快速找到解决事件的方案。q 优先级为最高的事件,需要立即事件升级,同时,事件继续按事件管理流程进行快速
26、解决q 超过规定的响应或者解决时限之后,需要立即升级事件,同时,事件继续按流程进行快速解决q 事件反复派单超过三次直接升级给事件经理具体事件升级机制如下表所示:表 31 事件升级机制事件升级机制小组技术经理事件经理运维经理技术总部领导公司领导优先级15分钟5分钟10分钟10分钟15分钟优先级21小时1小时1小时1.5小时优先级32小时2小时优先级44小时4小时3.1.9. 流程关联原则q 和问题管理的关联- 一线支持在解决事件的过程中,可以通过问题记录查找相应的解决方案- 通过度析事件记录,形成问题,并使该问题与相关事件建立关联- 通过事件单和问题单的关联,服务台人员对问题的解决状况进行跟踪并
27、和用户保持沟通- 对高优先级事件或者“变通方法解决”或“无法重现”关闭的事件,由问题管理流程生成问题进行进一步分析,直到拟定主线因素,得到主线解决。事件单和问题应建立关联。q 和变更发布管理的关联- 事件解决过程中,假如需要对相关IT组件进行变更(不在标准变更清单内的变更),必须按照变更管理的定义,提交变更请求(变更单必须和事件单建立关联),变更完毕后,继续事件的解决。- 高优先级事件的解决过程中,假如需要对相关IT组件进行变更,必须按照变更管理的定义,提出紧急变更请求,变更完毕后,补录紧急变更单,并和事件单建立关联。q 和配置管理的关联- 事件解决过程中,可以通过配置管理查询相关的配置项信息
28、(特别是关系信息)以及该配置项历史上发生的事件、问题或变更,来帮助故障的定位- 事件解决过程中,假如可以将故障定位到某个配置项,则必须将事件单与该配置项关联3.2 流程相关定义3.2.1. 事件信息项事件单必须包含如下事件信息项,XXX服务团队可以在此基础上进行扩充:表 32 事件信息项序号信息项说明1事件ID事件单流水号(系统自动产生)2事件请求人事件申报人的信息,涉及:姓名、公司、部门、电子邮件、办公电话、手机3事件登记时间在服务台生成事件记录的时间(系统自动产生)4事件登记人事件开单人的信息,涉及员工姓名、员工ID、联系方式等(系统自动产生)5事件发生时间针对故障:指的是业务中断的实际时
29、间 (也许早于登记时间,自动设立或者手工填写);针对用户请求:缺省值等于登记时间。事件发生时间必须早于或等于登记时间。6事件发生地点事件发生的位置信息7事件来源参见“事件来源”定义8事件标题事件的简要描述9事件描述对于整个事件内容的具体描述10事件性质参见“事件性质”定义11事件分类参见“事件分类”定义12事件状态参见“事件状态”定义13事件影响范围参见“事件影响范围”定义14事件紧急限度参见“事件紧急限度”定义15事件优先级参见“事件优先级”定义16事件完毕期限相应每一个事件优先级,系统根据流程相关定义中“事件解决时限”自动设定最终的完毕期限 (系统自动产生)17事件分派工作组被分派的支持小
30、组18事件分派人员被分派的支持小组内成员19事件工作日记反映事件解决过程的信息 20解决方案/变通方法事件解决方案/变通方法的描述21事件解决人事件的最终解决人22事件解决人角色参见“事件解决人角色”定义23事件解决时间记录事件状态为“已解决”的时间(系统自动产生)24解决是否超时参见“解决是否超时”定义(系统自动产生)25涉及第三方支持XXX和第三方集成商名称26关联配置项记录出现故障的线路编号或者CPE设备编号27关联的问题单号记录由事件引发问题时,关联的问题单号28关联的变更单号记录由事件引发变更时,关联的变更单号29事件结束代码参见“事件结束代码”定义30事件关闭时间记录事件状态为“结
31、束”的时间(系统自动产生)31反复事件标记标记为反复事件32相应告警ID事件如来自于监控系统告警,则填写相应告警的ID;若为用户自动上报,此处为空不填33 用户满意度用户对事件解决的满意限度。分值从5分至1分,分别相应非常满意、比较满意、一般,不太满意及很不满意34用户反馈信息用户对事件解决过程及结果的意见或建议35附件信息事件相关附件信息IT运维事件单(含事件、信息征询、服务请求)事件单编号: (示例:)受理事件基本信息 受理时间2023年 月 日 时 分受理人用户所属部门申报人申报人电话申报人EMAIL申报方式电话 邮件 工作台 现场 其他受理人根据事件形成事件信息服务分类故障 问题 改善
32、 征询 业务需求 投拆 其他 事件分类桌面终端类:PC机故障 局域网故障 软件故障 外设故障基础设施类:硬件故障 操作系统/DB/系统软件故障 网络故障 机房环境故障(空调、UPS等)应用系统类:可用性 响应速度 功能性 易用性 (应用系统列表选择)影响度:人员分类报障人员分类VIP1 VIP2 普通影响度:受影响人员分类单内部客户 单部门 2个部门以上影响度:单外部客户 单营业部 24个营业部 4个营业部以上影响度:关键设备关键设备(列表选择) 非关键设备 未知影响度:典型事件分类典型事件(列表选择) 无相应典型事件事件描述事件影响度事件紧急度1-危急(5分钟) 2-紧急(高,30分钟)3-
33、紧急(中,2小时) 4-紧急(低,4小时) 5-普通(4小时以上)事件解决优先级事件完毕计划时间受派人员解决人员记录响应时间 月 日 时 分解决人员服务方式电话 Email 现场 远程终端 送修 其它因素及故障分析:解决办法:是否需要发起技术问题解决 是 否 (去除?)完毕时间 日 时 分用户反馈(用户填写)解决结果所有解决 部分解决 未解决满意度评价非常满意 较满意 满意 不满意用户意见(可选)事件优先级升级记录事件结束方式自动结束 客户确认结束 转为其它 事件经理结束事件相应其它流程编号(转为其它时填写)转为同工具其它流程(相应编号) 转为NOTES其它流程(流程名称(列表)相应编号)最终
34、事件分类(服务台填报)故障类型问题类型征询类型需求类型投拆其他知识库评价有相应完善知识库 知识库需完善 无相应知识库 3.2.2. 事件来源事件来源代码用来标明事件的提出方式,事件来源可以涉及以下几种:表 33 事件来源事例来源 描 述 电子邮件 服务台通过电子邮件收到一个请求。 电话 服务台通过电话收到一个请求。 服务台工具(Help Desk) 服务台通过Web系统(流程管理平台)收到一个请求。 来访用户直接到电脑部工作间找相关工程师报障积极监控服务台通过系统网络管理工具积极监控得到的请求。 3.2.3. 事件性质事件性质用来表白事件的概要类型,具体可以包含以下几种:表 34 事件性质请求
35、类型 描 述 事件 出现对服务导致影响的不正常现象 信息征询 对与业务或IT相关杂项信息(联系人、电话号码,状态查询等)的请求 服务请求 对外宣布的服务(不含新业务需求) 3.2.4. 事件分类事件分类代码用于标记故障或申告的具体因素,由支持人员在解决过程中填写。当事件发生时,应当由服务台初步分析和定位事件的分类,一方面便于与历史事件/问题或者知识库的匹配,另一方面也便于选择合适的二线或者第三方进行分派。事件最终分类可由后续支持人员作进一步的确认,并在事件关闭前进行调整。事件的分类层次设计不超过三层,第一级分类,称之为“类别”,第二级分类,称之为“子类”,第三级分类,称之为“条目”。XXX事件
36、分类表分为三大类:桌面类、网络类、系统类表 35 事件分类流 程系统/类别模块/子类模块/子类说明使用部门典型事件二线负责人三线负责人四线负责人备 注各应用系统名称应用系统的模块名称模块业务功能说明使用该模块的业务部门填写基本原则:客户化语言描诉解决该事件的工程师或职能小组3.2.5. 事件优先级优先级是事件管理的一个关键要素,优先级决定解决事件的顺序及所需的资源。在XXX服务中,事件优先级可分为四级:P1(最高)、P2(高)、P3(中)、P4(低)。为方便服务支持对于事件优先级的判断,XXX建议从事件影响限度和事件紧急限度两维来进行优先级定位。事件的影响限度重要是对事件发生的关键限度以及事件
37、发生后的影响范围综合考虑得出。在XXX业务中,要考虑以下几个方面:q 用户身份q 受影响用户数量和范围q 受影响设备q 受影响系统具体影响限度鉴定可直参考附件中的影响度判读资料。事件的紧急限度重要由事件自身是否涉及关键业务系统来进行鉴定,如事件涉及关键业务系统,则认为紧急限度较高,需要尽快恢复;如事件不涉及关键业务系统,则认为紧急限度较低,可优先解决紧急限度较高的事件。在XXX业务中,事件紧急限度定义具体如下:表 36 事件紧急限度紧急度紧急度时间标准备注1-危急30分钟2-紧急(高)2小时3-紧急(中)4小时4-紧急(低)8小时5-普通8小时以上结合事件发生时的影响限度和紧急限度,可以通过下
38、表拟定事件的优先级:表 37 事件优先级矩阵事件优先级影响度高中低紧急度1-危急1232-紧急(高)2333-紧急(中)3444-紧急(低)3445-普通444注:对于用户上报的服务请求,一般建议按优先级为P4(低)进行解决。3.2.6. 事件时限在事件解决过程中,对于事件应有响应时间限制、分派时间限制和解决时间限制,以保证事件解决过程的高效执行。假如该事件的响应、一线分派、解决超过了时限,需要通告事件经理,同时也要根据具体情况通告给其他相关管理人员。响应时限指的是事件发生到在系统中登记所通过的时间;一线分派时限指事件登记时间到转给二线/第三方所通过的时间;解决时限指的是事件登记时间到事件状态
39、变为“已解决”所通过的时间。在XXX业务中,不同的事件优先级相应了不同的响应时限、一线分派时限及解决时限,具体如下:表 38 事件时限事件目的时间一线响应时间事件被分派并得到接受事件得到解决的时间备注优先级13分钟5分钟30分钟优先级25分钟10分钟2小时优先级310分钟20分钟4小时优先级410分钟30分钟8小时3.2.7. 事件状态事件状态代码表白事件所处的解决状态,事件状态如下:表 39 事件状态状态代码 描述 待解决一个事件被记录或创建已分派一个事件已被分派给一线支持人员、二线支持人员或事件经理; 受理中-1线受理中-1.5线受理中-2线受理中-3线受理中-4线任何一个服务台1/1.5
40、/2线支持人员或第三方(供应商、开发部)接受了事件并开始解决事件挂起事件信息不完整,或在某些情况下阻止事件受理员对事件进行解决,等待的因素为: 需要客户提供更具体的信息 优先级为1、2必须由事件经理挂起 不能联系到用户人员 升级到供应商解决 采购定单的批准 不可抗拒力因素 已解决为一个事件找到解决方案或变通方法已关闭事件经用户确认已关闭 3.2.8. 事件结束代码事件结束代码说明了事件是在何种情况下关闭的,结束代码如下:表 310 事件结束代码事件关闭代码 描 述 成功事件被正常解决成功但有问题事件已通过变通方法解决掉,但是需要进行更进一步的根源分析。不能重现没有找到错误或不能重现故障操作错误
41、用户错误(如操作错误、理解存在误差等)失败已知的错误、变通方法或已实行的变更失败,不能解决这个事件或问题3.3 流程角色和职责定义3.3.1. 事件流程负责人事件管理流程负责人从宏观上监控流程,保证事件流程XXX服务团队范围内被对的的执行。随着业务需求和IT环境的改变,流程负责人必须定期或不定期进行流程分析、找出缺陷、进行改善,从而实现服务能力的可连续提高。职责定义:q 拟定管理流程的衡量指标q 保证事件流程可以取得管理层的参与和支持q 保证事件流程符合业务实际状况和业务发展战略q 总体上管理和监控流程,建立事件流程运营机制q 保证事件流程实用、有效、对的地执行q 保持与其他流程负责人的定期沟
42、通专业技能:q 理解内部和外部业务环境q 理解业务规划及发展战略q 理解用户需求q 充足理解业务相关IT政策、操作过程和标准q 流程的评估和设计能力q 良好的分析和规划能力q 理解事件管理流程q 理解服务水平承诺处事技能:q 良好的矛盾管理技巧q 拟定问题和趋势发现的能力q 良好的口头和书面表达能力q 工作积极性和领导能力q 决策能力 3.3.2. 事件流程经理事件流程经理负责事件解决过程中的协调和监控,以及事件升级的判断以及升级过程中的具体执行或协调。职责定义:q 监控事件流程运营状况q 负责对事件解决过程的资源协调,跟踪事件的解决进展q 当事件超时升级或重大事件升级时,负责或参与资源协调,解决事件q 保证和问题管理流程的有效合作q 基于事件解决状况,发现IT或业务相关的问题专业技能:q 充足理解业务相关IT政策、操作过程和标准q 基本了解业务系统环境q 具有流程的知识q 了解用户需求q 分析技能