1、xx银行信息科技事件和问题管理办法xx总发xx253号附件3,xx年11月21日印发第一章 总 则第一条 为加强本行生产系统的事件管理和问题管理,明确在信息系统事件、问题管理工作中的职责,理顺事件、问题管理的各种关系,规范事件、问题管理流程,畅通事件、问题管理的渠道,保证xx银行计算机系统稳定、高效、安全地运行,特制定本办法。第二条 本办法适用于xx银行机房环境及设施、主机网络、应用系统等信息科技相关的事件和问题管理。第二章 组织与职责第三条 xx银行信息科技事件和问题管理中的主要职责包括:(一)运行管理科科长:1、负责在重大事件期间调配资源、制定计划和组织决策;2、负责审阅月度运行报告;3、
2、负责信息科技服务满意度调查。(二)机房值班人员:负责对事件进行接待、记录、流转及回访。(三)事件、问题管理员:1、负责对事件进行派单处理和追踪;2、负责识别并记录问题,对问题进行分类;3、负责实施问题解决方案;4、负责对问题和问题解决情况进行汇总并报告;(四)二线/三线技术人员(可能为非运维中心技术人员、外包技术人员、供应商技术人员、开发人员、外部专家等):负责对事件进行处理、原因分析,并提供规避方案。第三章 事件管理第一节 事件分类第四条 按照来源,事件分为下列二类:(一)故障类事件:因各种故障导致或可能导致信息科技服务中断或服务质量下降的事件。仅需对故障类的事件划分优先级;(二)非故障类事
3、件:不会导致信息科技服务中断或服务质量下降的事件;故障类及非故障类事件的详细二级分类参见附件一。信息安全事件的相关处理流程请参见信息安全事件管理办法的相关规定。第二节 事件优先级第五条 对于故障类的事件,基于如下两个维度对事件确定事件优先级:(一)事件的影响程度;(二)事件的紧急程度。第六条 事件影响程度等级从影响系统服务、影响分行、影响系统及影响时段四个维度进行判断,详见下表:维度事件影响范围影响系统及服务受影响的应用系统或服务名称影响分行范围从大到小分为:全辖、总行、分行/中心支行、部分网点、对业务运行无影响但存在潜在隐患影响时段分为主要业务服务时段(8:00-17:00)和非主要业务服务
4、时段(17:00-次日8:00);注:每年五月一日至九月三十日主要业务时段结束时间延后半小时。影响系统等级按重要程度由高到低分为A、B、C、D、E五类注:1、“影响系统等级”维度的A、B、C、D、E为对应用系统的分类,主要考虑系统的关键程度,具体的系统归类情况详见附件二。2、如某事件涉及多个系统或服务时,事件影响程度取其中较高的等级。第七条 事件的紧急程度紧急程度说明紧急对业务系统影响较大,导致或可能导致服务中断或服务质量降低,需要立刻进行恢复处理的事件。常规除紧急事件外的事件。第八条 事件的影响程度等级与优先级事件影响程度等级划分见下表,表中1级事件、2级事件被定义为重大事件。影响分行影响系
5、统影响时段主要业务服务时 段非主要业务服务时 段全辖A11B11C23D34E34空调、UPS、配电等设备11分行/中心支行A12B12C23D34E45部分网点A23B23C34D45E45总行A23B23C34D45E45空调、UPS、配电等设备23对业务运行无影响,但存在潜在隐患A34B34C45D55E55空调、UPS、配电等设备34事件的优先级根据事件的影响程度等级和事件紧急程度来综合决定。影响等级高并且紧急程度高的事件优先级为最高级,影响等级低并且紧急程度低的事件优先级为最低级。优先级按照以下顺序排序(故障类之外的其他类事件均默认为最低级别): 事件级别紧急程度1级事件2级事件3级
6、事件4级事件5级事件紧急事件13567常规事件248910注:事件的优先级分110级,1级为最高优先级事件,10级最低,优先级根据事件的影响程度等级(15级事件,1级事件影响程度最高,5级最低)和事件紧急程度(紧急、常规)来综合决定。第三节 事件的来源与受理第九条 事件的来源:(一)业务部门上报:全行24小时技术服务热线:当业务人员无法正常使用信息系统时,可以通过拨打技术服务热线向总行科技部请求技术支持;书面、传真等方式:业务部门还可以通过提交业务联系函、传真等方式上报事件;(二)监控系统报警:科技部设有724小时监控系统,当出现异常时能够通过声光报警、邮件等方式提醒运行中心人员及时进行处理;
7、(三)巡检:对机房环境及设施、数据库、服务器及网络设备的巡检过程中发现的异常进行记录和处理;(四)批作业:在批作业执行过程中,如发现:批处理异常、批处理超时的情况。第十条 事件受理:(一)机房值班人员负责接听24小时技术服务热线以及收取书面上报和传真,机房值班人员根据事件描述对事件进行初步判断,值班人员能直接解决的问题,不作为事件记录;无法直接解决的,必须记录详尽事件信息,并尽快通知事件管理员;(二)事件受理采取首问负责制,对于不是通过机房值班人员的事件报送,受理人应在接到事件报送后记录相关事件信息,上报机房值班人员,并启动事件管理流程,跟踪事件处理并负责事件回访工作。第四节 事件的处理第十一
8、条 事件管理员接到机房值班人员提交的事件报告后,应参照“运行中心知识库”,判断事件类型、紧急程度、影响范围等,并填写事件处理单。对于运行中心人员通过监控系统发现报警情况,或者在巡检、批处理中发现故障时,应及时填写事件处理单,上报机房值班人员,判断并记录事件类型、紧急程度、影响范围等,并提交给事件管理员。第十二条 对于故障类事件,应严格按照事件响应及解决升级时间表要求对事件处理单进行响应和处理。第十三条 事件管理员接到或创建事件处理单后,严格按照事件响应及解决升级时间表要求,对事件处理单进行响应和处理。事件管理员可更新机房值班人员记录的事件类型、事件紧急程度、事件影响范围等。第十四条 事件管理员
9、须按照“运行中心知识库”解决方案操作并解决事件。对于知识库中没有解决方案的事件,事件管理员应判断本岗位是否可以解决。对于本岗位已解决的事件,须将解决方案记录至“运行中心知识库”;对于本岗位无法解决的事件,应将事件处理单及时提交给二线技术人员,并电话通知。第十五条 二线技术人员接到事件管理员转发的事件处理单后,应按照事件响应及解决升级时间表进行响应。对于二线技术人员已解决的事件,事件管理员须及时将解决方案记录至“运行中心知识库”。第十六条 事件管理员应跟踪事件处理状态,并根据事件响应及解决升级时间表通知运行管理科科长。第十七条 对于优先级达到1级的事件,运行管理科科长须上报科技部总经理。总经理负
10、责监控该事件的处理过程。第十八条 对于需要通过生产功能变更流程或者特殊业务进行处理的事件,则须启动生产系统功能修改流程或特殊业务处理流程,相关流程完成后事件方可关闭。第五节 事件的关闭第十九条 对已解决事件,机房值班人员须回访业务部门提出人,了解其是否满意解决结果,通知事件管理员关闭事件处理单。第二十条 如需进一步提出问题的,则应创建相关联的问题处理单(报告),按照“问题管理”章节执行相关流程,并关闭事件处理单。第四章 问题管理第一节 问题的来源第二十一条 问题管理员负责从以下三种事件中识别问题,并发起问题处理单(报告)(附件四):(一)重复发生事件:一周内发生三次以上或累计发生五次以上的事件
11、;(二)未根本解决的事件:未识别根本原因,以临时应对措施解决的事件;(三)长期未解决的事件:一周以上未解决的事件。第二节 问题处理第二十二条 问题管理员创建问题单后,应提交给运行管理科科长审阅。运行管理科科长根据问题的性质、涉及的系统,指定具体人员或协调相关资源制定问题解决方案,并补充填写问题处理单(报告)。问题管理员负责更新问题处理单(报告)中记录的问题信息,如在问题处理单(报告)中填写解决措施等内容。 第二十三条 对本部门无法解决的问题,问题分析人员应联系供应商,由供应商帮助提供解决方案。第二十四条 运维人员按照解决方案在生产系统中实施相关操作,并在问题处理单(报告)中填写问题处理结果。问
12、题管理员对问题处理单(报告)进行复核,确认问题被有效解决后,将问题单置为结束状态,同时,将问题信息和处理情况汇总进入运行知识库。对于需要通过生产功能变更流程或者特殊业务进行处理的问题,则须启动生产系统变更流程,相关流程完成后问题方可关闭。第五章 分析与报告第二十五条 事件、问题管理员每月对事件、问题类型、数量和解决情况进行统计和汇总,并识别事件、问题发生趋势,提出可能的改进措施,加入运行中心月度报告,经运行管理科科长审阅后进行部内通报。第六章 附 则第二十六条 本办法由科技部负责解释和修订。第二十七条 本办法自下发之日起施行。附件:1.事件详细分类 2.应用系统分级表 3.xx银行事件处理单4
13、.xx银行问题处理单(报告)附件3-1事件详细分类事件一级分类事件二级分类备 注故障类应用系统无网络无数据库无服务器无存储及备份无柜面前置机无基础中间件无非故障类解锁包括:报表机柜员解锁、事后柜员解锁、前台IC卡充值解锁查看完工状态包括:查看网点完工情况、查看未完工员工信息、柜员完工报错处理流水错误包括:核心添加流水错误(前后流水不一致)、事后系统前后流水不一致信息查询包括:查询信息、数据的导入导出杀终端其他若选择其他类后,需手工填写类别信息附件3-2应用系统分级表等级系统名称A类(请结合实际情况填写)B类C类D类E类附件3-3xx银行事件处理单日 期时 间上报人联系方式故障来源接线员事件描述
14、:派单人建议处理人事件类别常规 紧急事件级别1级 2级 3级4级 5 级日志分析:事件原因:处理结果:处理人: 时间: 处理过程:备注: 10 附件3-4xx银行问题处理单(报告) 问题名称:问题类型重复发生事件 未根本解决事件 长期未解决事件问题发起人问题提出日期:要求完成日期:问题现象:(注:问题的现象描述,包括紧急程度、问题影响等内容)紧急程度(优先级):特急 紧急 普通问 题 影 响:影响业务开展 影响系统 其他相关科长意见: 日期: 年 月 日 问题分析与解决方案:(注:问题的责任归属、问题根本原因、问题趋势分析) 问题解决情况(实施结果): 实施人(签名): 日期: 年 月 日质量管理员确认签字: 日期: 年 月 日科技部负责人意见: 日期: 年 月 日注:处理方法、实施结果等可另附页 11