1、银行信息科技信息系统问题管理制度第一节总则第一条为稳步提升我行信息科技服务管理水平,加强信息系统问题管理和跟踪,实施故障根源分析和整改解决,预防故障重复性发生,特制定本制度。第二节适用范围第二条本制度适用于我行所有信息系统生产环境以及与生产系统相关的网络、设备、机房等基础设施和监控、操作等生产服务。第三条问题管理范围包括与IT生产系统相关的各种问题,以及围绕问题解决所发生的发现与记录、分析与诊断、解决与整改、关闭与总结的整个过程。第三节职责描述第四条问题管理过程的角色主要包括:问题提出人、问题经理、问题分析人、问题解决人。(一)问题提出人:1、问题提出人负责提出问题并提交问题单至问题经理。问题
2、提出人通过参与事件解决过程被动发现问题,或通过参与监控事件、日常检查、基础设施的运行趋势分析等活动主动发现问题;2、问题提出人负责对问题信息进行收集、整理并登记。问题提出人应及时登记问题,确保内容完整、描述准确,分类合理,避免重复提出问题;3、问题提出人负责对问题单的最后处理结果进行确认并关闭问题单。(二)问题经理:1、问题经理负责对问题进行分派、监控、所需资源的协调、定期产生报表等;2、问题经理负责定期对问题进行汇总,分析,向相关人员汇报问题单处理进度;3、问题经理负责问题的最后审核,并做好关闭和事后评价工作。(三)问题分析人:1、问题分析人负责对问题现象进行审核、确认;2、问题分析人负责深
3、入的问题分析,以找出根源性原因;3、问题分析人在特殊情况下为专家。(四)问题解决人:1、问题解决人负责确认问题分析人的分析结果;2、问题解决人负责分析结果的基础上,找到可行的解决方案;3、问题解决人负责安排生产变更或其他输出方式,实施问题的解决过程。第四节问题来源第五条问题的来源包括如下几种情形:(一)事件升级,通常由生产事件触发,管理目标是通过故障诊断、明确故障的根本原因、提出解决措施或纠正建议、最终解决问题以避免故障再次发生。(二)运维自查,通常由运维人员从监控事件、日常巡检、系统的运行趋势分析等工作中找出基础设施或环境中的薄弱环节、并提出消除薄弱环节的建议,进而阻止潜在故障的发生。(三)
4、风险事件,通常由我行风险管理部门根据生产系统故障的业务影响及风险隐患建立风险事件,并组织分析原因、提出整改要求及后续跟踪处理。(四)审计发现,通常为与我行信息科技相关的内、外部审计的问题发现,通过问题管理的生命周期以实现审计整改跟踪及解决过程。(五)专项检查,主要涵盖行内外专家或监管部门组成的各类信息科技专项检查,力图通过问题管理流程实现对检查结果的后续跟踪及解决。第五节问题识别与记录第六条问题提出人在创建问题单时需要说明问题来源、问题分类、优先级问题描述等详细信息。第七条问题管理流程应与事件管理流程相对独立,事件处理过程中故障消除、业务恢复后如需后续分析处理,应结束事件单,创建问题单。第八条
5、运维过程中发现的潜在故障,尚未影响业务的,应创建问题单。第九条对所处理事件历史记录进行趋势分析归纳后,形成的总结性案例问题,可创建问题单。第十条在确认风险事件需要进一步跟踪处理后,可由问题经理创建问题单。第十一条在确认信息科技相关的内外部审计结果后,可由问题经理创建问题单。第十二条在确认各类信息科技专项检查工作的检查问题后,可创建问题单。第六节问题分析与诊断第十三条问题在被创建后,由问题经理对问题进行初审,如判断需要进入分析流程的,由问题经理下派分析任务单进行问题的分析与诊断工作。第十四条问题分析工作应由技术专家、架构师、项目组负责人主导,复杂问题可多人并行进行问题的调查与诊断工作。第十五条问
6、题分析人在问题分析单中注意完整的填写处理过程、问题根本原因等字段。第十六条除非涉及厂商改造外购产品、国外厂商确认问题周期较长等外部客观情况,分析任务单应尽量在15个工作日内完成分析流程,并关闭分析任务。第七节问题解决与整改第十七条问题在被创建后,由问题经理对问题进行初审,如判断无需进入分析流程的,可直接由问题经理下派解决任务单进行问题的解决和整改。第十八条问题经理在确认分析人的分析结果后,可分派问题解决任务单至问题解决人处。第十九条问题解决人应由项目组负责人、各系统及专业相关的维护负责人主导,复杂问题可多人并行进行问题的解决与整改工作。第二十条问题解决人在问题解决单中注意完整的填写整改分类、整
7、改情况说明、解决方案、计划整改完成日期等字段。第二十一条问题解决人应在填写的计划整改日期内,完成问题的解决和整改工作。第八节问题关闭与总结第二十二条问题处理完成后,由问题经理负责对问题过程进行回顾,问题经理在回顾过程中,可将问题重新提交给处理团队处理。第二十三条问题经理完成问题回顾后,关闭问题。已关闭的问题单不允许重开。如果问题重复发生,则创建一个新的问题单。第九节风险事件类问题处理第二十四条为更好的跟踪处理风险事件及所涉及的整改内容,可由问题经理建立类型为风险事件的问题单。第二十五条风险事件问题单旨在对风险事件的整改点进行跟踪处理,由问题经理分派给整改解决人,并设定规定完成时间。第二十六条问
8、题解决人应在规定时间内完成风险事件整改任务单的反馈。第十节专项检查类问题处理第二十七条为更好的跟踪各类专项检查结果,可由问题经理建立问题类型为专项检查的问题单。第二十八条专项检查问题单旨在对专项检查的汇报结果和清单列表进行跟踪处理,由问题经理分派给检查结果的解决负责人,并设定规定完成时间。第二十九条问题解决人应在规定时间内完成专项检查整改任务单的反馈。第十一节审计发现类问题处理第三十条为更好的跟踪各类审计发现检查结果,可由问题经理建立问题类型为审计发现的问题单。第三十一条审计发现问题单旨在对我行内外部各项审计工作的问题发现结果进行跟踪处理,由问题经理分派给审计问题点的解决负责人,并设定规定完成
9、时间。第三十二条问题解决人应在规定时间内完成审计发现整改任务单的反馈。第十二节评价与提高第三十三条生产系统问题管理评价过程包括定期对问题单的分析、总结与回顾,根据各种问题属性对问题单进行统计,包括:问题来源、问题类别、问题优先级别、问题关闭状态等。第三十四条问题经理负责跟踪问题单的统计结果、分析问题的分布规律、进而提出建议提高整个问题管理流程执行的效率。第三十五条问题经理负责每月组织召开月度问题管理总结会,参加人员应包括运维中心总经理、各团队主管、事件经理、相关专家及架构师等。第三十六条问题经理负责不定期组织召开专项问题分析会,参加人员应包括问题所涉及系统的团队主管、相关维护人员、专家及架构师等。第十三节知识整理第三十七条对于验证有效的问题解决方案,问题处理人应视解决方案是否具有代表性和可复用性进行知识总结,并提交知识管理流程。第三十八条本制度由某银行科技开发部负责解释和修订。第三十九条本制度自发布之日起执行。二*年六月三十日