资源描述
农商行联合社机房基础环境应急预案
第一章 总则
第一条 为规范农商行联合社机房基础环境应急管理工作,科学应对机房突发事件,建立健全信息安全应急响应机制,有效预防、及时控制和最大限度地消除各类突发事件的危害和影响,根据《农商行信息系统突发事件应急管理办法》、《农商行联合社重要信息系统突发事件应急管理实施细则》等相关规定,特制定本预案。
第二条 本预案主要描述机房基础环境设施因系统故障或其他不可抗力无法正常运行时采取的应急措施。
第三条 本预案所称省联社是指农商行联合社。
第四条 重要术语定义
(一)本预案所指的业务服务时段为全天所有时间段。
(二)本预案所指的突发事件是指机房基础环境设施不能为重要信息系统提供支持服务、影响业务持续开展的、需要采取紧急处置措施应对的事件。
(三)本预案所指省联社科技信息中心IT服务台(以下简称服务台)是为系统应用部门和服务流程提供前台服务,负责人员指派、事件跟踪、知识库登记等工作。
第五条 本预案适用于农商行联合社。
第二章 突发事件分级
第六条 机房基础环境突发事件依照其影响范围及持续时间等因素分级,当突发事件同时满足多个级别定级条件时,按照最高级别确定突发事件等级。
(一) 特别重大突发事件(Ι级)
由于机房基础环境设施关键系统发生重大故障,发生故障的系统冗余性保护全部失效,无法继续支撑机房内各类设备和系统的正常运行,直接导致机房所承载的所有业务系统停用或中断。
(二) 重大突发事件(Ⅱ级)
由于机房基础环境设施关键系统发生严重故障,发生故障的系统失去部分冗余性保护,但机房各类设备运行正常,对数据中心所承载部分业务系统停用或中断。
(三) 一般突发事件(Ⅲ级)
由于机房基础设施环境系统发生普通故障,发生故障的系统保持冗余性,机房内各类设备和系统的运行未受任何影响,对机房所承载的各项业务未造成任何不良影响。
第三章 职能部门和职责
第七条 省联社科技信息中心应当成立应急处置团队,在发生机房突发事件时,做到及时实施专项应急处置工作。应急处置团队包括应急领导小组、应急技术执行小组和应急支持保障小组。
第八条 应急领导小组、应急技术执行小组和应急支持保障小组的主要职责是:
(一)应急领导小组
应急领导小组组长由省联社科技信息中心主任担任,副组长由省联社科技信息中心分管运维及机房的副主任担任,成员包括参加应急工作的省联社科技信息中心职能部门负责人。
主要职责:
1、负责信息系统突发事件的应急指挥、组织协调和过程控制;
2、授权其在应急处理过程中统一口径发布信息;
3、向省联社高管层报告应急处置进展情况和总结报告。
(二)应急技术执行小组
应急技术执行小组由省联社科技信息中心运维部门负责人担任组长,成员由运维部门人员及机房基础环境设施服务商组成。
主要职责:
1、实施重要信息系统突发事件的具体应急处置工作;
2、分析和评估重要信息系统突发事件业务影响情况;
3、收集分析信息系统突发事件应急处置过程的数据信息和日志;
4、向应急领导小组报告应急处置进展情况和事态发展情况。
5、制定和完善系统突发事件应急处置方案和操作流程等。
(三)应急支持保障小组
应急支持保障小组组长由省联社科技信息中心综合部门负责人担任组长,成员由相关部门人员组成。
主要职责:
1、提供应急所需的人力和物力等资源保障;
2、做好与业务部门的沟通联系工作;
3、做好秩序维护、安全保障等工作;
4、建立与电力、通讯、公安和消防等相关外部机构的应急协调机制和应急联运机制;
5、其他为降低事件负面影响或损失提供的应急保障等。
第四章 应急准备
第九条 人员准备
(一)应急技术执行小组和应急支持保障小组所有岗位应为AB角双人配置;
(二)任何时间,应急处置团队任何岗位应保证AB角中有一人在省联社科技信息中心所在城市;
(三)应急处置团队所有人员应在任何时间均保持电话联络的畅通;
(四)应急处置团队应与机房基础环境设施主要设备和服务供应商的管理层、技术层建立畅通的沟通渠道,设备和服务供应商熟知并认可其在本应急预案中应承担的职责;
(五)应急联络方式应保持更新,并由应急技术执行小组负责维护。
第十条 场地准备
(一)应急场地设在省联社科技信息中心;
(二)应急场地至少包括讨论用的会议室、供应急人员接入办公网和因特网的办公场地;
(三)应急场地配备必要的通信设施,至少包括充足的电话和传真设备;
(四)应急场地配备必要的计算机及其辅助设备。
第十一条 设备准备
(一)对重要部件和常见易损部件应在机房附近准备备件或者与设备供应商签订高级别的备件保障协议,便于应急取用;
(二)机房基础环境设施的所有设备和系统软件、线路应具有高级别的7×24小时保修服务。
第十二条 文档准备
(一)本应急预案;
(二)系统维护文档,包括各类故障定位、系统修复、系统关机、系统重启等;
(三)应急操作手册;
(四)应急处置团队人员名单及其联系电话;
(五)应急联络方式。
第十三条 其他准备工作
(一)当机房基础环境设施的运行环境、系统、设备等方面计划开展重大变更,以及来自电力、消防等安全单位进行计划内重要维护工作,应进行登记备案,并告知应急技术执行小组所有成员。备案情况应同时放置在省联社科技信息中心IT服务台备查,以利于应急处理中的故障定位工作。
(二)不断完善本应急预案内容。对于新出现的重大事件,应在事件处理完成后,经过讨论形成处理流程,经过测试和审批后,补充到本预案中。对于已经发生过的事件,如果处理流程有变化,也应及时更新。
(三)有关应急文档应妥善保存,并在应急场地备有多份硬拷贝。
(四)本应急预案应经过演练,所有应急人员熟悉应急预案中与自己相关的内容。
第五章 应急处置流程
第十四条 事件上报
机房基础环境出现故障后,省联社科技信息中心相关技术人员应及时进行故障定位和排除,如果未能及时解决,达到突发事件级别后,应向省联社科技信息中心IT服务台报告。
(一)触发条件
发生机房基础环境突发事件。
(二)工作步骤
1、第一时间上报省联社科技信息中心IT服务台;
2、核实故障的发生时间、主要现象、影响系统和范围;
3、密切关注事态发展,及时报送后续情况。
(三)方式
电话上报,可辅以邮件、传真等。
(四)执行人
省联社科技信息中心运维人员。
第十五条 事件通知
省联社科技信息中心IT服务台接到突发事件报告,应立即进行事件通知工作。
(一)触发条件
收到突发事件报告。
(二)工作步骤
1、通知应急技术执行小组相关成员,告知事件情况;
2、通知应急支持保障小组,并报告应急领导小组组长;
3、通知相关业务部门,告知事件基本情况,由业务部门负责做好相关客户解释工作。
(三)方式
通过电话通知。
(四)执行人
省联社科技信息中心IT服务台。
第十六条 影响评估和应急指挥
应急技术执行小组应在接到通知后迅速进行影响评估,应急技术执行小组组长应将评估结果报应急领导小组组长同时根据评估结果,通知相关人员进行现场响应,并制订故障排除和系统恢复方案。对于事件原因和影响清晰、处置措施明确的事件,应急技术执行小组组长应立即授权处置人员进行处置。
(一)触发条件
接通知后立即开展。
(二)工作步骤
1、故障确认
检查设备状态指示灯;
查看设备(系统)操作界面,查看报警信息;
检查该系统冗余备份模式是否遭到破坏;
勘查机房内服务器等设备的供电、制冷等运行环境是否受到不良影响。
2、评估系统故障原因、对机房内各类设备影响程度、信息系统业务受影响状况、预估业务恢复时间;
3、确定参与应急的运维人员、厂商支持人员及相关保障人员;
4、报告应急领导小组组长;
5、报告省联社科技信息系统应急工作领导小组。
(三)执行人
应急技术执行小组。
第十七条 技术恢复
根据故障确认情况,对于已经确认原因的事件,按照相关应急文档,迅速展开系统恢复工作,尽快恢复系统正常运行。
(一)触发条件
完成影响评估。
(二)工作步骤
1、故障恢复
根据不同的突发事件,具体操作方式参见机房应急操作手册等相关资料。
2、如发生需要跨行业部门协调的重大通信、电力、信息安全、突发事件等,按照银监会《银行业重要信息系统突发事件应急预案》请求有关行业部门提供支持;
(三)执行人
应急领导小组、应急技术执行小组、应急支持保障小组。
第十八条 恢复后工作
机房基础环境设施彻底恢复运行后,需要开展通告、总结、上报等后续工作。
(一)触发条件
系统恢复完成。
(二)工作步骤
1、应急技术执行小组完成技术恢复,向应急领导小组、省联社科技信息系统应急工作领导小组汇报;
2、省联社科技信息中心IT服务台补充完整事件受理、应急处理过程的记录,主要内容包括:主要处理步骤、参与人员、时间点等;
3、应急技术执行小组负责撰写技术分析报告;
4、应急领导小组组织有关人员根据事件过程记录、影响分析、技术分析报告完成总结报告;
5、应急技术执行小组、应急支持保障小组制订改进建议,报应急领导小组审批后,开展改进工作,预防事件再次发生。
6、由省联社科技信息中心IT服务台告知业务部门,宣布应急结束。
(三)执行人
应急领导小组、应急技术执行小组、应急支持保障小组、省联社科技信息中心IT服务台。
第十九条 应急处置过程中重大措施、重要操作均应留有记录,保持过程的安全可控。
第六章 附则
第二十条 本预案由省联社负责解释。
第二十一条 本预案自印发之日起执行。
展开阅读全文