1、机房应急预案伴随信息化建设不停深入,加强机房各类设备、系统和信息和网络安全等方面应对突发事件处理能力将是信息部门现在面临一项关键任务。 为应对机房可能发生突发事件,将正在发生或已发生事故损害程度减轻到最低,确保职员安全,特制订本应急处理预案。 1.1 机房突发事件分类 1.自然灾难:指地震、火灾等因自然原因引发网络和信息系统损坏。 2.事故灾难:指电力中止、网络损坏、软件、硬件设备故障等引发网络和信息系统损坏。 3.人为破坏:指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐怖攻击等引发网络和信息系统损坏。 1.2 应急处理人员组织机构(图)1.3 应急机构人员岗位职责1、应急总指挥职责 (
2、1)确保在任何时间,立即协调应急行动全部包含岗位人员; (2)提供必需紧急响应设备; (3)在紧急情况下全方面负责紧急行动; (4)在必需时向外界求救,比如:119、110、120等。 2、应急副总指挥职责 (1)在总指挥领导下具体开展工作,当总指挥不在时推行总指挥职责; (2)依据取得应急信息下达命令。 3、各相关设备责任人职责 (1)负责立即搜集信息向应急总指挥汇报事故情况; (2)负责现场临时设备抢救和对事态控制; (3)听从上级指挥人员指挥。 1.4 信息和网络安全突发事件处理标准 1.预防为主。立足安全防护,加强预警,关键保护基础信息网络和关系信息安全、稳定关键信息系统,从预防、监控
3、、应急处理、应急保障等步骤,在管理、技术、人员等方面采取多个方法充足发挥各方面作用,共同构筑信息和网络安全保障体系。 2.快速反应。突发事件发生时,根据快速反应机制,立即获取充足而正确信息,跟踪研判,果断决议,快速处理,最大程度地降低危害和影响。 3.分级负责。根据“谁主管,谁负责”标准,建立和完善安全责任制及联动工作机制。依据各责任人职能,各司其职,加强各责任人协调和配合,共同推行应急处理工作管理职责。 4.以人为本。把保障人员和公共利益安全作为首要任务。 5.常备不懈。加强技术贮备,规范应急处理方法和操作步骤,定时进行预案演练,确保应急预案切实有效,实现网络和信息安全突发公共事件应急处理科
4、学化、程序化和规范化。 1.5 机房应急开关机具体方法 机房各设备关闭次序以下:1.6 服务器及存放设备故障处理 1.6.1 排错步骤1.6.2应急处理具体方法 服务器设备损坏应急处理方法 A、关键应用系统所在服务器设备损坏后,应立即查明原因,使用备份服务器替换损坏设备,并立即恢复应用系统正常使用; B、立即和设备提供商联络,请求派维修人员前来维修。 服务器软件损坏紧急处理方法 A、快速查找原因,尝试重启系统。使用备份进行恢复。必需时联络开发商; B、当发觉服务器感染有病毒后,应立即将该机从网络上隔离出来。并启用杀病毒软件对该机进行杀毒处理,同时使用病毒检测软件对其它机器进行病毒扫描和清除工作
5、。经技术人员确定确实无法查杀该病毒后,应作好相关统计,并快速联络相关产品商研究处理; C、当因空调,电力等问题需要关闭全部服务器时,应遵照以下步骤: 先关闭全部应用服务器和数据库服务器,再关闭存放设备。开启全部服务器时,应先打开存放设备,再打开数据库服务器,最终打开应用服务器。 1.6.3 服务器突发情况统计文档 1.7 网络设备故障处理 1.7.1 网络设备排错步骤 网络设备排错步骤 下面步骤图是网络维护人员所应采取排错模型,当发生网络故障时应根据此步骤快速进行定位、排除故障。1.7.2 网络系统故障突发事件分级 1.7.3 应急方法 黑客攻击时紧急处理方法 A、当发觉网页内容被篡改、Int
6、ernet接入路由器有未知用户登录或经过其它方法发觉有黑客正在进行攻击时,应立即向信息部相关人员通报情况; B、在信息部人员授权下,立即备份当初log日志并采取端口限制方法阻断外部入侵,观察被攻击服务器等设备状态,同时向信息部领导汇报情况; C、协调相关应用部门,和信息部相关技术人员一同负责被破坏系统恢复和重建工作; D、帮助信息部人员协同相关部门共同追查非法信息起源; E、情况严重,依据突发事件等级应立即向相关上级部门汇报。 病毒安全紧急处理方法 A、当发觉计算机感染有病毒后,应立即将该机从网络上隔离出来;或从网络设备状态发觉病毒爆发应采取show mac-address sh arp定位或
7、IP查询将病毒机器所在网络设备端口shutdown; B、通知维护人员对该设备硬盘进行数据备份; C、启用杀病毒软件对该机进行杀毒处理,同时进行病毒检测软件对其它机器进行病毒扫描和清除工作; D、如发觉杀病毒软件无法清除该病毒,应立即通知用户并向及信息部责任人汇报,经信息部技术人员确定无法查杀该病毒并同意格式化硬盘后,作好相关统计,并格式化硬盘; E、机器恢复后重新开启网络设备对应端口; F、认为情况极为严重,依据突发事件等级应立即向相关上级部门汇报。 广域网线路中止紧急处理方法 A、链路出现问题后,网络维护人员应立即信息部责任人汇报,沟通地方节点技术人员共同快速判定故障,查明故障原因; B、
8、如属我方管辖范围,由双方技术人员立即配合给予恢复。如遇无法恢复情况,立即进行备件更换或向相关厂商请求支援; C、如属运行商管辖范围,立即和运行商维护部门申报故障,请求修复; D、依据突发事件等级应立即向相关上级部门汇报。 局域网中止紧急处理方法 A、局域网中止后,网络维护人员应立即判定故障节点,查明故障原因,并向信息部领导汇报; B、如属线路故障,更换新线路或重新安装线路;或从最近飞线至故障设备; C、如属路由器、交换机等网络设备(光模块)故障,应立即查找是否有相关备件能够替换,或和设备提供商联络更换设备,并调试通畅; D、如属路由器、交换机配置文件破坏,应快速根据备份配置文件重新配置,并调试
9、通畅;如遇无法处理技术问题,立即向相关厂商请求支援; E、情况严重,依据突发事件等级应立即向相关上级部门汇报。 1.7.4 网络突发事件统计文档 1.8 空调设备故障处理 若空调损坏,应第一时间通知厂家上门进行维修,并立即汇报信息部相关领导请示,取得授权后按机房设备关闭次序关闭各类设备。 1.9 消防设备故障处理 一旦机房发生火灾,应遵照下列标准:首先确保人员安全;其次保护关键设备、数据安全;三是保护通常设备安全; 人员疏散程序是:机房工作人员立即按响火警警报,并经过119电话向公安消防请求支援,全部些人员戴上防毒面具,全部不参与灭火人员根据预先确定线路,快速从机房中撤出; 人员灭火程序是:首先切断全部电源,开启自动喷淋系统或使用灭火器,灭火值班人员戴好防毒面具,从指定位置取出泡沫灭火器进行灭火。 1.10 电源设备故障处理 热力机房现在使用UPS系统,在紧急情况发生时,应按以下步骤进行关机: (1)确定全部负载均已安全关机。 (2)关闭UPS负载电源。 (3)将UPS系统启用开关切换到off 状态。 (4)将DC电池连接断路器切换到off位置。 (5)将全部电池拉出到红色电池断开线以外。 (6)断开PDU上断路器。 (7)将PDU后面总输入断路器切换到断开位置。 (8)将每个上行主电路断路器切换到断开位置。