收藏 分销(赏)

机房应急专题预案.doc

上传人:精*** 文档编号:2955461 上传时间:2024-06-12 格式:DOC 页数:10 大小:95.04KB
下载 相关 举报
机房应急专题预案.doc_第1页
第1页 / 共10页
机房应急专题预案.doc_第2页
第2页 / 共10页
机房应急专题预案.doc_第3页
第3页 / 共10页
机房应急专题预案.doc_第4页
第4页 / 共10页
机房应急专题预案.doc_第5页
第5页 / 共10页
点击查看更多>>
资源描述

1、机房应急预案第一章 总 则第一条 为确保XXXX单位机房安全和稳定,以确保正常运行为宗旨,根据“预防为主,主动处理”标准,本着建立一个有效处理突发事件,建立统一指挥、职责明确运转有序、反应快速处理有力机房安全体系目标,特制订本预案。第二章 机房突发事件分类第二条 自然灾难:指地震、火灾等因自然原因引发网络和信息系统损坏。第三条 事故灾难:指电力中止、网络损坏、软件、硬件设备故障等引发网络和信息系统损坏。第四条 人为破坏:指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐怖攻击等引发网络和信息系统损坏。第三章 应急处理人员组织机构第五条 组织机构框架图:信息技术部领导(总指挥)机房责任人(副总

2、指挥)网络设备责任人电源设备责任人消防及空调设备责任人服务器及存放设备责任人第四章 应急机构人员岗位职责第六条 应急总指挥职责(一) 确保在任何时间,立即协调应急行动全部包含岗位人员;(二) 提供必需紧急响应设备;(三) 在紧急情况下全方面负责紧急行动;(四) 在必需时向外界求救,比如:119、110、120等。第七条 应急副总指挥职责(一) 在总指挥领导下具体开展工作,当总指挥不在时推行总指挥职责;(二) 依据取得应急信息下达命令。第八条 各相关设备责任人职责(一) 负责立即搜集信息向应急总指挥汇报事故情况;(二) 负责现场临时设备抢救和对事态控制;(三) 听从上级指挥人员指挥。第五章 信息

3、和网络安全突发事件处理标准第九条 预防为主。立足安全防护,加强预警,关键保护基础信息网络和关系信息安全、稳定关键信息系统,从预防、监控、应急处理、应急保障等步骤,在管理、技术、人员等方面采取多个方法充足发挥各方面作用,共同构筑信息和网络安全保障体系。第十条 快速反应。突发事件发生时,根据快速反应机制,立即获取充足而正确信息,跟踪研判,果断决议,快速处理,最大程度地降低危害和影响。第十一条 分级负责。根据“谁主管,谁负责”标准,建立和完善安全责任制及联动工作机制。依据各责任人职能,各司其职,加强各责任人协调和配合,共同推行应急处理工作管理职责。第十二条 以人为本。把保障人员和公共利益安全作为首要

4、任务。第十三条 常备不懈。加强技术贮备,规范应急处理方法和操作步骤,定时进行预案演练,确保应急预案切实有效,实现网络和信息安全突发公共事件应急处理科学化、程序化和规范化。第六章 服务器及存放设备故障处理第十四条 排错步骤故障发生硬件故障软件故障服务器前后面板相关指示灯异常显示查看系统日志、任务管理器、程序状态等综合判定,列出原因编写故障文档处理故障判定结束第十五条 应急处理具体方法(一) 服务器设备损坏应急处理方法(1) 关键应用系统所在服务器设备损坏后,应立即查明原因,使用备份服务器替换损坏设备,并立即恢复应用系统正常使用;(2) 立即和设备提供商联络,请求派维修人员前来维修。(二) 服务器

5、软件损坏紧急处理方法(1) 快速查找原因,尝试重启系统。使用备份进行恢复。必需时联络开发商;(2) 当发觉服务器感染有病毒后,应立即将该机从网络上隔离出来。并启用杀病毒软件对该机进行杀毒处理,同时使用病毒检测软件对其它机器进行病毒扫描和清除工作。经技术人员确定确实无法查杀该病毒后,应作好相关统计,并快速联络相关产品商研究处理;(3) 当因空调,电力等问题需要关闭全部服务器时,应遵照以下步骤:先关闭全部应用服务器和数据库服务器,再关闭存放设备。开启全部服务器时,应先打开存放设备,再打开数据库服务器,最终打开应用服务器。第十六条 服务器突发情况统计文档日期故障发生时间服务器名称IP现象处理情况故障

6、恢复时间处理工程师备注第七章 网络设备故障处理第十七条 网络设备排错步骤 下面步骤图是网络维护人员所应采取排错模型,当发生网络故障时应根据此步骤快速进行定位、排除故障。故障发生进行故障数据采集经验判定和理论分析、列出多种可能原因列表并排列优先次序对每种原因实施排错编写故障文档故障排错判定结束YESNO第十八条 网络系统故障突发事件分级故障等级故障现象1级网络完全拥塞或设备宕机网络或设备处理能力严重受影响,对最终用户业务运作有严重影响网络或设备故障对关键用户(企业经理级或关键部门)造成严重影响网络完全拥塞或设备宕机网络或设备处理能力严重受影响,对最终用户业务运作有严重影响2级网络或设备性能严重下

7、降,对最终用户业务运作产生关键影响部分区域网络故障通常网络节点发生故障大部分用户网络通讯质量下降网络或设备性能严重下降,对最终用户业务运作产生关键影响部分区域网络故障3级网络或设备性能受损,但最终用户大部分业务仍可正常工作报警犯错和操作命令反常网络或设备性能受损,但最终用户大部分业务仍可正常工作报警犯错和操作命令反常4级其它通常故障,不影响系统整体运行,不影响大部分用户使用第十九条 应急方法(一) 黑客攻击时紧急处理方法(1) 当发觉网页内容被篡改、Internet接入路由器有未知用户登录或经过其它方法发觉有黑客正在进行攻击时,应立即向信息部相关人员通报情况;(2) 在信息部人员授权下,立即备

8、份当初log日志并采取端口限制方法阻断外部入侵,观察被攻击服务器等设备状态,同时向信息部领导汇报情况;(3) 协调相关应用部门,和信息部相关技术人员一同负责被破坏系统恢复和重建工作;(4) 帮助信息部人员协同相关部门共同追查非法信息起源;(5) 情况严重,依据突发事件等级应立即向相关上级部门汇报。(二) 病毒安全紧急处理方法(1) 当发觉计算机感染有病毒后,应立即将该机从网络上隔离出来;或从网络设备状态发觉病毒爆发应采取showmac-addresssharp定位或IP查询将病毒机器所在网络设备端口shutdown;(2) 通知维护人员对该设备硬盘进行数据备份;(3) 启用杀病毒软件对该机进行

9、杀毒处理,同时进行病毒检测软件对其它机器进行病毒扫描和清除工作;(4) 如发觉杀病毒软件无法清除该病毒,应立即通知用户并向及信息部责任人汇报,经信息部技术人员确定无法查杀该病毒并同意格式化硬盘后,作好相关统计,并格式化硬盘;(5) 机器恢复后重新开启网络设备对应端口;(6) 认为情况极为严重,依据突发事件等级应立即向相关上级部门汇报。(三) 广域网线路中止紧急处理方法(1) 链路出现问题后,网络维护人员应立即信息部责任人汇报,沟通地方节点技术人员共同快速判定故障,查明故障原因;(2) 如属我方管辖范围,由双方技术人员立即配合给予恢复。如遇无法恢复情况,立即进行备件更换或向相关厂商请求支援;(3

10、) 如属运行商管辖范围,立即和运行商维护部门申报故障,请求修复;(4) 依据突发事件等级应立即向相关上级部门汇报。(四) 局域网中止紧急处理方法(1) 局域网中止后,网络维护人员应立即判定故障节点,查明故障原因,并向信息部领导汇报;(2) 如属线路故障,更换新线路或重新安装线路;或从最近飞线至故障设备;(3) 如属路由器、交换机等网络设备(光模块)故障,应立即查找是否有相关备件能够替换,或和设备提供商联络更换设备,并调试通畅;(4) 如属路由器、交换机配置文件破坏,应快速根据备份配置文件重新配置,并调试通畅;如遇无法处理技术问题,立即向相关厂商请求支援;(5) 情况严重,依据突发事件等级应立即

11、向相关上级部门汇报。第二十条 网络突发事件统计文档日期故障发生时间服务器名称IP现象处理情况故障恢复时间处理工程师备注第八章 电源系统应急预案第二十一条 定时检验机房供电设备运行情况和电路线缆器材情况;第二十二条 当机房发生市电供电忽然停电或是电源异常时。首先应和供电局联络确定正常停电和估计停电时间。检验不间断电源电池可供电时间,确保设备正常运行,如碰到忽然断电,应立即将不在UPS电源供电范围内设备立即断电,预防忽然来电时瞬间电流过大造成设备损坏等现象;第二十三条 当确定停电时间超出机房UPS承载范围后,首先确定停电范围和受影响设备范围。并立即通知各部门和支企业营销部做好停电应急准备。然后通知

12、机房电源维护人和设备责任人抵达现场,做好各设备电源停电准备。在UPS供电电量仅剩10%以后,严格按操作手册停掉各服务器电源,最终停关键交换机和路由器,等候电力恢复;第二十四条 当确定停电原因是在本身供电系统范围内,立即汇报给负责领导,并立即联络相关维护人员达成现场检修。对于恢复时间无法估计,要通知各个部门做好准备工作;第二十五条 恢复供电后,严格根据操作程序逐步恢复机房设备和UPS供电,以防瞬间电流过大造成设备损坏。第九章 消防和防雷应急预案第二十六条 上班工作时间发生火警,还在机房工作人员应立即紧急撤离,并立即拨打119报警。在确保本身安全情况下,应尽可能使用灭火器进行灭火,降低电子设备损坏

13、。同时采取关闭电源总闸等方法,尽可能降低可能造成损失和破坏;第二十七条 非工作时间或节假日休息时间值班人员发觉火情后,要立即拨打119报警,并立即通知相关部门和领导,做好火灾处理工作;第二十八条 火情结束以后,机房相关人员应全体赶赴现场,并向企业相关部门汇报。同时立即联络相关网络企业和设备相关厂家,立即评定事故损失情况,研讨恢复网络系统正常运行最好处理方案;第二十九条 遇雷暴天气或接上级部门雷暴气象预警,应关闭全部服务器,切断电源,暂停内部计算机网络工作。雷暴天气结束后,立即开通服务器,恢复内部计算机网络工作。因雷击造成损失,应立即进行核实、报损,并将具体情况向部门领导汇报。第十章 自然灾难应急预案第三十条 发生自然灾难后,首先应该组织人员撤离现场。当确定灾难不会造成人生伤害后,在回到机房检验设备,立即向上级领导汇报,并联络相关网络和设备厂家,主动做好灾后恢复工作,确保在最短时间内恢复机房正常运行;第十一章第三十一条 本标准由信息技术部负责解释。第三十二条 本标准自颁布之日起实施。第十二章 附 件附件一 维护小组组员现场服务人员联络方法序号职务姓名手机邮件附件二 厂家帮助服务人员联络方法姓名企业电话职责网络设备代理商服务器及小型机等设备代理商机房弱电相关事项机房强电相关事项机房空调UPS设备发电机设备物业工程部消防设施

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服