1、机房应急预案手册一、机房事故处理通则 凡系统发生故障时,网管运行监控责任人必需立即组织抢修,不得拖延。 运行监控人员均应熟悉故障紧急处理步骤,熟练掌握操作步骤和方法。 运行监控管理人员应如实上报故障情况,故障汇报应该做到时间清、原因清、结果清。 重大故障和严重故障要报上级业务主管领导。对已处理重大故障和严重故障,事后必需做故障分析,查清故障原因,确定故障性质和责任,采取防范方法,避免同类故障再次发生。 故障处理基础标准:先关键后通常;先调通后维修。 1、故障等级网管系统故障等级共分三类:1.1 重大故障在系统运行期间,关键设备(包含传输或其它专业所属设备)、软件故障造成全部网管业务中止超出二十
2、四小时。1.2 严重故障在系统运行期间,关键设备(包含传输或其它专业所属设备)、软件故障造成下列情况之一系统故障: (1)全部网管业务中止超出12小时但不超出二十四小时; (2)网管部分业务中止超出二十四小时;1.3 通常故障 除重大故障和严重故障外其它故障。 2、故障通报和通报制度网管中心应建立相关设备故障处理联络制度,并将联络人和联络方法张贴在醒目位置。 网管中心应建立设备操作手册和故障处理步骤,并存放在固定地点。 网管中心应建立设备运行情况统计和记录表,并存放在固定地点。 2.1 故障处理: 2.11、在系统发生故障时,值班人员应对照运行维护手册进行简单故障处理和正确定位,对无法处理故障
3、应立即通知系统维护主管工程师,并逐层上报。系统维护主管工程师组织相关人员现场处理,故障处理完成后,立即通知故障提议点,并进行具体统计。当系统发生故障时,网管中心运行维护责任人必需立即组织抢修,不得拖延。 2.12、在处理故障时,应严格根据故障处理步骤进行,整个步骤强调闭环管理,按先关键后通常;先调通后维修标准进行。 2.13、在系统和设备故障处理过程中,若出现较为严重或一时无法处理问题,立即通知故障提议点,并立即向主管领导汇报,同时和厂家联络,立即争取技术支持,填写故障汇报。 2.14、在系统设备故障处理过程中,若使用了备件单元或备用电路板,应按要求分别具体登记故障发生工作单元、故障现象或故障
4、代码、换用备件名称、编号,有条件时应附受骗初打印统计,向主管汇报,并立即和备件管理人员取得联络,按正确手续发送返修。 2.15、在相关专业部门或设备供给商进行抢修过程中,网管中心应负责协调相关专业部门,采取其它方法对网络进行监控。 2.16、在相关专业部门或设备供给商进行抢修过程中,网管中心应负责协调相关专业部门,采取其它方法对网络相关数据进行保留和统计。 2.17、网管中心在相关故障排除后48小时内提交故障分析汇报。汇报将视故障等级上报所在企业运行维护部和上级网管中心。运行维护人员均应熟悉故障紧急处理步骤,熟练掌握操作步骤和方法。2.2 故障通报: 当出现值班人员不能处理故障时,值班人员应立
5、即上报系统维护主管工程师和部门主管 。故障处理完成一天内,系统主管工程师写出故障汇报,上报部门主管,重大故障和严重故障要报上级业务主管部门。 当发生故障时,机房当班人员应将故障发生经过具体填写进值班日志。 假如网管系统出现严重故障,在故障发生后应在第一时间向上一级网管中心通报相关情况。 出现故障后,由网管中心指定专员向相关部门通报故障影响范围和处理情况等。 运行维护责任人应如实上报故障情况,故障汇报应该做到时间清、原因清、结果清。 二、机房应急动力预案1、机房停电故障1.1 准备工作1.11停电后第一时间电话咨询供电企业(电话号码)问询停电原因及停电时长。 1.12电话通知相关领导停电情况,假
6、如在值班过程中停电需同事共同处理也立即通知,在停电期间要保持通信通畅有问题立即联络。(领导电话) 1.13准备扳手、六棱起、数字万用表、“+”字“”字螺丝刀各两把(大 、小)等常见电工工具,准备好高压绝缘手套、绝缘鞋、专用扳手。 1.14以上3点工作尽可能在最短时间内结束,然后针对故障原因作出对应处理。 1.2停电情况下处理方法从供电企业确定完停电原因及停电时长后,确定停电时长是否在UPS负荷工作时间范围内:假如在UPS负荷工作范围内,亲密观察UPS工作状态,全部设备正常工作;假如超出UPS工作范围内,向领导申请,存放信息,关闭机房设备,预防机房断电丢失数据。 1.3 市电恢复后操作1. 全部
7、设备恢复市电供电,检验设备供电运行情况。 2、UPS故障处理通州工商局机房UPS系统为2台OVERTOP RT30KH UPS 并机系统.如30KVA UPS系统中一台UPS故障,系统自动将负载倒到另一台UPS上,怎样关闭故障UPS,怎样再次开启UPS,以下: 关机1、先将旁路转换开关打到“ON”位置: 2、将UPS输出开关打到“OFF”位置 3、关掉UPS开关,这时UPS停止运行; 4、关掉UPS输入开关,系统关机完成。 开机1、首先确定UPS开关全部打到“OFF”位置,配电柜UPS输出开关也在“OFF”位置。 2、先把旁路转换开关打到“ON”位置 3、分别将UPS开关合闸; 4、当UPS面
8、板指示为旁路供电状态时,再把旁路转换开关打到“OFF”位置这时,UPS转到正常工作模式,开启完成。 5、最终合上UPS输出开关,系统供电正常。 当关掉其中一台UPS在开启措施1、先把旁路转换开关打到“ON”位置 2、再把已关掉UPS开关分别打到“ON”位置; 3、当两台UPS面板指示为旁路供电状态时,再把旁路转换开关打到“OFF”位置这时,两台UPS转到正常工作模式,开启完成 3、机房空调及局部过热故障紧急处理方案发生机房空调故障,会使机房温度升高,危害设备正常运行。所以发生这类故障后,要主动维修,假如一时无法修复,必需采取应急方法,保障机房环境符合要求。 现在机房空调一台艾赛尔精密空调,一台
9、大金空调。 1、首先判定机房空调什么故障,假如压缩机故障,送风机工作正常,此时尽可能将机房防静电地板掀开.增将出风口. 假如是空调送风机故障,不能正常送风, 把邻近空调送风口格栅尽可能调整,到故障空调前面区域,这么才能保障机房温度不至于上升。或尽可能将机房防静电地板掀开,增将出风口,或拿一般电风扇在故障空调影响区域吹风,打开机柜门,冰块局部降温等方法预防局部升温过快。 2、机房局部设备温度上升过快或过热处理步骤首先将此设备机柜门打开,让热空气充足散出, 也能够用电风扇对此设备吹风,加紧散热速度, 购置冰块,放在大盆里,置于局部过热部位,利用冰块融化吸收热量, 或同时放置冰块并用电风扇吹。 三、机房防火预案一、当发生火灾事故时,抢险工作应遵照以下标准: 1坚持“统一领导、分级负责、严密组织、亲密配合、快速反应、保障有力”标准。2坚持快速恢复生产、降低经济损失标准。3坚持标准性和灵活性相结合标准,注意讲究策略和方法。二、消防安全管理基础标准:1坚持“预防为主,防消结合”标准。2坚持“谁主管、谁负责”“两谁”标准。 fg