资源描述
十四、服务方案
一、机房及设备维护方案和计划
1、预防性检验
1.1 巡检时间
每个工作日早晨9点
1.2、巡检地点
计算机机房、精密空调、UPS
1.3、巡检目标
进行机房检验,对机房设备及供电系统、UPS系统、精密空调系统、录像系统等设备进行检验,立即发觉设备隐患,排除故障。
1.4、巡检要求
1.4. 1.巡检期间,进行状态检验,若发觉问题,如计算机机房物理环境异常、精密空调异常、UPS及配电系统异常等,应根据应急预案及操作步骤进行处理。
(1)电源、UPS:检验机房供电情况,UPS工作情况、指示状态。检验UPS蓄电池使用状态,确保蓄电池无松动。并使用温度枪进行检测物理温度。确保配电柜及UPS、蓄电池无温度过高现象。
(2)机房环境:检验机房卫生情况及物理环境。
(3)机房温度:检验温湿度,将温湿度控制在一定范围内。温度:22℃±5℃,湿度 ≤60%.
(4)机房空调:空调运行状态、空调内部有没有漏水现象、空调噪音、空调风量等。
(5)机房照明:机房照明系统是否正常,有没有异常情况。
(6)机房PDU:PDU市电或UPS是否正常,使用温度枪进行检测外部物理温度。
(7)机房整体:检验机房其它设备运行状态,有没有报警及指示灯异常状态。
1.4. 2.假如故障按恢复规程无法有效恢复,尤其是当发生机房环境(动力、空调)故障、关键设备、网络、系统、服务如无法立即恢复时,应立即通知甲方相关领导,由相关领导协调资源进行故障处理。
1.4.3.故障处理过程必需在机房日常巡检表备注栏中具体统计,以备查阅。
1.5、计算机机房现场管理要求
1.除工作人员外,其它工作人员进出机房,需签字后方可进入,同时计算机机房人员要在现场,检验监督其人职员作,避免其它人员未经授权私自接触机房物理设备。
2.机房机柜、线缆、设备等标签管理;
3.机房环境清理。
1.6每日检验内容列表
项目
性能检验内容
脆弱性检验内容
空调系统
高压压力、低压压力(风冷系统),冷冻水压力、温度,冷却水压力、温度(水冷系统),风机运行情况,滤网、内机排水系统、灰尘情况等。
机房热点情况、室内机漏水检验、室外风机运转情况、加湿罐阳极棒检验、过滤网检验等。
供配电系统
输入输出功率,输入输出电流、断路开关、接地电阻、零序电流、器件发烧情况等。
导线、器件发烧情况,断路开关、防浪涌器件情况等。
UPS系统
负载功率情况、器件发烧情况、电池情况(外观、液位、接线柱)等。
器件、导线发烧情况,电池放电时间等。
安全系统
录像备份管理、出入机房登记、器件灵敏度、画面清楚度(不一样照度情况下)、云台运行等。
器件灵敏度、监控死角问题等。
设备运行
机房环境
查看设备运行指示灯、机房照明运行情况、机房环境
设备运行是否有报警情况、照明是否正常、机房卫生是否整齐等
2、现场故障维修
每日巡检过程中,如有发觉设备及环境系统有故障状态,需进行统计并恢复故障状态。如不能立即恢复故障状态,则需进行应急预案处理。具体以下:
2.1 环境故障:卫生、温湿度、照明。(四级故障)
2.2 交换机故障:交换机蜂鸣,交换机开启不正常,指示灯异常。(三级故障)
2.3 空调故障:空调压缩机故障、空调冷凝水故障、空调漏水故障、空调制冷故障、空调加湿器故障等。(二级故障
2.4 UPS故障:UPS逆变故障、UPS旁路、UPS蓄电池温度、UPS蓄电池外观鼓包现象、UPS蜂鸣报警等(一级故障)
2.5 配电柜故障:配电柜内温度过高、配电柜打火现象等。(一级故障)
在处理故障时,最大程度做好故障恢复文档,努力争取恢复到故障点前业务状态。对于“系统瘫痪,业务系统不能运转”故障等级,假如不能于30分钟内处理故障,应立即提出应急方案,确保业务系统运行。故障处理后二十四小时内,提交故障处理汇报。说明故障种类、故障原因、故障处理中使用方法及故障损失等情况。故障类型、等级及对应标准列表:
故障等级
响应时间
故障处理时间
I级:属于紧急问题;其具表现象为:机房出现电力事故等意外情况造成业务停止、UPS系统瓦解造成业务停止、空调系统瓦解造成业务停止。
电话立即响应,5分钟内人员抵达现场,30分钟内恢复业务使用,2小时内提交故障处理方案。
12小时以内
II级:属于严重问题;其具表现象为:
出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。
电话立即响应,5分钟内抵达现场,1小时内提交故障处理方案
二十四小时以内
III级:属于较严重问题;其具表现象为:出现系统报错或警告,但业务系统能继续运行且性能不受影响。
电话立即响应,5分钟内抵达现场,2小时内提交故障处理方案
48小时以内
IV级:属于一般问题;其具表现象为:系统技术功效、安装或配置咨询。
电话立即响应,30分钟内抵达现场,2小时内提交故障处理方案
3天内
3、后台故障维修
后台故障状态维修,需要在甲方许可情况下,对设备进行维护及维修。
3.1 质保期内设备由我方查找故障原因并填写故障申请单,交由甲方进行协调处理,并帮助甲方进行故障排除及维修。如需联络厂商,则由我方负责。
3.2 三级及四级故障状态,我方可自行进行维护和维修设备,报由甲方同意后,我方自行进行设备维修,更换零配件部件等,并将维修统计保留文档交由甲方及我方双方管理。
3.3 质保期外设备出现故障,则由我方统一进行维修,费用由我方负责。并将维修统计报由甲方确定并存档。
3.4设备更换
对于无法修复设备,在协议使用期内,经甲方审核,由乙方负责整体更换同型号或类似型号产品,无法维修设备交由甲方。更换单个备品备件费用大于等于500元时,报甲方审核同意,备品备件费用由甲方负担; 更换单个备品备件小于500元时,备品备件费用由乙方负担,质保期内由供货商(厂商)进行更换除外。
4、资产管理
4.1对硬件设备型号、数量、版本等信息统计统计
4.2对软件产品型号、版本和补丁等信息统计统计
4.3 对机房设施设备连接统计统计
4.4 对综合布线系统结构图绘制
4.5 对机房更换设备连接统计统计
4.6每个月向甲方上报低值易耗品统计,包含仓库存放情况、耗材使用情况。
4.7 机房更新及更换设备统计
4.8 机房维护设备及备品备件管理及统计
5、应急处理
伴随网络信息化建设不停深入,加强机房各类设备、系统和信息和网络安全等方面应对突发事件处理能力将是我们现在面临一项关键任务。为确保系统及机房安全和稳定,以确保正常运行为宗旨,根据“预防为主,主动处理”标准,本着建立一个有效处理突发事件,建立统一指挥、职责明确运转有序、反应快速处理有力机房安全体系目标,将正在发生或已发生事故损害程度减轻到最低,确保职员安全,特制订本应急处理预案。
本预案共分为应用系统故障应急步骤和机房突发事件应急步骤
系统故障应急步骤
一、系统故障应急步骤说明
1、故障发生
系统运维服务小组可从以下路径得悉故障发生:
1.1、运维服务中心经过网管告警发觉故障
1.2、维护站点经过维护巡检发觉故障
1.3、用户发觉故障,报给呼叫中心
1.4、驻场工程师发觉故障
2、报障受理
监控系统运维服务小组得悉系统故障发生后,立即响应,并向报障人或单位具体了解系统故障情况。
3、信息研判
运维服务小组依据了解到系统故障情况进行分析判定,以确定采取通常故障处理步骤还是立即开启系统突发故障应急处理预案。
4、预案开启
如需开启应急预案,则立即通知系统突发故障应急领导小组,由领导小组开启应急预案,对系统突发故障应急事件进行全方面管控处理。
5、资源确定
系统突发故障应急预案开启后,首先是依据现场突发故障实际情况、紧急程度、技术难度、备品备件等情况对相关资源(关键是参与人员)依据经验进行调度和确定,关键有以下资源:
我企业技术支持人员;
相关厂家技术支持人员;
我企业聘用技术教授
6、预案实施
根据既定预案进行突发故障抢修,如碰到问题立即向系统突发故障应急领导小组汇报。
7、预案终止
预案终止时间由故障现场技术人员依据现场实际进展情况,在和用户单位相关部门协调后报系统突发故障应急领导小组决定。
8、结果上报
预案中止后,相关预案参与人员将整个事件过程中经验和教训,修改、完善事件应急预案。然后集中上报至系统突发故障应急领导小组。
二、 系统故障应急处理步骤图
机房突发事件应急步骤
一、机房突发事件分类
1、自然灾难:指地震、火灾等因自然原因引发网络和信息系统损坏。
2、事故灾难:指电力中止、网络损坏、软件、硬件设备故障等引发网络和信息系统损坏。
3、人为破坏:指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐怖攻击等引发网络和信息系统损坏。
二、 应急处理人员组织机构
三、 应急机构人员岗位职责
1、应急总指挥职责
1.1、确保在任何时间,立即协调应急行动全部包含岗位人员;
1.2、提供必需紧急响应设备;
1.3、在紧急情况下全方面负责紧急行动;
1.4、在必需时向外界求救,比如:119、110、120等。
2、应急副总指挥职责
2.1、在总指挥领导下具体开展工作,当总指挥不在时推行总指挥职责;
2.2、依据取得应急信息下达命令。
3、各相关设备责任人职责
3.1、负责立即搜集信息向应急总指挥汇报事故情况;
3.2、负责现场临时设备抢救和对事态控制;
3.3、听从上级指挥人员指挥。
四、突发事件处理标准
1.预防为主。立足安全防护,加强预警,关键保护基础信息网络和关系信息安全、稳定关键信息系统,从预防、监控、应急处理、应急保障等步骤,在管理、技术、人员等方面采取多个方法充足发挥各方面作用,共同构筑安全保障体系。
2.快速反应。突发事件发生时,根据快速反应机制,立即获取充足而正确信息,跟踪研判,果断决议,快速处理,最大程度地降低危害和影响。
3.分级负责。根据“谁主管,谁负责”标准,建立和完善安全责任制及联动工作机制。依据各责任人职能,各司其职,加强各责任人协调和配合,共同推行应急处理工作管理职责。
4.以人为本。把保障人员和公共利益安全作为首要任务。
5.常备不懈。加强技术贮备,规范应急处理方法和操作步骤,定时进行预案演练,确保应急预案切实有效,实现网络和信息安全突发公共事件应急处理科学化、程序化和规范化。
五、机房应急开关机具体方法
机房各设备关闭次序以下:
六、机房日常维护
1、建立健全机房管理制度
1.1在正常工作日内,信息技术部人员负责对机房进行监控,关键职责是:巡视网络设备及系统运行情况,发生异常情况立即处理,消除网络故障隐患。
1.2节假日期间技术人员轮番值班,负责处理相关异常情况。
1.3机房采取来人来访登记制度,未经许可,无关人员不得进入企业机房区域。
2、机房内严格采取防雷、防火、防尘、防静电等方法和机房二十四小时监控等方法。
3、认真做好数据备份工作,定时做一次数据库完全备份,每个月检验服务器运行和备份情况。
4、对机房关键网络设备(路由器、主干交换机等)进行工作时间内全程监控,发觉异常情况应立即进行处理,确保整个网络正常运行。
七、服务器及存放设备故障处理
1、排错步骤
2、应急处理具体方法
2.1 机房漏水应急预案
(1)发生机房漏水时,第一目击者应立即通知运维服务小组,并立即汇报监控系统突发故障应急领导小组。
(2)若空调系统出现渗漏水,运维服务小组责任人应立即安排停用故障空调,清除机房积水,并立即联络设备供给方处理,同时开启备用空调,必需情况下可临时用备用空调对服务器进行降温。
(3)若为墙体或机房门渗漏水,运维服务小组责任人应立即采取有效方法确保机房安全,立即清除积水,维修墙体或门窗,消除渗漏水隐患。
2.2 设备发生被盗或人为损害事件应急预案
(1)发生设备被盗或人为损害设备情况时,使用者或管理者应立即汇报系统突发故障应急领导小组,同时保护好现场。
(2)系统突发故障应急领导小组接报后,通知用户保卫部门、相关领导,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必需影像统计和文字统计。
(3)事发单位和当事人应该主动配合公安部门进行调查, 并将相关情况向系统突发故障应急领导小组汇报。
(4)系统突发故障应急领导小组安排运维服务小组、事发单位立即恢复系统正常运行,并对事件进行调查。运维服务小组和事发单位应在调查结束后一日内书面汇报系统突发故障应急领导小组。事态或后果严重,应向相关领导汇报。
2.3 机房长时间停电应急预案
(1)定时检验机房供电设备运行情况和电路线缆器材情况,当发生下列突发事件时,根据以下方案进行处理:
(2)当机房发生市电供电忽然停电或是电源异常时。首先应和后勤部门联络确定正常停电和估计停电时间。检验不间断电源电池可供电时间,确保设备正常运行,如碰到忽然断电,应立即将空调等不在UPS电源供电范围内设备立即断电,预防忽然来电时瞬间电流过大造成设备损坏等现象。
(3)当确定停电时间超出机房UPS承载范围后,首先确定停电范围和受影响设备范围。并立即通知各部门做好停电应急准备。然后通知机房电源维护人和设备责任人抵达现场,做好各设备电源停电准备。在UPS供电电量仅剩10%以后,严格按操作手册停掉各服务器电源,最终停关键交换机和路由器,等候电力恢复。
(4)当确定停电原因是在本身供电系统范围内,立即汇报给负责领导,并立即联络相关维护人员达成现场检修。对于恢复时间无法估计,要通知后勤部门做好柴油机发电及移动电源车供电准备
(5)恢复供电后,严格根据操作程序逐步恢复机房设备和UPS供电,以防瞬间电流过大造成设备损坏。
2.4 通信网络故障应急预案
(1)发生通信线路中止、路由故障、流量异常、域名系统故障后,操作员应立即通知本单位信息系统管理员,经初步判定后立即上报运维服务小组和系统突发故障应急领导小组。
(2) 运维服务小组接汇报后,应立即查清通信网络故障位置,隔离故障区域,并将事态立即汇报系统突发故障应急领导小组,通知相关通信网络运行商查清原因;同时立即组织相关技术人员检测故障区域,逐步恢复故障区和服务器网络联接,恢复通信网络,确保正常运转。
(3) 事态或后果严重,应向应急指挥办公室和相关领导汇报。
(4)应急处理结束后,运维服务小组应将故障分析汇报,在调查结束后一日内书面汇报系统突发故障应急领导小组。
2.5 不良信息和网络病毒事件应急预案
(1)发觉不良信息或网络病毒时,信息系统管理员应立即断开网线,终止不良信息或网络病毒传输,并汇报指挥调度中心运维服务小组和系统突发故障应急领导小组。
(2)运维服务小组应依据系统突发故障应急领导小组指令,采取隔离网络等方法,立即杀毒或清除不良信息,并追查不良信息起源。
(3)事态或后果严重,应向监控中心办公室和相关领导汇报。
(4)处理结束后 ,运维服务小组应将事发经过、造成影响、处理结果在调查工作结束后一日内书面汇报系统突发故障应急领导小组。
2.6 服务器软件系统故障应急预案
(1)发生服务器软件系统故障后,运维服务小组责任人应立即组织开启备份服务器系统,由备份服务器接管业务应用,并立即汇报系统突发故障应急领导小组;同时安排相关责任人将故障服务器脱离网络,保留系统状态不变,取出系统镜像备份磁盘,保持原始数据。
(2)运维服务小组应依据系统突发故障应急领导小组指令,在确定安全情况下,重新开启故障服务器系统;重启系统成功,则检验数据丢失情况,利用备份数据恢复;若重启失败,立即联络相关厂商和上级单位,请求技术支援,作好技术处理。
(3)事态或后果严重,应向监控中心应急指挥办公室和相关领导汇报。
(4)处理结束后,运维服务小组应将事发经过、处理结果等在调查工作结束后一日内汇报系统突发故障应急领导小组。
2.7 黑客攻击事件应急预案
(1)当发觉网络被非法入侵、网页内容被篡改,应用服务器上数据被非法拷贝、修改、删除,或经过入侵检测系统发觉有黑客正在进行攻击时,使用者或管理者应断开网络,并立即汇报系统突发故障应急领导小组。
(2)接汇报后,系统突发故障应急领导小组应立即指令运维服务小组核实情况,关闭服务器或系统,修改防火墙和路由器过滤规则,封锁或删除被攻破登陆帐号,阻断可疑用户进入网络通道。
(3)运维服务小组应立即清理系统,恢复数据、程序,恢复系统和网络正常;情况严重,应向监控中心应急指挥办公室和相关领导汇报,并请求支援。
(4)处理结束后 ,运维服务小组应将事发经过、处理结果等在调查工作结束后一日内汇报系统突发故障应急领导小组。
2.8 关键设备硬件故障应急预案
(1)发生关键设备硬件故障后,运维服务小组应立即汇报系统突发故障应急领导小组,并组织查找、确定故障设备及故障原因,进行先期处理。
(2)若故障设备在短时间内无法修复运维服务小组应开启备份设备,保持系统正常运行;将故障设备脱离网络,进行故障排除工作。
(3)运维服务小组故障排除后,在网络空闲时期,替换备用设备;若故障仍然存在,立即联络相关厂商,认真填写设备故障汇报单备查。
(4)事态或后果严重,应向监控中心应急指挥办公室和相关领导汇报。
2.9 业务数据损坏应急预案
(1) 发生业务数据损坏 时,运维服务小组应立即汇报系统突发故障应急领导小组,检验、备份业务系统目前数据。
(2)运维服务小组负责调用备份服务器备份数据,若备份数据损坏,则调用磁带机中历史备份数据,若磁带机数据仍不可用,则调用异地备份数据。
(3)业务数据损坏事件超出 2小时后,运维服务小组应立即汇报系统突发故障应急领导小组,立即通知业务部门以手工方法开展业务。
(4)运维服务小组应待业务数据系统恢复后,检验历史数据和目前数据差异,由相关系统员工补录数据;重新备份数据,并在工作结束后一日内汇报系统突发故障应急领导小组。
2.10 雷击事故应急预案
(1) 遇雷暴天气或接上级部门雷暴气象预警,运维服务小组应立即汇报系统突发故障应急领导小组,经请示同意后关闭部分服务器,切断电源,暂停内部计算机部分网络工作。
(2) 雷暴天气结束后,运维服务小组报经系统突发故障应急领导小组同意,立即开通服务器,恢复内部计算机网络工作,对设备和数据进行检验。
(3) 因雷击造成损失,运维服务小组应会同相关部门进行核实、报损,并在调查工作结束后一日内书面汇报系统突发故障应急领导小组。必需时,应向监控中心应急指挥办公室和相关领导汇报。
2.11 空调设备故障应急预案
若机房专用空调损坏,应第一时间启用机房备用空调,并通知厂家上门进行维修,并立即汇报信息部相关领导请示,取得授权后按机房设备关闭次序关闭各类设备。
2.12 火灾事故应急预案
(1)一旦机房发生火灾,应遵照下列标准:首先确保人员安全;其次保护关键设备、数据安全;三是保护通常设备安全;
(2)人员疏散程序是:机房工作人员立即按响火警警报,并经过119电话向公安消防请求支援,全部些人员戴上防毒面具,全部不参与灭火人员根据预先确定线路,快速从机房中撤出;
(3)人员灭火程序是:首先切断全部电源,开启自动喷淋系统或使用灭火器,灭火值班人员戴好防毒面具,从指定位置取出泡沫灭火器进行灭火。
2.13 电源设备故障应急预案
机房现在使用UPS系统,在紧急情况发生时,应按以下步骤进行关机:
(1)确定全部负载均已安全关机。
(2)关闭UPS负载电源。
(3)将UPS系统启用开关切换到off 状态。
(4)将电池连接断路器切换到off位置。
6、保密管理要求
为科学、有效地管理机房,促进网络系统安全应用、高效运行,特制订本规章制度,请遵照实施。
一、机房管理
1、路由器、交换机和服务器和通信设备是网络关键设备,须放置计算机机房内,不得自行配置或更换,更不能挪作它用。
2、计算机房要保持清洁、卫生,并由专员7×24负责管理和维护(包含温度、湿度、电力系统、网络设备等),无关人员未经管理人员同意严禁进入机房。
3、严禁易燃易爆和强磁物品及其它和机房工作无关物品进入机房。
4、建立机房登记制度,对当地局域网络、广域网运行,建立档案。未发生故障或故障隐患时当班人员不可对中继、光纤、网线及多种设备进行任何调试,对所发生故障、处理过程和结果等做好具体登记。
5、做好操作系统补丁修正工作。
6、网管人员统一管理计算机及其相关设备,完整保留计算机及其相关设备驱动程序、保修卡及关键随机文件。
7、计算机及其相关设备报废需经过管理部门或专职人员判定,确定不符合使用要求后方可申请报废。
二、机房安全保密制度
1.机房全部些人员必需严格遵守企业各项安全保密制度,高度重视信息系统安全保密工作,主动参与多种形式安全保密工作学习培训活动,接收安全检验。机房信息系统包含全企业管理、业务等企业关键信息,维护人员不得窥探、抄录、复制;不得转告和工作无关人员;不得随意向外界透露。操作人员未经财务审批不得私自动用、开设、查看、变更营业软件。
2.机房全部些人员未经许可不得访问信息系统中用户信息、公文、报表、邮件等属于授权访问数据信息或私人信息。
3.机房全部些人员未经授权,不得私自修改、查阅系统相关信息。
4.严格遵守帐号口令管理制度和安全操作条例,依据访问数据等级使用对应权限口令进入系统;不得窃取、破译她人权限密码。
5.机房全部些人员未经许可不得私自抄录、复制设备图纸、电路组织资料、内部文件、系统软件、技术档案、用户资料,也不得私自带离机房,使用后归还原处。
6.多种包含密级图纸、资料、文件等应严格管理,认真推行使用登记手续。IP地址及密码等涉密信息不得让无关人员轻易获取。
7.机房内关键保密文件、数据销毁,应使用碎纸机进行销毁,不得任意丢弃。
8.机房内部废弃设备、测试数据由仓管部门统一保留和处理。
9.机房全部些人员严格遵守通信纪律,增强保密意识和法制观念,不得随意监测用户通信。
10. 机房内部全部维护和管理人员,均应熟悉并严格实施安全保密要求。
7、人员管理要求
参考甲方相关工作制度进行人员管理,如作息时间、着装、考勤等。人员派驻须经过甲方审核,人员更换须在招标人进行立案。
对维保人员管理员应根据甲方要求和标准来进行实施。人员具体职责以下:
一、硬件维护人员岗位职责:
1.立即高效地完成份配硬件维修等各项任务,确保硬件正常工作。
2.维护人员要熟悉计算机原理和操作规程,熟悉仪器仪表使用方法。维护工作应遵照微机故障和维修操作步骤、基础标准和维修方法进行。
3.常常检验供电系统是否正常,电器连接点是否牢靠,用电器温度有没有异常;检验机箱、显示器上开关是否完好。对键盘、鼠标等易损件进行常规检验;对硬件系统进行外观和静态检验;对微机系统进行全方面动态检验,发觉问题立即处理。
4. 寒假、暑假或长久不用期间,要定时对其进行开机上电操作,以使机器内部保持干燥。
5. 寒假、暑假或长久不用期间,要使用塑料袋将主机、显示器及网线接头等严密包裹起来,避免受潮。
6.网络连接线路在使用过程中会出现多种故障,如某一工作站不能连接上网或一组工作站不能连接上网,这需要维护人员熟悉网络拓扑结构,经过检验网线、网络连接点、网卡、服务器和集线器、交换器等网络设备,找出故障点给排除。
7. 当硬件发生故障时,立即排除故障,立即恢复系统运行。
8. 定时进行硬件例行维护,建立每台机器维护档案。
9. 每次维修必需进行登记,包含更换设备和配件。
10. 主动参与业务学习,不停提升业务水平。
二、 软件维护人员岗位职责:
1. 立即高效完成软件维护等各项任务,确保计算机系统正常运行。
2. 日常维护保养时,开机关机一定要严格遵守操作规程,不可随意进行,尤其在微机运行过程中不能随意冷开启机器。机器运行当中,软件维护人员应时刻观察有没有异常情况,立即发觉立即处理。
3. 软件维护人员应备有多种工具软件、常见应用软件、操作系统软件和程序语言软件并留存试验中心一份。
4. 软件维护人员平时要实时、定时对计算机病毒进行查杀。立即对杀毒软件进行升级,确保杀毒有效性。要从预防病毒入手,对外来软件或文件应事先查杀再使用。断绝病毒传输路径。
5. 主动协调硬件维护人员排除硬件故障。
6. 平时应依据试验内容和计算机技术发展水平立即调整和更新网络中多种软件,以适应利用计算机进行教学需要。
7. 平时要做好系统保护和数据备份工作,系统出现问题后能够快速恢复。
8. 认真参与业务学习,不停提升本身软件维护水平。
9. 作好软件安全保密工作。
8、定时检验方案和计划
8.1. 定时维修
定时维修是按时间计算,应对机房和机房设备作定时检修。维修应包含以下内容:
1 )对机房内部和周围环境作一次根本性清理,把卫生搞好。
2)对机房内全部设备作一次清洗,除尘。
3)对空调设备、新风设备过滤装置作一次清洗。
4)排除设备在使用时出现故障和缺点。
5)检验、测试机房电源系统工作情况,并做好登记。
6)检验、测试机房空调设备工作情况,并做好登记。
7)其它检验。
8.2. 换季维修
换季维修是在每十二个月进入夏季之前和进入冬季之前为保障机房及
机房设备在盛夏和严冬能正常使用而进行预防性检验。换季维修
应包含以下内容:
1 )完成定时维修内容。
2)对空调设备中蒸发器、冷凝器进行一次大清洗、大检验。
3)检验并排除影响冷凝器散热效果障碍。
4)检验空调设备加湿水供给情况。
5)检验空调设备冷凝水排泄管道是否通畅,有没有异物堵塞。
6)检验加热装置工作情况。
7)检验多种电缆、导线固定,走向及通电后温升情况是否符
合要求。
8)检验多种安全设备、防火设备及报警设备工作情况。
9)夏季到来之前,还应检验机房防水 (或雨水)浸入室内措
施落实情况。
10 )其它检验。
8.3. 重大任务开始前检修
在重大任务开始前,为了保障机房及设备正常运行,为顺利完
成重大任务提供可靠环境而进行检修。关键应包含:
1 )完成季节性检验维修内容。
2)依据任务要求,定向检验部分相关设备情况。
3)为了保障重大任务约完成,临时增设部分设备安装和调
试。
4)其它相关检验维修。
8.4. 定时中修
计算机机房及其设备经过一段较长时间连续使用,机件磨损和自然老化,会使机房和设备存在部分问题,为了保障机房和设备深入使用,必需认真地对机房和设备进行维修。设备连续使用10000小时左右要进行中修,其关键内容有:
1 )机房结构,外部环境检修。
机房建筑结构改变。
机房严密性。
从机房穿过为楼内其它楼层使用多种管线对机房影响。
机房和外部多种连接用管路通畅、密封性检修。
机房周围环境改变情况对机房影响。
2)机房内装修部分检修。
机房吊顶部分要打开部分活动顶板。检验顶部多种电缆、信号线、管道连接、固定。清除吊顶上积尘。受损吊顶更换、调整。
对机房墙面装饰板进行全方面检验,清洁。
机房内活动地板打开一部分进行检验。检验地板下电缆、导线、信号线多种设备使其附件固定。清洁地板下部积尘。
对损坏、变色地板更换和调整。
检验机房内多种门、窗、隔断固定,玻璃密封条完整性。门和窗关闭、开启灵活性。关闭时密闭性。
对损坏灯具、门窗拉手、照明开关修理、更换。
3)完成空调制冷系统中修检验。
检验压缩机、排除异常情况。
清洗蒸发器、冷凝器、蒸发器,尤其对室外机要关键清洗。
对润滑系统清洗,更换润滑油。
清洗、更换过滤网。
检验皮带松紧情况,调整到适宜程度。
检验电器线路完好和控制开关灵活性,接触可靠性。
检验制冷剂是否泄漏,需要时给予补充。
检验冷凝管道有没有损伤、变形。
检验上下水管道是否通畅,接口有没有裂缝。
测试各个部位工作性能参数。
对怀疑部位进行认真检验,消除疑点。
4)完成机房供配电系统中修检验。
检验市电电压是否稳定。
配电柜各接触点是否牢靠,如有松动立即紧固。
调整机房内三相电源使之均衡分配。
检验电源线套管有没有破损、各类开关、控制器是否灵敏,并加以处理。
各类插座有没有损坏并给予更换。
整理机房使用中用电不规范行为。
5)完成UPS电源定时检测内容。
检验并清理使用UPS非计算机类设备。
测量UPS输入输出电压是否正常并加以处理。
对非免维护UPS电池进行一次放充电。
清理蓄电池灰尘并检验有没有泄漏情况。
6)对机房接地系统进行一次全方面检验测试。
计算机直流接地电阻小于一欧姆。
计算机交流接地电阻小于四欧姆。
计算机安全接地电阻小于四欧姆。
若使用组合接地系统,则计算机组合接地电阻小于一欧姆。
7)对安全消防系统和自动报警系统设备和线路进行一次全方面
检验、测试。
设备固定。
线路和管路固定和连接。
探头技术性能要进行实测。
消防系统相关附件技术性能测试和联动试验。
检验灭火气体设备间使之符合设计要求,钢瓶压力达成技术指标。非气体灭火其它灭火设施,均应符合技术要求。
更换手提灭火器材。
8)中修后要对机房情况和设备技术性能作一次全方面结论。在结论中应有以下内容:
机房内环境技术性能。
机房外部影响程度。
机房设备关键技术性能参数及使用情况评定。
需要更新机房设备。
对机房使用情况评定。
8.5. 定时大修
机房及其设备连续使用30000小时左右时要对机房及其设备进
行大修。大修时除完成中修内容和排除机房内设备故障外还应增加
以下内容:
1 )机房外部环境影响
对影响机房外部环境进行调查和测试,在调查基础上制订
改造方案。
2)机房本身建设结构情况
对机房本身建筑现实状况进行一次全方面检验评定,写出调查报
告,制订整修计划。
3)机房内部装修
要对机房内部装修情况进行一次全方面整修。在整修前要对机
房各部位,各方面进行检验,制订整修计划。机房内吊顶、地板要
全部打开进行检验、清洁;对吊顶、地板平整度进行调整;更换
裂缝、起鼓、脱皮、变色微孔顶板和活动地板;补刷楼层顶板、
地板防尘漆;墙面饰板严重变形或损坏要重新更换。
4)按大修内容完成空调制冷设备检验,制冷系统大修就是要
对机房空调设备和新风设备进行全方面测试、调整。关键是:
完成中修内容。
清洗压缩机外壳油垢和灰尘。
检验并校验温湿度探头和各类控制器灵敏度、正确性,如
果有损坏或动作失调应予更换。
监测系统中全部阀门并试压。
检修保温管道及绝热材料,不合格应重新作保温。
清洗室外机、散热器,并清理其周围杂物,确保散热充足。
清除辅助设备表面特铁锈,吹出内部油腻。
做好大修后试运行和测试工作。
5)完成供配电系统全方面大修检验。
检验应符合国家和当地供电部门相关要求。检验后应有供电部
门合格证方可重新使用。
6)对机房专用UPS电源进行全方面检验测试。
在大修中要对机房专用UPS电源作以下性能检测:
检验UPS电源内部附件,多种电缆、信号线固定。
对UPS电源作一次全方面清洁。
检验各接线端可靠性,清洁多种开关、接触器触点。检
查弹簧强度和灵活性。
检验多种集成电路板固定和清洁应良好。
检验蓄电池性能
对蓄电池作放电试验。
逐一测量每个蓄电池终了电压。
对蓄电池作24个小时充电。
不合格蓄电池要摘除,摘除蓄电池个数不能多于UPS
电源对蓄电池组最低程度。
蓄电池组不能满足要求时要全部更新。
对UPS电源性能作全方面评定。
7)对安全消防系统进行一次全方面技术性能检验。
报警系统可靠性和正确性检验。
灭火系统管路按要求作耐压试验。
灭火剂瓶 (罐)做耐压试验。
灭火药剂假如过期、压力不足应更换或补充。
对照完工图逐一检验烟感、温感探头灵敏性。
此项工作应由消防专业人员完成并由消防主管部门现场检验
指导。
8)对接地系统进行全方面测试。
假如是机房专用接地系统,在条件许可时,可抽查部分接地体
在地下锈蚀情况,接地电阻若达不到要求时,可补做或增加
接地体。
9)机房大修后要进行全方面验收。
机房大修应组织有机房专业装修资格企业完成,大修完成后应按
机房标准和大修要求进行检验验收。
二、机房维护服务方案
1、机房维护必需性
机房内设备对工作环境有着非同通常要求。
1.1、机房设备十分爱洁净,对灰尘尤其“感冒”。假如设备长久处于灰尘漫舞环境中工作,很轻易发生故障,因为灰尘会不知不觉地渗透设备控制框中,并直接覆盖到它电子线路中。时间一长,设备内部工作电路就会散热不良,长此以往自然就轻易出现故障。
1.2、设备全部害怕潮湿。设备内部有电子线路,假如电子线路中各个元器件长久在潮湿环境中工作,其电气性能会逐步下降,而且还有可能产生漏电现象,引发怒灾事故。
1.3、设备对环境温度十分敏感。高于40℃环境或低于0℃环境会降低设备工作效率,使它潜能得不到充足发挥,从而降低使用寿命。
1.4、机房硬件设备品牌过多、产品供给商过多,厂家售后保障方法不到位等等原因,造成设备使用一段时间后,设备故障不停、损坏率不停攀升,最终不得不对原有设备进行大面积更新,出现反复投资、浪费严重现象。
对于用户而言,往往因为专注于业务或受成本所限,缺乏专业机房维护人员和充足备件。假如说小故障尚可处理,那么,一旦机房发生突如其来大故障,用户便会措手不及,或无法找到症结所在,或没有可更换备件。此时,损失已经造成了。
为了做好机房设备维护工作,我企业维修中心配置对应人力、物力(工具、通讯设备等),确保中心机房正常运作,经过对机房环境支撑系统、监控设备、计算机主机设备定时检测、维护和保养,保障机房设备运行稳定,经过保养延长设备生命周期,降低故障率。
确保机房在突发事故造成硬件设备故障,影响机房正常运作情况下,可立即得到设备供给商或机房服务维护企业产品维修和技术支持,并快速处理故障。
2、维护内容
2.1机房监控设备维护管理:供配电监测系统、空调环境检测系统、门禁设备系统、漏水检测、保安监控设备(包含摄像头、硬盘录像机)、监控主机;
2.2机房空调和配电设备维护管理:精密空调机组、新风设备;UPS及电池、主配电柜、UPS配电柜;
2.3机房消防设备维护管理:多种探测器、手动报警按钮和报警控制器,灭火剂控制装置;
2.4机房供水水路、电路及照明线路维护管理:水、电路管线及接口检验维修。
2.5机房基础维护管理:机柜线路整理、标签检验更换、机房除尘清洁、地板、墙面、吊顶、门窗及相关配套维护管理
2.6机房主机设备维护管理:计算机服务器(包含PC服务器、
展开阅读全文