1、机房基础设施运行维护管理规范为保障机房基础设施安全、可靠、连续、稳定运行,提升机房基础设施运行维护科学化、规范化水平,依据管理措施和机房运维管理相关制度,制订本规范。第一章 总则第一条 制订本规范目标是确保机房基础设施稳定运行。经过落实制度要求,强化机房基础设施基础管理工作,促进机房运行管理标准化、规范化。第二条 本规范所指运行维护对象是指布署在总行机房基础设施系统及设备。第三条 机房基础设施指机房内为生产系统提供运行保障和运行环境场地设施。包含容纳生产系统机房、支持生产系统运行供电系统(含UPS系统)、空调系统、消防系统、安防系统、监控系统等配套设施及维护IT 系统辅助设施。运行维护管理指对
2、机房基础设施进行日常运行和维护,确保各项基础设施安全稳定地运行。运维管理包含日常管理、人员管理、设备管理、运行巡检、故障管理、应急处理、档案管理等内容。第二章 机房运行环境日常管理第四条 为确保机房生产设备及基础设施稳定运行,机房应连续确保以下环境要求:一、机房各区域内温度、湿度、空气洁净度等环境条件应符合要求,确保机房各区域良好工作环境,确保设备正常运行,并采取对应节能方法。主机房、网络机房、UPS室温湿度标准:温度:232,湿度:40%-70%,机房设备不得结露。二、机房各区域内应清洁、少尘,无悬浮颗粒物,无积水,无异味。 三、定时完成机房环境清洁工作,保持地面干爽、整齐、卫生,门、窗、玻
3、璃保持明亮洁净,门牌和标签标识清楚,墙面洁净无污迹,贴挂整齐,没有杂物。四、机房内不得有食物存放,采取方法严防鼠害、蚁害等。五、物品如清洁用具、安全用具、统计资料、仪表工具、门禁卡、设备钥匙等应摆放在指定位置,标识清楚,整齐有序。六、温湿度、水浸、烟雾、红外、门磁、摄像机等监测探头保持性能良好、运行正常。七、配电柜、箱内外要保持洁净整齐、无蜘蛛网和杂物。闸刀必需使用额定保险丝、严禁使用铜、铁、铝丝等替换。八、任何人不得私自变动机房各区域现有环境及设备设施。第五条 机房严禁带入易燃、易爆和危险物品,不得在机房内、走廊、通道和窗口周围堆放杂物,消防通道、紧急疏散通道应确保通畅,对机房各区域电缆井、
4、管道井、孔洞防火封堵进行检验,确保封堵严密。 第六条 机房严禁使用多种炉具和电热器具等大负荷用电设备,严格实施相关明火管理制度要求。第七条 机房各区域实施7x二十四小时实时监控,监控录像最短保留三个月,并能随时调阅。第八条 机房各区域应实施严格门禁管理方法,未经授权不得进入,门禁系统出入统计应最少保留十二个月,超出十二个月须下载保留。第九条 建立定时检验计划,对机房空调、供电、消防、监控、防磁、防雷、防静电、防水、防盗、防鼠及门禁等相关设施进行检验、维护。 第十条 机房电气管理应遵照以下要求: 一、机房严禁乱拉临时电源线,必需使用临时线时要采取双护套线。 二、机房使用微机必需使用固定电源插座,
5、严禁临时电源线和活动插线板长久使用。 三、机房配电柜、PDU和其它输供电设施部件配置防雷装置要定时测试和维护。防雷装置受到损坏、动作迟缓不起作用要立即更换。 四、全部电力线、地线线缆必需为一条完整线缆,严禁中间驳接。 五、电力线截面积应和负载相符,严禁超负荷运行。增加设备超出原设计供电容量或电力线截面积负载,应进行对应扩容或更换电力线。 六、机房应有严格防尘、防静电方法。进入机房人员在对生产设备和基础设施设备进行操作时必需严格根据防静电操作要求进行。 七、在机房开展安装和使用动力设备、配电设备及供电线路工作,应严格遵守用电管理要求。未经负责安全保卫和信息技术部同意,任何部门和人员不得将用电设备
6、私自接入供电系统。机房内部用电必需报负责安全保卫和信息技术部同意、立案后方可实施。 八、全部基础设施电源线室外部分(如空调室外机等)穿放保护套管和室外电源端子板、压力开关、温湿度传感器等防水防晒方法应保持完好。 第十一条 机房消防管理应遵照以下要求: 一、机房工作人员必需做到“三懂”“、“三会”、“三能”。“三懂”即:知道本岗位工作过程和设备火灾危险性、知道预防火灾方法、知道火灾扑救方法。 “三会”即:会用消防器材、会处理事故、会报警。 “三能”即:能自觉遵守消防安全要求制度、能立即发觉火险、能有效扑救早期火灾。 二、任何人不能随意更改消防系统工作状态、设备位置。需要变更消防系统工作状态和设备
7、位置,必需经机房运维管理部门责任人同意,关键变更须经部门主管责任人审批核准。机房工作人员应保护消防设备不被破坏。 三、依据实际情况配置消防设施,对消防设施严禁私自搬动和挪作她用。 四、严禁对机房生产设备和基础设施设备使用水、干粉或泡沫等易产生二次破坏灭火剂。 五、对于机房内可能发生局部范围小型火情,能够采取现场配置手提式消防设备进行灭火。 六、一旦出现消防安全事故,应根据机房消防应急预案处理。第十二条 机房各区域内设备安放应符合承重、散热、抗干扰等方面要求,不得超出用电和承重负载。 第十三条 机房施工作业指对机房各区域、生产设备和基础设施巡检、维护、测试、清洁、勘察和施工改造等;设备作业指生产
8、设备和基础设施设备检验、安装或变更。施工作业和设备安装必需遵照以下要求: 一、维护(巡检、测试、清洁等)作业应根据维护规程要求和作业计划实施。实施非维护作业需有相关主管部门核准作业计划及方案。 由外单位人员实施施工作业和设备作业计划应取得相关主管部门同意,并按要求安排陪同人员。 二、施工作业和设备作业人员必需遵守各项机房管理制度,严禁在机房内吸烟、饮食。外来作业人员必需服从机房工作人员及陪同人员管理。 三、施工作业包含线、缆布放及设备、器件安装,必需严格遵照机房工艺规范要求和其它技术要求,不得因作业而破坏机房原有工艺规范或降低机房安全标准。 四、陪同人员对施工作业和设备作业人员必需严格监督管理
9、,并配合对施工作业和设备安装全过程安全、工艺、环境卫生等管理,立即阻止可能影响机房安全操作及其它违章操作,发觉问题立即汇报。施工作业和设备作业结束后,陪同人员应负责检验和验收,并督促现场杂物和垃圾立即清理。陪同人员需具体统计过程中所发生任何关键问题。 五、因施工作业和设备作业需要使用电缆槽道、桥架、竖井、爬梯时,需取得维护部门同意;需要对电缆孔洞进行拆封,必需取得负责安全保卫同意;完成后必需遵照“谁拆封,谁恢复”标准,进行规范封堵。六、严禁设备外包装在机房内开箱、并严禁在机房内堆放设备包装、材料等。七、施工作业和设备作业严禁使用明火(如焊枪、喷灯等)。确因工作需要明火作业必需经负责安全保卫同意
10、、核发动火证,并制订安全防范方法后方可实施。 八、严禁使用卤钨灯等高温照明灯具作临时照明,如确需使用,必需经负责安全保卫同意、核发动火证,并制订安全防范方法后方可实施。 九、使用油机等含油设备、工具时,严禁使用明火。 十、包含墙、顶、地板等易产生灰尘施工作业和设备作业,必需采取严格、有效防尘方法,并立即清理。十二、施工作业和设备作业人员每日离场时必需清理现场,将使用过机房物品、设备复位,带走临时使用设备和工具,不得遗留作业垃圾。施工作业和设备作业完成后,作业人员应根本清洁现场,确保机房环境整齐。机房工作人员应严格监督检验上述清理工作,对违反现场清理要求行为立即阻止。十三、严禁将机房作为施工作业
11、和设备作业人员休息场所。十四、设备安装或变更后,作业人员或陪同人员应立即更新机柜上设备标签,并向机房工作人员提供设备信息,包含设备名称、型号、用途、安装位置、设备用电功率、重量等。第十四条 机房各区域设计和施工技术资料、机房基础设施使用手册、机房维修和维护指南,和设备、供电、布线等配置文档,应由专员保管,立即更新,确保资料有效性。第三章 机房人员管理第十五条 因为机房基础设施中和电气相关工作存在着固有危险,包含电气工作必需由含有资质人员和含有合理安全工作步骤前提下进行操作,并应利用防护设备和其它控制手段,如上锁挂牌设备,以预防现场人员受到电击、烧伤、电弧和其它潜在电气安全隐患。电气工作人员在进
12、行相关工作时应遵守相关法规标准,包含但不限于:GB 26860 电力安全工作规程、DL 408 电业安全工作规程。不含有电气工作资质人员不能私自操作电气设备、线缆。第十六条 机房应建立人员出入区域控制:主机房许可部门责任人、信息安全处、系统网络处、机房运维管理部门及系统技术责任人进入;网络机房许可部门责任人、信息安全处、系统网络处、机房运维管理部门人员进入;UPS室许可部门责任人、信息安全处、机房运维管理部门人员进入。机房各区域出入控制经过机房门禁权限设置控制。外部及本部门人员进入未授权区域需根据机房出入管理要求进行审核、登记,并由有权人员全程陪同。第十七条 非授权人员不得触碰、移动、损坏机房
13、基础设施、多种控制开关;不得改变机房基础设施系统、监控系统配置。第十八条 机房工作人员要接收基础设施安全培训,包含安全标准、危险识别、控制风险等内容,掌握基础设施安全操作技能,确保机房工作人员人身安全。 第十九条 为确保机房工作人员含有履岗能力,应进行全方面培训。包含:机房基础设施工作原理、操作步骤、应急预案、和管理制度等。对于机房工作人员应不停提升理论知识,方便在缺乏操作程序应急状态下进行正确处理。第二十条 机房工作人员应将机房基础设施历史事件总结分析作为培训关键素材,进行全员培训;对于新职员应在上岗前给予培训,以避免相同事件再次发生。第四章 机房基础设施设备管理第二十一条 机房应建立完整基
14、础设施设备登记,并及实时更新。基础设施设备登记应包含全部基础设施设备清单,关键设施设备应统计事件情况、变更情况、维护保养频次等信息。基础设施登记应最少包含以下信息:种类、设施设备说明、制造厂家、产品型号、规格、位置、序列号、投产日期、维护频次等。第二十二条 机房基础设施全部操作,均应事先制订具体标准维护步骤,经过审核后存档并严格实施。标准维护步骤用于规范和明确机房各项基础设施各项设施检验和维护操作步骤。应将操作步骤和要求以统一格式描述出来,用来指导和规范日常运维工作。制订标准维护步骤还应包含全部关键基础设施设备在多种情况下全部能实施常见操作。比如手动重启UPS操作步骤、精密空调温湿度范围控制等
15、。 基础设管理员岗位人员负责制订标准维护步骤。第二十三条 对机房关键基础设施设备重大维修、安装操作,应事先制订标准维护步骤。可要求外部技术支持企业提供制订标准维护步骤标准和操作提议,机房运维管理部门负责最终确定审核,并由部门主管责任人同意实施。第二十四条 机房基础设施属于关键设施,应确保外部技术支持企业及派出人员含有机房基础设施运维服务资质。机房运维管理部门应在开展运行维护作业前审查资质证实、考察专业能力和经验。第二十五条 外部技术支持人员在现场工作时要严格遵照机房基础设施操作步骤和安全要求,机房工作人员应监督并立即纠正和制度要求不符工作方法和行为。机房运维管理部门责任人应立即协调和处理现场问
16、题。第二十六条 对外部技术支持企业及其派出人员现场管理应符合外包和合作方管理制度要求。外部技术支持人员在现场实施维护程序之前,应接收机房相关制度培训,并取得机房运维管理部门和部门主管责任人同意。在实施维护活动过程中要严格遵照操作步骤。操作时需由机房工作人员陪同并监督统计步骤实施情况。外部技术支持人员巡检、维护、修理工作应提交现场服务汇报并存档。陪同人员登记机房基础设施检修统计。第二十七条 对于含有条件机房基础设施冗余设备(如精密空调等)应设置轮换运行机制,以延长整体设备生命周期和节省能耗。第二十八条 对机房基础设施设备和物理环境应建立完整、清楚标签标识,便于清楚、快捷地掌握区域及整个机房系统配
17、电、制冷、消防等关键提醒。应最少包含:设备标识:包含设备名称、型号、编号等;警示标识:如“设备已带电/ 危险”、“严禁合闸”、“严禁分闸”、“自动/手动”等;物理环境标识:如位置标识、区域标识等。第二十九条 机房运维管理部门应明确在机房生产设备摆放区域、基础设备设施摆放区域、临时设备或工具摆放区域。第五章 机房基础设施巡检第三十条 机房巡检分为每日巡检、每个月巡检和每季巡检。巡检对象包含机房机房环境、基础设施运行、生产设备运行、机房环境监控系统和集中监控系统等。其中生产设备运行和集中监控系统巡检要求按摄影关制度要求实施。第三十一条 每日巡检由机房工作人员完成,最少确保每两小时对机房全部区域进行
18、现场检验,如发生运行故障或可能影响生产设备和基础设施设备运行异常情况时,应视情况缩短巡检时间间隔。每个月巡检和每季巡检由外部技术支持企业和机房工作人员共同完成,是对机房基础设施、机房环境等专题检验维护。关键排查设备运行隐患、处理遗留问题、定时完成设备部件更换等。第三十二条 每日巡检应包含以下内容:一、检验机房设备标识、标签,保持标示、标签清楚牢靠。二、对机房物品码放进行整理。保持设备、设施和环境整齐。三、检验机房环境监控系统运行情况,包含温湿度、水浸等运行情况,保持性能良好和工作正常,发觉异常和报警信息应立即汇报、处理。 四、检验生产设备和基础设施设备指示灯状态、面板信息,发觉异常和报警信息应
19、立即汇报、处理。 五、检验门禁运行情况,检验机房各区域门开合情况是否良好,有没有变形。检验机房外墙窗户密闭情况,保持外墙窗户密闭。六、检验机房各区域上下水管、阀门、供暖等装置有没有漏水、破损、阀门关闭不严情况。七、检验机房天花板、墙体、地面有没有漏水、渗水、破裂等情况。八、检验机房精密空调附件地板有没有油污。九、检验机房各区域温湿度控制是否达标。十、检验机房各区域配电柜、箱电闸开关闭合情况等有没有异常;检验UPS室和强电间UPS设备有没有异常。十一、对UPS室和强电间UPS蓄电池组各单体进行外壳鼓胀、开裂、极柱变型、爬酸、渗漏等现象检验,对各单体电池间连接部位检验是否牢靠。 机房工作人员每日最
20、少需使用测温仪器对UPS室和强电间UPS蓄电池组进行一次全方面温度检测,立即发觉蓄电池温度异常情况。十二、检验机房各区域内消防报警探测器和消防设备,立即汇报异常并处理火警信号。检验内容包含机房火灾探测器(烟感和温感探测器)、喷淋头、防火门、防排烟设备、消防器材(灭火器、防毒面具、消防栓等)、疏散标志、指示灯和其它各类安全设施,发觉异常、报警、损坏等情况应立即汇报和处理。十三、检验机房钢瓶间是否存在钢瓶压力不足、阀门和连接线是否牢靠;检验机房各区域消控设备、阀门是否存在异常情况。十四、检验机房各区域消防通道、紧急疏散通道,应确保通畅、张贴疏散路线图、应急照明设施有效可用。第三十三条 每个月和每三
21、个月巡检是对机房基础设施设备运行专题检验和维护,包含对基础设施设备各部件运行状态检测、对易损耗部件(如空调滤网等)和损坏部件(如损坏蓄电池等)进行更换、对基础设施设备进行维护(如清洗空调室外机、清除UPS设备风扇灰尘等)。由含有专业资质外部技术支持人员和机房工作人员共同完成。外部服务企业应在巡检完成后出具巡检汇报,机房工作人员登记机房基础设施检修统计。第三十四条 机房工作人员对在巡检中发觉报警信息、设备仪表提醒异常情况、受损设备部件、其它影响或可能影响机房设备运行异常情况等应立即汇报、处理。第六章 机房基础设施故障管理第三十五条 机房基础设施发生运行故障或发觉各类可能出现异常情况,机房工作人员
22、应根据突发事件处理,必需立即确定,立即处理,不得拖延。突发事件响应和处理应根据不相同级事件下对应处理步骤开展。当故障临时无法排除时,需要逐层汇报,进入事件升级步骤。如遇特殊情况,和直接责任人联络不上时,可越级向上一级责任人汇报。 第三十六条 机房基础设施故障处理完成后,机房运维管理部门应立即组织故障分析,基础设施管理人员负责记机房基础设施运行故障登记。重大运行故障应提交故障分析汇报,包含发生时间、设备、位置、故障影响、故障分析和原因、故障处理过程说明、故障风险和后果、优化提议等。 第三十七条 应建立机房基础设施应急预案,并立即更新。基础设施应急预案应适适用于有可能发生严重故障情况。基础设施管理
23、人员负责制订应急操作步骤。应急预案用于规范应急操作过程中步骤及操作步骤,确保运维人员能够快速开启,确保有序、有效地组织实施各项应对方法。机房基础设施严重故障场景包含但不限于:一路市电供电时中止;双路市电供电时同时中止;发电机组开启失败;发电机在带关键负载时故障停机;单个空调故障停机;全部空调故障停机;单台UPS故障停机;机房发生消防报警;机房发生严重漏水、渗水,影响生产设备或基础设施设备运行等。第三十八条 机房运维管理部门应针对应急操作步骤开展演练工作,演练形式包含桌面推演(能够采取口述和现场模拟方法)、实战演练。实战演练应充足评定演练风险,并针对可能出现突发事件场景提出应急处理方法,避免演练
24、过程发生突发事件。应急演练参与人员应正确掌握应急预案场景判定和应急操作步骤。第七章 机房环境监控管理第三十九条 机房环境监控系统是对动力、温湿度控制、漏水等机房环境状态提供实时不间断监测及故障报警监控系统,便于机房工作人员立即了解基础设施运行状态和立即发觉异常情况。第四十条 基础设施管理人员负责管理机房环境监控系统。对机房基础设施运行阈值设定应基于安全性、运行效率和节省能耗综合考虑,同时对应设置监控报警阈值等。第四十一条 基础设施管理人员应依据机房环境监控系统统计基础设施运行数据、故障发生情况、设备维修情况等每十二个月出具基础设施运行汇报,针对存在问题提出改善提议。第八章 机房基础设施档案管理
25、 第四十二条 机房基础设施档案包含基础设施运行文档和技术文档。 第四十三条 机房基础设施运行文档包含维修统计、故障处理统计、巡检统计、值班统计、安全生产检验统计等。第四十四条机房基础设施技术文档包含但不限于:机房计划设计资料及完工图纸(含建成后变更、改造)、基础设施设备清单及相关操作文档和保修保养资料、和基础设施相关自动操作系统逻辑图及说明文档、机房环境监控系统控制点配置表、基础设施验收测试文档、机房建筑设计资料和完工图纸。完整并正确技术文档是机房基础设施后期运行、维护、维修、故障诊疗、优化改造基础。第四十五条 机房基础设施文档管理应严格实施总行及信息技术部相关档案管理制度要求,设定文档起草、变更、审核、同意、保留、分发等职责权限和工作步骤。第四十六条 机房应建立完整机房基础设施文档记录表,并立即更新。机房基础设施文档记录表应包含文档收录、保留、上交、更新、废除等信息。第九章 附则第四十七条 本规范由信息技术部负责解释。第四十八条 本规范在公布之日起实施。