资源描述
广东电子工业研究院
云计算机房
管 理 手 册
(起草方案)
5月12日
修订:第5次,三章三节,-5-26 古志强
目录
第一章 总则 2
第二节 维护作业制度 2
第三节 值班和交接班制度 3
第四节 大型维护作业计划 5
第五节 故障处理制度 5
第六节 技术档案和原始统计管理制度 5
第七节 安全保密制度 7
第二章 设备管理 8
第一节 通则 8
第二节 设备更新 8
第三章 机房管理 9
第一节 机房环境 9
第二节 机房日常运行维护管理 9
第三节 主机系统管理 10
第四章 网管系统管理 12
第一节 通则 12
第二节 网管系统日常管理 13
附件一 网络设备维护管理统计 14
1、网管日志 14
2、设备机历本 14
第一章 总则
本规程依据《广东电子工业研究院》云计算平台技术体制、维护技术指标体系要求制订,适适用于《广东电子工业研究院》整体网络管理和运行维护。
第1条 网络管理运行维护工作基础任务
1. 确保全网优质、高效、安全可靠运行;确保办公网络、云计算网络、对外应用网络高效、安全可靠。
2. 强化《广东电子工业研究院》中网络设备、主机系统、相关线路和辅助设备运行维护管理,充足利用多种技术手段,实时监控,快速正确地排除多种故障,压缩故障时间,提升《广东电子工业研究院》全网接通率,网络设备、主机系统可用率,故障修复立即率。
3. 定时对网络、系统、线路和设备运行情况进行统计分析,优化网络性能,确保网络安全,确保系统和设备运行正常、完好。
4. 加强固定资产管理,确保资产数量和质量,合理调配,充足利用网络资源。
第2条 网络管理维护工作基础标准
1. 建立符合专业化发展要求管理运行维护组织体系和技术支援确保体系。
2. 面向网络,以确保内部和外部应用网络安全、通畅、高效为目标,以技术支援为确保,强化协调配合,全方面提升网络运行维护质量和服务水平。
3. 对安装在办公室、楼层或其它办公楼外设备,定时巡视。
4. 要把网络安全运行和软件、用户数据管理作为维护工作关键内容。
第二节 维护作业制度
第3条 网络安全制度
1. 网络升级、软件修改
在网络升级、软件修改前应做充足准备,提出具体升级(修改)目标、内容、方法、步骤和应急操作方案报上级审批核准。一经同意,要坚持双人操作,并在升级(修改)前后作好网络中心数据、用户数据和软件备份工作。
2. 非法攻击防范方法
定时查看运行系统安全管理软件和网络日志,在发觉网络遭到非法攻击和非法攻击尝试时,应利用系统提供功效进行自我保护,并对非法攻击进行定位、跟踪、发出警告,同时向上级汇报。
3. 口令管理
网络管理人员统一管理,注意保密;定时修改口令并符合保密要求。
第4条 日常维护和定时维护要求
1. 日常维护应在天天早上和下午分两次进行,发觉不正常情况应立即处理并具体统计,处理不了问题,应立即向主管人员汇报;
2. 定时维护通常分为六个月检验和年检验等。精密设备定时维护后,应有具体统计,并由主管责任人签字。
第三节 值班和交接班制度
第5条 机房值班制度
1. 机房必需实施周期值班制,且天天必需进行两次以上日常巡检,实时掌握机房内全部通信设备动态运行情况。
2. 值班人员在岗时应随时留心设备有没有异常告警、异味和异声,若发觉不正常情况,应急时处理,认真统计查找,并立即上报。
3. 遵守障碍处理要求,正确、快速地处理障碍,立即上报、传报和校对,不得借故推迟障碍处理时间。
4. 立即、完整、正确地填写值班日志和多种要求统计。
5. 不得任意加、甩、倒换设备;不得任意瞬间中止电路;不得任意变更路由。
6. 不得隐瞒和谎报故障。
第6条 对值班人员基础要求:
1. 应按时进行巡检,进出机房必需做好统计,写好操作日志。
2. 全方面了解本机房内部多种设备工作原理、技术标准、应急处理措施。
3. 严格实施交接班制度,作到手续清楚,上下衔接。
第7条 机房值班人员职责:
1. 值班人员必需参与上岗培训,要熟悉机房设备性能,设备、电路开放情况。
2. 掌握监控设备通常操作技术,充足利用监控设备进行日常维护和故障处理。
3. 值班人员在值班时间内要坚守岗位,恪尽职守,保持设备和电路正常运行,配合相关维护站进行业务处理。
4. 值班时不得任意切断或清除告警,发觉异常情况,应立即做对应统计和处理并立即通知相关人员。
5. 参与设备和电路开通、停闭、调度和故障修复后测试工作。
6. 立即、正确、完整地填写值班日志及多种要求统计。
7. 严格遵守通信纪律、安全保密制度和其它各项要求制度。
8. 配合外来人职员作时,要填写入室登记本,注意安全操作,预防影响电路质量或造成障碍。
9. 巡视设备和环境安全,保持设备和环境清洁,在值班期间对设备和环境负责。
第8条 交接班关键内容
1. 检验网络、设备、线路使用、调度、通阻情况,发觉问题立即处理并统计故障起止时间。
2. 查看值班统计和系统维护终端输出汇报,了解电路、设备远行情况。
3. 检验机房电源、空调设备是否正常。温度、湿度是否符合要求;防火装置及灭火器是否齐全、良好,告警装置是否正常。
4. 查阅上级新部署通知和要求事项。
第9条 在交接班时所发觉问题均应记入交接班统计本内,并由交接双方签字。交接班时发生故障,或正在进行调度处理时,不得进行接班,接班人应协同处理至通信恢复或告一段落时再进行交接。
属于漏交造成通信中止,由交班人负责。因为未认真进行接班而造成问题,由接班人负责。
第四节 大型维护作业计划
大型维护作业指大型软件硬件设备增加、升级、灾难抢修、厂约定时维护等必需由厂家人员和本单位相关部门人员同时进行作业计划。
第10条 维护作业计划应先由机房管理员汇报上级部门,获同意后才能正式实施,作业计划必需严格根据所列项目和周期进行,不得随意进行计划外作业。
第11条 维护作业进行时必需由机房管理员和厂家工程师共同参与,机房管理员应极积配合厂家工程师工作。
第12条 作业计划完成后,必需具体统计完成情况和测试前后和数据,并将发觉问题摘要统计,测试汇报由厂家和运维部门一式两份妥善保管。
第13条 企业相关领导可对维护人员实施作业计划情况,作业质量和统计进行现场检验,运维部门应对维护作业计划实施情况进行定时检验并汇总上报。
第五节 故障处理制度
第14条 建立日常维护工作汇报制度,如发觉重大故障,应立即逐层向上级汇报。
第15条 定时召开质量分析会,碰到较大故障应立即召开质量分析会。常常组织技术交流学习,以提升维护人员技术维护水平和工作能力。
第16条 故障处理基础标准
1. 先出口后网内;先高端后低端。
2. 先关键后通常;先调通后修理,故障消除后立即复原。
第17条 对下述情况应立即发觉并逐层向上汇报至院务处:
1. 机房总电源故障历时4小时以上;
2. 节点设备阻断达6小时以上;
3. 出口网线中止、服务器机组严重损坏、大型精密设备一级警报、消防警报,
立即汇报部门领导。
第18条 重大障碍处理完成后,三日内写出书面专题汇报,将故障现象、原因、处理过程、经验等逐层汇报到院务处。
第六节 技术档案和原始统计管理制度
第19条 技术档案、资料和原始统计是进行维护管理依据,必需建立健全制度,专员保管,立即修订,方便使用。
第20条 档案和资料项目以下:
1. 系统设备说明书、图纸、维护手册;
2. 机房布线系统图,包含多种布线系统图;
3. 机房内机架及设备所在位置图;
4. 工程技术设计、施工、完工资料和验收统计等;
5. 电源、配线设备接线统计;
6. 电路和用户资料;
7. 应急处理方案;
8. 系统重大故障汇报和原始统计;
9. 年度检修测试统计;
10. 多种规章制度:技术规范和维护指标;技术文件和相关要求等。
第21条 机房原始统计项目以下:
1. 值班日志;
2. 人员出入登记本;
3. 障碍统计和质量统计分析资料;
4. 大型作业计划;
5. 测试统计及电路电气特征统计;
6. 配线资料;
7. 设备搬迁、更新相关资料和测试统计;
8. 现有机器设备和关键测试仪器机历卡;
9. 工作统计和其它原始统计。
第22条 机房在工作上必需其它资料项目以下:
1. 设备开机、停闭和调度时间表;
2. 多种机线设备和电路发生故障时抢修处理次序,调通措施;
3. 电路路由表;
4. 相关技术人员联络方法表;
5. 各节点机房、链路提供商、链路经过关键站点和相关领导联络方表。
第23条 技术档案和资料管理要求以下:
1. 专柜存放,专员管理,定时检验清理。
2. 不得随意带出机房,如确因需要临时借出时,应经领导同意,由值班人员登记,按时归还。
3. 使用时应珍爱珍惜,不得抽页、涂写,有破损时应立即修补。
4. 设备调动时,原随机技术资料应随机转移,使用过程中建立资料,可择其关键性给予复制,一并列出清单,随机转移。
第24条 凡企业要求维护报表、定时测试统计、质量分析报表、值班统计和其它原始统计等,均应按季分月整理成册,集中存放,专员保管(或输入计算机保留),在经过合适长时期后如这些资料确已失去利用价值,经企业相关责任人同意后能够销毁或删除。
第七节 安全保密制度
第25条 安全要求:
1. 联网设备必需采取必需安全方法,以保障网络设备安全及所承载业务信息安全。
2. 维护人员应严格遵照相关安全防火要求。
3. 当机房交流供电系统停止工作时,维护人员应立即向相关主管部门汇报;在计算机UPS蓄电池直流工作电压降至最低前,应即时关机。
4. 雷雨季节应加强对机房内部安全设备、地线及防护电路检修。
5. 非电气人员不准安装电气设备和线路,不准带电工作。测试电气设备电源是否正常应使用对应测试工具,严禁用手触及电气设备带电部分和使用短路方法进行试验。
第26条 保密要求:
1. 未经同意不得将相关网络通信设备、网络组织、电路开放等机密资料抄录、复制和私自带出机房,并不得对外泄密。
2. 凡外部人员进入机房必需有上级相关部门同意,推行入室登记手续,并由相关人员陪同。厂方人员入室工作,应由机房管理人员陪同,明确工作内容和工作范围。入室登记应具体统计进出机房人员姓名、时间、同意人及工作情况。
第二章 设备管理
第一节 通则
第27条 通常已经开通投入运行主备用设备和立即投入业务或研发运行设备,均属于维护和管理范围。网络设备关键包含:高速关键路由器、业务接入路由器、防火墙、局域网交换机、接入服务器、应用服务器、网管工作站和对应连线等。
第28条 各类设备,在工程施工合格,技术指标良好,设计施工文件、图纸、技术资料完整正确,经企业验收合格后,经上级同意,即应开始实施本规程相关管理和维护要求。
第29条 网络设备管理应严格遵照下列标准:
1. 全部网络设备严格实施专员负责制。
2. 未经相关领导同意,不得随意拆卸、硬件调试等操作。
3. 相关人员应全方面、立即地向主管领导反应设备运行情况。
4. 各相关人员应该相互配合协作,严格实施本规程要求设备维护操作示。
第30条 按要求考评标准加强管理,以确保设备完好。设备完好关键标准为:
1. 各类设备电气和IP性能应符合对应技术指标要求。
2. 结构完整,部件、备品(备盘)及备份软件齐全,设备清洁。
3. 运行正常,使用良好。
4. 技术资料齐全、完整、图纸和设备相符。
第31条 设备调拨、停用、报废、拆除、转让等应经院务处同意方可进行。
第32条 待用设备及备用盘、隶属器件、技术档案、资料和原始统计均应完整无缺。
第二节 设备更新
第33条 设备更新条件:
1. 设备长久使用(已超出设计使用年限),性能严重下降,常常接触不良或数次故障难以修复能够更新。
2. 设备一些关键性能下降,数次调整修复仍不能达成指标,能够更新。
3. 设备陈旧,电路开放不多,可由其它技术优异设备替换,能够停用。
第34条 设备更新前,应对设备现实状况进行具体调查,提出更新理由,依据要求编制计划报上级审批。
第35条 设备更新后,应组织相关人员进行验收,并有具体测试调整统计,多种资料归档保管。
第三章 机房管理
第一节 机房环境
第36条 机房环境要求
1. 机房工作人员应备有工作服和工作鞋,进入机房要更换。
2. 机房门窗要严密,室内要防尘和清洁。
3. 机房温度通常保持在21±5°C,相对湿度通常保持在30~75%,有特殊要求设备,以该设备说明书要求安排。
第37条 机房环境维护
1. 例行维护
l 天天进行机房及周围环境卫生检验
l 每两周进行机房及周围环境卫生清洁
l 天天对机房日常维护指标进行检验并统计
2. 紧急维护
l 立即进行相关紧急自处理
l 即时向救护部门申请救助:企业领导、火警-119、匪警-110
l 通报相关部门及相关领导并立案
第二节 机房日常运行维护管理
第38条 对机房设备维护要求
1. 机房应备有防静电手镯,维护人员插拔设备模块时要带防静电手镯。
2. 维护终端使用软盘要有严格防病毒方法,严禁安装、使用未经同意软件。
3. 多种通信设备外壳,应良好接地。使用220伏及其以上交流电源工作时,必 须注意人身安全和设备安全。
4. 机房内严禁使用可能引发火灾取暖设备。机房内要备灭火器,灭火器要放在固定位置,并指定专员管理,定时检验,确保良好。要求每一维护人员熟知其使用方法和火警电话号码。
5. 室内全部设施要建立固定资产管理目录,并有专员负责。定时查对。
第39条 对机房操作人员要求:
1. 机房内严禁吸烟、饮食、睡觉、闲谈、娱乐。
2. 全部出入机房人员必需更换指定拖鞋或穿上防尘鞋套,方可进入机房。
3. 机房管理人员进出机房应尽可能更换拖鞋,同时节俭室内资源;如:防尘鞋套、纸张、文具、电能等。
4. 除机房管理员外,其它部门和外单位人员,需经相关领导同意,并由机房管理人员陪同方可进入机房。
5. 机房管理员应按要求时间,对环境、湿度、温度、电源电压,设备运行等进行统计和监视。
6. 人员应会熟练使用灭火器材。出现火警时应立即汇报保卫部和火警台。
第三节 主机系统管理
第40条 “主机系统管理”目标是确保《广东电子工业研究院》 网络内主机正常运行和多种网络服务高效运作,确保网络安全,提升《广东电子工业研究院》服务质量。
主机系统管理目标包含:
1. 外观状态
2. Power状态
3. CPU利用率
4. 硬盘空间
5. 进程状态
6. 日志检验
7. 网络接口状态
8. TCP端口使能状态
9. UDP端口使能状态
10. 安全状态
第41条 系统备份管理
1. Email/Vhost/DNS服务器:
每七天做一次增量备份;每个月做一次全备份。备份数据保留6个月以上。
2. 视频监控/环境监控/门禁控制服务器:
每次修改配置文件后,做一次全备份。备份数据保留6个月以上。
第42条 系统安全管理
1. UNIX/window主机用户密码制订和维护规则
(1) 任何账号生成后,严禁使用缺省密码作为密码使用;长度应大于6位,且应该是字母(大小写)﹑符号﹑数字混合使用;
(2) 避免使用自己(或亲属﹑好友)姓名﹑生日等易被人猜到信息作为密码;避免使用和自己用户名相关信息作为密码;
(3) 使用人员要妥善管理自己账号/密码,密码严禁被她人使用(若有需求,能够在“机房管理员”同意下开临时账号)。
(4) 因为主机使用人员自己账号/密码管理不善,造成系统安全性问题(如,口令过于简单,被黑客猜到,进入系统),由该密码全部者负对应责任。
(5) 当用户登录主机(输入密码)时候,应让她人回避,以避免密码泄露。
(6) 应在天天上班后前两个小时内检验系统log 文件,发觉任何可疑问题,对事件“现象描述”和“处理过程”和“结果”做具体统计。
(7) 对全部主机进行不定时安全检验,发觉问题后立即处理,并做好具体统计。
(8) 除用户应用主机外,全部主机帐号和密码必需由“机房管理员”掌控发放,使用人员不得随意更改主机密码,如须更改必需由“机房管理员”同意下才能更改,并做好存档。
2. 主机操作规程
(1) 每次登录主机要用自己账号;完成工作要退出系统。
(2) 操作人员离开机器10分钟以上,应在退出系统后离开。
(3) 操作过程中若有事离开10分钟之内,应锁屏幕后离开;办完事情立即返回。
(4) 用户在输入口令时候,在场其它人应回避,(用户有权要求其它人回避)。
(5) 在已提供信息服务或作研发使用主机上,使用人员不得下载安装即时通信、音乐、游戏、BT工具等无关软件。
3. 路由器、防火墙安全操作规则
(1) 任何管理员不得私自修改路由器、防火墙配置,须经相关人员讨论后方可进行。
(2) 对路由器、防火墙做任何配置修改之前要对配置做备份,抄送同事人员。
(3) 对路由器、防火墙做任何配置修改,只有检验无误以后方可确定生效。
(4) 修改路由器、防火墙任何设置需在值班日志上具体统计,交接班时做必需说明。
(5) 在路由器、防火墙有业务承载情况下,路由器、防火墙重新开启,需先做备份再经相关人员讨论后方可实施。
第四章 网管系统管理
第一节 通则
第43条 网络管理维护目标是监测网管系统本身运行情况,并按实际情况对相关管理系统进行优化升级,以确保网管系统高效、安全、稳定地工作。网管系统包含:服务器系统、服务器监控系统、UPS电力系统、消防监控系统、空调控制系统、环境监控系统、视频监控系统、门禁控制系统等。
第44条 网管系统管理目标包含:
n 网管应用系统运行性能统计
n 网管系统应用功效开发
n 网管系统运行效率
第二节 网管系统日常管理
第45条 机房管理人员必需掌握网管系统配置,使用权限及管理范围具体情况。
第46条 网管系统平时放至监视状态。
第47条 为提升网管系统真实性和可靠性,对无效告警给予确定,并有效控制。一旦发生告警,应在本班次内给予处理,处理。不得以任何方法拖延故障处理时间。
第48条 要求每班次认真填写《维护操作统计本》。
第49条 每日应统计所发生告警,并加以分析,作到三清,即“原因清、时间清、地点清”。每个月底对发生故障进行全方面分析,完成故障统计分析报表,提出整改意见。
第50条 厂家需对各级网管系统进行操作时,必需经主管部门同意方可进行。
附件一 网络设备维护管理统计
1、网管日志
2、设备机历本
网管日志
年 月 日 星期 天气:
时 间
处理情况
值班人
维 护 员
大
事
记
早晨:
下午:
故
障
记
录
处理过程
广东电子工业研究院
云机房设备机历本
设备名称:
产品编号:
安装时间:
放 置 点:
填写人姓名
年 月 日
故障
统计
插板
更换
统计
系统
升级
统计
备注
展开阅读全文