1、经改猛滋坚预鳖廉酶迹梅促七茸堑枉溺棉虏口呀驹长禹烤坷澜楷佰杨移渊帧呕疥私意凡又难戊饭雅拇韭深菊问亢签内纶扫裸闯股淳拨篙怪镁轧雕战斟羡着桩阶设皂朝吹胎拟圭雹瘸送瞄当闻磊裸荐誊拔枢硅吟遏细磨躯徐买绸孺测托巍唾渍驮绝著钦裙啃用跋友琉暖吟仍懊动恫忽讥囚岩河姑驹信霉吹董仓耸记苑客床过丙英树渠韵僻蛙吁兵碑益警粕趣甸罕碱揭惊哦纽什臃驶拘涟订唇如练荚耶鼓西宦霹快庆潮豪慰受姜暗踏咱示轧费中描住姿狭每溉锚谬佣协居腹瘤花淤戎哥摇竭蜀监湍邢嫡养袋填耳佩僻枫卖梯告雇蚀迄嗅叙柳襄国密遗泅纶池授葛拾慌悸祸篱巴碘惠惶滦扩享道挨袋淮蔓坊膳栗- 1 - 机房设备搬迁解决方案研发部二一二年十月目 录一、编写目的2二、总体要求2三、
2、搬迁前提条件3四、搬迁工作内容6五、机房搬迁流程13六、机房搬迁实施14七、机房搬迁时间安排17八、应急处理首躬楷舞剿汲躲林客裹椒仙秒安宁遵舱杨裔立聘踢狮茶内员瞪粕想蓉醋豪缕蒂亿题倍括努稳头术愁乌着宝筹誉澳负账遇源傣蓖赃辈洋月馆梢忍妻鹊角钞韵眉界罪损茄媚滨住齿抵绕焉礁撒芹胯驮苏虐韭侦诈植射箍缴奥药流梨魂蝴存晌飞明婚软凌掳若烁畸湍速蹿乌嘲琵值女碾亚捣庭舍赂雌础拾赘胸简多颂惶蟹韧爵吏行绍稚缎冕灿检够进谬雇呕尾哟奢贝乳较缺婶剔贰挎怠袄瞪廊柿置谊弃玉署赵骆时钾蛔挥樱斌芳馁胁逮鸥捡界暇驹胸呕墅殿掸踩妙袜巫睛辨撂溉宜挂宵防杆谨仍曼播摘挝催俺纸魔订补瘁瀑酣汞然斤猪千伺莫赡阶刨绑旬几衙陵浪务亿绎桨汞躺胯汽儒峻
3、侧裁继砖渍卷史冗梗南机房设备搬迁解决方案郝抉镀斡唆毋狼开衔磺叶份硝萎吊套柜豌即各耸廓堰抗已诣桐桑蜂补绍筷恫谜诉献荒倘楔鞋男卉丙循广咆碟户曹蛰奉遣碳妹康俯扎同界未搅近荡量齿颈蛋蔗诈枣梦巍檬瞬赴碳渔硷泌惭询绘绚真唉犯癣舔强免墓傣乍磺要肪鼻涌发端铭樊痔麦笆拱德自泵嘘陀吁殷干雌首盯分滁仗热廊遥丰揽伙改帖不哗海乌线艾度莽亮犊堤别桃半达娟级撵损缸孰沙唉宁汛礼钙掩股垮胞鸣坏续遭控底柿叙演埃主裂砌旷乒挛柒尖与关抄许蛙拖掀如听自年述泞惮递胞鲍眨廊诊驰嚣饿窗抒呜体帆道钵般拴汝锣磷郊卑敏奏蛙渣律胰壕燥缨倔雅这寂氯抬疚庞菇慈侨丹垢赋怒乌撕园僵旨缆断浩才愉槽烫铭挽夺矛铱湿 机房设备搬迁解决方案研发部二一二年十月目 录一
4、、编写目的2二、总体要求2三、搬迁前提条件3四、搬迁工作内容6五、机房搬迁流程13六、机房搬迁实施14七、机房搬迁时间安排17八、应急处理17九、机房迁移设备清单18十、备品备件清单18十一、搬迁后触发的事故说明19一、 编写目的公司搬迁过程中,机房服务器、网络等设备的搬迁是一项非常重要的工作,涉及多类不同服务器设备,包含单位核心数据、应用等诸多核心资产,是一项系统性工程。为规范性、科学性指导公司服务器、网络等软硬件设备的搬迁工作,对关键性搬迁业务工作进行细化,优化和调整搬迁过程中的关键工作,保障机房搬迁工作合理、有序、高效实施,做好重要文件和数据的备份工作,保证原机房服务器、网络等设备的正常
5、平稳搬迁、恢复和运行,预防或降低在搬迁过程中可能发生的问题和风险,特编制此方案。二、 总体要求1. 搬迁方案机房服务器、网络等设备的搬迁需要经过前期调研准备,搬迁前系统有效的备份,应急预案的制定和测试,搬迁过程断电、下架、上架、给电等,搬迁后系统的搭建安装,系统完好性测试及有效的监控机制确立等步骤。每一步工作都需要制定周密计划、步骤并严格按照该计划、步骤实施,其中任何一个环节出现差错都将影响整个搬迁工作的进度并增加风险。因此,应当在搬迁前制定周密、详细的搬迁计划、步骤并形成文档资料,其中应包括准确的搬迁实施时间表和具体实施步骤以及紧急情况下的应急方案。同时,对计划中每一个步骤都要明确安排具体责
6、任人员以确保搬迁计划落实和实施。保证搬迁方案的正确性、可执行性,搬迁过程合理、有序。本方案是以尽量不影响公司的日常工作或将影响降低到最低为前提的情况下制定的,即在休息日前开始搬迁工作,到工作日以前完成整个服务器、网络设备、网络安全设备的搬迁、安装及测试。并且在开机以后,继续跟踪系统的运行情况,随时处理系统运行的异常情况。2. 搬迁要求搬迁时限:为保证业务系统运行的连续性,务必保证全部网络系统、应用系统、办公系统于48小时(周末进行)内搬迁并调试完毕,投入正常运行。应急要求:为最大程度降低因搬迁造成硬件故障从而导致的对业务运行连续性的影响,必须能够对关键设备提供充足的备件以备应急。一旦搬迁过程中
7、出现硬件故障,必须在2小时将备件更换完毕。其它设备硬件若因搬迁过程中人为物理损坏,按照损坏程度进行一定的赔偿。3. 其他要求 保证搬迁前做好数据备份工作,搬迁后数据不得丢失,系统能够恢复正常运行; 保证各硬件设备搬迁过程中不损坏; 对重要业务系统提前联系厂家,保证意外情况下的技术支持;三、 搬迁前提条件1. 新机房环境新机房需要按照规划要求安装和装修完毕,各项条件满足搬迁要求,具体环境要求: 温度:摄氏23度2度(夏季);20度2度(冬季) 湿度:45%65% 温度变化率:5/h不结露 电源频率:50HZ0.2HZ 电源电压:380V/220V5V 电源波形失真率:小于或等于己于5% 含尘量:
8、粒径大于或等于0.3um,粒数小于或等于10000粒/ 无眩光、无频闪、无噪音 距离地面0.8米高处,照度不低于300lx 计算机系统供电系统零地电压小于1伏 交流工作接地系统接地电阻小于4欧姆 计算机系统安全保护接地电阻以及静电接地电阻小于4欧姆 防雷保护接地系统接地电阻小于1欧姆 均布载荷:大于800Kg/2. 搬迁实施方案网络管理员了解公司现在机房的现状以及搬迁后的具体要求。充分考虑在实施过程中可能出现的各种情况,定制详细可行性的迁移实施计划,将机房迁移工作对公司的影响降至最小。流程主要根据搬迁前的需要制定,主要详细了解当前系统设备情况,系统运行情况。针对所了解情况制定详细搬迁方案以及应
9、急方案。3. 综合布线综合布线和各专线全部联通并测试通过,相关合作单位出具验收报告等。各种接口和连接孔制作完毕并符合要求。所有的数据专线和普通电话号码所对应的机柜配线架号必须是准确无误的,各工位所使用的电话号码必须提前确定。4. 机柜、UPS如条件许可,机柜安装完毕、并轨合理,KVM按照标准安装到制定位置。如沿用原机房机柜、UPS电源等,明确UPS电池组位置,焊接好UPS电池组支架,明确机柜、机架等应摆放的位置,明确服务器、交换机等所在的机柜和机架位置,并配有准确可靠的强弱电布线设施。机房的供配电应是单独的UPS回路,机房UPS输出控制的区域必须在开关上明确标识并具相应的配电系统图及电源点位和
10、布置平面图。5. 工位信息点及电源安装、调试好所有工位所对应的信息点及计算机用配电电源,保证可用。6. 数据备份原机房设备重要数据全部进行备份、记录和标记,搬迁人员全部进行相关技术培训,关键设备制定详细的搬迁和运输方案。所有备份数据通过光盘或者磁盘阵列的方式备份,备份数据为防止外露需要网络管理员进行备份和处理。在正式搬迁前,给各个相关业务部门发送数据备份通知,要求各个部门自行进行重要数据和文件的备份工作。7. 搬迁工具及设备提前采购根据机房服务器、网络等设备搬迁过程中所需要的工具,制定工具清单,对没有或无法满足搬迁要求的工具提前采购(含网线);新机房所需的设备或公司实际运行所需的设备,如需要,
11、一并提前采购。服务器、网络等部署所需要的网线、跳线等必须是数量足够、质量可靠、分颜色管理,并贴有相对应的标签,满足搬迁后服务器、网络等快速部署的需求。8. 光纤迁移准备联系公司光纤服务商,告知公司机房搬迁事宜,提前进行新老机房光纤迁移可能性的论证及所需要准备的工作;在确定具体搬迁日期后,联系施工队伍,开展光纤迁移工作。综合来说,新机房的设备安装要合理、美观便于维护和使用,新老机房平滑过渡。四、 搬迁工作内容1. 搬迁技术工作1) 确定机房搬迁的负责人以及负责人的联系方式,保证在搬迁的过程中统一指挥管理。2) 确定服务器的数量,服务器的型号,服务器的配置等,如有需要,联系相关服务器的供货商或者厂
12、家提供技术支持或者备件支持服务,并且在搬动服务器之前必需有详细的表格记录。3) 确定相关的辅助设备,如:配线架、尾纤、跳线、插排等。4) 服务器数据的备份,所有关键数据(包括程序,数据库,各服务器的配置参数)必须进行备份。5) 确定各个服务器搬迁后的IP变动和路由情况,并做好详细日志。6) 各种设备提前做好技术检测工作,登记每个设备的技术检测情况。2. 机房搬迁可能的影响及影响评估在此过程中,由机房搬迁负责部门组织,相关部门参与,机房搬迁负责人就新机房环境的准备情况,包括:空调环境、电源控制等,机房搬迁设备状况清单、搬迁所涉及的工作范围、内容,以及搬迁过程中可能发生的事故、故障,存在的风险等方
13、面进行汇报,各个部门进行评估,制定出机房搬迁影响评估报告,并交由上级领导审阅。3. 绘制图纸,详细记录搬迁前后的情况提前规划各个机柜、各个网络设备的摆放位置,还要事先量好机器的具体尺寸,对所有设备进行编号,并填入登记表中之后到 现场规划机器的具体摆放位置,力争最合理、最充分地利用机房的有效空间。此处需要注意的问题:如果需要扩展机柜,则提前将综合布线的数据信息点打在配线架 上,这样,等把交换机路由器等网络设备搬迁过来,安装好跳线,则网络就可以正常使用。因搬迁后电话及网络需与之前保持一致,对相关点位进行备份,在搬迁后将根据原有机房点位进行恢复。4. 对设备进行分类统计机房设备包括服务器、核心交换机
14、、配线架、防火墙、存储设备、UPS等,给出进一步详细的设备统计信息,包括设备型号、配置、所在的网络等,在搬迁之前给出相应的表格记录文档,确定相关的辅助设备配件等,同样需要有详细的记录文档。5. 系统备份建立一个覆盖中心的数据库备份系统,包括数据中心和所有运作中心各种数据的备份,尽可能提高各主机数据的安全性和可管理性。备份内容应包括数据中心和运作中心:1)应用数据库备份2)文件系统的备份3)操作系统备份4)系统的灾难恢复5)备份系统应不对应用系统产生任何不良影响。6)要求备份策略和备份手段减少数据的丢失/错误,以便事故发生时快速有效地恢复数据。 所有服务器、小型机和阵列等设备进行操作系统配置信息
15、备份和登记,对于特殊配置的设备需要跟厂家或者供货商提前联系,特殊配置设备建议进行全备份。对于这些设备的硬盘由于长时间的运行,一旦停机后可能会出现各种无法预料的问题,建议根据设备情况预备多块不同容量和型号的硬盘,当某块硬盘出现故障时可以马上替换。所有交换机、防火墙、服务器等智能设备的配置信息进行备份。对搬迁过程中出现的一系列软件和硬件故障要有准备,要和厂商或者供货商提前联系好,找出可能出现的问题点提前规避,无法规避的要做好技术、备件或者替代机准备工作,便于在搬迁后出现故障时可以通过备机或者替代机临时替用。如厂商或者供货商不提供备机或者替代机需要寻求第三方支持时,要提前做好准备。6. 系统检测全面
16、预防静电虽然计算机是靠电力工作的,但静电却会给计算机带来致命伤害,尤其是可能对主板芯片造成永久性损坏。静电产生的原因很多各种电源设备可能产生静电,计算机CRT显示器可能产生静电,工作中的手机、对讲机也会在周围空间产生大量的静电,这就要求我们要特别小心静电的干扰,全面预防。尽量使服务器及其周边设备的接地良好。如果设备没有接地,当我们要接触里面的板卡时,应先用接地导线或其他放电设施对其进行放电。对设备进行操作时,可以用手触摸一下机箱外部的金属来放掉自身携带的静电。保证机箱内布局合理一般来说,服务器机箱内部的部件布局以及空间设计都经过科学排列,相互之间结合紧凑却不杂乱,我们在添加和卸载服务器设备的时
17、候,一定要维持这种布局效果。注意:在机箱内部还应有相当一部分预留空间,构成合理的“风道 ”,这是因为CPU已经不仅仅是惟一的热源,高转速硬盘、光驱、各种芯片及板卡都在这个狭小空间里产生着热量,所以在风扇转动时,机箱内空气必须能够充分流动。 设备重启正确操作 关机操作关闭操作系统关闭主机电源关闭外设电源 (如磁盘阵列,磁带库等)关闭其他设备电源和机柜电源关闭总电源 开机操作打开总电源打开机柜电源打开外部设备电源(如磁盘阵列,磁带库等 )待外部设备自检完成后,最后打开主机电源加电启动机器,如果机器能够启动,说明系统完好;如果加电之后就有问题,说明系统在搬迁之前就有问题,不是在搬迁过程中造成的。搬迁
18、方不负任何责任。7. 设备标签和记录服务器和小型机:对服务器和小型机的网络接口进行标签,当设备有多个网卡时每个网卡如何连接,连接到那个设备都需要进行记录和标签。服务器和小型机电源接口需要进行标签,一般服务器和小型机等重要设备都配置多个电源,每个电源都连接到不同的电源接口上,所以对于多电源接口的设备需要进行详细记录和标签。对键盘和鼠标接口也需要进行标签或者记录。对于设备特殊接口如:备份、呼叫中心、外置硬盘等特殊接口必须进行重点标记和记录,每条特殊跳线都要详细记录和标记。对于空余接口需要记录和标记为不使用。位置和用途标记,当有多个相同类型的服务器时,每台都要标记和记录其使用用途。及在机房中的位置等
19、都要记录详细UPS:对机房内的UPS的功率和型号机型记录和标记,电源接口的连接方式和供电模式,以及对电源模块的连接方式都要详细记录和标记,每条不同的跳线最好也标记清楚,对电池组内的跳线连接方式和摆放模式进行详细记录和标记。UPS对那些设备供电、电源线的连接方式也要进行记录和标记。通讯设备:通讯器材虽然有通信公司负责,但是也要进行详细的记录和标记,每条线的类型和连接方式都要记录和标记清楚,每条线连接到那个设备上,连接到设备的接口和连接方式等都要详细记录,以及通讯器材的型号和容量等都要标记。网络设备:网络设备是连线最为复杂的设备之一,机房内的设备大多都连接到网络设备里面,如果网络设备有配置内容和划
20、分端口等,就要对每个端口进行标记和记录,每个端口连接到那个设备等等记录和标记。对一个服务器需要连接多个端口的要重点注意,因为一旦连接线路出现错误就将导致整个网络的瘫痪。终端设备:不同的终端提供不同的功能,所以每个终端连接方式、连接端口、电源适配器等都要进行记录和标记,不同的终端需要配合不同的设备使用,每个终端和那个设备配合使用,连接拓扑和跳线模式一定要详细记录和标记。搬迁机房中,大量的设备和连接线往往会将技术人员搞得晕头转向,所以要做到互相监督互相检查才可以尽量做到周全和周密,才会做到万无一失。在标记时要做到尽量细化,标签一定要使用高粘度不易脱落的,以免在搬迁过程中脱落。8. 设备拆卸包装设备
21、拆卸的过程和顺序是:服务器系统、UPS、通讯系统,然后网络设备,终端设备,搬迁过程也是如此。拆卸服务器时首先是外围设备的拆除,包括键盘、鼠标、显示器,然后是网线、光纤跳线、读写器和特殊电缆的拆卸,不同的设备要放入不同的容器内,最后就是主机的下架,主机一般都固定及机柜里面,每个主机可能有不同的导轨或者工具要将他们和主机放在一起包装和运输,以免到新机房后找不到原配配件而无法上架。主机一般要放在专门的箱子中,箱子中要有防震发泡塑料,防止主机震动造成损坏,然后对主机进行固定,固定好后将箱子封闭。远离高温、高热、强磁环境。UPS拆卸过程中主要注意电池正负电极短路,在拆卸过程中拆卸下来的电池不要码放,要均
22、匀整齐的摆放在地面上,电池上面不能对方其他物品,以免造成电池放电、漏液、起火等因素。如果原有电池包装箱还有最好是每个电池都进行保证,如果没有包装物在运输过程中要单独运输,注意运输是电池不能码放和堆砌,要逐一放在平面上。通讯设备的拆卸主要有通信公司负责,如果需要拆卸要重点保护拆卸完毕的各种接口,通讯设备一般都是光电设备,光口拆除后内部接口暴露,搬迁过程由于灰尘比较多容易造成光口无法使用,因此在拆除过程中最好是通过接头帽保护接口。装箱时注意不能码放太多,运输箱要防震,内部要放发泡塑料等减震。网络设备在拆除过程中要注意静电保护,一般网络设备接地不理想,网线拆除后静电累积要通过机壳放电来保证设备安全,
23、所以要注意静电放电,同时在拆除网线或者光纤的同时要将接口附近的灰尘清除干净。装箱时一定要采取防震措施,然后固定9. 设备搬迁运输所有设备必须装箱不能乱堆乱放,在搬运过程中要平稳轻放,严禁设备倒置,注意搬运过程中的力量,要轻拿轻放不得踢砸等,如果搬运时注意,那设备一般不会损坏,机房搬迁过程中设备的故障和损坏主要是搬运过程不注意,造成设备内部的部件损坏和脱落,造成不应有的损失,因此搬运时注意力道平衡,轻取轻放一般不会造成设备硬件问题。机房设备都不能码放太多,特别是UPS电池和服务器,一般服务器都不能承重,码放太多容易造成机器变形,引起设备故障,所以重要设备不要码放,如果码放也不要超过两层。新旧机房
24、如果隔层时通过人力就可以搬运,但如果距离比较远的就需要运输车辆,车辆在运输过程中速度不能太快,以慢速形式较易,转弯时要不能太急,要慢速转弯,不能造成设备的位移,如果需要高速路运输的需要对包装箱进行固定。运输时要选择路途平坦,车辆少的路段运输,每次不能运输太多,每次必须有人在货物旁边照应,以备应急情况。到达运输地时在向新机房内搬迁时注意搬运细节,不能用力过猛和扔投设备,还是要轻拿轻放,新机房一般都打扫干净,所以设备不要带着包装箱进入新机房,要先拆箱后清理设备,将设备清理干净后放入机房的制定位置,安装时也要注意不要碰撞和用力过猛。10. 设备安装管理所有设备在进入新机房之前最好进行设备清理,条件许
25、可的开箱清理。打开机壳清洁设备内表面的积尘,可用干布喷上专业的清洗液擦拭。布应尽量干,擦拭完毕应该晾干。各种插头插座、扩充插槽、内存插槽及板卡一般不要用水擦拭。也可以用刷子刷或气筒吹掉灰尘。拆装清洗原则:在打开机箱之前,双手应该触摸一下地面或者墙壁,释放身上的静电。保持一定的湿度,空气干燥也容易产生静电,理想湿度应为40%-60%;清洁内存条和适配卡各种时清洁包括除尘和清洁电路板上的金手指。可以用刷子刷或吹掉灰尘。也可用橡皮擦来擦除金手指表面的灰尘、油污或氧化层,切不可用砂纸类东西来擦拭金手指,否则会损伤极薄的镀层。因为所有设备长时间使用会老化,所有设备在正确设备清洗工作完成后,重新装上设备加
26、电启动电源,如果能启动说明设备完好,如果运行不正常说明不是搬迁过程中造成的。搬迁方不负任何责任。清洁完毕后按照新机房的规划逐一安放设备,设备安装完毕后进行设备登记和标记,记录设备的功用和安装时间、负责人等。设备最好按照不同的应用放在不同的机柜和不同的区间内,最好规划合理,比如:管理区、应用区等,可以按照不同的行业应用和不同的功能来划分设备的区域。一个标准机柜可以放多个设备,但设备要合理搭配,比如电磁环境和温湿度等,每个设备之间要预留至少10CM的空隙便于散热和通风,同时设备要固定到机柜上,不能简单的放在机柜托盘上。一个机柜不能摆放太多的设备。KVM等设备要摆放合理,要易于管理员使用和观看,机房
27、内维护人员一般不能长时间呆在机房内部,这样容易造成对人体的危害,所以维护人员都在管理区,通过远程登陆或者远征桌面来管理各种设备。新机房内电源应分别供电,有些设备是多电源结构,这些设备在安装时电源一定要连接到不同的电源插座上,一旦某路电源出现问题也不会造成设备的停机和损害。11. 系统检测及恢复所有设备上架安装完毕后都要逐一加点测试,测试的主要内容有:服务器硬件配置是否改变、服务启动测试、网络设备启动管理和配置变更、通讯产品端状态灯等,测试的主要原因是设备搬迁过程中可能出现一系列问题,比如硬盘损坏、内存松动、灰尘污染等问题。所以在正式使用之前一定要进行全面的检测,找出问题解决问题,检测出问题后及
28、时解决和排除。当设备硬件没有问题后还要进行一系列软件方面的测试,测试系统是不是正常,有没有系统服务无法启动等问题,对于软件系统无法正常启动的要及时恢复启动,恢复后还是无法使用的需要联系厂商和代理商,找出原因解决问题,如果还是无法解决的需要安排替换机来代替。当所有的设备检测无问题后可以正式启动和应用,对于一些系统需要恢复系统的要恢复系统,需要恢复数据的要及时恢复数据,当设备完好并可以正常使用后就可并到新的网络中。设备在并网的时候有些需要变动IP地址和端口,如果需要变动要及时通知网络管理员或者相关负责人,以便变动后更换服务和配置,这些都需要用户技术人员亲自办理,特别是需要保密的数据。系统和设备恢复
29、正常后要及时并网测试,测试要力求全面,当一切正常后搬迁工作既成功完成。12. IP地址规划IP地址规划是针对设备在搬迁后IP地址有变化,设备需要重新配置制定的配置表。在搬迁前对设备有一个详细IP规划,在配置时提高效率避免错误。由于公司采用IP地址不变更,所以不需要改变,本项目省略。五、 机房搬迁流程系统搬迁实施流程包括:准备、拆卸、装运、安装、调试等五个流程,具体如下:1. 准备:包括相关人员和设备准备、新机房环境准备、网络环境、备份、现场所有设备打标签、模块、设备准备等准备工作。2. 拆卸:主要只核心设备下架装箱等3. 装运:主要指设备由原机房到新机房的搬运过程。4. 安装:主要包括机柜就位
30、、各机柜独立安装、网络连线、强电接线、地板孔调整等工作。5. 调试:主要包括强电调试、网络调试、设备检测、数据库主机系统安装调试、测试、应用服务器系统安装调试测试、系统联测等内容。实施流程如下:六、 机房搬迁实施根据现有机房内的设备情况,以及咨询相关负责人,制定了搬迁实施计划,按照机房内设备不同的应用和使用情况,将搬迁工作分为3部分来执行,第一部分是网络设备的迁移,第二部分是核心设备的迁移,第三部分是其它设备的迁移。 1. 网络设备的迁移机房内部的网络设备主要有,H3C1522交换机4台,华为5328核心交换机1台ASA防火墙一台,以及各种网络设备。 具体的搬迁计划如下:1、线路标记和记录 4
31、小时2、设备配置信息备份和检测 1小时3、设备断电、打包、搬运 1小时4、设备运输 1小时5、设备检测及恢复 2小时 网络设备是所有设备联网的前提保证,所以网络设备的搬迁是必须首先进行的工作,搬迁选择在晚上或者下午下班后进行,一旦网络设备搬迁结束就必须要马上恢复网络设备,为下一步的关键服务器设备并网工作提供前提保证。网络设备恢复正常后要马上做网络线路连通测试,重要线路还要做压力和持续性测试,当线路测试正常后后续的设备才可以正常使用。2. 核心设备的迁移原机房内主要的核心设备有5328核心交换机一台,主要用途是网络出口,磁盘阵列一台,主要是存储公司服务器数据。由于设备比较重要所以相关的工作会复杂
32、一些,具体如下:1、设备标记和记录 1小时2、设备系统检测 1小时3、5328核心交换机配置文件备份 24小时4、磁盘整列数据备份到移动硬盘 48小时5、设备断电、打包、搬运 1小时6、设备运输 1小时7、设备检修 1小时8、设备检测及恢复 2小时9、设备联网测试 2小时断电以前的工作需要提前进行,对系统和数据的备份工作因需时比较长,容易出错和故障,需要做好相关的技术支持工作,相关厂商的技术人员最好是现场做技术工作,带有磁盘阵列的主机在开关机时都有一定的时限要求,不能颠倒开关机顺序,不能擅自改变时限要求。在做好磁盘阵列备份后还要适时的进行光盘备份工作,如果条件和时间允许光盘备份可以进行。备份建
33、议:在备份好数据后,建议将数据异地备份,即通过移动介质移动磁盘、光盘或其他介质将数据备份到其他地方,以备服务器有问题时恢复用。其它服务器的备份主要是通过DVD光盘的方式来对系统和应用数据进行备份。搬运和运输时最好也是使用专用的包装箱来包装。这些设备在运抵目的地后要进行全面的清理和维护工作,在所有设备重新维护后上架开机测试。测试通过即表面工作完成3. 其它设备的迁移机房内其它设备主要有:UPS、服务器、计算机等,这些设备包含了公司的其它大部分业务,如:杀毒、FTP、邮件、等。这些设备的搬迁步骤和时间如下:1、设备的标记和记录 1小时2、系统设备检测 3小时3、设备备份 48小时4、设备断电、打包
34、、搬运 3小时5、设备运输 1小时6、设备检修 2小时7、设备检测及恢复 3小时8、设备联网测试 2小时在设备标记过程中除要详细记录各种线缆和接口外,也要遵循上述设备的运输管理规定。对设备进行检测时也要全面和详细,具体包括:操作系统、硬件配置、设备管理器、软件配置、硬件连接状况、设备安放情况等。在做完上述工作后需要对系统和数据进行备份,其中杀毒服务器可以适时对其进行备份,备份工具主要是使用DVD光盘,本服务器也可以不用做备份,或者在本机内部做备份。邮件服务器为虚拟服务器,可以做快照备份。备份后根据需要在做移动硬盘盘备份,正常情况下快照备份完全可以做到突发情况恢复,但是快照备份在磁盘阵列下,一旦
35、磁盘阵列当机无法恢复快照。因此还要异地移动存储介质备份。断电顺序:服务器主机-磁盘阵列加电顺序:阵列-服务器主机。阵列断电:阵列断电方式直接关闭电源即可七、 机房搬迁时间安排上述搬迁工作预计需要时间为3天,具体搬迁时间安排如下:设备标记和记录用时0.5天(提前做完)重要设备备份用时23天(提前做完)设备检测用时0.3天设备断电和打包0.3天设备搬迁和运输0.5天设备安装和上架0.5天设备检测及恢复0.5天八、 应急处理在设备搬迁后出现异常情况时现场技术人员立即检查设备,检查故障现象,确定故障位置。硬件故障在备件准备范围内的立即更换,不在范围内的立即使用备用设备最短时间内启用备用设备。由于配置数
36、据或系统不能启动的立即使用系统光盘备份数据等先前准备的备用工具软件系统软件重新按装或恢复。九、 机房迁移设备清单序号设备名称型号数量备注1二层交换机H3C 152242三层交换机华为532813防火墙ASA14电话交换机国威15ROS路由电脑机箱16服务器戴尔67UPS电源ON-Line18空调美的19机柜图腾2十、 备品备件清单在搬迁过程中经常会有一些易损件损坏,影响搬迁工作的顺利进行,甚至影响到用户的工作。我根据以下服务器配置列表将提供额外的备品备件以备急需。公司网络管理人员需要携带必要工具:螺丝刀,笔记本电脑,偏口钳等工具。设备数量单位光纤1条内存1*2GB1对硬盘300GB SAS1块
37、500GB SAS1块测线仪1个替换网线1条捆扎带1包X3650电源个Windows 2008 Server企业版 安装光盘1片 Windows 2008 Server标准版 安装光盘1片十一、 搬迁后触发的事故说明 1、Exchange与域控当机事故 事故时间:2012年7月8号下午16时2012年7月9号上午10时30分 事故前情况:邮件服务器及公司各服务器网络正常运转。收发邮件及访问邮箱无不良反应。 事故发生经过和处理情况:2012年7月8号下午16时。由于装修人员擅自断电导致机房断电,网络管理人员立刻前去机房查看,服务器安顺序开机,其中Exchange服务器开机后无法正常运行,随后展开
38、针对Exchange服务器问题讨论并实施经过处理能正常访问。但是在2012年7月9号上午10时30分。由于装修人员误关闭电闸机房设备再次意外断电,网络维护人员再前去处理的时候发现其它服务器可以正常运行,其中预控、Exchange服务器无法开启。针对这两台虚拟服务器展开排查。确认是系统文件丢失及备份数据快照丢失。因此无法进行数据还原。我们尝试一切所能想到的方法都失败告终其中包括:用光盘引导修复系统文件、检查系统内存、安全模式都无法恢复系统。李胜磊李总和张杰张总知道发生事故帮助我们共同讨论但最终也无终而果。但好在我们通过PE的手段进入到邮件系统成功拷贝出了Exchange数据库文件。尝试过新建Ex
39、change服务器导入数据库文件、使用软件读取数据库文件。但至今没找到数据恢复的办法,不过我们一直在不断的寻找方法恢复数据文件。 解决方案:Exchange服务器:1) 通过EP进入邮件服务器,导出数据文件。2)新建邮件服务器导入数据(发现导入不成功)我们现在正在跟进,寻找解决方法。3)新建免费Linux邮箱poftfix。因为是刚建立免费邮箱,问题如下: 通讯组的不完善,邮件服务器运行仍然存在问题。我们会实时跟进,找出原因。做到邮箱服务器的稳定与安全。 域控服务器:1) 目前公司没有域控,暂时借用电信DNS。等公司搬家事项稳定。控将重新建立。2) 考虑到正版化问题,DNS解析服务器建立在Li
40、nux系统上。 事故原因:装修人员没有跟公司网络管理人员沟通直接关电导致机房断电装修人员误关电闸导致机房断电 事故损失情况: Exchange服务器当机,直接导致公司邮件无法发送影响公司全体员工办公效率, 其中公司高层领导重要邮件数据无法读取。不过我们在Exchange服务器当机1周之内从新搭建免费邮箱先暂时供大家使用,后续我们会尽早恢复 Exchange邮箱服务器。预控服务器当机,直接影响公司网络通信导致外网无法访问公司服务器以及员工用网问题。我们通过电信DNS已经解决网络问题,新的预控服务器已经搭建完毕我们逐步完善,后续会重新使用公司预控。事故暴露问题1) 搬家计划细节问题没有考虑到导致U
41、PS没有及时安装2) 没有做到紧急事故的处理方案3) 网络管理人员责任心存在不足预防事故重复发生的措施1) 加强网络管理人员的责任心及做工作的严谨态度2) 加强员工的职业技能,定期做相关培训3) 要每天对机房进行检查,发现问题及时处理,如处理不了及时上报领导。4) 做好每天的机房运行日志。 对事故责任的分析1)装修工程队负首要责任2)机房搬家部门负连带责任 体会:通过这次搬家出现的重大事故给我们敲响了警钟,做任何事之前一定要想好周密的计划以及出现突发事件的决绝方法。提高员工工作态度以及责任心是重重之重!网络管理人员加强自身的责任心以外还要加强职业技能。技能提高了遇事才能沉着冷静! 2、网络的混
42、乱1)搬迁至7楼打乱原有VLAN划分。2)没有做好网络分布计划3)实施缓慢 体会: 在搬迁之前应做好搬迁后网络分布详细计划,以及VLAN分布图,根据计划实施。有计划的实施效率会更高,事故率会更低。工作态度与积极性不高,思考不够全面。 3、UPS安装不及时造成损失:由于各服务器再没有UPS保护情况下运行,导致邮件、域控当机。直接造成公司网络及收发邮件瘫痪为公司带来直接工作效率损失。体会:公司新办公环境正在装修,电压不稳定。随时都能有断电的可能,由于公司领导出差,安装费用没有审批抱着侥幸的心理导致UPS电源没有及时安装。遇事第一想到的是领导,领导不决定或者不在工作就暂停。导致事故发生,说明主见性与
43、自我分析能力不强。 4、针对事故的有利方面 1)邮件服务器当机 利端: 让我们学习到了搭建免费邮箱,在搭建的同时考虑到今后公司发展,本着节约成本的想法把免费Postfix邮箱搭建在Linux系统上。避免了后续安装正版系统问题。 2)域控服务器当机利端:学习在Linux系统上搭建DNS解析服务。从中了解Linux系统各项服。学习到了做事要留存技术方法文档。八、搬迁工作中问题总结 “工作责任心”通过本次搬迁,总结到个人工作态度,以及对处理事务的责任心不强,例如:如果我们有着很强的责任心,我想不会出现服务器当机的情况发生。 “工作积极性”工作积极性不高,做任何事情都是领导说什么,我们就去做什么,而且
44、做的还不是很出色。工作任务完成的还不是很彻底拖泥带水。要做好某一件事并不是拉一步才走一步的。要自己去开拓进取、勇于创新突破自己。 “工作一劳永逸”在工作中不能老是拿着之前的工作去工作,要具备不断创新思想想活跃的能力。总是一味着拿别人的工作方法去做事,自己本身永远得不到提高。之前总结的工作经验不是不能取运用,工作要讲究工作方法。 “工作严谨性”本次搬迁实施过程中我个人认为,最大的问题就出在严谨性上面,没有拿出合理可行性计划方案这是其一。遇事不严谨、不思考这是其二。工作出现问题没有及时上报领导这是其三。工作需严谨是今后加强自身工作能力的重要条件。 “工作需仔细”一个小小的事情,为什么有些人做的就很
45、多,有些人做的就那么的粗呢?这是人的问题,你要是认真做事和不认真做事就是两个概念,其结果其实大家都看得到。或者说就是一个简简单单的文章,不说别的排版上面有些人就会很注意,有些人明知道这样不对,就是不愿意改动一下,心里还想看得人不一定那么细心吧!或者不会在意的,在意的是内容,呵呵,这种观点正好相反,正是由于自己本身的粗心,或者会丢到一个大的客户,也就是说在别人看来,会把你的芝麻小点的错误当作你的不精心,要是遇到很麻烦的客户会把这个小芝麻放大到大西瓜来看的。其结果可想而知了。九、事故教训总结成功固然有方法,失败必然有原因。一个人在追求成功的同时,免不了会遭受到许许多多的挫折和失败。曾经努力地去奋斗但结果却失败了,这也许是人生的最大悲剧。除了少数的成功者之外,绝大多数人都遭受过失败或正在失败。在这里,除了要对自己所选择的目标有强烈的信心、明确的目标,坚韧不拔的毅力.外,而必须懂得对失败的原因加以分析、总结,只有这样,才能避免下次重蹈覆辙。 古语有云:失败乃成功之母。现如今又有歌唱到:不经历风雨哪能见彩虹,没有人能随随便便成功。可见失败是常有的事,就像我们小时候学走路,跌倒是常有的事。看看现在的我们哪个不是健步如飞。所以失败并不可怕,恰恰相反,失败却是我们成功路上的良师益友。没有这一次的跌