1、大数据中心设备维保服务方案*技术XXXX 年 XXXX 月 XXXX 日5.平安管理策略为了保护网络的平安性,除了在网络设计上增加平安服务功 能, 完善平台的平安保密措施外,平安管理规范也是网络平安所必须的。平安管 理策略一方面从平安管理规范来实现,另一方面从技术上建立高效的管理平 台(包括网络管理和平安管理)。平安管理策略主要有:定义完善的平安管 理模型;建立长远的并且可实施的平安策略;彻底贯彻规范的平安防范措施; 建立恰当的平安评估尺度,并且进行经常性的规那么审核。1 .平安管理原那么网络信息平台的平安管理主要基于三个原那么:多人 负责原那么:每一项与平安有关的活动,都必须有两人或多人在场
2、,并签署工作情况记录以证明平安工作已得到保障。任期有限原贝h 与平安有关的职务不能是专有的或永久性的,工作人员应不定期地循环任职,以使任期有限制度切实可行。职责别离原 贝h除非平台主管领导批准,在信息处理平台工作的人员不得了解或参与职责以外的任何与平安有关的事情。2.平安管理的 实现应根据管理原那么和该平台处理数据的保密性,制定相应的管理制度或采用相应的规范。具体工作是:根据工作的重要程度,确定该平台的 平安等级和平安管理的范围;制订相应的机房出入管理制度,限制工作人员 出入与己无关的区域;制订严格的操作规程;操作规程要根据职责别离和多 人负责的原那么,不能超越自己的管辖范围;制订完备的平台维
3、护制度;对平台进行维护时,应采取数据保护措施。 维修和维护时故障的原因、维护内容和维护前后的情况要详细记录;要制订 平台灾难时的应急预案,使损失减至最小。对工作调动和离职人员要及时 调整授权权限。三、服务器设备维保服务概述在当今充满竞争与挑战的世界里,如何集中精力于自己的核心业务、如何借 助外脑、如何整合各方资源迅速提高企业的竞争力,以获得持续、高速的增长, 已成为每个企业管理者思考的重点。建立高效、可靠、专业的服务支撑体系那么是企业实现上述开展战略的重要保 证。IT规划、管理、实施、维护是一项技术复杂、本钱高昂、变化频繁、人员 素质要求高的系统工程,企业自己操作虽然可靠,但存在如下问题:信息
4、技术的 广泛性、复杂性决定了企业不可能配备技术很全面的专业人员从事企业自身的 IT工作;企业自身网络的狭隘性难以留住一流的IT技术人才,造成实际运维人 员专业化程度不够,有可能影响企业IT工作的科学性、系统性、经济性;企业 对自身IT工作人员的专业工作管理很难做到专业IT服务公司对其技术工程师的 严格、系统的管理程度;由于上述原因导致的企业对IT的投入在很大程度上未 能得到应有的回报,累计效率损失严重,不能实现对核心业务的有力支援和保障。由此可见,引进外脑、引进高度专业化的IT外包服务,实是企业轻松的、 切实可行的解决之道。不仅能够解决上述的问题,还有如下优点:服务行为的公 司化。外包服务商的
5、外派人员的所有行为代表公司,企业假设对其服务不满意可要 求立即更换,且对其工作中的过失所造成的损失能够获得相应的补偿;强大的配 套支持能力。除企业要求外包服务商提供的相关服务外,专业外包服务商本身所 具有的专业队伍、供货渠道、行业经验、业务体系等能为企业带来更多的潜在利 益;灵活的外包服务方式可为企业度身定制最正确性价比的特色服务,即可以按时 定价、也可以按次定价;即能够整体外包、也可以切块外包。专业外包服务公司的特点: 严格、规范的外包服务管理高水准、多层次的专业服务工程师队伍 丰富的外包服务经验即时、准确的服务质量监控体系 非常完整的配套业务体系,客户可获得更多的附加价值.切实有效的服务保
6、障方案概述本地化服务及响应方式响应没有次数限制:服务接受方的软件、硬件系统出现故障,或设备运行过 程中有技术疑问需要技术咨询时,可在所选定的服务级别时效内拨打由服务提供 方提供的服务热线 。服务提供方应立即处理客户的 请求,提供远程技术支持与诊断,直至客 户得到满意的结果;7义24级别 支持响应时效:一年365天全天候服务支持,30分钟内响应客户服务诉请。工程师现场响应时间:业务时,将安排工程师赶往现场协助诊断抵达现场时间7*242小时内到达用户现场,紧急时刻1小时到达现场0. 5小时内响 应7*24小时硬件保修当系统硬件发生故障时(合同期内),维护工程师应以最快速度赶到故障现 场进行故障检测
7、、维护,及时更换故障部件恢复系统正常运行。如果故障在短时 间内无法排除,我公司会向贵单位提供替代整机,如我公司解决不了的问题会与 产品制造商联系缩短故障排除时间。在做硬件维护前我公司会制定详细可行的计 划,确保贵单位的数据平安和业务运行的可靠稳定连续。7*24小时系统软件维护维护范围:基于检测和分析,将及时获取原厂发布的版本更新或者补丁程序等,如果适 合贵单位的情况,会及时做好升级举措。但在升级和打补丁之前,要对必要的系 统数据做好备份,防止异常情况发生。通常情况下,该项工作在每次的巡检结束后,通过分析给出明确结论,确定 是否需要升级软件;在发现异常时,根据故障分析判断是否升级软件对使用过程中
8、遇到的疑难问题进行支持对系统性能优化提供建议及支持对系统平安、网络配置提供建议及支持现场进行疑难问题解决现场进行性能优化现场进行系统配置及时通知客户新的系统更新信息提供相应系统并进行更新安装提供新版本系统安装服务配合测试新版本系统系统板卡,设备的微代码升级提供新技术、新方法、技术经验及技术动向。协助客户制定出具备可操作性的主机设备故障应急方案并协助演练。免费咨询服务.服务方案设计原那么本方案主要针对贵单位的服务器主机及配件,相关的操作系统设计合理科学 的维保策略。方案的设计遵循以下原那么:1.1 1业务为中心:本工程的最终目标是保证业务系统的平安和可靠运行。包括计算机系统的可 靠运行和业务数据
9、的平安保证,我们将动用一切有效的措施手段,力求业务系统 万无一失,我们的目标是:“非正常性停机时间为零二重在措施:注重预防。我们将在传统的被动式服务的基础上提供主动式的服务,和客户 一起做好系统的监控维护工作。采取以预防为主的策略,把故障隐患消灭在萌芽 中。服务组织。服务组织管理和流程管理是工程成功得关键。我们将在责任工程 师(工程经理)的统一调度下,指挥技术、应用、商务及服务监督人员,在售 前、服务实施、售后的各个环节紧密与客户方配合。1.2 追求最正确性价比:服务的级别意味着客户的本钱,我们在保障高标准服务的前提下,努力通过 精心组织、精心实施来降低客户的本钱,同时为客户提供更多的增值服务
10、。2 .保修服务内容及标准本方案针对贵单位上IBM服务器及相关的硬件设备及操作系统保修服务以 及数据库协助保修服务、协助应用软件升级、应用软件的备份等服务内容。主要 服务工程如下:3. 1故障排除在规定时限内排除故障恢复系统运行,包括故障定位、部件更换、数据恢复 的全部工作,不在另外收取任何费用。3.2 定期巡检定期对系统进行预防性维护,包括检查系统状态、设备清洁、系统备份,以 及与客户工程师的技术交流。3.3 培训我们将免费提供针对工程的技术培训和技术交流。包括:现场培训:主要在巡检及工程实施过程中进行,由我公司工程师结合实际情 况,对工程设备的安装调试、使用和维护进行详细的讲解,到达客户相
11、关人员能 够自主使用和维护系统设备的目标。专业技术培训:通过培训使相关技术人员能有效管理IBM服务器、监控、日常操作维护,对 集群环境、AIX环境、系统性能优化等特别予以关注。我公司将免费提供培训师 资、教材及搭建培训软硬件环境。培训的具体地点及安排由我公司和用户协商而定。参考课程如下:系统及网络管理集群高可用方案故障定位与系统运维常见问题4 增值服务3.4. 1咨询服务:解答客户在系统使用中的问题。可通过 解答客户非保修设备使用中的技 术问题。一般情况下,指导客户解决问题,特殊情况下,可到客户现场指导并解 决问题,这样可以有效地提高客户的系统管理水平,降低系统的人为故障率。定期发送有关资料,
12、使客户及时跟踪掌握相关IT新技术及新产品,互相交 流系统使用及维护方面的经验。协助客户建立健全规范的管理制度和系统使用维护的技术流程及规范。建立 系统的配置档案和升级维护档案,定期提交系统维护及管理报告。3. 4. 1. 1 系统升级、扩充为客户提供系统升级、扩充、改造、迁移等服务。结合客户的实际情况,为 客户详细制订切实可行的技术方案和合理的费用计划,并可提供现场的实施工 作。如客户需要搬迁设备,我们可以为客户制订平安周密的搬迁计划,并负责实 施,保证客户设备搬迁后的正常运转,省去了客户自行搬迁所带来的烦恼。3. 4. 1.2 协调工作协调原厂商(包括软硬件)的维护和维修工作。定期召开例会,
13、双方交流, 向客户方领导汇报工作并听取领导及技术人员的意见和建议。服务标准3. 4.2服务工作时间提供7X24 受理服务请求或帮助客户解决技术问题。3. 4. 3响应时间接到问题报告后0.5小时内提供 支持服务。2小时内到达用户现场,紧 急时刻1小时到达现场。故障恢复时间接到报修后8小时之内系统恢复正常;如需要进行备件更换,两小时内完成 现场备件更换。非系统崩溃的情况,非系统崩溃的情况。接到问题报告后0.5 小时内提供 支持服务;乙方工程师按合同约定的频度到甲方单位进行巡检并 出具巡检报告。保密条款我公司公司将严格遵循保密协议,凡涉及客户的机型配置、IP地址、软件 等信息不得向第三方泄露,维护
14、过程中如需涉及客户系统的数据信息,必须先通 过客户方认可,维护工作的数据信息(无论是打印或介质上的数据信息)不得带 离客户工作现场,如有更换或损坏硬盘盘片,均交回技术处处理。4.服务实施细那么. 1前期工作在保修合同生效前,我公司将派出硬件工程师和系统软件工程师前往客户现 场,对现场相关网络设备进行测试,并对运行情况做好文档记录。然后对设备进 行必要的清洁、保养和维护,使设备处于良好的运行状态。施工交底依据合同明确服务标准、工作流程、联系方式;建立设备档案 详细记录设备型号、出厂编号、版本号、工作状态;场地环境检查 包括供电装置、电源电压、接地和室内湿度、温度、温变梯 度、空气洁净度、防雷措施
15、等进行检查,对问题隐患提出改进建议;.2故障预防建议系统工程师通过预防性检查对系统硬件进行检测和诊断,对系统中潜在的硬 件故障采取预防措施。如果某些部件出现无法恢复的故障,系统工程师将尽快予 以修理更换。维护期内提供定期巡检服务。系统工程师定期巡检的目的在于通过 巡检及时发现和纠正可能出现的硬件和系统问题,从而在最大程度上为设备的 连续稳定运行提供保证,巡检内容主要包括:1)服务器主机系统的运行状态;2)网络设备的运行状态;3)外部设备(包括磁盘阵列)运行情况;4)所有连接接口,CABLE,电源等可能容易导致设备出现问题的敏感部件;5)检查系统Error log;6)协助用户机房技术人员解决和
16、分析日常设备运行中出现的未解决问题。4. 3故障排除保修合同生效后,系统发生故障后每次服务流程如下: 报修系统发生故障,客户可在第一时间内与我公司工程经理(责任工程师)取得 联系,说明客户单位、故障机型,尽可能说明故障现象以及可能的故障原因。客户也可与我公司服务中心直接联系,服务中心调度长在第一时间内与我公 司工程经理取得联系,服务中心的SMS系统会全程跟踪本次服务。 响应我公司工程经理会立即在响应时间(本工程为0.5小时)与客户现场工程师 取得联系,取得详细的故障信息,做出相应的判断,在 中与客户工程师互动 交流,首先排除因系统参数设定、使用中的软性故障,如果未能排除故障那么服务 工程师立即
17、准备赴现场服务。 现场服务服务工程师携带相应备件赴用户现场进行维修。首先进行现场诊断,分析锁 定故障部件,更换部件或调整参数,数据恢复,直至系统恢复正常运行。每次现场服务完成后,由我公司工程师填写现场工作日志,由客户方代 表确认并签署意见后交公司存档。如第一次现场服务不能解决故障,那么立即启动应急预案。 第三方配合我公司公司承诺:只要是我公司所保的系统发生故障,我们的服务工程师必 须在第一时间内赶赴客户现场。不管是系统硬件、操作系统故障,还是非我公司 承担的网络、应用程序故障,或者系统升级改造、系统迁移等,我公司服务工程 师将积极配合客户完成系统维护工作,绝不会因扯皮推卸责任而损害客户利益。4
18、.4巡检4. 4. 1巡查内容定期巡检的目的在于及时发现和预防可能出现的硬件和系统问题,从而在最 大程度上为系统的连续稳定运行提供保证,巡检工作主要包括: 1.主机系统的运行状态,对系统CPU、内存、I/O状态、进程等检查; 2.外部设备运行状态,对磁盘阵列、磁带机、外置光驱、维护终端等的 状态、设置进行检查;对风扇、后备电池、磁盘、磁带、键盘等敏感部件进 行重点检查,如有故障征兆那么进行先期更换; 3.连接件检查,对连接插头、电缆、电源插座等进行检查; 4.环境检查,包括电源电压、接地和室内温度、湿度、空气洁净度等; 5.清洁保养,清除机箱、滤清器内的灰尘与异物; 6.系统优化,协助客户对O
19、S进行系统性能调整和系统优化,提高系统 效率;进行相关的平安 7.性进程检查; 8.技术交流,双方技术人员分析和解决日常运行中出现的未解决问题; 9.工作报告,在对系统进行全面的检查后,给出详细的报告,根据检查 结果给出相应建议和改进方案。、服务概述51. 硬件保修服务52. 远程技术支持服务53. 现场技术支持服务64. 回访服务65. 现场巡检服务6平安保障体系71 .网络平安策略72 .平台平安策略73 .应用平安策略94 .数据平安策略95 .平安管理策略10服务器设备维保服务21. 切实有效的服务保障方案概述32. 服务方案设计原那么41 业务为中心:42.1 重在措施:4追求最正确
20、性价比:53. 保修服务内容及标准51故障排除53. 2定期巡检53培训54. 4增值服务61 咨询服务:61. 4. 1. 1系统升级、扩充64. 1.2协调工作6服务标准74.2巡查周期我公司技术服务为贵单位提供乙方应提供7X24全天技术支持服 务,并根据甲方的需要提供现场支持服务。具体服务时间由甲方需求决定,服务 响应时间按本招标文件第四点要求施行。 1.确保本次保修范围内所有硬件设备的正常运行。 2.确保本次保修范围内服务器设备操作系统的正常运行。 3.及时提供操作系统升级和故障硬件更换。 4.提供特殊时段(如:结账日、春节、劳动节、国庆节、年终、系统停 机维护、数据集中及用户认为必须
21、的重要时段)的服务,以及产品安装、系 统变更和迁移等的现场支持服务。 5.乙方应提供7义24全天技术支持服务,并根据甲方的需要提供现场支 持服务。具体服务时间由甲方需求决定,服务响应时间按本招标文件第四点 要求施行。 6.每月一次例行巡检即预防性维护并提供例行巡检报告; 7.每月一次的系统运行性能诊断并提供性能分析报告; 8.每次硬件故障处理后提供硬件处理和备件更换报告; 9.每季度一次健康性检查,全面检查硬件系统的工作状态、对硬件系统 的运行环境进行评估、现场解答有关硬件技术方面的问题、磁盘系统CACHE 使用率、硬件可用率、故障分布和维修类型状况,并交付硬件系统健康检查 报告书,针对设备的
22、运行状况,提出设备的配置和参数设定等方面优化建议; 10.每半年并进行一次维护工作总结,并提交报告书; 11.乙方在服务年度期满前十五天应通知甲方,并完成年度现场维护,提 供年度服务总结报告,方便贵单位控制和管理。4.5 备份与恢复策略随着信息技术的广泛应用,计算机系统的可靠性对生产系统的影响越来越 大。作为IT服务的提供者,我们将仔细、全面地考虑并且制订备份与恢复策略。操作系统备份以系统卷为主,必须建立完整的系统备份档案,保证系统宕机 时能及时恢复系统原有状态,包括此系统下运行的所有相关软件的配置。双机热 备份软件应按应用系统的实际配置情况制定相关的数据备份计划,如卷组备份、 卷备份、文件系
23、统备份、文件备份等。应用系统的数据备份应由应用部门根据应 用的实际情况列出所有相关数据的连接关系,以便制定出一份详细的数据备份计 划,为数据恢复提供一份完整的依据。我公司系统工程师将为用户制定一份完整的系统备份方案,在日常维护的过 程中有义务协助用户做好系统的数据备份工作,并提供相关的技术支持,用户备 份的介质将存放在用户处,以便故障的恢复。当用户系统出现故障之后,我公司 的系统工程师将在用户的故障现场,开始进行故障的排除工作。需要用备份数据 做系统恢复时,用户方需提供完整的数据备份。系统工程师还将对用户提供系统升级和安装补丁的工作。假设涉及非系统软件 的补丁,只要用户提供补丁,我们也承诺协助
24、用户完成安装任务。4.6 工程实施计划我公司技术服务根据实际服务要求、各种资源状况、系统运行状况 和其他现实因素,要求工程组长必须要全面规划出一个符合实际的整个工作进度 计划。4.7 工作结果与工作报告4. 7.1现场服务报告到达时间,工作内容,工作结果,遗留问题,客户评价等。每次工作完成后 提交。4. 7. 2巡检报告系统状态检测评估,系统备份记录,系统管理建议。报告每月提交一次。4. 7. 3健康报告硬件系统的工作状态检查、评估、磁盘系统CACHE使用率、硬件可用率、故 障分布和维修类型状况,设备的配置和参数设定优化建议。报告每季度提交一次。4. 7. 4维护工作总结每半年一次维护工作总结
25、,并提交报告书。5. 7. 5总结报告包括年度保修工作统计,保修工作记录,更换部件统计,联席工作会议记录, 系统管理建议,最终系统状态检测评估记录。工程结束后一周内提交。6. 服务保障措施行话常讲:说得好不如干的好,干的好就要看得见。保修服务具有不可感知 性、差异性等特点,就是说服务的好坏只有到工程结束时才能得出评价,而且不 同人的评价结果会有一定的差异,所以光凭事前承诺和事后惩罚约束不一定就能 选择合适的服务提供商。我公司在多年IT服务的经验基础上基本形成了科学量 化的、规范化、可视化的服务体系。5 . 1备件保障考虑到本工程具有系统平安性要求高、所保机型技术水准高等特点,为了做 好本工程的
26、服务,首要因素是必须具备有效的备件保障,我们将与贵单位工程经 理共同分析所保系统的运行状况,圈定系统的薄弱环节,共同商议备件部署计划, 包括型号、数量、保存地点、检查方式、调整周期等。6 .2组织及人员保障制定了与服务有关的一系列管理方法、标准的作业流程和规范化的技术规 范,并在不断地加以修改和完善。公司专门为客户设立了服务热线,设有专人值守负责接待客户的来电来访, 使客户的需求能够得到及时有效的响应。在较长节日前,公司将及时提醒客户检 查、备份系统,并提供节日期间我公司值守安排计划。我公司多名技术人员专业从事服务业务,主攻专业涉及主机、网络、数据库、 应用及客户资源管理等,数名资深高级工程师
27、有着十多年丰富的实践经验,具有 高超的技术水平和服务水平。公司定期对服务工程师进行各种新产品、新技术和服务技巧等内容的培训, 以提高技术人员的技术水平和服务水平。针对本工程将专门成立贵单位工程组,人员及分工如下:工程经理:专职负责所保设备故障维修与日常维护,是客户与我公司公司保 修工作的唯一界面。通过工程经理客户可以解决技术、商务等一切问题。凡涉密 系统的保修业务,我公司公司将选派政治可靠、技艺高超、认真负责的工程师担 当工程经理。服务专员:负责与客户的联系和回访,帮助责任工程师协调和解决保修过程 中出现的商务事务工作。服务工程师:在工程经理的领导下执行故障维修与日常维护。调度长:负责公司日常
28、保修业务调度。当工程经理在现场需要支持时,由调 度长整体负责调度协调我公司的人力、物力资源,包括派出第二批次现场工程师、 启动应急预案、调用第三方资源等。后备工程师:我公司公司将对用户的设备及使用情况进行分析,计划调配工 程师,当工程经理无法迅速到达客户现场或不能在第一时间内排除故障的情况 下,由后备工程师出任增援现场服务。服务总监:定期对服务质量和完成情况进行监督,受理甲方的业务投诉,由 公司主管副总经承担。5. 3全条款在维护工作前,我公司服务工程师须提前24小时(紧急故障处理除外)向 贵单位工程主管提出书面的维护申请。内容包括维护的目的、操作工程师、操作 步骤、涉及系统硬件变更、涉及系统
29、软件变更、预计操作所需时间、申请操作所 需时间等内容。待得到贵单位工程主管书面批复后维护工作方能开始,且所有操 作必须有贵单位方代表在场。如维护工作需要使用移动介质,那么必须事先在贵单位本地进行病毒检查,经 客户方确认方可使用。维护操作必须事先做好操作方案并制定应急方案,必须严格掌握控制操作时 间。所有操作必须两人以上在场,其中一人主持操作一人确认详细记录,所有操 作记录须存档并长期保存。1.4 巡检通过巡能够及时发现并排除故障隐患,有效保证客户系统的正常运行。定期的系统和数据备份可以快速恢复业务应用,一旦系统故障可以把损失的 风险降到最小。经常化、制度化的巡检可以保持双方技术人员的活跃接触,
30、有更多的机会交 流在系统使用及系统维护方面的经验,有利于提高系统维护的效率。我公司每一个月例行巡检一次。1.5 服务监督客户可随时拨打公司热线,对公司的服务提出批评和建议,公司将热情接待 每一位客户,认真听取客户的意见,并将处理结果及时反应给客户。我公司设有专门的服务监督机构,由主管服务的副总经理全面负责。服务监 督机构不定期以各种方式向客户征询对公司服务的意见和建议,并送交服务相关 部门,及时反应给客户。对内部,服务监督机构定期对公司整体的服务质量进行 评定,提出改进建议。同时对服务工程师的服务质量、技术水平等进行综合评定, 将评定结果提交相关部门作为评定工程师工作业绩的重要依据。6 .应急
31、预案行话讲:人算不如天算。从科学的角度来讲即使再严密的服务措施也可能遇 到不测事件,我们本着高度负责任的态度,针对具体工程设计组织相应的应急预 案,在技术、备件、人员、资金等多方面,用具体措施来保障对客户的服务承诺。应急情况一般是指: 工程经理或本地服务工程师无法及时抵达服务现场因突发事件并发而造成不能提供有效备件第一次现场服务故障未排除系统宕机且未能确定故障原因 以下情况虽然不属于我公司责任范围但我公司有义务尽全力予以配合:因地震、雷击、战争等不可抗拒力造成系统损坏因供电系统、火灾造成系统损坏我们将事先与贵单位工程经理共同讨论制定紧急预案,在紧急情况发生时启 动紧急预案。同时公司将迅速派出高
32、层管理人员赶赴客户现场,会同客户方领导 共同协商,调度指挥各方面有效资源完成保修工作。针对不同情况我们将单独或 同时采取以下几种应急措施:6.1 1备机替换当业务系统不能在约定时间内恢复正常时,我公司将从我公司把替代系统运 往客户现场,替换故障系统来运行业务程序,保障客户业务系统在最短的时间内 恢复运行。替代系统是同型号同档次机型,特殊情况下不排除起用相似机型,原那么是首 先保证业务系统的正常运行。当故障系统修复后再替换回替代系统。6.2 紧急调用工程师我们有庞大的服务工程师及技术顾问队伍,如有需要我公司可以快速调动后 备工程师紧急赶赴客户现场完成保修工作。当有突发或并发事件发生时,调用异地工
33、程师当第一次现场服务无法排除故障时,调用更高技术水平或更加专业的工程师 紧急赶赴现场协助工程经理紧急调用备件当本地无法提供有效备件时,我们将从中心备件库从其他备件渠道紧急调用 备件,并在最短的时间内用最快的方式发至客户现场。6.3 紧急调用第三方资源我们与许多原厂商及业界同行建立有紧密的商务合作关系,紧急情况下我们 可以调用第三方后备厂商资源,包括备件、技术资源、技术工程师等。6.4 远程诊断紧急情况下我们可利用Internet或 拨号进行远程诊断和故障排除工 作,通过技术服务中心的主服务器或模拟系统直接确认问题而加快故障的排除过 程。7 .巡检制度报告表格1机房巡检工程 范围本规定适用于网络
34、设备机房。 目的为了更加有效的对网络信息系统进行管理,及时查找、发现网络及信息系统 设备隐患,排除故障,根据相关规定实际情况,制定本管理制度。 检查工程要求:电源、UPS:检查机房供电状况,UPS工作情况、指示状态。服务器:检查服务器是否当机,服务器(磁盘阵列)硬盘灯指示是否正常。机房环境:检查机房空调工作状态,机房温度。 情况记录各检查工程如无异常情况,在正常或异常栏中打“ J”,如有异常情况,做好详细情况说明并及时上报技术主管。7. 1. 1设备CPU利用率情况检查编号:SXKR-001检查工程:设备CPU利用率情况检查检查命令:检查期待结果:CPU利用率平均值50%;最大值70%备注:检
35、查范例:检查结果:口正常 口不正常7. 1. 2设备memory利用状况检查编号:SXKR-002检查工程:设备memory利用状况检查检查命令:检查期待结果:备注:检查范例:检查结果:口正常 口不正常设备系统模块运行状况检查编号:SXKR-003 检查工程:设备模块运行状况检查检查命令:检查期待结果:备注:检查范例:检查结果:口正常 口不正常3.4.2 服务工作时间7响应时间73.4.3 故障恢复时间7保密条款74.服务实施细那么71前期工作71.1 故障预防建议8故障排除81.2 巡检94. 1巡查内容94. 4.2巡查周期10备份与恢复策略104.5 工程实施计划11工作结果与工作报告1
36、14. 7.1现场服务报告114. 7.2巡检报告114. 7.3健康报告114. 7.4维护工作总结124. 7. 5总结报告125.服务保障措施125. 1备件保障121.2 组织及人员保障12全条款131.3 巡检14服务监督146. 应急预案141备机替换156.1 紧急调用工程师15紧急调用备件15设备电源及风扇检查编号:SXKR-0004 检查工程:设备系统电源及风扇检查检查命令:检查期待结果:电源及风扇运行正常备注:检查范例:检查结果:口正常 口不正常设备运行温度检查编号:SXKR-005检查工程:设备运行检查检查命令:检查期待结果:设备内部各局部工作温度小于45摄氏度检查范例:
37、检查结果:口正常 口不正常7. 1.6设备系统LOG日志检查编号:SXKR-006 检查工程:设备系统LOG日志检查检查命令:备注:检查范例:有无异常日志:有 口没有7.2最终巡检报告7. 2. 1机房健康巡检报告检查时间 年一月0 : 检查人、机房环境检查项结论情况摘要检查项结论情况摘要温度口正常口异常湿度口正常口异常%痕迹口正常口异常清洁口正常口异常异响口有口无异味口有口无注:痕迹检查地面、墙壁、天花是否有裂痕、水渍,机房内是否有鼠患、蚁患、 嶂螂活动的痕迹,正常室温:2025二、周边设备检查项结论情况摘要检查项结论情况摘要UPS口正常口异常电池组口正常口异常空调口正常口异常消防口正常口异
38、常三、服务器检查项操作提示/正常值结论情况摘要整 体 检 查硬件故障查看服务器设备故障灯正常口异常如发生故障,此处详细说明现象与解决方法补丁是否有新补丁需要测试安装口是口否如有未装补丁,请详细登记补丁名称与对应服务器名称防病毒病毒库是否升级为最新口是口否病毒库日期文 件 服 务 器系统事件无错误事件与不明登陆事件正常口异常日志文件设置以及运行正常,数据量正常正常口异常磁盘卷组无处于失效状态的逻辑卷正常口异常功能域用户正常登陆正常口异常文件服务器正常访问正常口异常文件功能正常正常口异常数据备份最近备份时间:年 月 日正常口异常域服务检查系统日志文件无错误信息正常口异常运 算 系 统 服 务 器系
39、统事件无错误事件与不明登陆事件正常口异常日志文件设置以及运行正常,数据量正常正常口异常磁盘卷组无处于失效状态的逻辑卷正常口异常功能业务正常正常口异常服务业务正常启动正常口异常数据备份最近备份时间:年 月 日正常口异常日志文件设置以及运行正常,数据量正常正常口异常磁盘卷组无处于失效状态的逻辑卷正常口异常功能远程登陆正常工作正常口异常数据库正常工作正常口异常数据备份最近备份时间:年 月 日正常口异常服务器巡检报告此次检查备注联系人信息:客户名称联系 Email地址主机型号:序列号:主机名:IP地址:子网掩码:缺省路由:配置CPU内存主板硬盘网卡I/O板显卡电源存储阵列磁带库硬件显示器口正常 口不正
40、常键盘/鼠标口正常 口不正常光驱口正常口不正常板卡口正常口不正常磁带机口正常口不正常线缆口正常口不正常电源口正常口不正常风扇口正常 口不正常系统系统指示灯状态前面板指示灯口正常口不正常电源指示灯口正常口不正常磁盘指示灯口正常不正常系统控制板指示灯(CPU/MEM, I/O等)口正常口不正常系统日志信息IML日志口正常 口不正常操作系统日志口正常口不正常交换区使用率TOP或任务管理器查看使用率%口正常口不正常磁盘分区使用率Windows 系统Unix 系 统用命 令 df -kC: / 使用率%口正常口不正常D: /usr使用率%E: /var使用率%口正常口不正常其它分区口正常口不正常操作系统
41、版本/ 核心patch版本WINDOWS xxxx 版本 SP1,2,3,4 uname -a高可用性软件版本数据库软件版本存储软件版本备份软件版本备注:日期: 2012年 月 日报告编号:SXKR00001客户签字:工程师签字:四、附件1.附件:产品清单品牌规格型号数量序列号位置服务 时间HPIBM1. 4紧急调用第三方资源155远程诊断166. 巡检制度报告表格161机房巡检工程167. 1. 1设备CPU利用率情况检查171. 2设备memory利用状况检查188. 1. 3设备系统模块运行状况检查191.4设备电源及风扇检查209. .5设备运行温度检查211.6设备系统LOG日志检查
42、227.2最终巡检报告237. 2. 1机房健康巡检报告237. 2.2服务器巡检报告25四、 附件261. 附件:产品清单26一、服务概述随着企业信息化的高度开展,IT基础构架已经成为支撑企业业务正常运行 的重要因素,稳定、平安的IT业务系统甚至成为企业的核心竞争力之一。硬件 故障、数据丧失、宕机、负载过高或闲置、病毒、人为操作失误等IT系统问题 直接影响企业业务系统的正常运行。基于多余年的IT服务经验,我们总结提炼出涵盖主流IT设备厂商从主机、 存储、网络到软件系统等全线IT基础构架的维保服务产品,为客户的业务提供 跨厂商的技术支持,以专业的工程师队伍和规范的业务流程为客户及时解决系统 故
43、障、恢复业务系统运行,降低系统故障率,提高IT系统可用性,并帮助客户 提高自身的IT管理能力。综合服务能力强,涵盖了 HP、IBM、SUN、CISCO等主流厂商从服务器、存储 到网络设备等得全线IT基础构架设备,单一服务接口简化多品牌管理、我们能 够满足用户对不同层次的服务和不同种类产品的需求,为用户提供一站式服务。针对此次维保服务,内容主要有:1 .硬件保修服务本服务是对续保客户提供的一种保障性增值服务,即对维保服务期内的产品 硬件在产品正常使用过程中可能发生的故障(人为不当操作、设备运行环境、不 可抗力因素等造成的产品毁损情形除外)提供终身维护维修服务。硬件保修服务 作为设备最基本、最重要
44、的服务之一,为产品的长期稳定运行增加了一个重要的 平安筹码,有利于延长了产品的生命周期,有利于更好的保障客户网络平安。维保服务期内,正常使用下发生故障由*技术负责保修。服务器 损坏的部件或配件为厂商的正规产品。2 .远程技术支持服务远程技术支持服务是指*技术技术工程师通过 、网络等方式为最终用户提供排除故障、更改配置、调整网络结构等技术支持服务。最终用户 提出技术服务请求,*技术技术工程师通过 、网络等远程支持服 务为最终用户提供的技术服务。3 .现场技术支持服务现场技术支持服务是指*技术技术工程师为最终用户提供排除故 障、更改配置、调整网络结构、软件版本升级、平安值守、售后培圳等技术支持 服
45、务。最终用户提出技术服务请求,*技术技术工程师通过 、网 络等远程支持服务不能解决最终用户提供的技术服务请求时,*技术 技术工程师为最终用户提供现场技术支持的服务,原那么上在半个小时内响应,两 小时到现场,八小时解决问题。4 . 回访服务*技术设有专职 回访人员。 回访人员每季度不少于3次 通过 向最终用户的设备维护、使用人员了解相关设备运行情况,并记录贵单 位维护、使用人员反映的问题或意见及时反应给*技术技术经理,以 便能及时响应相关服务请求,解决有关问题。*技术建有完善的技术服务规范,严格要求所有相关服务的人员 必须提供优质规范的服务,每次技术服务后,*技术安排有专门人员 对技术服务人员的服务质量等情况进行回访调查,通过对技术服务质量的监督和 收集客户单位对我们服务的善意的意见和建议,以期确保和进一步提升为客户单 位提供的服务质量。5 .现场巡检服务*技术不定期指派技术工程师到达最终用户设备使用现场,对设备进行现场巡检,了解最终用户单位的设备运行状况,及时发现问题、解决问题, 并为最终用户提供