1、 XXXX —IT系统运维服务处理方案 四川XX科技 4月 目 录 概述 1 市信息办IT系统运行现状 2 运行的系统及设施 2 非正常或不稳定运行系统 2 目前系统维护现状和存在的问题 3 现状总结重点需求 3 XXXXIT运维服务优势 4 IT系统运维服务项目指导原则 5 总体目标 5 基于 IT 服务管理模式(ITSM) 6 人员、资源、技术和过程四者平衡的运行维护服务模型 6 快速响应及时解决 7 以预防为主的方针 7 量化的服务级别管理 8 IT运维服务项目阶段划分
2、设计 8 启动阶段 9 正常服务阶段 10 总结阶段 10 IT系统运维服务项目的范围 11 服务范围 11 运维服务项目服务时间、服务方式 11 运维服务项目涉及的产品范围 12 硬件范围清单 12 软件范围清单 15 项目运维预算 15 IT系统运维服务项目组成员及职责 16 运维服务项目组成员 16 IT系统运维服务项目服务级别管理 19 故障级别定义 19 关键指标定义 20 SLA服务协议 20 运营级别协议 21 支持合同 21 IT系统运维服务项目配置管理 22 目的 22 范围 22 配置管理项目 23 配置管理表 23 流程说明
3、 23 定义配置管理对象和配置管理项 23 收集初始数据 23 更新配置管理表 23 填写配置变更记录表 24 定期核查配置管理表 24 IT系统运维服务项目事件管理 24 目的 24 事件管理流程 26 服务台事件受理 26 请求记录和分类 26 热线电话尝试解决 26 远程解决 26 现场解决 27 二线支持 27 服务响应 27 调查诊断 27 确定解决方案 27 客户确认 28 资料归档 28 配置核对更新 28 热线关闭 28 服务报告 28 IT系统运维服务项目问题管理 29 目的 29 过程测量指标 29 问题管理流程 30
4、问题确认与受理 30 问题登记和归类 30 派单 30 问题调研和分析诊断 30 确定临时措施 31 确定解决方案 31 问题回顾和评审 31 问题归档 32 问题关闭 32 问题报告 32 IT系统运维服务项目变更管理 32 目的 32 变更级别及定义 33 变更流程描述 33 变更确认受理 33 变更记录和分类 34 变更分类执行 34 变更关闭 34 变更报告 34 IT系统运维服务项目发布管理 35 目的 35 发布过程 35 制定发布方案 35 发布方案评审 36 构建测试环境、测试和验收 36 沟通和培训 36 分发和部署 36
5、 更新配置库 36 发布关闭 37 发布报告 37 IT系统运维服务项目服务信息安全管理 37 目的 37 确定安全实施范围 38 实施安全规范 38 IT系统运维服务项目服务可用性管理 39 目的 39 范围 39 过程测量指标 39 服务组件设计 40 服务组件监控设计 40 服务组件维护设计 40 服务组件恢复设计 41 IT系统运维服务项目服务能力管理 41 IT系统运维服务项目服务持续性管理 41 IT系统运维服务项目服务成本管理 42 IT系统运维服务项目服务报告 42 IT系统运维服务项目客户沟通管理 42 IT系统运维服务项目项目质量检查
6、 43 概述 伴随XX市政府信息化工作关键已经从基础设施建设向深化应用逐步转移,信息技术应用和业务之间已形成良性互动发展趋势。 XX市政府服务平台信息化系统建设,含有尤其关键性和特殊性,尤其以行政权力系统为关键,扩展到对应关键业务子系统及集成项目,其运行环境多系统、多数据库、多应用平台、多厂商网络及系统设备,多业务应用等复杂管理环境。 在此背景下,市信息办信息系统运行维护和建设对比,已经变得相同关键,信息系统建设后有效应用更依靠于高质量IT运行维护服务。 因各应用系统维护难度和专业度不停加深,现在现有传统维护方法已经无法满足信息应用系统维护需求,怎样提升信息化应用系统连续
7、可用时间,从而有效提升业务部门工作效率,已经成为越来越迫切需要处理问题。 XXXX企业作为专业软、硬件系统建设厂家,为政府信息化系统提供了含有针对性和科学性运行维护服务处理方案。 市信息办IT系统运行现实状况 运行系统及设施 非正常或不稳定运行系统 1. 系统名称: 2. 运行情况: 3. 系统名称: 4. 运行情况: 现在系统维护现实状况和存在问题 1. 系统厂家多,售后服务分散,轻易形成技术孤岛,造成资源浪费。 2. 各系统厂家碰到系统边界线问题时,相互推卸责任,影响系统整体运行效果。 3. 当碰到紧急重大故障时,无法得到立即恢复服务。 4. 对于安全隐患或隐
8、性故障没有有效技术防患方法。 现实状况总结关键需求 1. 含有整年365天,7 x 二十四小时无间隙服务 2. 需要加强机房设施及关键设备日检管理方法 3. 需有系统硬件、软件全方面维护服务整体处理方案 4. 需常驻资深运维工程师提供快速技术支持 5. 需设备备件保障及设备硬件保修 6. 需当地现场技术及软件业务操作培训 7. 经过相关方法,完善非正常或不稳定运行系统 XXXXIT运维服务优势 XXXX可为市电子政务系统提供涵盖主流IT设备厂商从关键服务器、主机、存放、网络、视频、集成设备到软件系统等全线IT基础构架维保服务产品,为电子政务IT系统提供跨厂商技术支持
9、以专业工程师队伍和规范服务步骤为电子政务办立即处理软、硬件系统故障、恢复系统故障、恢复系统运行,降低系统故障率,提升IT系统可用性,提升电子政务系统IT运维管理能力。 1) 严格根据ISO/IEC 0IT服务管理体系标准,实施运维管理; 2) XX科技高层管理对IT运维服务管理体系实施很重视,完善管理体系平台,包含方针和框架,保障有效管理和实施; 3) 关键系统(三台合一接处警调度通讯指挥系统)技术故障快速处理能力; 4) 针对市电子政务办IT运维服务项目标服务策划管理、SLA服务等级管理、业务关系管理、事件管理、问题管理、配置管理、变更管理、服务汇报、服务能力管理、服务可连续性管理
10、服务可用性管理、服务成本管理、公布管理有一套完整体系建立; 5) 涵盖主流IT厂商软、硬件产品服务能力,已电子政务系统为关键,统一服务接口,简化服务管理步骤; 6) 灵活SLA服务等级选择,便于用户依据本身需求情况定制服务; 7) 全天侯服务、全过程监督,经过各关键指标监控实现服务过程可测量; 8) 提供从数据、硬件平台、软件平台、网络平台和基础平台全方面维护服务整体处理方案; 9) 现场常驻资深工程师提供快速技术支持和故障排除; 10) 建立确定可行保修设备备件保障机制; 11) 经过例行操作服务、响应支持服务、咨询评定服务和优化改善服务,多角度多层次立体式保障用户系统运行稳
11、定,拓展用户信息化建设思绪; IT系统运维服务项目指导标准 总体目标 引入优异IT运行维护服务理念和方法,建立并完善基于ISO/IEC 0 IT 服务步骤管理体系,从传统项目售后服务向基于服务水平管理和步骤导向IT运维服务管理转型,以期达成: 1. 建立规范服务步骤,提升服务接收方和服务提供方运行效率; 2. 建立连续一致服务,提升服务接收方满意度,确保用户满意度; 3. 有效及高效地整合和利用信息、基础架构、应用、人员等 IT 资源; 4. 以最低成本、最大效率来利用、管理和维护资产和设备; 5. 提升一线服务台处理率,改善服务步骤,快速响应服务接收方需求。在
12、SLA服务等级协议约定事件处理时间内,事件处理完成率达成100%; 基于 IT 服务管理模式(ITSM) ITSM 管理模式经过业务-IT相结合,服务内容定位和管理,服务实施和开展和服务运作管理四个方面将业务和IT服务亲密结合起来。依据业务需求制订出对应IT策略,并将IT策略转换为具体IT服务计划和定义出服务等级。服务建立和实施将IT策略贯穿一直,使IT最大程度满足业务需要。 人员、资源、技术和过程四者平衡运行维护服务模型 过程 服务等级管理 服务汇报 事件管理 问题管理 配置管理 变更管理 公布管理 安全管理 技术 研发 发觉问题 处理问题 人员 人员管理
13、岗位结构 知识 技能 经验 资源 运行维护工具 服务台 备件库 知识库 关键指标 策划 实施 改善 检验 1. 人员:为确保服务提供方相关人员含有应有运行维护服务能力。为确保故障响应、处理问题和交付结果可控,XX科技在人员管理、岗位结构和人员知识、技能、经验、安全意识等方面建立了完善管理和考评体系,从而确保服务人员能够含有和达成应有水平。 2. 资源:为确保含有提供足够资源能力,以满足和服务接收方约定及未来运行维护服务需求。XX科技将合理建立和配置运行维护工具、服务台、备件库和知识库等相关服务资源,从而保障服务资源立即、有效投入。 3. 技术:为确保含有和运行维
14、护服务策划相适应技术和手段。在运行维护服务实施过程中,可能面临多种问题(如硬件故障)、风险(如安全漏洞)和新技术和前沿技术应用所提出新要求,XX科技依据用户方相关要求或技术发展趋势,能够发觉和处理问题、风险控制、技术贮备和研发、应用新技术和前沿技术。 4. 过程:经过对ITIL最好服务实践模型了解,XX科技将建立以下服务过程:服务等级管理、服务汇报、事件管理、问题管理、配置管理、变更管理、公布管理、安全管理,经过对各个服务过程步骤化、标准化管理对整个服务过程实现可监控,从而保障服务提供可控和连续可靠。 快速响应立即处理 XX科技将为XX市电子政务办IT运行维护服务对象提供快捷便利服务方法
15、依据用户 IT 运行维护服务对象不一样阶段业务需求和内部人员结构用户化我们服务。XX科技丰富经验和庞大服务体系,以运维团体驻场方法服务,使我们服务含有快速响应和立即处理事件能力。 以预防为主方针 XX科技IT运行维护服务改变了传统保修服务只是被动接收问题并处理问题特点,而是从预防为主,经过实时监控和分析发觉IT应用系统中潜在问题和风险,立即采取对应方法以避免问题发生。这么做法最大程度降低了IT应用系统事故发生,确保用户 IT 应用系统最大时间连续工作。 量化服务等级管理 服务质量评定不再是一个模糊概念,经过对服务过程中各项关键指标连续监控,以关键指标量化方法定时根据建立内部测评审核
16、机制对关键指标达成度进行测量,从而实现服务过程连续改善,保障服务质量稳定和连续提升。经协议双方同意服务等级将作为服务质量管理依据。清楚明确服务质量要求使得服务管理最有效。 IT运维服务项目阶段划分设计 为了整个IT运维服务项目提供良好管理监控,并对项目中各管理组织之间连续运作建立合适联络,我们把整个项目实施分为四个阶段: 1) 开启阶段:服务实施过程前期准备工作和计划,包含运维服务管理制度建立、项目团体人力资源到位。 2) 过渡阶段:完善支持服务步骤,服务磨合逐步成熟。 3) 正常服务阶段:正常地实施运维服务全过程。 4) 总结阶段:项目标总结移交并达成有序结束。 时间跨度图所表
17、示: 理 管 维 运 理 管 产 资 理 管 目 项 开启阶段2周 过渡阶段2周 总结阶段2周 管理制度、步骤建立 资产评定、接管和标准化 现场人员到位 运维服务磨合 (无服务等级承 诺) 资产信息数据库建立 资产采购和租赁 日常资产管理服务 提供正常运维服务(有服务等级承诺) 资产配置标准化管理 管理制度、步骤改善 服务等级管理、质量控制 对第三方服务监督、评定管理 项 目 管 理 资 产 管 理 运 维 管 理 项目开启会 定时沟通协调会,汇报 过渡阶段宣传 协议签定后 SLA 确定 接管第三方
18、服务渠道 服务台到位 常规服务阶段48周 管理制度、步骤建立 资产评定、接管和标准化 现场人员到位 运维服务磨合 资产信息数据库建立 资产采购和租赁 日常资产管理服务 提供正常运维服务(有服务等级承诺) 资产配置标准化管理 管理制度、步骤改善 服务等级管理、质量控制 资产数据移交 服务总结汇报 对第三方服务监督、评定管理 项目开启会 定时沟通协调会,汇报 过渡阶段宣传 协议生效日 SLA 确定 接管第三方服务渠道 服务台到位 在每一个阶段过程中全部有对应工作安排及阶段结果输出,开启阶段、正常服务阶段和总结阶段三个不一样关键阶段组成完
19、整服务过程。 开启阶段 和市电子政务IT运维协议正式生效后,作为整个项目标开启阶段。在此阶段中,关键实施前期准备工作,为立即提供高质量服务打好基础。(开启阶段估量需要2周时间)。该阶段关键工作以下: 1) 成立IT运维项目组,确定市电子政务办为运维服务接收方,XX科技为运维服务提供方,并确定双方职责分配; 2) 相关人员到位,提供IT运维服务项目标准备工作; 3) 召开项目开启会议,制订各现场支持服务计划沟通会,明确工作范围,制订开启阶段计划; 4) 双方互动协调出台SLA服务等级协议细节,报请双方上级部门或领导审核,并明确SLA服务等级协议; 5) 项目管理、运行维护等规章制度
20、步骤确实定; 6) 双方人员一起讨论相关工作计划和需求; 7) 系统维护服务实施计划出台和审核; 8) 针对服务范围包含硬件设备进行预检服务; 正常服务阶段 项目开启后,新服务系统能够实现IT运维服务范围所承诺服务后,即进入正常服务阶段。在正常服务阶段,全部工作将根据制订计划进行,并提供服务等级承诺。具体工作以下: 1) 运维服务管理体系和步骤改善; 2) 正常运维管理; 3) 季度服务例会召开; 4) 设备运行风险评定; 总结阶段 此阶段开始于协议要求服务时间立即结束前2周。这个阶段关键工作是和XX市电子政务办充足沟通,移交服务本年工作。并从项目标服务实施过程中积累总结
21、经验,以促进提升在后续运维项目中工作质量和绩效。 1) 搜集服务期中各部分服务文档资料及相关汇报; 2) 汇总、装订,提交用户并存档; 3) 项目评定、总结; 4) 召开年度服务回顾总结会形成项目总结汇报; IT系统运维服务项目标范围 服务范围 资产托管服务、技术咨询服务、故障处理服务、系统升级改造服务、系统搬迁服务、培训服务、巡检服务、回访服务、硬件维修更换服务、定时系统健康检验服务、系统演练服务、重大会议保障服务、厂家支撑服务; 运维服务项目服务时间、服务方法 1) 运维服务项目服务期:从XXXX年XX月XX日起——XXXX年XX月XX日止,累计XX年; 2)
22、运维服务项目服务方法:XXXX运维项目组在XXX市现场驻点式服务; 运维服务项目包含产品范围 1. 硬件维护服务范围清单 依据硬件维护服务范围清单,确定对运维项目中提供服务产品界定愈加正确; 2. 软件维护范围清单 依据软件维护范围清单,确定对运维项目中软件维护范围愈加清楚; 硬件范围清单 机柜 序号 设备 型号 6-06柜 1 HP服务器 DL388 GenB 2 认证网关 吉大正元G3000-E 3 认证网关 吉大正元G3000-E 4 证书注册中心 吉大正元LRA 5 身份认证服务器 曙光A420r-G 6 行政权力运行服务器 曙
23、光A420r-G 7 行政权力运行服务器 曙光A420r-G 8 行政权力运行服务器 曙光A840-G10 6-05柜 1 抗DDOS 傲盾KFW- 2 负载均衡A 华夏APPEX 3 负载均衡B 华夏APPEX 4 山石VPN HILLSTONESG-6000M3100 5 WEB防火墙 国舜科技 6 交换机 H3C S5500 7 交换机 H3C S5500 8 深信服AF-1520 深信服AF-1520 9 交换机 H3C S5120-28P-SI 10 交换机 H3C S5120-28P-SI 11 深信服1
24、550 12 华三路由器 H3C MSR36-20 6-04柜 1 交换枢纽 IBM system X3650m4 2 办件查询前置 IBM system X3650m4 3 信息公开前置 IBM system X3650m4 4 数据库/备份服务器 IBM system X3850X5 5 WEB服务器 IBM system X3850X5 6 WEB服务器 IBM system X3850X5 7 WEB服务器 IBM system X3850X5 8 IBM 2498-B24 9 IBM DS3512 10
25、NAS存放 IBM system storage N3240 6-03柜 1 数据库/备份服务器 IBM system X3650 2 企业和部门服务器 HP DL580 3 网页防篡改服务器 HP DL380G6 4 电子政务流转服务器 IBM X3610 5 电子政务公章服务器/防病毒服务器 IBM X3610 6 政务外网市级关键交换机 H3C S7506E 软件范围清单 项目运维预算 序号 收费项 预算计算方法 金额 备注 一 软件服务成本预算 1、 2、 二 硬件服务成本预算 1、 2、
26、 三 硬件保修成本预算 1、 2、 四 备品备件库建设预算 1、 2、 五 场地成本预算 1、办公室 2、测试环境 3、办公设施 六 项目组组织成本预算 1、薪水: 2、培训费: 3、交通费: 4、差旅: 七 企业管理成本预算 3. 项目标管理成本 4. 税金 运维服务项目预算累计: IT系统运维服务项目组组员及职责 运维服务项目组组员 针对运维服务项目,双方建立项目组组员,设计适宜事情管理接口,便于正确有效快速管理运维项目工作事物。 运 维 项 目 小 组 成 员 项目责任人
27、业务关系责任人 运维项目接口人 运维项目协调人 应用系统使用部门 运维项目经理 运维项目待命运维工程师 服务台值班运维工程师 项目决议 项目管理 运维工作 事件处理 XX科技运维服务项目组人员配置及职责 运维项目经理(多年IT运维服务项目管理经验) XXXX指派一名含有良好技术背景和丰富项目经验项目经理,作为项目标总接口人和项目责任人。 1. 负责协调内部人员、软硬件资源,立即对市局运维项目范围提供服务、确保各项指标完成情况; 2. 负责整个服务项目标具体组织和管理,召集季度例会和工作协调会; 3. 制作、完善具体服务项目方案和服务等级计划,在服务过
28、程中立即动态地调整方案,提升工作效率,确保服务质量; 4. 给管理小组组员分配任务,随时监控每个组员服务管理情况,控制服务质量; 5. 负责整个服务项目中问题管理、变更管理; 6. 作为和市局指挥系统间唯一接口,负责向市电子政务办汇报服务情况、变更需求等情况,并立即将相关要求反馈给管理小组; 7. 接收市局指挥系统投诉和协调市局指挥系统需求改变,立即反馈制订应急计划,汇报项目领导小组和市局指挥系统责任人; 驻场运维工程师(二年IT运维服务项目实施工作经验) 1. 负责计划内服务内容实施; 2. 负责第一时间响应用户故障汇报; 3. 负责主动性监控,立即发觉故障隐患; 4. 负
29、责现场故障修复; 5. 关键、疑难故障立即上报项目经理和热线中心; 6. 负责实施其它主动式服务及其它专业服务; 7. 负责处理现场和服务台无法处理用户问题; 8. 负责在技术问题方面和总部支持团体和原厂服务商联络沟通; 项目接口人 1. 代表电子政务办,负责运行维护服务项目管理,和XX科技接口人; 2. 在运行维护过程中,负责变更管理等需要协调、确定之事宜; 3. 突发事件处理管理协调; 4. 和XX科技运维组定时交流沟通; 项目协调人 1. 运行维护服务中用户方具体维护帮助人员; 2. 在运行维护过程中,负责帮助运维工程师处理日常故障事宜; 3. 突发事件相关
30、帮助工作; 4. 日常和运维组人员交流沟通; IT系统运维服务项目服务等级管理 针对市电子政务IT系统运行情况及需求,识别编写具体服务需求和绩效并形成服务目录和服务等级协议; 对服务需求进行约定、定义、编制、监控、变更和评审等; 故障等级定义 故障等级 定义 重大故障 因关键系统设备或服务端软件造成系统瘫痪,造成整个业务系统功效丧失性故障(如:交换机瘫痪造成数据库瘫痪、关键服务程序故障、整个系统无法进行受理等); 通常故障 辅助子系统在运行过程中发生不影响基础业务系统使用或间接性故障(如:服务器故障) 关键指标定义 关键指标 定义 响应时间 从接到用户故障申
31、报时间起,到工程师电话反馈给用户止,所使用时间。 到场时间 故障响应时间起,到工程师抵达故障现场之时止,所使用时间。 处理时间 故障响应时间起,到工程师完成故障处理之时止,所使用时间。 主动式服务 要求时间 结合项目实施周期,制订服务计划,并要求具体时间阶段,长久实施过程。 SLA服务协议 服务项目 故障等级 SLA-1 响应时间 重大故障 7天*二十四小时 0-10分钟响应; 通常故障 7天*二十四小时 0-10分钟响应; 到场时间 重大故障 7天*二十四小时 1小时内工程师到场处理; 通常故障 5天*8小时 2小时内工程师到场
32、处理; 处理时间 重大故障 4小时内工程师处理完成,关键系统恢复,基础业务系统恢复使用; 通常故障 二十四小时内工程师处理完成业务系统恢复使用; 主动式服务 要求时间 依据服务计划时间,确保时间不偏离 运行等级协议 运行等级协议(OLA)是IT运维组和企业研发部门和采购供给部门就市电子政务IT系统运维服务项目所签署协议。(如服务台或项目组有受理故障升级、软件修改需求时,企业内部需严格遵守和项目组OLA协议约定,保障运维项目服务实施效果)OLA支持运维组提供多种服务。 支持协议 支持协议(UC)是和外部提供商就运维项目中部分服务供给所签署协议。(如通信运行商、专用服务器
33、厂商、DLP大屏厂商、其它专用设备厂商等第三方厂商支持保障) IT系统运维服务项目配置管理 目标 配置管理步骤总体目标是提供一个统一、一致步骤来管理IT系统运维服务项目环境中全部组成部分,以确保: 1) 全部配置项被识别和统计下来; 2) 配置项目前和历史状态得到汇报; 3) 配置项统计完整性得到维护和确定; 4) 用户服务环境稳定性; 5) 实现资产管理目标; 范围 配置管理范围是XX科技开发管理信息系统运行和服务环境下所包含配置项,包含接处警调度指挥通讯系统、其它各子系统运行环境布署环境设备、系统软件等,及服务环境中包含用户信息配置。具体活动包含识别、控制、汇报
34、和审核等行为。包含: 1) 用户信息:企业用户信息; 2) 软件信息:参考软件服务范围清单全部系统软件,建立配置信息; 3) 硬件信息:参考硬件服务范围清单全部系统硬件,建立配置信息; 4) 服务文档:服务项目文档、服务统计、用户手册等; 配置管理项目 各配置管理对象需统计具体配置参数项,比如服务器物理位置、计算机名称、服务器品牌型号、IP地址、CPU型号、内存量、操作系统版本号、安装业务系统软件名称等。 配置管理表 统计配置管理对象各项配置信息。每个配置管理对象建立一张配置管理表,表 内统计该对象每个配置管理项目标具体值。 步骤说明 定义配置管理对象和配置管理项
35、在首次建立配置管理系统或增加新软硬件资源时,运维经理需要对管理对象和配置参数进行定义,建立对应配置管理表,并提交给运维工程师。 搜集初始数据 配置维护预案根据配置管理表搜集系统数据,并核查其数据正确性。 更新配置管理表 在确定配置数据正确性后,由运维工程师将新配置信息写入配置管理表,配置维护预案需要在接到配置变更单后二十四小时内完成配置管理表更新。 填写配置变更统计表 运维工程师在完成配置管理表更新,并通知运维经理后,需要将此次配置变更情况统计在配置变更统计表中。 定时核查配置管理表 1) 当因为系统变更造成配置变更时,在变更完成后1日内填写配置信息变更通知,并提交配置管理员。
36、 2) 配置管理员在接到配置变更单后,依据配置变更单内容进行配置变更派单,由配置操作员进行配置变更操作。若需要增删配置对象或配置项目,则由配置管理员进行对应增删操作后,通知维护员更新配置信息。 3) 配置维护预案在接到配置信息变更单后二十四小时内,需要根据步骤要求完成配置信息更新,并在变更单中写明处理人、处理时间和处理结果,并回送至配置管理员。 4) 配置管理员在配置变更统计表中统计此次变更行为 IT系统运维服务项目事件管理 目标 事件管理是一个被动性任务,为了降低或消除存在或可能存在于IT服务中干扰原因给IT服务带来影响,以确保用户能够立即恢复自己正常工作。所以,将事件统
37、计下来并分类,再分配给合适专业人员处理,同时监控事件发展,并在事件得四处理以后将其关闭。 事件管理步骤关键功效是立即处理日常工作环境中出现事件,保持IT服务稳定性,其目标包含: 1) 建立统一事件受理机制; 2) 事件处理步骤中设置升级机制,和其它步骤之间关联接口,设置优先等级和业务影响划分; 3) 建立重大事件步骤管理; 4) 确保事件统计内容全方面,确保步骤输入; 5) 在成本许可范围内立即恢复服务。 6) 快速响应服务请求。 7) 跟踪事件处理状态。 8) 确定事件处理和用户满意度。 9) 进行事件控制。 10) 按规范统计事件。 11) 监视并结束事件。 12
38、) 进行定时服务回顾。 13) 提供一个日常服务接口。 事件管理步骤 服务台事件受理 用户经过服务台汇报事件,搜集好相关信息,受理并进入事件处理步骤。服务台需要搜集以下信息: 1. 来电用户单位名称、联络人、电话号码等基础信息。 2. 影响业务具体原因、故障现象和所属优先级。 请求统计和分类 依据事件汇报信息,一线支持统计《用户服务受理单》,经过电话方法需要问询用户具体事件描述,然后依据用户描述判定事件分类、优先级等信息。 假如事件是相关供给商问题,依据协议协议,直接转三线支持。若事件比较重大且优先级为关键紧急,则需要汇报项目经理。 热线电话尝试处理 一线支持人员受理事件
39、后,首先依据用户所描述故障情况,参考《知识库》,对用户进行对应指导处理。 远程处理 一线支持人员无法经过电话指导用户处理事件,在取得用户同意情况下,能够采取远程工具,登录用户计算机来操作处理。 现场处理 一线支持人员无法经过电话或远程帮助用户处理事件,需要到现场帮助用户处理问题。 二线支持 经一线支持人员尝试处理无果或经判定不属于一线支持能力范围内,提交二线支持处理。 工程技术部和软件开发部:负责处理客服工作碰到疑难问题,并分析其问题原因。 企业管理层:负责客服人员新增、多种配套服务设备添加审批,并牵头处理重大故障或服务中产生纠纷问题。 服务响应 参考SLA服务协议实施。
40、 调查诊疗 现场服务人员(一线、二线、三线)在现场经过标准配置进行比对等方法对故障进行分析,查找出故障原因。 确定处理方案 技术服务人员依据故障分析结果确定处理方案,并和用户沟通实施处理方案所需要时间,确定处理方案可行性。若发生事件一时处理不了, 需要和用户约定处理时间。对于重大故障(故障等级为高或中)须做好数据备份。 若故障处理时包含通常、重大、紧急变更,转变更管理步骤,参考《变更管理程序》。 事件处理后,故障现场责任人分析若属于影响重大或常常出现问题,需要经过问题管理进行根本处理,转问题管理步骤,参考《问题管理程序》。 用户确定 待事件处理完成,需要和用户确定,并以抽样形式进
41、行用户满意度调查。 资料归档 技术支持人员将《用户服务受理单》进行归档。将《用户服务受理单》存档。 配置查对更新 当事件处理后配置项属性需要变更时,则由一线支持提交配置管理责任人进行配置项修改,修改该支持项目标应用系统配置信息,参考《配置管理程序》。 热线关闭 当产生新处理方案时,需要提交到知识库,对知识库进行相关维护,该技术服务结束。 服务汇报 事件管理责任人按每个月对事件进行总结并分类,并将汇报发给项目经理。 事件汇报内容包含: 1. 本月事件总数。 2. 本月服务响应总数。 3. 二线支持处理事件总数。 4. 三线支持处理事件总数。 IT系统运维服务项目问题管
42、理 目标 1. 问题管理步骤根本目标是消除或降低系统运行环境和用户服务过程中事件发生数量和严重程度,预防相同事件再次发生,从而为市电子政务办建立一个稳定系统运行环境,提升用户服务可用性。 2. 分析并确定事件根本原因,找到最终处理方案,以预防这类事件再次发生; 3. 确保问题分配了正确支持人员,提升处理率; 4. 依据问题优先级合理分配IT资源; 5. 对事件统计做趋势性分析,主动提供预防性方法。 过程测量指标 1. 问题数量 2. 问题处理率 运维项目经理每个月对问题处理进行监控和度量,搜集问题处理数据,分析统计问题数据,编写《问题汇报》。 问题管理步骤 问题确定和受
43、理 问题起源: 1. 不能查找出原因事件需要上升到问题管理; 2. 以往没有发生过事件需要上升到问题管理; 3. 经过对事件趋势分析得出需要根本处理问题,如反复发生事件; 4. 经过监控或巡检得出问题。 问题能够从事件管理步骤、售后服务和趋势分析等方面发觉问题,能够经过事件提交和其相关联问题统计。 问题登记和归类 一线运维工程师发觉问题后,经过分类整理,立即填写《问题统计表》,提交到问题管理责任人。 派单 问题管理责任人接到《问题统计表》后,分配问题责任人,问题责任人员成立问题分析小组。问题责任人必需保持问题跟踪,直到问题关闭。 问题调研和分析诊疗 问题责任人召集问题分
44、析小组对问题进行调查研究,尝试让问题重现,找出问题产生根本原因并制订处理方案,或采取变通方法,或采取相关预防方法等,将问题影响降至最小。 确定临时方法 1. 当问题查找出原因以后,能够作为已知错误,一样故障就能够作为事件管理来处理,事件处理过程参考《事件管理程序》。 2. 当相同故障连续不停地发生时候,而且严重影响应用系统不可用性时,问题责任人必需首先采取临时处理方法,首先恢复系统可用性,以降低影响。 3. 问题责任人经过分析判定,假如因为资源不足, 不能处理问题(包含软件资源、硬件资源、技术资源等方面),则把问题提交到三线支持(内部或外部供给商)处理。问题责任人把问题提交三线支持后,
45、还必需负责继续跟踪问题状态,直到问题关闭。 确定处理方案 1. 问题责任人及问题分析小组经过问题分析,有了处理方案后,补充完善《问题统计表》,并进行评定,确定是否需要经过变更管理实施该处理方案,变更实施完成后回到问题管理进行问题回顾和评审。 2. 变更管理参考《变更管理程序》。 问题回顾和评审 问题管理责任人召集问题责任人及相关人员对整个问题处理过程和结果进行回顾和评审,验证问题处理效果。假如是属于重大问题,还要组织评审会议,可能还需要邀请用户代表参与。补充《问题统计表》,形成《会议纪要》。 问题归档 问题责任人对问题处理过程中包含资料进行归档,并把问题处理方案加入到知识库中。
46、 问题关闭 确定问题已经得四处理,全部资料已经归档后,问题责任人员负责关闭问题。 问题汇报 问题处理后,30天内搜集以下信息,形成服务汇报: 1. 本月问题总数量; 2. 本月已处理问题数量; 3. 本月未处理问题数; 4. 本月问题分类情况; 5. 分析本月问题所造成影响及范围。 IT系统运维服务项目变更管理 目标 变更管理目标是确保变更在受控方法下正确评定,同意和实施。降低和杜绝非授权变更,降低变更风险和对业务影响。 变更等级及定义 变更等级 定义 简易变更 简易变更是指在维护过程中对系统或服务所做出多种改变,包含增补、移除和其它修改。说再具体一点,
47、变更对象是两个,一个是IT基础架构,一个是IT服务(包含和步骤和文档),和这两个对象相关改变全部要归入变更范围。 标准变更 一线支持接到用户热线,直接作为事件处理,事件处理过程中包含变更,直接实施。 重大变更 重大变更类似:服务器设施变更、通讯组网结构改变、批量数据更改、系统大版本升级等 这类影响面广,系统一旦不可用,用户反应强烈。要有具体变更方案、步骤、计划、时间安排和回退步骤等,而且方案需要经过部门经理、企业主管领导审批。 重大变更需在提交变更统计,经过各级审批后,由运维组依据方案实施变更。 紧急变更 紧急变更包含:指影响关键业务系统正常运行紧急事件、实施时间紧急重大变更。
48、因为时间紧迫,变更方案由双方领导直接审核后实施。 变更步骤描述 变更确定受理 由事件管理步骤、问题管理步骤、第三方提出变更请求,变更责任人确定是否需要受理变更。 变更统计和分类 若接收标准、重大变更申请,变更责任人或申请人填写《变更统计表》。 变更责任人必需确定该变更请求类别和优先级方便根据不一样步骤实施后续变更动作。 变更分类实施 依据变更不一样类型,分别实施不一样变更步骤,有标准变更、重大变更。 变更回顾 实施变更后需要作变更回顾,要由变更管理责任人从技术和步骤角度去回顾变更,确保变更得到了预期效果,对变愈加以评定,并寻求步骤改善机会。 变更关闭 变更实施人员关闭变
49、更请求。 变更汇报 变更管理责任人每个月对变更数量进行统计,对变更过程存在问题进行分析,形成变更服务汇报。变更度量指标包含: 1. 多种类型变更数量; 2. 变更期间服务中止时间; 3. 计划时间内完成重大变更百分率; 4. 未达成预期结果变更数量。 IT系统运维服务项目公布管理 目标 1. 确保和运维服务项目中软件系统公布是可追溯和安全,确保只有正确、经过同意和测试版本才能被安装; 2. 在公布计划和试运行期间和市电子政务办进行沟通并考虑她们期望; 3. 确定全部最终公布软件正本拷贝是安全可靠,确保软件原始拷贝被安全地存放在固定位置和配置管理数据库得到立即更新; 4.
50、 确保全部软件变更全部得到公布,而且公布过程是安全和可追踪。 公布过程 制订公布方案 公布责任人依据变更计划制订《公布方案》,公布方案通常包含: 1. 描述公布目标和背景; 2. 描述公布影响范围; 3. 确定参与公布部门及人员; 4. 对用户和服务支持人员交流、准备、立案和培训; 5. 确定测试、培训、客服支持、现场布署等工作计划; 6. 安排布署完成后续工作计划; 7. 确定在公布失败情况下退回方案; 8. 可预见问题和对应处理方法; 9. 确定和软、硬件相关配置基线。 公布方案评审 由公布责任人牵头,各公布相关部门责任人参与评审公布方案,评审经过后实施。 构






