资源描述
【系统交维步骤和规范】
版本 <V1.0>
拟制
日期
-07-07
审核
日期
同意
日期
修订历史统计
版本
日期
AMD
修订者
说明
V1.0
-7-7
A
新增规范文档
(A-添加,M-修改,D-删除)
目录
1. 服务目标 5
2. ERP系统交维步骤 7
3. ERP系统交维资产清单 11
4. ERP系统交维文档清单 14
5. ERP系统交维文档要求 16
5.1 用户手册(系统功效说明书) 16
5.2 维护手册(系统技术说明书:包含软、硬件架构说明) 16
5.3 备份策略清单(含历史及新增) 17
5.4 系统资产清单(含历史及新增) 17
5.5 系统配置清单(包含安装地点信息,含历史及新增) 17
5.6 接口清单(含历史及新增) 18
5.7 系统账号清单(含接口账号 ,新增账号 ) 18
5.8 新功效清单 18
5.9 程序布署手册 18
5.10 回退操作手册 19
5.11 测试汇报 20
5.12 系统测试用例 20
5.13 源代码 21
6. ERP交维系统压力测试 22
6.1 压力测试目标 22
6.2 压力测试工具 22
6.3 压力测试用例 22
6.4 压力测试指标及期望值 22
6.5 压力测试数据及场景 23
6.6 压力测试汇报 24
7. ERP系统交维前提条件 25
7.1 交维系统转交整改条件 27
8. ERP统一维护组维护内容 28
9. 时间管理 32
1. 服务目标
各应用系统、应用平台建设周期完成,正式投入使用,系统建设部门将其移交维护部门进行运行统一维护。为规范各应用系统、应用平台从建设转为运行维护步骤,降低系统故障,缩短故障处理时间,提升各应用系统、应用平台运行稳定性、高效性,提供高质量系统支撑,特制订本管理步骤。
经过开展规范化,步骤化,知识化维护服务, 保持各应用系统、应用平台稳定性和服务高效性,并实现以下期望目标:
u 经过各个团体在运维管理、技术支持方面经验知识,将现有被动服务完全转变为主动服务,用完善制度和合理步骤确保应用系统连续稳定地运行,提升系统运维水平和服务质量;
u 梳理各应用系统、应用平台运维工作和各类步骤,总结并制订各类工作步骤,完善故障处理机制,建立故障处理、日常维护知识管理体系,以缩短问题、故障处理时间,满足服务响应时限要求;
u 配合维护主管全力以赴完成企业IT计划、项目管理、系统分析、系统建设等高价值、含相关键竞争力工作内容,外包日常维护、故障处理等相对规范、固定工作内容,实现分工精细化,职员专业化,服务标准化;量化维护工作内容,实现维护工作标准化,制度化,显性化;
u 最终根据ITIL标准建立信息服务体系和运维服务团体,实现“运维服务一体化”,“平台管理智能化”,成本结构全方面优化、运行效益显著提升最终目标。
2. ERP系统交维步骤
步骤步骤说明:
信息系统建设部门填写并提交《应用系统交维申请表》或《应用平台交维申请表》,应用系统或应用平台进入交维申请步骤。依据平台组提供平台交维工作清单,检验建设方提供平台网络拓朴图、资产配置清单、平台操作文档及风险评定列表等等,经过服务组进行预接收。
2.1 评定预接收条件
依据维护组提供交维工作清单,检验建设方提供网络拓朴图、资产配置清单、维护手册、用户手册、风险评定列表等等,经过维护组进行预接收。为确保各应用系统、应用平台稳定运行,建设方在交维时,必需先达成以下应用交维条件:
A. 应用系统功效能够为用户提供长时间不中止、可用服务,确保交维前30天无故障发生,90天内无重大故障发生。
B. 需要交接应用系统必需有一个和正式环境业务数据、技术架构、布署环境完全一样测试环境。
C. 配合完成1-2次交维培训,讲解平台架构、业务逻辑、数据流转、现在维护步骤和常见故障点等;若平台存在性能隐患及遗留问题,需建设方处理达成交维要求再接。如平台软硬件性能瓶颈、可用应急环境、数据备份及监控时效性。
D. 上线后出现紧急和严重缺点必需处理。
E. 按本文第3、4、5章要求提交相关清单及验收交维文档。
F. 依据建设部门提交《备份说明文档》检验应用系统、应用平台备份情况,内容包含服务器信息,备份路径、备份内容、备份频率,保留时长等信息。
G. 依据建设部门提供资产清单,清点硬件设备及查对网络拓朴图、网线标签、虚拟机和应用系统对应关系。确定资产信息是否已录入CMDB中,信息是否完整。
H. 检验资源分配情况(服务器资源利用率不能超出80%(CPU、内存)、负载均衡配置、存放情况及IP地址使用情况)。
I. 服务器监控需接入IPNET或ZABBIX,建设部门需提交监控指标信息,和交维前出现故障汇报。
J. 依据交维清单,平台维护组需要查对设备及相对应配置,如有遗留问题,建设方需依据交维汇报整改内容进行修复。
K. 其中对于不一样架构系统可达成维护可用性不一样:
u 应用、数据库及硬件服务器全部是双节点冗余系统,维护可用性目标为99.9%;
u 应用、数据库及硬件服务器有一个是单节点系统,维护可用性目标为99%;
u 无磁带备份系统,可容忍全部数据丢失;
u 有磁带备份系统,每X天进行一次备份,可容忍X天数据丢失。
L. 系统必需含有必需功效:
u 接口连接等使用程序账号必需能够方便修改密码;
u 系统必需在应用界面上含有完善用户权限管理功效;
u 系统必需提供必需网管接口。
2.2 各团体进行费用评定
信息室费用评定
一线服务台评定
系统监控组评定
7676平台维护组评定
维护室费用评定
应用维护组评定
中间件及数据库平台维护组评定
硬件服务器维护组评定
备份系统维护组评定
网管维护组评定
4A维护组评定
网络维护组评定
机房环境维护组评定
2.3 费用申请
维护室综合各团体费用评定后进行费用申请
2.4 系统转维资源准备
应用系统在计划建设阶段就应该具体评定系统转维过程中所需维护资源。现在信息系统部对于每一个应用系统转维护过程中所需资源以下图所表示:
系统转维过程中牵涉到维护资源如上图所表示。应用系统转入运维阶段后需要部分列资源投入,应用系统在转维护过程中应立即知会各维护资源提供方,同时提供项目相关维护文档方便转维工作顺利进行。
2.5 维护组对应用系统、应用平台进行预接收
检验预接收交维文档及代码;预接收检验不经过,退回信息系统建设部门进行整改或资料补充;
召开交维培训会议,由建设方进行培训,了解日常维护工作及服务对象,提出常见故障及处理措施。
维护组对信息系统进行软硬件风险、缺点诊疗评定, 对于有严重安全风险和有严重缺漏,则退回信息系统建设部门整改。
2.6 进入为期30天试维护阶段
跟业务用户召开职责分工会议,有目标地跟业务用户确定相关服务承诺,并给出职责分工表 。
试运维期间如系统出现批量安全漏洞、系统BUG等符合整改条件,运维组将该系统移交系统建设部门整改。
各个维护组签收《应用系统运维移交申请表》或《应用平台运维移交申请表》,确立应用系统、应用平台正式移交维护组运维,进入正式维护阶段。
依据应用系统、应用平台维护包含内容,能够分为4个维护层:
u 硬件管理——硬件故障由硬件原厂或第三方维保处理。
u 网络管理——网络策略配置和故障处理由网络维护组负责。
u 系统管理——基础软件管理,初步故障定位及处理交由平台维护组负责。如平台维护组无法处理,则提交相对应专业维护组进行处理。
u 应用管理——由应用维护组进行日常维护,出现故障后由应用维护组进行故障定位,并组织各团体立即处理系统故障。
应用系统步骤图以下:
应用平台步骤以下:
步骤
3. 应用系统、应用平台交维资产清单
3.1 硬件资产列表
物理服务器(详见资产清单)
编号
设备型号
序列号
设备名称
IP地址
配置信息
虚拟服务器
设备名称
IP地址
配置信息
项目名称
设备用途
联络人
联络电话
3.2 存放及网络设备
编号
设备型号
序列号
设备名称
IP地址
配置信息
3.3 软件资产列表
软件名称
版本号
license
软件用途
使用期限
数量
4. 应用系统、应用平台交维文档清单
序号
文档名称
运维用途说明
备注
1
备份策略清单
提供备份策略清单,包含所在服务器主机名、所在服务器IP、存放路径、备份数据量、备份策略名称、备份方法及备份频率、备份窗口数据保留时间等备份情况
2
应用测试汇报
开发商应依据测试案例在开发环境进行新功效测试、回归测试、压力测试并出具三种测试经过测试汇报
3
存放配置及分配清单
存放配置操作文档、配置情况及分配清单
4
第三方联络人员列表
平台及应用干系人管理
开发商、第三方开发商、硬件、业务部门等相关责任人联络方法
5
回退操作手册
该文档关键是用于二线平台维护人员进行回退布署,开发商需对此次回退布署过程进行具体说明
6
基础环境布署配置信息
支撑及管理平台运行
安装布署信息及账户密码
7
接口清单
提供系统、应用层、数据库层、及硬件层等接口清单
8
平台及应用故障及隐患清单
历史故障统计和维护统计、为优化平台及降低风险提供依据
历史故障统计和隐患清单
9
平台监控策略及监控清单
告警时效性、立即性
监控策略及清单
10
平台压力评定汇报
应用系统压力测试汇报(测试目标、措施、工具、用例及测试指标期望值)
需要测试压力指标及测试汇报
11
软件安装布署及操作手册
指导及管理系统管理操作
12
软件资产清单
描述软件布署环境、使用基础软件版本、网络架构
尽可能能提供系统拓扑图
13
数据库交维清单
数据库配置情况
数据库建设方案、配置文档、管理员账户密码、配置清单及故障处理汇报
14
网络设备交维清单
网络架构及网络配置
网络拓朴图、配置管理文档、设备维保、网络配置清单及日常维护统计
15
维护手册
该文档关键用于二线维护人员进行技术维护,让维护人员能够参考手册开展职责范围内全部维护工作
16
系统测试用例
开发商应依据《业务需求说明书》编写新功效测试用例、回归测试用例
17
系统配置清单
提供系统、应用层、数据库层、及硬件层等配置清单
18
系统维护工作列表
开发商现在在系统维护方面工作描述,包含月度故障率、数据提取量、数据调整情况、数据备份策略等
尽可能能提供维护管理手册
19
系统账号清单
提供系统、应用层、数据库层、及硬件层等账号清单
20
系统资产清单
若包含到新增软件情况,需提供系统用到全部license,包含license序列号、license文件、license开始时间、license到期时间、license联络人、license联络方法
21
新功效清单
提供此次新交接功效清单及简明说明
22
应急演练方案及汇报
快速恢复业务
应急演练方案及应急环境
23
应用系统布署配置表
系统架构及布署情况,资源使用情况
应用系统布署配置
24
应用系统接入步骤规范
规范化管理应用接入及资源申请
应用接入规范
25
应用系统清单
立即响应应用系统维护,通知对应干系人
布署在平台上应用系统清单,包含应用用途、业务部门、业务主管、维护商、维护人员、开发商、开发人员等信息
26
应用虚拟机备份策略表
备份管理
备份策略及备份清单
27
硬件资产清单
平台布署使用硬件资源
提供网络拓扑图、网络布线(网络及光纤)标签图、硬件维保信息
28
用户手册
该文档供一般用户、维护人员及其它需要了解系统功效人员阅读
29
源代码
开发商在交接前必需提供程序源代码,并确保源代码完整性
30
资产信息录入CMDB中
配置管理
5. 应用系统、应用平台交维文档要求
5.1 用户手册(系统功效说明书)
该文档供一般用户、维护人员及其它需要了解系统功效人员阅读,让上述人员能够全方面掌握系统全部功效使用。新增版本文档中应包含系统全部功效使用说明,同时标注此次新增或变更内容,基础要求以下:
有结构、有层次对系统支撑业务场景及业务步骤进行描述;
有结构、有层次对各用户界面功效及各信息字段含义及限定进行具体说明;
文档具体程度要做到含有基础业务知识但未接触过系统用户经过阅读文档即可使用系统。
5.2 维护手册(系统技术说明书:包含软、硬件架构说明)
该文档关键用于二线维护人员进行技术维护,让维护人员能够参考手册开展职责范围内全部维护工作。新增版本文档中应包含系统软硬件技术架构说明,同时标注此次新增或变更内容。
该文档必需包含以下内容:
u 系统技术架构说明:对应用系统硬件服务器、数据库、中间件及步骤引擎等其它软件平台架构进行具体说明。
u 系统关键逻辑说明:针对关键业务逻辑,结合程序进行具体说明。
u 应用程序模块架构说明:对各模块功效及相互间逻辑联络进行说明,并分析数据流向。
u 系统业务需求技术实现方案说明:针对一些常见和特殊业务进行处理,经过该文档掌握业务步骤处理。
u 数据库表结构说明:对数据库表结构进行具体说明,并提供具体数据字典和ER图。
u 接口说明:针对于每个系统接口进行说明,包含交互方法、交互数据源、交互频率等。
u 定时器等专用服务说明:说明其工作原理,使用说明等。
u 脚本说明:针对常见脚本、数据操作脚本、报表脚本等进行具体说明。
u 程序包变更说明,针对新增和修改地方进行说明。
u 提供操作系统、数据库、中间件及步骤引擎等其它软件平台关键配置及特殊配置要求;
u 提供具体应用程序各配置项及初始配置列表;
u 提供给用程序预置账号及初始密码列表,提供数据库等平台访问账号及初始密码列表,提供各系统接口账号及初始密码列表;
文档具体程度要做到含有基础技术知识但未接触过系统维护人员经过阅读文档即可进行系统维护。
5.3 操作配置手册(软件功效说明书)
该文档供维护人员阅读,能够全方面掌握系统全部功效使用。应包含系统全部功效使用说明,同时标注此次新增或变更内容,基础要求以下:
u 有结构、有层次对平台软硬件操作场景及业务步骤进行描述;
u 有结构、有层次对各用户界面功效及各信息字段含义及限定进行具体说明;
u 文档具体程度要做到含有基础业务知识但未接触过系统用户经过阅读文档即可使用系统。
5.4 平台维护手册(系统技术说明书:包含软、硬件架构说明)
该文档关键用于平台维护人员进行技术维护,能够参考手册开展职责范围内全部维护工作。该文档必需包含以下内容:
u 系统技术架构说明:对应用系统硬件服务器、数据库、中间件及步骤引擎等其它软件平台架构进行具体说明。
u 系统关键逻辑说明:针对关键业务逻辑,结合程序进行具体说明。
u 系统业务需求技术实现方案说明:针对一些常见和特殊业务进行处理,经过该文档掌握业务步骤处理。
u 提供操作系统、数据库、中间件及步骤引擎等其它软件平台关键配置及特殊配置要求;
u 提供具体应用程序各配置项及初始配置列表;
u 提供给用程序预置账号及初始密码列表,提供数据库等平台访问账号及初始密码列表,提供各系统接口账号及初始密码列表;
5.5 备份策略清单(含历史及新增)
提供备份策略清单,包含所在服务器主机名、所在服务器IP、存放路径、备份数据量、备份策略名称、备份方法及备份频率、备份窗口数据保留时间等备份情况。
若包含到变更或新增要标注并说明情况。
5.6 软件资产清单(含历史及新增)
若包含到新增软件情况,需提供系统用到全部license,包含license序列号、license文件、license开始时间、license到期时间、license联络人、license联络方法。
5.7 系统配置清单(包含安装地点信息,含历史及新增)
提供操作系统、数据库、中间件及步骤引擎等其它软件平台关键配置及特殊配置要求;
提供具体应用程序各配置项及初始配置列表;
提供给用程序预置账号及初始密码列表,提供数据库等平台访问账号及初始密码列表,提供各系统接口账号及初始密码列表;
若包含到变更或新增要标注并说明情况。
5.8 接口清单(含历史及新增)
提供数据库新增接口清单,包含接口提供方、消费方、调用频率、同时程序、调用方法、调用配置(用户名、密码)、接口约定(报错代码、报错提醒、报错含义等)、接口视图。
提供Webservice新增接口清单,包含接口提供方、消费方、调用频率、同时程序、调用地址、调用配置(用户名、密码)、接口约定(报错代码、报错提醒、报错含义等)。
若包含到变更或新增要标注并说明情况。
5.9 系统账号清单(含接口账号 ,新增账号 )
提供新增数据库账号清单,包含其在数据库中账号名、对应权限、对应角色、对应表权限。
提供新增应用账号清单,包含其在应用系统中用户名、对应权限、对应角色。
提供新增操作系统账号清单,包含其在操作系统中用户名,对应用户组,对应角色、对应权限。
5.10 新功效清单
提供此次新交接功效清单及简明说明。
5.11 程序布署手册
提供具体系统回退步骤
如在布署有额外操作名要求,也要写入手册
5.12 回退操作手册
该步骤关键是用于二线平台维护人员进行回退布署,开发商需对此次回退布署过程进行具体说明。在系统回退布署前,假如有包含数据库回退,开发商须提供用于回退回退脚本,假如没有,须在布署文档中说明。回退布署步骤应包含程序卸载(停中间件)、数据库回退、旧程序安装、程序开启、程序开启后检验项,以上多个步骤具体要求以下:
程序卸载:需描述清楚程序卸载具体步骤。
数据库回退:
多个回退SQL脚本,需要集中到一个SQL脚本中,平台组只需实施汇总后一个回退SQL脚本;
在实施脚本之前,需要平台维护组备份数据库对象(备份函数、存放过程,表等)或需要停止对象(如停止触发器等),需事先说明,并提供具体对象备份脚本和对象停止开启脚本;
回退脚本需说明脚本在PL/SQL工具下命令模式,如COMMAND或SQL WINDOW下实施;
回退脚本如有实施次序要求,需在布署文档中标明回退脚本实施次序,数据脚本实施后,结果中存在正常异常,需先说明;
回退脚本全部命令均要求自动提交。
旧程序安装:需描述清楚旧程序安装具体步骤。
程序开启:需描述清楚程序开启具体步骤。比如,有些布署需要重启中间件,请在文档中说明。
程序开启后检验项:需描述开启成功后检验步骤。
5.13 测试汇报
开发商应依据测试案例在开发环境进行新功效测试、回归测试、压力测试并出具三种测试经过测试汇报。
该文档应根据《业务需求说明书》编写,最少应包含以下内容
测试用例编号及名称
测试环境地址
测试人及测试帐号
测试路径或活动
测试场景说明
有可能影响到功效点
测试步骤
测试期望结果
测试实际结果
测试结果确定(签字)
5.14 系统测试用例
开发商应依据《业务需求说明书》编写新功效测试用例、回归测试用例。
5.15 源代码
开发商在交接前必需提供程序源代码,并确保源代码完整性。
5.16 第三方联络人员列表
开发商、第三方开发商、硬件、业务部门等相关责任人联络方法
5.17 存放配置及分配清单
存放配置操作文档、配置情况及分配清单
5.18 基础环境布署配置信息
安装布署信息及账户密码以支撑及管理平台运行
5.19 平台及应用故障及隐患清单
历史故障统计、隐患清单和维护统计、为优化平台及降低风险提供依据
5.20 平台、应用监控策略及监控清单
监控策略及监控指标清单
5.21 数据库交维清单
数据库建设方案、配置文档、管理员账户密码、配置清单及故障处理汇报
5.22 网络设备交维清单
网络拓朴图、配置管理文档、设备维保、网络配置清单及日常维护统计
5.23 应急演练方案及汇报
应急演练方案及应急环境
5.24 应用系统接入步骤规范
规范化管理应用接入及资源申请
5.25 系统维护工作列表
开发商现在在系统维护方面工作描述,包含月度故障率、数据提取量、数据调整情况、数据备份策略等
5.26 应用系统清单
布署在平台上应用系统清单,包含应用用途、业务部门、业务主管、维护商、维护人员、开发商、开发人员等信息
5.27 硬件资产清单
提供网络拓扑图、网络布线(网络及光纤)标签图、硬件维保信息
5.28 平台压力评定汇报
应用系统压力测试汇报(测试目标、措施、工具、用例及测试指标期望值)
5.29 应用系统布署配置表
系统架构及布署情况,资源使用情况
5.30 资产信息录入CMDB中
应用系统、应用平台需录入到CMDB中
6. 应用系统、应用平台交维系统压力测试
6.1 压力测试目标
压力测试目标就是检验系统最大吞吐量,检验现行业务系统在多种压力交易量下运行情况,检验系统运行瓶颈,获取系统处理能力等等。
6.2 压力测试工具
美科利企业(Mercury)性能测试软件Load Runner
微软企业性能测试软件Web Application Stress工具(简称WAS)
6.3 压力测试用例
现行应用系统进行脚本录制、测试回放、逐步加压和跟踪统计。测试过程中,由Load Runner或WAS管理平台调用各台测试前台,提议多种组合交易请求,并跟踪统计服务器端运行情况和返回给用户端运行结果。
依据测试系统硬件条件,选择满负荷压力,在系统资源使用基础维持在90%左右情况下,测试数据库处理能力。
6.4 压力测试指标及期望值
1, 网络等级测试指标。
吞吐量:单位时间内网络传输数据量
冲突率:在以太网上监测到每秒冲突数
2, 服务器操作系统等级指标。
标准
平均
峰值
CPU利用率
内存利用率
存放IO
3, 数据库等级测试指标。
数据库I/O流量大小
数据库锁资源使用数量
数据库并发连接数
6.5 压力测试数据及场景
1, 测试数据库需含有和真实环境成一定百分比或基础一致数据。
2, 测试环境分4个,使用逐步加压模式。
A, 每隔2秒增加1个用户连接,最多增加到100个用户,查看并统计运行情况。
B, 每隔2秒增加2个用户连接,最多增加到200个用户,查看并统计运行情况。
C, 每隔2秒增加1个用户连接,最多增加到300个用户,查看并统计运行情况。
D, 每隔3秒增加1个用户连接,最多增加到400个用户,查看并统计运行情况。
每个场景全部包含:用户登录-业务操作-业务完成-退出系统,全部用例全部按以上场景进行测试,因为pc性能限制,为了更正确模拟现场环境,将运行全部脚本布署在8台Load Runner或WAS终端上,关键目标就是检验在不一样压力情况下,业务系统性能表现。
申请10台虚拟机,配置为Windows 、2.50GHz双核CPU、4G内存。在10台虚拟机上布署采集用户端,每台布署15个终端,每个测试终端隔1秒生成一个条码模拟文件,即模拟每秒并发量150次。
6.6 压力测试汇报
实施每个场景时统计以下对应数据:
1. 数据库(Oracle)服务器上主机上CPU利用率;
2. IO和CPU利用率对照表以下;
3. DB服务器上监控网络流量;
4. 运行并发用户数目;
5. 测试中完成各操作平均响应时间:(单位:秒);
6. 测试中每秒点击率以下;
7. 交易吞吐率(每秒处理数据量)。
7. ERP系统交维前提条件
必需提供第3、4、5章节中说明全部文档,文档内容必需完整、全方面和属实;
配合完成1-2次交维培训,讲解交维系统架构、业务逻辑、数据流转、现在维护步骤和常见故障点等;
若交维系统存在性能隐患及遗留问题,需建设方处理达成交维要求再接。如交维系统软硬件性能瓶颈、可用应急环境、数据备份及监控时效性。
依据交维清单,维护组需要查对设备及相对应配置,如有遗留问题,建设方需依据交维汇报整改内容进行修复;
1, 数据备份,满足备份交维需求,包含备份环境、备份需求,如:
(1)备份环境前期准备包含以下方面:
备份环境
备份架构
网络环境
备份系统接入
备份资源
接入前提
1、尽可能选择统一备份维护现有架构(赛门铁克备份架构);
2、如需加入新备份架构(如微软、IBM等),需要完成新架构接入全部投资工作;
3、需要提供该架构稳定使用及使用优势评定,和经过领导审批取得人员后续维护资源。
1、网络端口、防火墙策略放通;
2、实现设备和现有备份设备物理、网络连接。
1、对需备份各设备进行备份系统(用户端)安装;
2、配合备份组完成各备份结点配置、调通。
1、整理自有备份资源情况,提交文档;
2、检验各设备状态,确保设备使用正常,无硬件故障,设备版本已升级到最新或最稳定状态;
3、转移设备维保情况,将设备资产信息录入CMDB。
(2)备份需求接入时,
接入方
备份组
备份需求接入处理
1、整理备份数据类型,数据大小,日增加量及对应恢复需求;
2、提供系统数据历史增加情况及估计两年增加量;
3、提出具体备份路径,对应备份策略需求。
1、评定可用备份资源是否满足接入方备份需求,按需调整;
2、依据备份恢复要求,综合网络速度,系统IO限制,对备份架构进行调优;
3、依据备份恢复要求,对各类型备份数据指定备份介质。
4、结合系统业务情况,IO/并发,制订正确备份策略(时间点、并行窗口、任务排序等)。
2, 恢复演练,平台需要有应急环境,应用系统或虚拟机交维前做备份恢复演练,双机配置网络设备需要做切换演练。
3, 平台监控,监控策略及监控对象梳理,严重告警信息需发到对应维护人员手机,做到立即性。
4, 配置管理,平台对应设备及应用系统全部录入CMDB中管理。
5, 平台隐患,梳理数次出现故障及存在隐患点,给出对应处理措施及汇报。
6, 硬件维护商、操作系统维护商、网络维护商、中间件维护商、数据库维护商需提供5*8小时现场支持服务和7*二十四小时远程支持服务。
7.1 交维系统转交整改条件
运维期间如交维系统存在批量安全漏洞、系统BUG等,维护组将该系统移交系统建设部门整改,移交整改条件以下:
1, 操作系统安全扫描有5个或以上严重漏洞;
2, 应用系统渗透测试,应用软件漏洞类型多于2种且漏洞数量大于10个,需业务部门要求开发商做安全整改。
3, 应用系统出现全局性功效缺点及BUG,造成系统不能正常使用,或关键功效步骤不能正常扭转。
4, 应用系统常见功效出现功效缺点致占用资源不释放,影响平台稳定性及其它应用系统使用,需业务部门要求开发商优化应用。(如CPU达成75%、内存达成85%及存放IO读写过高)。
5, 应用系统存在性能问题(页面响应缓慢类报障>50例/周),并确定需经过软/硬件升级/扩容处理。
8. 维护组维护内容
8.1 应用维护组
为确保各应用系统、应用平台稳定高效运行,统一维护组维护服务关键内容以下:
维护大类
维护小类
具体内容
服务类
系统使用咨询和指导
用户在日常使用系统过程碰到各类操作及系统逻辑咨问询题,能够经过维护单形式通知维护人员,维护人员对碰到问题进行解答及指导。
数据后台调整
因为用户操作失误造成错误数据,经相关责任人同意后,维护人员需要为用户修改为正确数据。
后台数据导出
在系统没有提供功效情况下,维护组能够给用户提供部分数据导出服务,但数据导出仅限于根据数据库表结构导出系统原有数据,维护不进行复杂逻辑处理及数据整理工作。
系统设置
除用户角色、权限和审批步骤之外设置进行维护。
维护类
组织故障处理
本系统及本系统和其它系统接口出现故障时,应用维护组对故障进行初步判定,将故障提交给相关团体进行处理,在整个故障处理过程负责协调各方团体共同处理并立即向维护主管汇报情况。
系统BUG及性能问题定位
系统出现BUG及性能问题,应用维护组应预先对现象进行确定,并提交开发商处理。
数据问题查证及处理
和其它ERP外围系统如出现系统间数据不一致情况,应用维护组应配适用户进行排查并给出合了解释;如确定为系统BUG,维护组提交至开发商处理。
应用层日常巡检及性能监控
每日对应用系统登录、数据库关键业务表、总条数及总容量进行巡检,并利用工具随时对应用系统运行进行性能监控。
应用层主动维护操作:完成备份、重启、测试环境管理等工作
系统备份
搜集系统相关信息,进行风险评定,确定需要备份数据源及备份需求
和平台组及备份组共同确定备份策略
配合备份组及平台组完成系统数据恢复测试和演练
系统重启
和平台组共同制订系统重启计划
系统重启后对系统进行登陆验证
测试环境管理
提出测试环境克隆需求
测试环境使用管理
确保测试环境正常使用
定时更新测试环境数据
系统运行情况总结及分析
依据系统每个月运行情况出具总结月报及系统可用率数据。
组织新功效、补丁上线
审核开发商提供上线文档
对原有功效进行简单验证,以降低新程序包对原有功效影响
在整个上线过程中如出现故障时负责协调各方团体共同处理并向维护主管汇报情况。
系统配置管理
负责日常配置变更实施、配置资料制作及保管、配置相关管理措施及步骤制订。
帐号管理
数据库业务帐号管理:负责数据库层业务帐号设置及变更、维护帐号管理相关表格、帐号相关管理措施及步骤制订
应用层支撑帐号管理:负责应用层支撑帐号设置及变更、维护帐号管理相关表格、帐号相关管理措施及步骤制订
安全管控工作配合
审计管理:配合各项审计工作,并根据要求提供对应样本。
根据各项安全管控要求开展日常维护工作
配合各项安全管控工作开展
提出系统优化提议
依据系统性能监控结果及用户反馈性能缓慢或不可用情况,提出性能优化提议。
月结/年结支持
月结支持
8.2 平台维护组
层次
工作类别
工作项
工作细项
基础层
定时服务
每日巡检
天天进行巡检:SCOM监控健康巡检、SQL Server集群健康巡检,Oracle数据库健康巡检,SCVMM健康检验
每七天巡检
1、检验负载均衡应用系统站点配置情况
2、检验域控和地市企业同时复制情况
3、DNS服务健康情况
月度巡检
机房每个月硬件常规检验,包含服务器、交换机,负载均衡和存放设备健康检验
补丁升级
平台每两个月windows服务器安全补丁升级
安全加固
每个季度配合服务器设备安全扫描和针对扫描结果安全加固(关键应用系统)
资源管理
基础组件\资源维护服务
服务器操作系统重新安装及定时重启维护
处理服务器硬件故障报修及检验测试
WSUS补丁分发、KMS服务器管理、帮助地市服务器经过KMS激活
SCVMM系统管理:
1)、虚拟主机管理
2)、虚拟机增加、修改、删除等操作管理
3)、虚拟机资源管理等其它SCVMM管理操作
VMware vSphere管理:
1)、虚拟主机和群集管理
2)、数据存放和数据存放群集资源管理
3)、虚拟网络连接和管理
4)、虚拟机增加、修改、删除等操作管理
5)、虚拟机资源配置和资源监控管理
SVC管理:
1)、存放机头管理
2)、存放资源分配
3)、存放监控管理
负载均衡配置管理:
1)、负载均衡网络配置
2)、负载均衡运行状态检验
3)、负载均衡切换维护
配置管理
基础配置信息管理
1、对平台服务器设备和各配置参数按实际情况进行登记,并录入CMDB
2、针对每个应用配置数据进行搜集并录入到资产明细表,并针对每次应用配置改变立即更新到CMDB
3、每次设备扩容和新设备上架和旧设备下架进行实时硬件配置数据更新
4、每次应用和系统软件配置发生改变时我们以配置变更方法进行更新配置
中间层
事件管理
工单处理
日常各个维护服务团体、开发商等服务咨询
各服务器维护账户申请审批、延期、禁用,账号密码修改,4A访问账户授权
存放资源调整、服务器外借搬迁、机房出入申请,服务器紧急重启
平台设备维保服务数据搜集和确定
故障处理后故障监控和观察,对故障进行总结提供故障处理汇报
依据SCOM监控信息进行验证和排查可能存在故障或隐患
平台数据库、服务器无法连接、网络中止、安全漏洞,服务停止,其它帮助等工作
可用性管理
应急演练
编写平台及应用系统应急演练方案及计划
选择演练目标及搭建恢复演练环境
平台及应用系统备份恢复应急演练,编写应急演练汇报和应急发觉问题跟踪处理
平台应急发觉问题跟踪处理
数据备份
每六个月查对梳理服务器及应用系统备份策略及备份信息
监控管理
监控指标及监控对象梳理(服务器CPU、内存、磁盘及网络拨测)
监控对象用户端安装及网络调试,配合监控策略优化及频率调试
天天zabbix及IPNET告警信息确实定和清除;
平台优化
平台优化
1、针对系统运行CPU、内存、磁盘空间占用、日志文件大小、文件服务器使用等系统资源情况进行分析
2、平台基础硬件平台、网络平台、安全平台整体优化分析提议
3、平台服务软件(SQL Server/IIS/WebLogic/Windows/.Net Framework)优化分析提议
4、对接入平台应用系统进行需求分析及资源优化配置
资源调研及梳理
资源搜集和分析
1、搜集如服务器硬件信息、网络环境信息、应用系统信息、操作系统信息布署和服务器资源使用情况
2、每三个月搜集应用系统数据确定整合服务器对象
应用管理
应用系统维护服务
公布申请受理,帮助应用功效性调试,应用系统服务重启和故障处理
关键应用系统访问量统计
配合应用系统资源调整及配置:
1、虚拟机资源需求分析及调整;
2、网络访问端口配置及负载均衡配置;
综合管理
知识管理
服务规程
平台运维规范更新
文档管理
对多种故障处理总结成知识库文档数据对平台各类设备和组件技术方案,实施方案,运维手册进行分类并归档。
综合管理
工作总结汇报和交流培训
维护主管日报工作整理
IAP平台运维周报编写
平台运维例会及会议纪要
平台维护月报、六个月小结、年度总结汇报
参与多种培训及交流会议
团体管理\技术交流和分享
9. 时间管理
平台转运维过程时间计划以
展开阅读全文