资源描述
信息化系统运维方案
信息化系统运维方案
一、项目概述
建设有独立机房和办公网络,业务系统多,存储数据量庞大。各单位的信息系统各不相同,依赖的网络运行环境也各不相同,对网络的管理策略与网络安全管理要求非常高。为确保单位存储数据、设备设施、资产资源的有效、安全、稳定的运行,必需要建立合理、规范、适用的组织管理体系,并能有效展开实施的运维管理体系和方法,从应用管理、数据管理、资产管理、资源管理、安全管理、配置管理、环境管理、应急响应等方面对主机、网络、数据库、存储、数据等信息系统重要设施和资源进行运维管理,最终确保信息系统的安全、稳定的运行,为正常的办公及业务办理提供坚实的支持。
二、服务内容及要求
运维管理方案含运维服务团队管理、运维服务工作管理、服务台管理、运维服务工作制度的建立和完善运维服务流程规范运维服务工具的完善、运维服务体系的评估和改善、运维服务咨询等主要内容。
资产保管、建立资产档案、资产标识、资产核查、资产变更、流程规范等。
〔1〕基础网络环境运维:运行状态监控和预警、定期巡检维护、机房应急演练、网络安全检测、开关机、故障处理、网络接入、调整网络及优化、设备及线缆标识、配置信息备份管理、技术文档管理等。
〔2〕操作系统运维:运行状态监控和预警、定期巡检维护、故障处理、调整优化、配置信息备份管理、技术文档管理等。
〔3〕数据库系统运维:运行状态监控和预警、定期巡检维护、数据安全检测、开关机、故障处理、调整优化、配置信息备份管理、技术文档管理等。
〔4〕中间件系统运维:运行状态监控和预警、定期巡检维护、故障处理、调整优化、配置信息备份管理、技术文档管理等。
〔5〕数据存储系统运维:运行状态监控和预警、定期巡检维护、开关机、故障处理、调整优化、配置信息备份管理、技术文档管理等。
〔6〕数据备份系统运维:运行状态监控和预警、定期巡检维护、开关机、故障处理、调整优化、配置信息备份管理、技术文档管理等。
〔7〕容灾备份环境运维:运行状态监控和预警、定期巡检维护、开关机、故障处理、调整优化、配置信息备份管理、技术文档管理、容灾恢复方案、容灾恢复演练、容灾恢复等。
〔8〕虚拟机平台运维:虚拟化平台运行状态监控和预警、定期巡检维护、故障处理、调整优化、配置信息备份管理、技术文档管理、虚拟机搭建等。
重大活动确保服务:方案制定、组织协调、活动前调试、活动中确保、活动后总结、流程规范等。
5.容灾备份〔业务系统数据库异地备份〕
〔1〕依据甲方数据异地备份的必需求,提供异地备份服务、软件及备份方案;
〔2〕针对甲方所有应用系统数据库搭建实时在线数据复制灾备系统;
〔3〕灾备支持oracle,sqlserver数据库;
〔4〕灾备支持aix,linux,windows操作系统;
〔5〕灾备系统软硬件,由乙方提供;
〔6〕软硬件产权双方必必需确保软硬件产权合法性,甲方不承当任何产权纠纷。
6.1 数据库运维
〔1〕优化完善数据库管理规范
参加优化完善甲方现有数据库管理规范,并且能在合同签订后1个月内提交甲方认可的规范可行的修改补充文本〔电子1份及纸质2份〕,包涵但不限于以下内容:
①日常运维方案,包涵日常运维工作人员、人数、场地、方式、工作内容、沟通方式、评分考核机制等。
②定期巡检方案,包涵巡检的周期、次数、人员、方式、内容、报告提交、客户评价、巡检发现问题处理机制等。
③数据备份恢复方案,包涵数据备份恢复的目标、技术手段、配备的软硬件环境、备份恢复耗时、正确性检验、故障预先应对脚本等。
④数据容灾及演练方案,包涵数据容灾的目标、技术手段、配备的软、硬件环境、容灾的实时性/稳定性/安全性的测评、周期的演练等。
⑤系统性能监控方案,包涵系统性能监控的项目、采纳的工具、监控指标的制定、监控数据的采集/分析/存档、监控发现问题处理机制等。
⑥故障应急处理方案等,包涵各种故障的分类、定义、影响范围、应对方式、应对时效、数据抢救程度、事件分析、处理方案改善机制等。
⑦配合甲方定期对各种方案进行演练。评估和掌控各种方案的效果和处理时间,并依据客户环境的及时变幻调整方案,演练结束后出具评估结果。
⑧及时更新数据库运维列表、出具运维月报,评估甲方所有数据库运维现状、潜在风险、解决计划、应急方案等内容。
〔2〕数据库安全服务
依据日常服务或专项工作发现潜在隐患,跟踪原厂产品动态,收集安全补丁信息,对各类风险进行评估,提出数据库升级建议及实施方案,并依据客户时间安排实施完善升级;设置数据安全参数,限制数据库在合理的特定范围内开放,依据安全检测报告等对数据库进行优化。
〔3〕数据库安装配置及迁移
基于AIX、SOLARIS、HP-UNIX、LINUX、WINDOWS 等所有平台安装单库、集群、DA TA GUARD 〔数据卫士〕、HA 〔双机〕等各种环境,依据系统业务特征、数据量、OS 状况、主机状况、存储状况、网络状况等制定出最正确数据库配置,并生成报告;同时依据甲方要求,无论软件升级、硬件改换、数据库升级、数据库改换、存储改换、灾备改换等可能碰到的各种状况,均能提供完善快速的数据迁移服务方案,协助甲方实施并生成有关文档。
〔4〕数据库故障紧急救援服务
依照系统是否能够正常运行、数据是否遭到破坏,划分故障级别,制定服务细则,定制不同状况下的数据抢救方式。故障出现30分钟内到达现场,1小时内解决,超过1小时驻场工程师仍然不能解决问题的,乙方专家接到通知后,在1小时内抵达现场进行紧急救援,
并且在1小时内完成故障处理,恢复服务。
当发生突发性故障时,乙方能够按照相应处理流程在规定的响应时间内快速排查解决,最大程度的抢救数据,确保数据完整性。同时协助甲方对数据库所在整个软硬件环境出现的问题,进行故障排除。并按甲方要求,及时形成事故处理报告及改善看法。
〔5〕数据库性能诊断及调优
数据库性能诊断及调优由具有丰富工作经验的资深工程师对数据库随着业务周期进行监控,数据库性能诊断及调优在现场实施,每年六次〔每两个月一次〕,包括但不限于以下内容:
1)会话数、活动会话数、会话打开的游标数;
2)系统压力指标,redo 产生量、Logical reads、Block changes、Physical reads、Physical
writes、User calls、Parses、Hard parses、Sorts、Logons、Executes、Transactions;
3)命中率指标,Buffer Nowait %、Redo NoWait %、Buffer Hit %、In-memory Sort %、
Library Hit %、Soft Parse %、Execute to Parse %、Latch Hit %、Parse CPU to Parse Elapsd %、% Non-Parse CPU;
4)共享池的使用状况,Memory Usage %、% SQL with executions1、% Memory for SQL
w/exec1;
5)最消耗资源的等待事件的具体信息;
6)RAC 环境下,Global Cache Service - Workload Characteristics、Global Enqueue Service
Statistics、GCS and GES Messaging statistics,此3 个大类下的几十个子指标的值;
7)RAC 环境下,GES Statistics for DB,次大类下几十个子指标每秒、每事务、合计的
值;
8)最消耗资源的SQL,分别从请求获得内存数量、读数据块数量、执行次数、解析调
用次数、子版本数量角度抓取;
9)实例活动统计,Instance Activity Stats for DB,次大类下几十个子指标每秒、每事务、
合计的值;
10)热点表空间的I/O 统计信息;
11)热点数据文件的I/O 统计信息;
12)锁,即数据库中各种队列的信息,包括锁类型、请求次数、得到次数、失败次数、
等待时间等;
13)回滚段的使用信息,Undo Segment,此大类从不同面进行的统计状况;
14)栓锁的使用状况,Latch Activity for DB,包括锁类型、请求次数、得到次数、失败
次数、等待时间等;
15)SGA 各个子缓冲区的使用状况,比如Dictionary Cache、Library Cache、Shared Pool
等区域中内部使用时信息,包括请求类型、请求次数、得到次数、失败次数、等待
时间等;
16)磁盘排序状况,热点表等;
17)抓取资源消耗排列靠前的用户清册、运行脚本。
18)对各种性能监控统计信息进行分析,查找、诊断应用系统数据库中存在的性能瓶颈;
针对应用系统数据库存在的性能瓶颈进行调整〔包括对数据进行分区存储〕,提升
系统运行效率。并对监控调优过程生成完善的文档报告。
〔6〕数据库数据备份、恢复及归档日志挖掘
数据库性能诊断及调优由服务商具有丰富工作经验的资深工程师依据用户的具体环境,每年不少于两次对各应用系统进行备份数据可用性测试,每年协助甲方进行不少于两次数据备份恢复演练〔每次演练随机抽取应用系统数据进行数据备份恢复〕,包括但不限于以下内
容:
1)制定切实可行的数据库备份、恢复及归档日志挖掘方案,验证备份文件有效完整性;
2)定期测试备份数据的有效性;
3)协助甲方进行应用系统数据恢复演练,通过具体的恢复实验,协助甲方验证具体的
备份是否有效,以及演示如何使用备份进行不同级别的恢复;
4)依据甲方要求,对指定的归档日志进行挖掘,还原操作痕迹;
5)周期性评估数据增量、备份时间变化、恢复时间变化,依据变化调整备份恢复策略;
6)生成全面的备份恢复机制文档、应急处理文档、操作过程文档等。
〔7〕数据库定期现场巡检
每年派二线人员进行现场巡检4 次,每三个月1次,在甲方人员现场进行健康巡检,每次巡检不少于1周时间,并于巡检结束后3日内提交检查报告。报告包括但不限于如下内容:
1)运行状况;
2)数据库对象有效性,空间使用及规划、是否必需要安装新的补丁、网络连接状况;
3)数据库健康检查,提交检测报告。
4)数据库运行状况进行调整或提出调整建议。
5)数据库存储容量变化,对存储配置和数据备份与恢复进行调整或提出调整建议。
6)变化状况,对数据库配置参数进行调整或提出调整建议。
7)依据系统负荷状况,对操作系统、数据库配置进行调整或提出调整建议。
8)针对数据库性能指标参数或应用系统特别问题,提出特别表的维护建议。
9)针对应用系统特别问题,提出应用软件制定及代码层的调整建议。
10)巡检中发现的各种隐患的处理报告。
11)乙方安排的各种其它事项的处理报告。
乙方对数据库可能存在的性能问题进行全面的分析、评估和调整,以确定在系统软件层面上存在的主要性能瓶颈和隐患,在性能诊断基础上,对数据库进行性能调优,以提升应用系统的整体性能。同时协助甲方对数据库所在的整个软硬件环境存在的性能问题,进行相应的诊断和性能调优,并提出相应的优化建议和看法。
〔8〕Oracle 数据库管理常规培训及知识转移
1)Oracle 常规培训:依据甲方培训必需求,供应商每年对甲方相关技术人员进行一次数
据库技术培训,培训时间不少于5 天。培训地点和实际操作环境由甲方提供。乙方
负责提供师资。
2)知识转移应包括但不限于知识的共享和知识的汲取两个阶段。乙方可通过现场授课、
面对面交流、即时通信工具、电子邮件等途径、转移有关经验知识、同时有义务向
甲方人员提供有关的帮助文档、文献资料、软件工具等,同时供应商指导机房人员
将知识运用到工作中,帮助甲方人员实现知识的汲取。
〔9〕开发咨询、开发技术方案审核
开发技术方案审核由具有丰富工作经验的资深工程师依据甲方要求,给出审核看法和建议,出具审核报告,包括但不限于以下内容:
1)技术咨询,技术指导;
2)协助开发人员进行数据库端程序的调试;
3)代码优化,优化原则的培训;
4)技术实现方式的改良建议;
5)数据库端程序的制定;
6)系统布暑等技术方案;
7)数据通讯等技术方案;
8)数据容灾等技术方案;
9)数据备份恢复等技术方案;
10)数据安全等技术方案;
从技术可行性、性能评估等方面给出看法和建议。
6.2 数据库安全建设
数据安全建设必需要达到以下目标:
1)提升现有业务信息系统数据库的系统安全性,检查和验证数据库在运维开发过程中
预防数据泄露、预防误操作、非法SQL 注入等操作,实现对第三方运维开发人员
对数据库准入、访问控制、事后审计,拟利用技术手段来规范数据库管理员和开发
人员的访问行为,保护敏感数据不泄露。
2)提供数据库安全策略,围绕着核心数据安全构建全新的信息安全防御体系。
3)建立数据脱敏,利用其敏感数据自动发现功能、对敏感数据按必需进行漂白、变形、
遮盖等处理,避免敏感信息泄露,同时又能确保脱敏后的输出数据能够坚持数据的
一致性和业务的关联性。
4)建立操作系统、硬件设备、中间件和数据库智能化、一体化监控,7*24 小时无值守
自动巡检,运维云线上远程DBA 告警派单和技术支持服务交付。
乙方依据自身实际状况与技术能力提供建设方案,如建设必需用到第三方软件或硬件,乙方必必需确保软硬件产权合法性,甲方不承当任何产权纠纷。
6.3 依据甲方实际状况定制开发数据库管理软件
1)软件监控内容:数据库性能监控、数据库主机性能监控、数据库日志监控、数据库
服器日志监控、数据库对象监控、数据库健康状况监控、数据库故障预警、表空间
使用状况、磁盘使用状态;
2)能依据时间段,性能指标选择生成数据性能状况分析图;
3)能依据时间段,生成系统健康状况分析报告;
4)软件监控数据要求至少储存两年;
5)软件产权归乙方,服务期内甲方拥有使用权。
信息化建设由多个服务单位实施,每个建设单位只负责对应承建的项目建设,建设过程缺乏统一的管理与协调。由于各个项目的建设周期与建设时间不一致,所以整体信息化目前仍存在一些不够。乙方必需要依据数据机房现状、网络机房现状、智能建设现状、弱电建设现状分析目前建筑信息化存在的不够与必需要调整的地方,制定数据机房、网络机房、弱电的网络完善方案并予以实施。乙方必需按排工程师与所有建筑信息化建设公司对接,由于部分项目已经过了项目免费保修期,甲方只负责提供建设公司对应的联系方式与尽量协调建设公司配合提供技术支持,具体技术对接与方案制订必需乙方自行完成。乙方网络完善实施完成后必需要提供所有安装规划文档与运维手册给甲方运维管理部门。
为确保建筑网正常运行与网络安全,要求服务公司提供:网络运维管理、网络监管软件、网络入侵检测设备、运维网络安全隔离设备。〔网络安全管控所有软硬件产权归乙方,乙方必必需确保软硬件产权合法性,甲方不承当任何产权纠纷〕。
8.1网络监管软件:、
〔1〕软件功能要求:告警管理、性能管理、拓扑管理、配置文件管理、网元管理、链路管理、VLAN 管理、日志管理、物理资源、电子标签、IP拓扑、智能配置工具、自定义设备管理、安全管理、终端资源管理、设备软件管理、系统监控工具、故障采集;
〔2〕软件性能要求:满足大型网络管理要求,能提供全方位的网络业务管理,可管理5000个网络设备。
8.2入侵检测设备:
〔1〕全面检测:覆盖网络、服务器、终端及应用;
〔2〕具备IDS 的检测能力:漏洞攻击、Web 应用攻击、蠕虫木马等恶意软件、网络DoS 等;
1)〔3〕具备检测使用人员网客户端攻击的功能〔浏览器、媒体文件、各种文档格式
等〕;
〔4〕具备应用用层拒绝服务攻击及预警功能(HTTP、DNS、SIP 等);
〔5〕具备应用感知能力,自动识别应用帮助用户掌插网络真实状态,漏洞跟踪的能力,及时发现攻击,提供及时处理功能;
〔6〕具备完善的报表展示功能:
1)详实的报警信息,同时提供针对性的响应指导措施;
2)可进行攻击录包,帮助用户更清楚的了解黑客行为过程并进行采证。、
3)提供各种安全报表,让用户轻松掌插内部安全状态及趋势;
4)提供各种的预定义策略,可以满足定制化策略的必需求;
5)提供各种的日志统计报表功能,从不同粒度和不同维度全面展示网络实时状况、
历史信息及检测到的各种攻击排名、流量趋势走向。方便住建委能随时了解网
络健康状态,对网络加固和IT活动实施予以指导。
8.3 运维网络安全隔离设备:
〔1〕实现运维网络与业务网络及数据中心网络的物理隔断,实现链路层与网络层的断开;
〔2〕通过基于ASIC 制定的硬件电子开关实现可信、不可信网络间的物理断开,保护可信网络免遭黑客攻击;
〔3〕设备两端内置了IDS入侵检测引擎,可有效保护系统自身及受保护网络免受攻击者的频繁攻击;
〔4〕具备SAT 功能,身份认证功能;
〔5〕提供基本的用户名/口令身份认证功能以外,还可与外部认证系统集成支持扩大的Radius、PKI 数字证书、SecureID 等多种强身份认证功能;
〔6〕提供安全代理服务功能和AI 安全过滤功能,能够依据来源、目的地、用户特权和时间来控制对特定的HTTP、SMTP 或FTP 等资源的访问;
〔7〕提供安全功能,包括:确认通信是否遵循相关的协议标准;进行异常协议检测;限制应用程序携带恶意数据的能力;对应用层操作进行控制,这些新功能对企业级网络环境中应用层的安全控制起到了很重要的强化作用;
〔8〕内嵌防病毒引擎,可实现对内外网摆渡数据的病毒查杀,其防水墙模块可有效阻止内网信息的外泄及木马、蠕虫等恶意程序通过HTTP、SMTP 等方式向外泄漏信息。实现对病毒的高效查杀,支持包括HTTP、SMTP、POP3协议的网关级病毒过滤;
〔9〕具备内容过滤及文件格式检查功能,对管理员指定格式的文件或指定内容关键字的邮件、网页、FTP 文件等具有安全过滤功能;
〔10〕提供管理功能,以便进行有效的策略创建和安全管理。能够监控并记录系统状态,全面审计网络活动、入侵活动、管理员的配置操作、系统错误信息、违反规则的过滤信息等日志信息。
配备笔记本4 台〔作为中心平常运维使用〕:CPU:i5或同等及以上档次;内存:≥8G;硬盘:≥250G SSD固态盘;光驱。
〔1〕须派驻至少4名技术人员驻场办公,办公场地由甲方提供,办公设备由乙方自行配备。驻场技术人员组成:项目经理1 人,工程师3 人;专业技能必必需包涵:oracle 数据库工程师1名、主机存储维护人员1名、网络维护人员1名、设备维护人员1名。数据库工程师必需取得OCP 认证证书,必需熟练掌握以下Oracle 运维技术:Oracle 日常运维和故障处理,包括基于AIX、LINUX、WINDOWS 等甲方所有平台安装单库、集群,Oracle 补丁升级,Oracle 性能优化,Oracle 备份与恢复等。乙方驻场工作的工程师必需接受桂林市住房和城乡建设信息中心的工作安排及人员管理等相关事项[乙方于投标文件中必需提供: ①拟投入本项目数据库工程师的OCP 认证证书复印件、2021 年以来至少6 个月乙方为该数据库工程师缴纳社保的相应证实材料复印件;②包涵数据库工程师在内的至少 4 名驻场技术人员工作岗位安排、工作简历表〔包涵工作年限、技术能力及相关经验等内容〕〔2〕乙方须安排服务人员驻场工作,以甲方信息机房为中心,提供5 (工作日〕*8 (小时〕运维服务,同时提供7(日〕*24 (小时〕应急响应及技术支持服务。
〔3〕乙方所有驻场人员以及公司相关人员必需遵守甲方对信息安全保密的各项管理规定和要求,并按照要求与甲方签署《信息安全保密协议书》,采用切实可行的措施确保甲方的网络与信息安全。
〔4〕本项目中,甲方委托乙方运维的硬件设备资产由两部分组成,包括保内设备和过保设备。保内设备指仍在设备供应商或集成商提供的质保期内的设备,由原供应商或集成商承当设备的维保服务,由乙方负责资产保管和巡检等;过保设备指已超过设备供应商或集成商提供的质保期的设备,由乙方承当设备的维保服务。原保内设备出保后,除特别状况外,直接归入出保设备,移交给乙方提供维保服务。
〔5〕网络设备、服务器、存储设备、机房空调、配电设备等机房设备维护要求1个工作日完成,如紧急必需要提供备用设备进行替代使用,无法修理的故障件,必需进行改换新件进行处理。
三、项目总体要求
工作日天天8:00—12:00,14:00—18:00应有专人值班。国家法定节假日〔如国庆、春节、元旦等〕,国家或桂林市住房和城乡建设委员会的重要会议、重大活动以及突发安全事件期间等特别时期,如果甲方有具体必需要,乙方应安排人员进行驻地值守或为特别任务加班。
乙方人员安排驻场项目经理,负责与甲方之间的日常沟通、协调,按时向甲方交付各种维护文档和记录,包括日常巡检及维护记录、服务周报、服务月报、服务季报、服务年报以及定期工作总结。
包括运维规划管理、资产管理服务、设备维保服务、系统环境运维、数据管理服务、参观接待支持、会议支持、培训服务等方面的例行操作、响应支持、优化改善、调研评估等服务内容。
现场服务,也可以采纳 、电子邮件、 、即时通信软件等服务方式。
5.应急服务。
乙方应建立应急响应机制,制定应急预案,并严格按照要求实施,定期组织实施应急演练,并向甲方提交应急演练报告。
6. 技术支持
乙方组织内应该具有经验丰富的技术专家和业务专家,包括网络、主机、存储、数据库等,并可以随时为驻场人员提供资深技术支持。
7. 满意度调查
乙方组织内应有固定的服务质量管理部门,公开、公示甲方投诉方式和流程,设定专人接收、处理来自甲方的服务投诉,定期展开服务满意度的调查。
〔1〕认真遵守国家保密法律、法规和规章制度,履行保密义务;认真遵守乙方工作单位与甲方签订的《信息安全保密协议书》。
〔2〕认真遵守甲方对乙方所制定的相关规定,认真遵守桂林市建委其它各项安全保密的相关规定。定期对运维服务人员进行安全保密管理和思想教育,强化保密意识和安全生产意识。
〔3〕对在本项目实施过程中接触到的涉及甲方的敏感信息的资料、文件、数据等承当保密义务;在本项目实施过程中不去刺探或者以其他不正当手段获取甲方的敏感信息。
〔4〕任何状况下,不将甲方的敏感信息泄漏、告知、公布、公布、出版、传授、转让给任何第三方或以其他任何方式予以披露。
〔5〕在没有获得甲方事先书面同意之前,不得在任何时候以任何形式为本项目以外的目的使用敏感信息。
〔6〕因本项目必需要所持有或保管的一切记录着上述敏感信息的文件、资料、报告、信件、 、磁带、磁盘以及其他任何形式的载体,须在甲方要求下的任何时候予以交还,项目实施相关人员本人不得留有这些文件的任何复制文件。
〔7〕如发生失泄密事件,按照国家相关法律法规要求处理。
〔8〕确保项目完成后仍对其在该项目期间接触、知悉的属于甲方敏感信息的相关人员承当如同项目期间一样的保密义务。
〔1〕乙方须依据甲方对运维服务岗位的实际必需要设定驻场技术人员岗位,选派具备相应技术能力的驻场技术人员。甲方对各运维技术服务岗位的具体要求见下表:
〔2〕在本项目服务合同存续期间,乙方不能擅自改换或撤离服务人员。如有人员调整,须得到甲方的认可同意。
〔1〕甲方为乙方提供运维服务工作场所,并为乙方提供办公场所的 线路与网络线路接入。
〔2〕乙方在甲方提供的办公场所内,自备办公家具、办公设备和办公用品,自行维护办公环境的卫生和安全。
本项目实施过程中,甲方委托乙方针对甲方的设备资产进行管理,包括保内设备和保外设备〔含相关的系统软件〕。保内设备由原供应商或集成商承当设备本身的维保服务,由乙方负责资产保管、状态监控、日常巡检和定期巡检等维护;保外设备由乙方承当设备本身的维保、资产保管、状态监控、日常巡检和定期巡检维护。
乙方须接受甲方的绩效考核,绩效考核分为运维过程绩效和年度运维绩效两类。
〔1〕乙方应编制、维护和保管各类运维过程文档和系统文档资料,包括资产清单、数据清单、系统拓扑图、运维服务技术手册等;
〔2〕乙方应储存好运维服务过程中各种记录和文档,包括巡检记录、现场服务记录单、故障及事故报告、工作总结报告,依据甲方要求及时整理和提交。
〔3〕乙方应以周为单位总结日常运维服务工作,向甲方提交运维周报,以季度和年为单位全面总结运维服务工作,向甲方提交运维服务季度总结和年度总结。
〔4〕运维服务过程中的各种专项报告,如故障报告、事故报告、改善建议等,乙方应进行规范管理,与其他文档一起向甲方提交。
〔5〕乙方应使用文档管理工具,安全专业针对运维服务文档进行规范管理。
〔1〕运维目标
在甲方主管部门的领导下,管理和完善运维服务体系,确保向甲方提供科学、规范、高质量的信息化运维管理服务。
〔2〕运维范围
包括运维服务团队管理,运维服务工作管理,服务台管理,运维服务工作制度及流程规范的建立和完善,运维服务工具的完善,运维服务体系的评估和改善,运维服务咨询等。
〔3〕运维内容
1)运维服务团队管理,包括:梳理、明确服务人员的岗位使命,依据服务工作必需
要和团队实际状况进行规划和调整;对服务人员的考勤、着装、服务意识、
服务态度、日常行为等进行管理;对服务人员的服务能力进行评估,依据服
务工作必需要和团队实际状况进行规划和改善;将服务人员的调整状况及时向
甲方申请和汇报;对服务团队的办公环境、设备及工具的使用和维护进行管
理。
2)运维服务工作管理,包括:运维服务工作的组织安排;运维服务工作过程和结
果的监控管理,及时向甲方反馈和汇报任务完成状况;定期组织服务工作例
会;按照甲方要求定期对运维服务工作进行总结汇报。
3)服务台管理,包括:建立服务呼叫中心服务台,对甲方用户的服务请求进行记
录、分发、跟踪和反馈;整理归档各类服务文档。
4)运维服务工作制度的建立和完善,包括:针对运维服务管理的各个方面,依据
采购人的相关规定和要求,制定各项工作管理制度。如人员管理制度、考勤
管理制度、进出建委制度、值班管理制度、工作汇报制度、工作例会制度、
保密制度、办公环境管理制度等;完善各项制度的具体内容;梳理已有制度,
补充缺少的制度,完善制度体系。
5)运维服务流程规范的建立和完善,包括:针对运维服务管理的各个方面和各项
具体服务内容,依据甲方的相关规定和要求,制定各项服务流程和规范。如
基本礼仪和行为规范、热线服务规范、现场服务规范、服务禁语等基本工作
规范;事件管理、问题管理、变更管理、配置管理、公布管理、供应商管理、
投诉管理、安全管理、服务分级、故障分级等运维管理流程规范;会议确保、
活动确保、项目配合等技术流程规范;各类运维文档编写和提交的规范等;
完善各项流程规范的具体内容;梳理已有流程规范,补充缺少的流程规范,完
善流程规范体系。
6)运维服务工具的完善,指依据甲方信息网络系统运维服务的实际特点和必需要,
不断优化、改善和补充运维服务工具。
7)运维服务体系的评估和改善,包括:定期对运维服务体系整体状况、优点、不
足、风险隐患等进行分析、总结和评估;针对评估结果制定优化改善方案并执
行。运维服务咨询,指评估分析甲方信息网络系统的运维必需求,提供建立、优
化、完善服务管理体系的咨询和规划服务。
〔1〕运维目标:规范信息化资产的管理工作,提升信息化资产的使用效率和管理水平,确保国有资产可以得到充分使用。
〔2〕运维范围:包括甲方信息网络系统中的各类硬件、系统软件和信息化数据。
〔3〕运维内容:资产保管。负责对甲方信息化资产清单所列设备的保管。由于乙方工作失误导致的资产丢失、损坏等状况乙方负责无条件赔偿;由于其他原因导致的设备故障、损坏状况,乙方要按照服务合同中的相关规定履行相应的改换、修理责任,确保系统的稳定运行。
〔4〕建立资产档案。针对所有的信息化资产逐一建立完整的资产档案,资产档案应该包涵资产大类、细类、名称、数量、用途、安装部位、所属系统、保修期限、SN 号、原厂商、集成商、运维商、修理改换状况等。
〔5〕资产标识。制作信息化资产标签,对资产实体进行标识。
〔6〕资产核查。乙方每年不少于两次对所承当运维的信息化资产进行整理,并配
合甲方职能部门做好资产核查工作,将资产清单与资产实物进行一一核对,维护资产清单准确性,同时向甲方提交信息化资产保管和运维报告。
〔7〕资产变更。当资产发生变更时,乙方应及时更新资产标识、资产清单。无论在任何状况下,乙方在变更资产前都必需要得到甲方相关主管部门的签字认可。
〔1〕运维目标:确保当甲方信息网络系统中的硬件设备发生故障时可以在最短时间内完成修理或改换,减少故障影响时间。确保高风险及易损、易耗类的设备和配件可以得到及时的补充。
〔2〕运维内容
1)故障设备修理:当设备发生故障或损坏时,关于保内设备及时向维保厂商报修
并配合完成修理,关于保外设备及时向设备厂商报修并配合完成修理。
2)故障设备改换:当设备发生故障或损坏必需改换时,关于保内设备及时向维保厂
商报修并配合完成改换,关于保外设备及时采购替代设备并完成改换。
3)设备维保服务的购置:对专业技术性较强的出保设备,应代甲方选择和购置专
业厂商的维保服务,并配合完成定期巡检、维护保养、耗材改换、故障修理
等工作。
4)备品备件:对备品备件进行妥善保管,建立备品备件清单,严格按照计划使用。
建立并完善备品备件计划、采购、保管和使用的相关流程规范。
〔1〕运维目标:确保各类网络的畅通,及时响应和排除网络故障,避免大面积网络瘫痪。
〔2〕运维内容:网络定期巡检维护,包括:
1)每日设备状态监控和预警、网络链路负载检查、双核心状态检查、设备日志
检查;
2)每月网络性能分析;
3)每季度热备系统切换测试、设备除尘等;
4)按要求〔如节假日〕对网络设备进行关机或开机;
5)网络链路及设备的故障响应、诊断与解决,核心网络设备故障隔离;
6)专用线路的状态监控,故障响应,故障报修,配合运营商及时进行修复等;
7)网络接入,网络配置及网络结构的调整优化,网络设备的调整与迀移等;
8)网络设备及线缆标识,线缆整理等;
9)网络系统的配置文件和配置信息备份管理;
10)技术文档管理。依据运维必需要,及时总结技术维护文档,并对技术文档进行动
态更新、管理。
〔1〕运维目标:确保各类操作系统平台的稳定运行,及时响应和排除系统故障,确保核心系统平台瘫痪故障次数为0。
〔2〕运维范围:主机系统维护包括位于内网机房和外网机房的所有服务器,涉及IBM、HP、Lenovo、dell等多家厂商的小型机和PC 服务器。
〔3〕运维内容
主机系统定期巡检维护,包括:
1)每日设备和系统状态监控和预警、设备日志检查;
2)每月系统性能分析,主备节点切换测试;
3)每季度垃圾数据处理、设备除尘等;
4)按要求〔如节假日〕对主机系统进行关机或开机。
5)主机系统环境的故障响应、诊断与解决,核心系统故障隔离;
6)主机系统配置的调整优化,系统迀移等;
7)主机系统的配置文件和配置信息备份管理;
8)技术文档管理。依据运维必需要,及时总结技术维护文档,并对技术文档进行动
态更新、管理。
〔1〕运维目标:确保数据库系统环境的稳定运行,及时响应和排除系统故障,确保核心数据库系统瘫痪故障次数为0。
〔2〕运维范围:数据库系统包括位于内网机房和互联网业务中的应用的数据库主要有:oracle、SQL Server 等。此外还对集群系统,中间件提供维护服务。
〔3〕运维内容
数据库系统定期巡检维护,包括:
1)每日系统状态监控和预警、系统日志检查;
2)每月系统性能分析,数据库一致性检查;
3)每季度垃圾数据处理、清理日志等;
4)按要求〔如节假日〕关闭或启动数据库系统;
5)数据库系统环境的故障响应、诊断与解决,核心系统故障隔离;
6)数据库系统配置的调整优化,系统迀移等;
7)数据库系统的配置文件和配置信息备份管理;
8)Oracle RAC 状态检查,一致性检查、故障响应、诊断与解决;
9)技术文档管理。依据运维必需要,及时总结技术维护文档,并对技术文档进行动
态更新、管理。
〔1〕运维目标:确保中间件系统环境的稳定运行,及时响应和排除系统故障,确保核心中间件系统瘫痪故障次数为0。
〔2〕运维范围:中间件系统包括位于内网机房和互联网业务中的应用的中间件。
〔3〕运维内容
中间件系统环境定期巡检维护,包括:
1)每日系统状态监控和预警、系统日志检查;
2)每月系统性能分析;
3)每季度清理日志等;
4)按要求〔如节假日〕关闭或启动中间件系统;
5)中间件系统环境的故障响应、诊断与解决,核心系统故障隔离;
6)中间件系统配置的调整优化,系统迀移等;
7)中间件系统的配置文件和配置信息备份管理;
8)中间件集群的性能调优,可用性检查,故障响应、诊断与解决;
9)技术文档管理。依据运维必需要,及时总结技术维护文档,并对技术文档进行动
态更新、管理。
〔1〕运维目标:确保数据存储系统环境的稳定运行,及时响应和排除系统故障,确保核心数据存储系统瘫痪故障次数为0。
〔2〕运维范围:存储系统包括位于内网机房和外网机房的存储设备,涉及IBM、SUN、EMC 等多家厂商的磁盘阵列、磁带库等设备。
〔3〕运维内容
存储系统定期巡检维护,包括:
1)每日系统状态监控和预警、系统日志检查;
2)每月系统性能分析;
3)每季度清除垃圾数据、磁盘空间整理、设备除尘等;
4)按要求〔如节假日〕对存储设备进行关机或开机;
5)存储系统环境的故障响应、诊断与解决;
6)存储系统配置的调整优化,磁盘空间的调整优化,系统迀移等;
7)存储系统的配置文件和配置信息备份管理;
8)技术文档管理。依据运维必需要,及时总结技术维护文档,并对技术文档进行动
态更新、管理。
〔1〕运维目标:确保数据备份系统环境的稳定运行,及时响应和排除系统故障。
〔2〕运维范围:数据备份
展开阅读全文