1、日常运维管理制度1.运维保障机制(1)建立硬件、网络、系统、应用及业务软件日常维护步骤机制;(2)建立故障应急处理步骤机制;(3)建立备份恢复保障机制;(4)建立安全保障管理机制;(5)建立版本管理机制,管理平台生产环境运行软件版本;以上机制应形成文档,作为日常遵照规范,按要求实施。2硬件维护能力需对硬件设备含有7*二十四小时不间断支持、响应能力,标准上每日对硬件设备最少健康检验一次并统计;定时对网络环境进行检验。我企业服务器布署在移动云上定时经过命令进行硬件检测,内存、硬盘、I/O使用情进行查询并进行登记,每台服务器运行软件对硬件性能使用情况检测,对于服务器我们进行系统备份、软件,每日对网络
2、使用情况进行观察,针对突发异常流量进行分析。3. 故障处理响应及要求设备(系统)出现故障时,依据不一样故障等级提供对应服务响应,响应方法及要求以下:故障等级故障内容响应时间及效果其它I 通常故障出现系统故障,不影响系统运行,不影响业务正常运作工程师即时响应处理,二十四小时内处理。对于硬件故障(含机房环境故障),要求不管在何时确诊需要进行备件更换,发出备件更换指令起3小时内备件抵达故障现场,并恢复系统正常运行。II 次要故障出现系统故障,影响系统运行或影响非关键业务运作,不影响关键业务运作工程师即时响应处理,8小时内处理。III 重大故障出现系统故障,系统瓦解或其它情况,影响关键业务正常运行工程
3、师即时响应处理,2小时内处理。4含有应急预案针对布署国家平台节点服务器我们实施系统备份、软件关键数据实时备份,主机备份是提供保留某个时间点上主机系统数据状态服务。基于主机备份能够随时生成或删除备份,并基于已备份进行主机恢复,实现已经有应用和主机数据快速复用,如系统出现事故无法使用将进行系统恢复并把最近一次备份数据进行恢复。对于突发情况建立应急服务步骤,关键是针对可能发生多种意外情况设计应急方案,以控制和规避突发事件带来集中性风险,从而降低设备集中性风险所造成损失,制订以下步骤图: 为确保服务实施质量能够稳定并不停有所提升,保障用户需求能够得到有效满足,保障服务实施团体为用户提供统一、标准化服务
4、支持,并为用户设置专门技术服务专员,对进行全程跟踪,提升服务实施专业性,制订服务步骤:5数据库维护能力每日对数据库进行日常巡检,内容包含对日志、会话数、表空间、磁盘空间等关键数据库参数进行检验(需要配置监控软件);对数据库进行数据备份、归档日志整理、表空间维护、权限分配、异常问题处理;对数据库相关JOB进行维护;定时对数据库进行重启,以释放资源;制订数据备份方案及数据恢复演练方案,定时进行数据恢复演练。6中间件维护能力对中间件进行运行情况检验;每日对关键中间件和应用日志进行检验。定时对中间件性能进行检测,必需时进行优化处理。7安全要求 需要根据信息系统等级保护二级要求对系统进行维护,包含但不仅
5、限于:(1) 定时对系统进行风险评定工作,包含对网站及应用接口进行外网渗透测试、对内部主机进行漏洞扫描,并完成加固工作;(2) 对网站进行安全7*二十四小时安全监测,发觉问题立即统计并处理;(3) 需每七天最少一日信息系统进行安全巡检。包含对网络安全设备巡检、配置优化,对信息系统内各类状态进行判定,定时升级规则库和系统版本。8.运维服务方法为了确保项目全部软硬件设备正常运行,我方提供了灵活服务方法,能够充足满足项目标需求,服务方法有以下多个: 服务台提供技术咨询、服务请求受理、任务分配、意见受理用户服务专员快速通道、服务查询等服务。 远程支持服务为终端用户提供远程技术维护服务。 现场服务为远程
6、未能处理问题提供技术支持、现场维护服务。9.运维人员管理: (1)人员贮备建立和运行维护服务相关人员贮备计划和机制,确保有足够人员,以满足和需方约定目前和未来运行维护服务需求。 (2)人员培训建立和运行维护服务相关培训体系或机制,在制订培训计划时识别培训要求,并提供立即和有效培训。 (3)绩效考评建立和运行维护服务相关绩效考评体系或机制,并能够有效组织实施。10. 岗位结构:有专职团体负责运行维护服务工作,对运行维护服务中不一样角色有明确分工和职责定义,为了保障运行维护服务交付顺利实施,需方也应提供必需接口。 一个完整运行维护服务团体应包含管理、技术支持、操作等关键岗位:a)管理岗职责: 1)
7、在运行维护服务中负责管理运行维护服务; 2)和需方建立顺畅沟通渠道,正确地将需方需求传输到运行维护服务团体; 3)计划、检验运行维护服务各个过程,对运行维护服务能力策划、实施、检验、改善范围、过程、信息安全和结果负责。 b)技术支持岗职责: 1)在运行维护服务中负责技术支持,包含网络、操作系统、数据库、中间件、应用开发、硬件、集成、信息安全等; 2)对运行维护服务过程中请求、事件和问题做出响应,保障信息安全并对处理结果负责。 c) 操作岗职责: 1)在运行维护服务中负责日常操作实施;2)依据规范和手册,实施运行维护服务各过程,并对其实施结果负责。11.整理知识库 含有运行维护服务活动相关知识积累,以确保在整个组织内搜集、共享、反复使用所积累知识和信息,包含:a) 针对常见问题描述、分析和处理方法建立知识库;b) 确保整个组织内知识是可用、可共享;c) 选择一个适宜知识管理策略;d)知识库含有知识添加、更新和查询功效;e)针对知识管理要求制订相关管理制度,并进行知识生命周期管理。