1、运维规划精品文档一、运维现状问题发现:二、运维架构设想:(1) 监控管理:提供整套服务器的全面监控,包括机房监控、业务监控、系统监控、资源监测及应用监测。(2) 配置管理:提供统一的CMDB管理,包括配置建模、配置发现、配置维护及数据应用。(3) 自动化管理:提供应用部署管理、操作自动化管理。(4) 流程管理:提供运维服务流程管理,包括服务台、服务目录、事件管理、问题管理、变更管理、知识库及流程引擎等。(5) 运维门户:提供生产服务器统一运维入口,包括平台统一认证、系统管理及级联管理等。三、运维体系初步实施:1、 搭建zabbix监控平台实时监控所有生产环境服务器、磁盘、网络、负载及业务系统的
2、运行状态、性能。根据监控和处理结果,及时记录相关信息,定期汇总。2、 通过线上服务器的监控,将线上服务器的CPU、内存、磁盘调制最优值,保证资源最大化。3、 搭建测试环境,并将生产环境中测试环境回收,使生产环境与测试环境区分开,保证生产环境稳定运行,4、 搭建跳板机,对线上生产环境实行单点登录,对用户实施限制,以及后期对线上自动化部署的实现。5、 与开发人员配合沟通,解决运行过程中的相关问题。四、运维体系工作内容:1、从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的管理。l 设备基础性能检测;l 设备日志查看;l 测试ping的连通性;l 网络安全策略应运是否正常;l 异常网
3、络数据包流量;l DOS、DDOS等网络攻击情况监测;2、对主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护。 进行监控管理的内容包括以下几点:l CPU性能管理;l 内存使用情况管理;l 硬盘利用情况管理;l 系统进程管理;l 监控备份服务进程、备份情况(起止时间、是否成功、出错告警);l 监控记录磁盘阵列、存储硬件故障提示和告警,并及时解决故障问题;3、 对数据库的监控管理,了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性的进行性能优化。同时,密切注意数据库系统的变化,主动的预防可能发生的问题。进行监控管理的内容包括以下几点:l 数据库基本信息:文件系统、碎片、死锁、CPU占用率较大或时间较长的SQL语句。l 表空间使用信息监测;l 数据库文件I/O读写情况,读写是否分离;l Session链接数量监控;l 查看每日数据备份,数据同步是否正常;l 检测数据库后台进程;4、 负责对终端PC、笔记本以及工作站的操作系统、应运软件和硬件的维护,解决使用人员在应用过程中遇到的问题并简单的培训。 收集于网络,如有侵权请联系管理员删除