1、资料内容仅供您学习参考,如有不当之处,请联系改正或者删除。Zabbix运维监控解决方案目录一、 背景3二、 目标3监控的基本内容4三、 采用的软件4四、 软件的特点5五、 软件的优势5系统架构7监控实现方式: 8监控指标8规则引擎9一、 背景网站平台部署运行后会出现各种各样的故障, 比如服务器CPU负载高, 磁盘容量使用超过80%, 内存使用超过阈值, 系统进程多, tomcat服务宕机等问题都会给公司平台稳定和服务带来非常大的损失, 此时需要一个相对完整的监控体系能够24小时监控您的网站, 一旦网站发生异常, 会有报警提醒您, 如邮件, 微信, 电话, 短信, 及时避免流量损失。Zabbix
2、是一个企业级的开源分布式监控解决方案, 它是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。zabbix具备常见的商业监控软件所具备的功能( 主机的性能监控、 网络设备性能监控、 数据库性能监控、 FTP等通用协议监控、 多种告警方式、 详细的报表图表绘制) 支持自动发现网络设备和服务器; 支持分布式, 能集中展示、 管理分布式的监控点; 扩展性强, server提供通用接口, 能够自己开发完善各类监控。zabbix server能够经过SNMP, zabbix agent, ping, 端口监视等方法提供对远程服务器/网络状态的监视, 数据收集等功能, 它能够运
3、行在Linux, Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X等平台上。二、 目标物理范围: 组件: 硬件, OS, 存储, 中间件, 数据库, 机房, 网络等维度: 可用性, 性能。指标: 见下。监控的基本内容 性能数据 基本CPU, 磁盘, 网络, 内存等关系系统正常运行的基本指标。 端口状态 一般交换机或网络设备, 端口启动状态, 流量大小, 网络状态 日志内容 日志内容监控, 系统日志, 应用程序日志, 错误信息。 系统状态 DB , OS, 中间件等的系统状态 硬件状态 硬盘状态, 风扇, 电池, 内存, 主板等系统状态 机房状态 UPS
4、, 机柜电功率, 机房电功率, 机房温度, 湿度, 空气质量, 漏水, 消防, 人员出入, 机房门状态, 机柜门状态, 红外线, 图像, 防盗等 应用状态 程序启动时间, 网站访问速度等。三、 采用的软件软件名称: ZABBIX 4.0 LTS四、 软件的特点zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。zabbix能监视各种网络参数, 保证服务器系统的安全运营; 并提供柔软的报警机制以让系统管理员快速定位/解决存在的各种问题, 其真正的可扩展性, 高可用性, 易用性, 灵活性, 极大地降低了企业的总成本, 是当前最受欢迎的解决方案 五、 软件的优
5、势 1.企业级开源监控方案2. 各组件分离Zabbix由3部分构成, zabbix server, Web front, zabbix DB, Zabbix Proxy与可选组件zabbix agent。3 监控方式zabbix server能够经过SNMP, zabbix agent, ping, 端口监视等方法提供对远程服务器/网络状态的监视, 数据收集等功能, 它能够运行在Linux, Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X,W等agent 配置文件中, 根据要求编写脚本, 将定期执行该脚本获取指定的信息。格式: UserParamet
6、er=custom.updatescript,/etc/z平台上。4支持自定义监控Zabbix agent支持脚本监控, 只需要在abbix/zabbix_agentd/custom_updatescript5支持远程执行命令允许指定的server, 调用agent本机系统命令, 获取相关信息。6硬件配置信息采集 zabbix agent需要安装在被监视的目标服务器上, 它主要完成对硬件信息或与操作系统有关的内存, CPU等信息的收集。7丰富的可视化功能, 包括仪表盘, 自定义图表和网络拓扑功能8代理支持的系统版本zabbix agent能够运行在Linux ,Solaris, HP-UX,
7、AIX, Free BSD, Open BSD, OS X, Tru64/OSF1, Windows NT4.0, Windows / /XP/Vista)等系统之上。 9支持无代理监控方式Zabbix server 能够支持fping , 对网络通畅, 丢包率, 错误率, 重传等的监控10支持Web网站的自动登录测试能够支持对web网站的自动登录测试, 并对登录结果进行匹配和测试。11 核心功能zabbix server能够单独监视远程服务器的服务状态; 同时也能够与zabbix agent配合, 能够轮询zabbix agent主动接收监视数据( trapping方式) , 同时还可被动接
8、收zabbix agent发送的数据( trapping方式) 。 另外zabbix server还支持SNMP (v1,v2), 能够与SNMP软件(例如: net-snmp)等配合使用。 12 支持分布式监控Zabbix proxy 为分布式服务器的一种实现方式。Zabbix proxy 和zabbix server 同步config。Zabbix proxy 主动轮训zabbix agent, 将数据采集到zabbix proxy的数据库中, 将数据, zabbix proxy 使用一个进程将数据同步到zabbix sever上。如果发生proxy联系不到server , 将对在本地数据
9、库保持2天的数据, 网络联通或server能够通信后, proxy将对把数据重新传送到server。 准备采用的软件: zabbix 4.0 LTS系统架构监控实现方式: OS 安装Agent, zabbix server 设置监控配置项, 采集结果。 网络设备 经过SNMP, zabbix Server开启snmppoller进程轮询SNMP, 根据SNMP查询结果 存储设备 一般经过API方式, 没有API的, 采用登陆设备上, 返回命令采集结果, 对采集结果进行格式化。 数据库 一般为经过插件, 第二种为经过集中库, 对数据库进行读取。 硬件 经过IPMI方式, 获取相关硬件信息, 如风
10、扇, 温度, 电池, 硬盘, 内存插槽等硬件环境信息。 机房监控 经过API方式, 直接调用机房环境监控系统的数据。 中间件 经过JMX 监控, MQ 或其它的memo cache 经过编写脚本并格式化输出。 应用: 经过嵌入Jar包, 程序轮询, 将相关信息收集到本地, 然后推送到监控服务器上 业务: 经过将数据库中的数据采集, 查询发送给监控服务器。监控指标NumberTypeCase备注1CPULoad Average2CPU Utilization3MemoryMemory Utilization4Swap /pagfile Utilization5Network Transfer6N
11、etwork Error /Drop Packet7DiskFile System Utilization8Disk I/O9ServiceProcess Monitoring10Windows Service11TCP Port Connectivity12TCP Port Response Time13DNS Monitoring14NTP Monitoring15LogText Log16EventLog17FileFile Monitoring18OtherPerformance counter(windows)规则引擎1、 警报触发机制: 规则引擎, 查询zabbix 监控数据DB中的事件, 根据系统架构编写, 根据指标或触发器, 生成事件, 规则引擎对事件和系统的的负责人, 显示警报内容。2、 警报的校验: 对任何警报, 经过3种的间接方式验证, 如果在3个网段发生的事件进行校验, 如果发生两个重复的警报内容, 则触发警报。3、 警报的发送方式: 事件平台, 邮件, 微信, 电话和短信现阶段, 事件为统一平台 事件平台4、 警报推送方式: PUSH方式, 即根据CMDB中的系统的负责组的信息进行定位目标人群, 群组人员信息由负责人负责。