收藏 分销(赏)

zbixx运维监控管理平台使用综合手册NEW.doc

上传人:快乐****生活 文档编号:2998901 上传时间:2024-06-12 格式:DOC 页数:29 大小:2.49MB
下载 相关 举报
zbixx运维监控管理平台使用综合手册NEW.doc_第1页
第1页 / 共29页
zbixx运维监控管理平台使用综合手册NEW.doc_第2页
第2页 / 共29页
zbixx运维监控管理平台使用综合手册NEW.doc_第3页
第3页 / 共29页
zbixx运维监控管理平台使用综合手册NEW.doc_第4页
第4页 / 共29页
zbixx运维监控管理平台使用综合手册NEW.doc_第5页
第5页 / 共29页
点击查看更多>>
资源描述

1、xxxx运维监控管理平台操作手册V1.0xxxx(天津)科技变更统计 序号版本变更说明修改人/日期01V1.0新建张冠洲/1月目录1.平台介绍41.1概述41.2平台功效41.3优劣势42.安装布署52.1服务端环境准备52.2数据库准备52.3编译安装62.4配置文件及web前端文件修改62.5web前端安装配置62.6开启Server72.7在hosts上配置agent83.配置使用93.1添加 Hosts93.2添加 Items103.3添加 Triggers113.4添加 Actions113.5添加 Medias123.6添加 Users133.7添加 WEB Monitorings

2、133.8添加 Graphs163.9添加 Screens173.10添加 Maps183.11添加 SNMP监控193.12添加自定义监控193.13添加 Templates193.14添加Reports(定制报表)203.15添加Macros213.16添加自动发觉设备223.17添加Inventory223.18Export/Import XML223.19Maintenance(维护时间)231. 平台介绍1.1 概述xxxx运维监控管理平台依据本身业务需求进行开发以满足平台监控业务需要。平台经过C/S模式采集数据,经过B/S模式在web端展示和配置。被监控端:主机经过安装agent方

3、法采集数据,网络设备经过SNMP方法采集数据Server端:经过搜集SNMP和agent发送数据,写入MySQL数据库,再经过php+apache在web前端展示。平台运行条件:Server:Server端需运行在LAMP(Linux+Apache+Mysql+PHP)环境下,对硬件要求低Agent:现在已经有agent基础支持市面常见OS,包含Linux、HPUX、Solaris、Sun、windowsSNMP:支持各类常见网络设备1.2 平台功效含有常见商业监控软件所含有功效(主机性能监控、网络设备性能监控、数据库性能监控、FTP等通用协议监控、多个告警方法、具体报表图绘制)支持自动发觉网

4、络设备和服务器支持分布式,能集中展示、管理分布式监控点扩展性强,server提供通用接口,能够自己开发完善各类监控2. 安装布署2.1 服务端环境准备平台Server端需要运行在CentOS、RedHat Linux、Debain等Linux平台上,这里以RHEL AS5作为布署环境。Root用户安装必需包,提议配置好yum,经过yum安装下列包,处理包依靠关系。LAMP环境#yum install mysql-server httpd php其它需要用到包:#yum install mysql-devel gcc net-snmp-devel curl-devel perl-DBI php-

5、gd php-mysql php-bcmath php-mbstring php-xml解压#tar zxvf ethane-1.8.1.tar.gz增加用户和组#groupadd ethane#useradd g ethane m ethane2.2 数据库准备开启MySQL数据库:#service mysqld start修改MySQL root用户密码(默认密码为空)#mysqladmin uroot password root测试能否正常登陆数据库#mysql uroot proot创建平台数据库Mysql create database ethane character set ut

6、f8;Mysql grant all on ethane.* TO ethanelocalhost identified by ethanepass; Mysql flush privileges;导入数据库sql脚本#cd ethane-1.8.1# cat ./create/schema/mysql.sql |mysql -uroot proot ethane # cat ./create/data/data.sql |mysql -uroot -proot ethane # cat ./create/data/images_mysql.sql |mysql -uroot -proot e

7、thane 2.3 编译安装配置编译,prefix是安装后程序目录# ./configure -with-mysql -with-net-snmp -with-libcurl -enable-server -enable-agent -enable-proxy -prefix=/usr/local/ethane# ./configure -with-mysql=/usr/local/mysql/bin/mysql_config -with-net-snmp -with-libcurl -enable-server -enable-agent -enable-proxy -prefix=/usr

8、/local/ethane/mysql编译安装# make# make install2.4 配置文件及web前端文件修改添加服务端口,添加后以下# grep ethane /etc/servicesethane-agent 10050/tcp# Ethane Agentethane-agent 10050/udp# Ethane Agentethane-trapper 10051/tcp# Ethane Trapperethane-trapper 10051/udp# Ethane Trapper添加配置文件# mkdir -p /etc/ethane# cp ./misc/conf/* /

9、etc/ethane# chown -R ethane:ethane /etc/ethane修改Server配置文件基础不用修改,用默认配置即可,只需修改一项DBPassword=密码# vi /etc/ethane/ethane_server.conf修改Agentd配置文件,更改HOST NAME 为本机hostname就好了#vi /etc/ethane/ethane_agentd.conf添加web前端php文件# cd frontends/# cp -rf php /var/www/html/# cd /var/www/html# mv php ethane# chown -R et

10、hane:ethane ethane2.5 web前端安装配置修改php相关参数# vi /etc/php.ini 找到以下几项,改成下面值,前面有;号要删掉max_execution_time = 300max_input_time=300memory_limit = 128Mdate.timezone = Asia/Shanghaipost_max_size = 32Mmbstring.func_overload = 2重启apache#service httpd restart在当地浏览器上访问Serve地址开始web前端配置,http:/ServerIP/ethane按提醒一步步nex

11、t,其中Step 3 Check of pre-requisites 必需全部项目OK后才能继续配置,如有提醒fail,去server上检验是否安装这个包或配置是否按上述更改。图 1Step 4 填入Server 登陆mysql用户和密码Step 7 按提醒下载配置文件到Server/var/www/html/ethane/conf下,名字一定要是ethane.conf.php配置完成后,出现登陆界面,默认用户为:admin,密码为:ethane2.6 开启Server安装完成后server程序在/usr/local/ethane/sbin/目录下,能够直接开启#/usr/local/etha

12、ne/sbin/ethane_server为了便于启停Server,我们做部分小配置复制控制程序# cp ./misc/init.d/redhat/ethane_* /etc/init.d/修改配置目录,将以下两个文件中BASEDIR=改为/usr/local/ethane, 下面两个配置中bin改为sbin,ETHANE_AGENTD,ETHANE_SUCKERD # vi /etc/init.d/ethane_server_ctl# vi /etc/init.d/ethane_agentd_ctl加入开机开启# echo /etc/init.d/ethane_server_ctl star

13、t & /etc/rc.local# echo /etc/init.d/ethane_agentd_ctl start & /etc/rc.local创建快键方法# ln -s /etc/init.d/ethane_server_ctl /usr/bin/ethane_server_ctl# ln -s /etc/init.d/ethane_agentd_ctl /usr/bin/ethane_agentd_ctl开启Server和Agentd(能够经过start stop restart来操作)# ethane_agentd_ctl start# ethane_server_ctl star

14、t检验开启是否正常,查看进程是否起来,分server和agentd#ps ef | grep ethane假如进程没起来,能够查看对应日志错误,默认在/tmp/ethane-*.log至此平台 Server端安装已完成2.7 在hosts上配置agent平台需要在被监控host上安装agent,把对应平台agent包布署到各被监控端,按以下方法在被监控上运行agent。Linux、UX:Linux、UX上agent是编译好了,不用安装#useradd ethane #cd /usr/local/ethane#tar zxvf ethane_agents_1.8.linux2_6.i386.ta

15、r.gz取一份server上ethane_agentd.conf到当地,然后按说明修改,通常我们只需修改以下5个参数:Server=Ethane Server IPHostname=本机名LogFile=本机agentd日志保留文件SourceIP=本机IPListenPort=10050修改完成后,运行agentd#/usr/local/ethane/sbin/ethane_agentd -c /usr/local/ethane/ethane_agentd.conf &#ps ef | grep ethane_agentd假如进程没起来,可查看agentd.log日志来排查问题。(注:开启时

16、提议用全路径,不然可能会犯错)加入开机运行# echo /usr/local/ethane/sbin/ethane_agentd -c /usr/local/ethane/ethane_agentd.conf & /etc/rc.localWindows:Windows下解压用户端包到c:,下载修改好ethane_agentd.conf文件也放到c:,打开cmd命令行,实施C:ethane_agentd install安装后会在平台服务里添加一个ethane_agentd服务,会自动开机运行假如需要将用户端和配置文件放在其它目录,请实施C:DIR/ethane_agentd c DIR/eth

17、ane_agentd.conf install 开启agentd服务C:ethane_agentd start或是经过管理-服务找到ethane_agentd来开启3. 配置使用经过当地浏览器访问来开始配置和使用平台。使用平台进行监控之前,要了解监控步骤。一次完整监控步骤能够简单描述为:Host Groups(设备组)-Hosts(设备)-Applications(监控项组)-Items(监控项)-Triggers(触发器)-Actions(告警动作)-Medias(告警方法)-User Groups(用户组)-Users(用户)3.1 添加 HostsHost是平台监控基础载体,全部监控项全

18、部是基于host。经过Configuration-Hosts-Create Host来创建监控设备图 2按提醒填入Name、Groups、IP ,其它选项默认即可,Link Templates 处选择一个模板,save即可成功添加设备。(注:假如host上没安装agent,添加后状态会是unmonitor,会采集不到值,平台自带大量设备监控模板,我们添加主机时经过link到这些模板,就能够快速添加主机监控项和告警触发条件)。一类hosts能够归属到同一个Host Group,便于分类管理同一类设备,在Configuration-Host Group-Create Host Group 能够添加

19、设备组。3.2 添加 ItemsItem是监控项,是监控基础元素,每一个监控项对应一个被监控端采集值。在Configuration-Hosts界面,我们能看到每个host所包含items总数,点击对应主机items项,能够看到具体每个item信息,这些items能够引用自templates,也能够自己创建。图 3经过点击具体item名字能够修改已经有监控项属性,点击Satus链接能够禁用/启用这个监控项。(注:我们能够经过新建一个template,在template中禁用掉全部不需要用到items,然后把同一类hosts link to这个template,就不用一台台主机去更改items)新

20、增item能够经过点击右上角create item来创建图 4 按提醒逐项填入相关信息即可,其中key是平台已经自带取值方法,Application类似于host groups,是item组。(item key也能够自定义,后面会讲到怎样自定义监控项)平台自带很多监控采集项及方法,基础能满足目前全部监控功效,这些全部包含在item item key中了。3.3 添加 TriggersTrigger是触发器,当Items采集值满足triggers触发条件时,就会产生actions。每一个trigger必需对应一个item,但一个item能够对应多个trigger。一样,经过点击Configura

21、tion-Hosts-Triggers中某个trigger名字,能够修改trigger属性。(注意:引用自templatetrigger触发值是不能单独修改,必需在template中修改,或是复制一个一样trigger再修改,然后禁用掉之前)新增trigger能够经过点击右上角create trigger来创建图 5Expression中选择对应item、触发方法及触发值,Severity是告警等级,依据trigger严重性来选择。平台提供多个trigger触发方法供选择,常见我们能够选择last value /=/#/N(最近一次采集值),或是选择maximal value for peri

22、od of time (一段时间内最大值),等等。能够依据实际需要来设定触发方法。3.4 添加 ActionsAction是告警动作,当触发器条件被满足时,就会实施指定action。经过Configuration-Actions-Create Action来创建Action图 6Event source:起源triggers,即全部triggers条件满足时全部会实施这个actionDiscovery:自动发觉模块Auto registration:事件产生统计Escalations:告警是否升级,及升级时间Subject、Message:告警标题和内容 ,此处可引用平台宏变量;比如 HOST

23、NAME:TRIGGER.KEY.last(0)表示最终一次采集值。Recovery Message:告警恢复信息,不勾选平台会用默认,勾选后自定义Conditions:trigger产生条件,条件能够多选Operation:选择media 及user3.5 添加 MediasMedia,即告警方法,平台能够提供四类Media:Email/SMS/Jabber/Script,经过Administrator-Media Type来修改或新增告警方法Email方法最常见,填入相关SMTP信息,即可经过邮件方法发送告警。图 7SMS方法要在server主机上接入短信modem。Jabber方法是一个

24、linux下即时通讯工具,经过Jabber发送即时消息。Script方法能够经过自己编写程序或脚本方法发送告警信息。3.6 添加 Users在Administrator-Users 能够添加用户和用户组经过User Group能够限制用户权限,ethane自带用户组权限限制基础能满足我们要求。创建用户时能够依据用户不一样作用划分到不一样组,media中填入告警接收地址及告警接收时间等信息。图 83.7 添加 WEB MonitoringsWeb Monitoring是用来监控web程序,能够监控到web程序下载速度、返回码及响应时间,还支持把一组连续web动作作为一个整体来监控。下面我们以监控

25、登陆平台web程序为例,来展示怎样使用web monitoring。Configuration-web-Create Scenario 创建一个Scenario(注:必需选择host后才能创建scenario,平台全部items全部必需创建在hosts上)图 9Application:选择这个scenario所在application组Name:scenario名字Basic authentication:鉴权Update interval:监控频率,s为单位Agent:选择要使用浏览器用户端,可能一样web程序对不一样用户端展示内容会不一样Status:默认为activeVariables:

26、变量定义,这里定义变量可在后续steps中使用,这里我们定义了用户和密码变量Steps:web 程序各个步骤,选择add新增一个Loginstep,来模拟用户登陆,传输用户和密码给index.php页面图 10URL:监控web页面(注:必需是全路径带页面名)Post:传输给页面参数,多个参数之间用&连接,此处可引用前面定义变量Timeout:超时时间Required:页面中能匹配到字符,匹配不到即认为错误Status codes:页面返回码添加完step后,我们在Monitoring-web页面即能看到监控状态和图示图 11创建完scenario后,平台 server会自动创建相关items

27、,所以我们只需为这些items添加triggers即可让web scenario犯错时产生告警Configuration-hosts-点击scenario所在host条目标trigger,直接create trigger,在select items时候就能够看到平台自动创建items(注:自动创建items在hostitems列表中直接是看不到,需要在创建trigger时选择items时才能看到)图 12能够在items列表中看到,平台为每个step创建了3个item,Download Speed/Response Code/Response Time,为整个scenario创建了一个test

28、.failitem,能够分别为其创建trigger下例我们创建一个Login页面返回码trigger,大于等于400即为错误图 13再创建一个整个scenario全部step运行是否成功trigger,采集值为0表示整个scenario全部step全部实施成功了,第几步step实施失败就返回数字几,且后续step全部不会继续实施下去。图 14这么,一个完整web monitoring就配置完成了。Web monitoring还有更多强大功效,未能一一研究了解,有待挖掘3.8 添加 Graphs平台Graphs功效很强大,能够为每一个item绘制图,也能够把多个items绘制在一张图内。经过co

29、nfiguration-hosts选择要绘制图host,点击graphs,create graphs即可创建图。图 15Graph type:图样式,有线状、柱状、饼状还能够自定义图大小,及Y轴最大最小值经过add items能够添加在同一个图中展示多个items(注:注意每个item颜色及取值范围,范围相差太大图会显示不全)配置好graphs在monitoring-graphs中查看在monitoring-last data下能快速查看每个host每个itemgraph3.9 添加 ScreensScreen将多个信息放在一起展示,便于集中展示某个host多个信息,或是比较多个hosts同一

30、个信息,这些信息能够为graphs、maps、server infos等等,几乎涵盖平台全部监控信息。经过configuration-screen-creat screen来创建,创建时定义screen行数和列数,点击对应单元格内change,添加对应信息图 16经过monitoring-screen,能够查看之前配置好信息。3.10 添加 Maps这里能够添加相关主机拓扑图:configration-maps,在右上角能够create maps或import map这里我们点击crate maps 点save保留。图 17然后编辑保留好maps图 18上面加号和减号能够增加主机 link说明

31、主机连接情况,能够进行自定义。图 193.11 添加 SNMP监控snmp监控要在configration 中hosts中添加相关主机模板和snmp版本,通常见snmp监控网络设备就能够了。平台对server监控通常是用agent来做,所以不提供snmp对server监控,这一点和cacit有本质区分,因为cacti关键是经过snmp对主机和网络设备进行监控。图 203.12 添加自定义监控对于平台功效上无法实现监控,能够经过自己编写程序或脚原来辅助完成,并将脚本结果经过agent递交给server统一管理,一样能够绘制graph 报表等。3.13 添加 Templates假如有大量同一类设备

32、,需要监控信息也大致类似,一个个去修改相关参数比较麻烦,我们能够经过创建一个template来简化操作。Configuration-Host Groups-Template-Create Template图 21创建template后,在configuration-host-template下找到刚创建MyLinuxTemplate,修改相关items、triggers、graphs等信息,使满足要求后link到相关host即可。3.14 添加Reports(定制报表)平台中相关报表功效有三项:Status of ethane:这是相关整个监控平台图 22Avaliability report

33、:整个平台可用平台报表提供过滤功效。图 23Most busy triggers top 100:提供最常见triggers 预览:Bar report :可定制报表能够报多个报表整合到一起。以下图是对test1 serverfree memory和swap free每小时报表:图 243.15 添加MacrosMacros指宏变量,定义宏变量能够在trigger、actions等多个场景中引用。Macros分平台自带全局宏及自定义宏。引用macros例子可参考上述action中添加Hostname:trigger.key.last(0)例子。平台还支持自定义macros,在添加host或是t

34、emplate时,我们能够在macros项中定义好后续要用到宏变量,格式为:macroname=macrovalue自定义宏变量及平台自带宏变量全部能够在场景中引用,在碰到引用宏变量时,会先查找目前场景中定义宏,接着查找目前host自定义宏,接着查找linktemplate宏,最终查找平台自带全局宏。所以在自定义宏时注意宏引用次序。3.16 添加自动发觉设备经过平台相关设置,能够自动添加设备,能够更友好维护和添加相关设备。3.17 添加InventoryInventory 用来管理设备存档信息。在添加host时,勾选右侧Use profile,我们即可填入该台设备型号、编码、MAC地址等具体信

35、息,勾选Use extended profile则能够填入更具体信息。图 25填写inventory信息在inventory-hosts下能看到.能够替换OCS部分功效。3.18 Export/Import XML平台提供将全部配置导出为标准XML格式文件,一样,也支持导入标准格式XML配置文件。经过configuration-Export/Import-Export,勾选要导出host,Preview能够展示要导出host具体配置,选择export即可导出xml文件到当地。图 26Import可导入当地XML文件,注意格式一定要符合标准要求,假如server上有同名配置,会被覆盖掉。假如有大

36、量配置需要手动新增,譬如新增oralce监控,我们能够手动编写xml,一次导入全部items和triggers,但要注意格式,可自己导出一个配置后参考。3.19 Maintenance(维护时间)这一点和NagiosSchedule downtime for this host差不多,在Nagios中能够设置在downtime不需要告警,不过本平台设置愈加具体和可管理。图 27上图是Nagiosdowntime设置,能够看出比较简单。图 28在Maintenance中能够添加一个维护名字,在Maintenance type中能够设置no data collection选择该选项以后数据不在从agent端搜集,也就是说不会产生tigger,这个和nagios downtime一样在该阶段全部不会有告警信息,还有一个选项是with time data 搜集相关数据,应该也不会产生告警信息(没有试验,验证)。在下面Active since 和Active till 能够选择开始和结束时间,Description添加该维护时间相关描述。下面Maintenance是愈加具体时间设置,即维护周期时间类型,one time onle daily(天天) 每七天,每个月等开始日期时间长度等设置。图 29 选择维护server或 groups.

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服