收藏 分销(赏)

ARMS 智能告警套件最佳实践.pdf

上传人:Stan****Shan 文档编号:1240238 上传时间:2024-04-19 格式:PDF 页数:16 大小:4.24MB
下载 相关 举报
ARMS 智能告警套件最佳实践.pdf_第1页
第1页 / 共16页
ARMS 智能告警套件最佳实践.pdf_第2页
第2页 / 共16页
ARMS 智能告警套件最佳实践.pdf_第3页
第3页 / 共16页
ARMS 智能告警套件最佳实践.pdf_第4页
第4页 / 共16页
ARMS 智能告警套件最佳实践.pdf_第5页
第5页 / 共16页
点击查看更多>>
资源描述

1、场景一:年轻有为的小A今天刚刚升职,开始负责他们公司最核心业务系统的稳定性保障任务。这个系统非常复杂,既有像CPU使用率、内存使用率等基础指标,又有像响应时间、调用量等业务指标,又因为它有很多Java写的应用,可能还需要关注一下JVM指标,林林总总几百个指标。有没有合适的工具,告诉小A应该对哪些指标配告警?场景二:小A请教资深运维工程师“稳哥”,“稳哥”根据他从业10年的经验,给小A划了下需要重点监控的十几个指标。小A非常开心,开始回去配告警。但是,小A填告警阈值的时候,发现“阈值设置得太松,有可能漏掉问题;阈值设置的太严,一天下来告警999+”小A又回去请教“稳哥”,“稳哥”表示阈值这个东西

2、,必须参考每个指标的历史表现来设置。而且现在公司的业务不断壮大,需要不断地调整阈值,他也没有办法给出了一组永远有效的阈值。有没有合适的工具,给小A推荐合适的阈值?场景三:小A经过长时间不断地调整阈值和试错,终于慢慢得到了一组还算靠谱的告警阈值。但是小A发现,有的指标天然起伏不定,无论用什么阈值都不大合适。比如他们公司的打车软件,每天上下班的时段,下单接口每分钟有1000+的调用量,如果低于这个阈值,需要及时告警。但是,在非高峰期的时段,甚至可能是每分钟调用量可能是0,都不需要告警。有没有合适的工具,帮助小A监控起伏不定的指标?监控指标推荐文档:https:/ 体验Demo链接:https:/

3、调用次数 调用错误次数 调用错误率 调用响应时间应用依赖服务统计 应用依赖服务调用响应时间 JVM FullGC次数 JVM YoungGC次数 JVM堆内使用内存量 JVM非堆总使用内存量 JVM超时等待线程数 数据库调用次数 数据库调用错误次数 数据库调用响应时间 核心线程数 最大线程数 活跃线程数 队列大小 当前线程数 已执行任务数 线程池使用率 节点机CPU使用率 节点机空闲磁盘 节点机系统负载 节点机空闲内存HTTPHTTP状态码异常 HTTP接口状态码4xx调用次数 HTTP接口状态码5xx调用次数异常监控 异常发生次数 异常接口调用响应时间告警指标筛选页面Demo:静态阈值推荐Demo:区间检测页面Demo:对AIOps感兴趣的同学可以加一下:预祝大家元旦快乐:)

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服