收藏 分销(赏)

2022年中国AIOps现状调查报告.pdf

上传人:Stan****Shan 文档编号:1287622 上传时间:2024-04-22 格式:PDF 页数:68 大小:4.12MB
下载 相关 举报
2022年中国AIOps现状调查报告.pdf_第1页
第1页 / 共68页
2022年中国AIOps现状调查报告.pdf_第2页
第2页 / 共68页
2022年中国AIOps现状调查报告.pdf_第3页
第3页 / 共68页
2022年中国AIOps现状调查报告.pdf_第4页
第4页 / 共68页
2022年中国AIOps现状调查报告.pdf_第5页
第5页 / 共68页
点击查看更多>>
资源描述

1、中国 AIOps 现状调查报告(2022 年)中国 AIOps 现状调查报告(2022 年)2022 年 7 月 28 日中国 AIOps 现状调查报告(2022 年)2 报告目录 前言.3 核心观点摘要.6 一、调查背景.9(一)调查方法及样本.9 1、调查方法.9 2、样本描述.9 3、样本说明.12(二)报告术语界定.13 二、AIOps 发展现状.14(一)AIOps 能力建设基本情况.14(二)AIOps 场景应用情况.29(三)AIOps 发展趋势与挑战.37 三、AIOps 实践案例.40(一)运营商篇.40(二)银行证券篇.49(三)服务提供商篇.63 中国 AIOps 现状调

2、查报告(2022 年)3 前言 随着互联网与信息技术的快速发展、企业数字化转型、以及在大数据、云计算、人工智能等新技术的加持下,近年来,智能运维正成为企业高效管控种类繁多数量庞大的物理设备、精准定位故障信息、实时防护网络攻击、快速迭代需求变更等新时代运维场景下不可或缺的科技力量和解决方案。国务院关于印发“十四五”数字经济发展规划的通知中指出,数据的爆发增长为智能化发展带来了新的机遇。加快推动智能化应用建设,促进各环节智能化升级,提升基础设施网络化、智能化、服务化、协同化水平,加快优化智能化产品和服务运营。产业数字化的经营理念在各行业持续渗透,激励着越来越多的企业提升信息化建设的战略地位、增加数

3、字化投入,这也将进一步突出 IT 运维对于企业管理和业务创新的重要意义。为进一步了解中国 AIOps 产业发展现状,梳理中国 AIOps 产业发展脉络,云计算开源产业联盟开展了 2022 年度 AIOps 现状调查。问卷以中国信息通信研究院牵头编制的智能化运维(AIOps)能力成熟度模型系列标准为参考,聚焦中国 AIOps 能力建设成熟度现状,对 AIOps 产业发展现状、未来 AIOps 发展趋势、企业当前面临的困难与挑战等情况进行了调查,共收回有效问卷 1807 份。本报告以调查结果为基础,结合行业专家的深度访谈、研讨,力争详实客观地反映企业对 AIOps 落地实践的需求,为广大关注 AI

4、Ops 的从业人员、专家学者和研究机构提供真实可信的数据支撑。本次调查由中国信息通信研究院联合近 60 家企业共同发起,包括中国工商银行、中国农业银行、建信金科、浦发银行、平安银行、交通银行太平洋信用卡中心、华泰证券、安信证券、深圳证券通信有限公司、中国联通软件研究院、中国移动集团、中国铁塔、腾讯、阿里巴巴集团、阿里云、蚂蚁集团、京东科技、华为云、苏宁消费金融、亚信科技、浪潮云、博睿数据、广通优云、宇信科技、擎创科技、必示科技、浩鲸科技、IBM、BMC 中国公司、戴中国 AIOps 现状调查报告(2022 年)4 尔科技集团、爱数、润建股份、北京华佑科技、新炬网络、东软集团、金蝶天燕、云杉网络

5、、华青融天、紫羚云、思特奇、宝兰德、绿盟科技、北京基调网络、西骏数据、鼎茂科技、嘉为科技、普元信息、LinkedSee 灵犀、星汉未来、烽火通信、金山云、创新奇智、同创永益、上海叠念、金现代、日志易、云新信息、高效运维社区、dbaplus 社群等,各地 AIOps 实践企业和社会各界也给予了大力支持,在此,谨表示最衷心的感谢!同时也对参与中国 AIOps现状调查访问的企业朋友表示最诚挚的谢意!云计算开源产业联盟 2022 年 7 月 中国 AIOps 现状调查报告(2022 年)5 参与编写单位:中国信息通信研究院、中国工商银行、中国农业银行、建信金科、浦发银行、平安银行、交通银行太平洋信用卡

6、中心、华泰证券、安信证券、深圳证券通信有限公司、中国联通软件研究院、中国移动集团、中国铁塔、腾讯、阿里巴巴集团、阿里云、蚂蚁集团、京东科技、华为云、苏宁消费金融、亚信科技、浪潮云、博睿数据、广通优云、宇信科技、擎创科技、必示科技、浩鲸科技、IBM、BMC 中国公司、戴尔科技集团、爱数、润建股份、北京华佑科技、新炬网络、东软集团、金蝶天燕、云杉网络、华青融天、紫羚云、思特奇、宝兰德、绿盟科技、北京基调网络、西骏数据、鼎茂科技、嘉为科技、普元信息、LinkedSee 灵犀、星汉未来、烽火通信、金山云、创新奇智、同创永益、上海叠念、金现代、日志易、云新信息、高效运维社区、dbaplus 社群。参与编

7、写人员:杨玲玲、牛晓玲、尚梦宸、白瀚雄、刘凯铃、刘昭炜、任政、耿鹏、马琳、陈俊、金艳、洪磊、周东杰、权宁升、曹家豪、盘隆、董善东、张颖莹、王月凡、张宪波、蔡小刚、顾黄亮、李红霞、张永皋、孙光涛、李骅宸、任志强、葛晓波、曹立、赵成栋、刘渝、李康、胡永乐、陈刚、梁铭图、罗先桥、李飞、包彤、刘玉节、刘亚军、张润滋、徐国忠、何亮亮、何永进、胡忠想、吴伟峰、李庆焐、李启明、董彦广、黄国标。中国 AIOps 现状调查报告(2022 年)6 核心观点摘要 AIOps 能力建设基本情况 多数企业近年来在运维方面的资金投入仍处于增长阶段。近 4 成企业运维方面年平均投资规模超 5000 万元,投资规模在 500

8、0 万元-1 亿元的企业占比 11.24%,1 亿元-5 亿元的企业占比 13.45%。超半数企业在实现自动化运维、自动化部署的基础上进一步增强监控、运维智能化能力。根据本次调查显示,61.21%的企业选择优先关注和投资 DevOps 自动化部署,52%的企业选择优先关注和投资升级监控和 AIOps。以结果为导向的 IT 运维 KPI 指标是当前企业关注的重点,企业对于用户体验的关注正在持续升温。根据本次调查显示,60.04%的企业最关注“可用性、正常运行时间和性能”指标。用户满意度也获得了 44.66%的关注,这反应了企业对于用户体验的持续升温。智能运维已经在各行业逐步落地应用,特别是在科技

9、、互联网、金融、电信几大领域应用效果十分显著。根据本次调查结果,科技和互联网行业受访者所在企业表示已建立了智能运维平台并形成了相关评价体系分别占比 49.64%和 37.96%,其次是银行占比 28.99%和电信企业占比 25.97%。内外双修,智能运维系统/工具/平台既可用于增强企业自身运维能力,同时也可以对外输出产品能力。根据调查显示,企业的智能运维系统/工具/平台同时具备行业特性,如 48.29%的科技公司和 43.64%的互联网企业,主要对外提供智能运维产品及解决方案,50.36%的金融企业则更多面向内部使用。超半数企业以自主研发的方式建设 AIOps 能力。根据本次调查结果,超过半数

10、(57.83%)的受访者所在团队主要以自研的方式搭建智能运维平台/工具,22.98%的受访者所在团队中国 AIOps 现状调查报告(2022 年)7 采用共研方式搭建智能运维平台/工具,另外还有 19.20%的受访者所在团队选择采购第三方解决方案搭建智能运维平台/工具。多数企业内部组建了专职团队负责 AIOps 能力建设。根据本次调查结果,25.84%的受访者所在企业组建了专职团队/部门负责智能运维能力建设,此外还有由多个团队/部门联合组建(13.17%),各团队/部门分别建设(13.06%)和联合第三方厂商/外包组建(12.45%)等多种团队模式。将现有监控平台、大数据平台等多种数据源接入智

11、能运维工具/平台,进行多场景数据融合是当前比较常用的智能运维实践方式。目前近一半(46.21%)的企业采用数据接入方式,同时还有 37.85%的企业智能运维工具/平台具备数据采集能力。持续完善数据能力,搭建计算分析引擎,进行数据分析和模型构建是智能运维能力中不可或缺的一部分。根据本次调查结果统计,目前 76.93%的受访者所在企业均已搭建了计算能力引擎,主要以自研(36.86%)和采用第三方提供(40.07%)两种方式为主。AIOps 场景应用情况 AIOps 仍处于初期发展阶段,受访者对目前 AIOps 能力水平的评价与期望超过其所在企业实际应用的情况。从整体来看,30.27%的企业自评目前

12、处于辅助智能化运维阶段,28.61%的企业自评处于进阶智能化运维阶段。智能运维在质量、成本、效率、安全四大运维领域均已开展部署和应用,其中质量领域最为关注。调查显示,54.79%的企业当前着重关注智能运维的质量领域(包括异常检测、告警收敛、根因分析、故障处置等)能力建设,其次 45.77%的企业关注效率领域,45.49%的企业关注成本领域,30.82%的企业关注安全领域。中国 AIOps 现状调查报告(2022 年)8 大部分企业在数据分析和算法模型分析方面已经逐步开始场景探索。并且已有 15.61%和11.07%的受访者所在企业将数据分析方法和算法模型应用与大部分业务场景。通过使用智能运维算

13、法,可快速提升运维智能化、自动化水平,大幅降低故障平均检测时间,加速平均修复时长。通过调查发现,目前已经有 11.95%的企业核心系统故障服务恢复时长可以达到 10 分钟内的水平,11.23%的企业已经达到 15 分钟内完成系统故障恢复。AIOps 发展趋势与挑战 多数企业领导层已经对智能运维能力建设加以重视并付诸行动,但在智能运维的建设过程中仍有诸多困难与挑战。根据调查统计,目前遇到的困难和挑战主要在不同运维场景中的实践探索中产生的,比如“能力定制化,难以跨业务应用或泛化成本高”(35.81%),“场景有限,大量运维场景没有成熟的方案”(33.98%),“新场景建设周期长”(30.71%)。

14、需求驱动能力升级,除普遍关注的质量场景,安全场景成为更多企业未来关注和提升的方向。根据本次调查结果,质量场景仍然是主要提升方向。36.75%的企业在未来将提升故障的根因定位效率,32.82%的企业将会提升故障修复速度,31.82%的企业将完善故障预测能力以及 23.52%的企业将会建立故障处理流程规范。安全场景得到更多的关注,40.79%的企业将加强对安全事件的快速响应以及相应的防范措施的建设。未来趋势:加强人员与技术方面投入,持续探索智能运维场景,持续优化现有场景能力,提升稳定性,易用性。47.76%的企业将在目前已有的智能运维场景中继续优化改进,提升效果。44.71%的企业将在易用性、可用

15、性、稳定性等方面持续改进。中国 AIOps 现状调查报告(2022 年)9 一、调查背景(一)调查方法及样本 1、调查方法 本次调查报告采用在线问卷调查方式,共收集到有效问卷 1807 份。2、样本描述 参与调查企业所在行业:包括互联网、科技、电信、银行、能源、证券、教育、咨询与服务、零售等行业。数据来源:中国信息通信研究院 图图 1 1 行业分布行业分布 中国 AIOps 现状调查报告(2022 年)10 参与调查企业规模:人员规模在 500 人以上的企业占比接近六成。近四成的受访企业资产规模在 1 亿元以上。数据来源:中国信息通信研究院 图图 2 2 企业人员规模企业人员规模 数据来源:中

16、国信息通信研究院 图图 3 3 企业资产规模企业资产规模 中国 AIOps 现状调查报告(2022 年)11 参与调查人员地域分布:覆盖全国 31 个省级行政区近 90 个城市。数据来源:中国信息通信研究院 图图 4 4 个人地域分布个人地域分布 参与调查个人职位:超过 5 成的受访者来自运维与研发部门,其中 28.33%的受访者来自运维部门,28.22%的受访者来自研发部门,12.68%的受访者来自技术及架构相关部门。数据来源:中国信息通信研究院 图图 5 5 个人职业分布个人职业分布 参与调查个人工作经验:超过半数的受访者工作经验在 4 年以上,工作经验为 6 至 10中国 AIOps 现

17、状调查报告(2022 年)12 年的受访者居多,5.31%的受访者工作经验超过 20 年。数据来源:中国信息通信研究院 图图 6 6 个人工作经验个人工作经验 3、样本说明 序号 N 值 说明 1 N=1807 样本总量 中国 AIOps 现状调查报告(2022 年)13(二)报告术语界定智能运维概念:智能运维(AIOps)是将大数据,AI 机器学习和其他技术相结合,通过主动,个性化和动态的洞察力,用以增强和辅助主要的 IT 运维工作,是企业级 DevOps 在运维(技术运营)侧的高阶实现。智能运维系统/工具:具备数据处理、智能计算能力,采用智能化方法解决某种运维场景问题(如质量域下的异常检测

18、场景等,成本域的资源优化场景等)。智能运维平台:具备数据处理、智能计算能力并且能力已覆盖了多个传统运维领域(质量、成本、效率、安全)场景的智能运维系统/工具。中国 AIOps 现状调查报告(2022 年)14 二、AIOps 发展现状(一)AIOps 能力建设基本情况 在当前数字化转型的浪潮下,企业 IT 运维方面的投资规模将逐步增加,IT 运维的关注方向也将逐步从自动化运维向智能化运维发展。伴随着企业规模扩大,业务模式更新,以及云计算、大数据、人工智能等新技术应用,智能运维能力已在科技、互联网、金融、电信等行业逐步落地应用,并呈现出多样化的发展趋势。近三年中,近 4 成企业在运维方面年平均投

19、资规模超 5000 万元,此外投资规模在 2000-5000 万元的受访者所在企业占比 12.74%,500-2000 万元占比 18.55%,100-500 万元占比 21.26%,100 万元以下占比 13.88%。数据来源:中国信息通信研究院 图图 7 7 企业运维年平均资金投入规模(企业运维年平均资金投入规模(20192019-20212021)中国 AIOps 现状调查报告(2022 年)15 在实现自动化运维、自动化部署的基础上进一步增强监控、运维智能化能力。根据本次调查显示 DevOps 自动化部署(61.21%)、升级监控和 AIOps(52%)是大部分企业的优先关注和投资的方

20、向。数据汇总来看,提升系统自动化部署能力,实现基础架构代码化、测试自动化等是企业当前投资的重点方向。另外可观测性、SRE 等时下热点也成为企业的投资方向和选择。数据来源:中国信息通信研究院 图图 8 8 企业在技术投资时优先考虑的企业在技术投资时优先考虑的 ITIT 运营指标运营指标 中国 AIOps 现状调查报告(2022 年)16 企业 IT 运营首要目标是减少故障发生次数,提高故障修复效率,以保证系统高效稳定运行,并进一步降低运营成本。根据调查结果显示,60.04%的受访者所在企业最关注“可用性、正常运行时间和性能”指标,同时有 46.60%和 44.66%的企业关注“发生故障/事件的数

21、量”与“用户满意度”,40.29%的企业关注“MTTR(平均恢复时间)”,此外 28.33%的企业将“IT 运营成本”也纳入了运营关注指标。数据来源:中国信息通信研究院 图图 9 9 企业企业 I IT T 运营关注指标运营关注指标 中国 AIOps 现状调查报告(2022 年)17 智能运维已在各行业逐步落地应用,特别是在科技、互联网、金融、电信几大领域应用效果十分显著,根据本次调查结果,科技和互联网行业受访者所在企业表示已建立了智能运维平台并形成了相关评价体系分别占比 49.64%和 37.96%,其次是银行和电信企业(28.99%和 25.97%)。数据来源:中国信息通信研究院 图图 1

22、010 企业智能运维能力建设情况企业智能运维能力建设情况 中国 AIOps 现状调查报告(2022 年)18 内外双修,智能运维系统/工具/平台既可用于增强企业自身运维能力,同时也可以对外输出产品能力。根据调查显示,企业的智能运维系统/工具/平台同时具备行业特性,如科技和互联网企业,主要对外提供智能运维产品及解决方案(48.29%和 43.64%),金融行业则更多面向内部使用(50.36%),电信行业相对较为均衡,面向内部使用,同时也对外提供产品及解决方案(51.80%)。数据来源:中国信息通信研究院 图图 1111 智能运维系统智能运维系统/工具工具/平台提供服务类型平台提供服务类型 中国

23、AIOps 现状调查报告(2022 年)19 超半数企业以自主研发的方式建设AIOps能力。根据本次调查结果,超过半数(57.83%)的受访者所在团队主要以自研的方式搭建智能运维平台/工具,22.98%的受访者所在团队采用共研方式搭建智能运维平台/工具,另外还有 19.20%的受访者所在团队选择采购第三方解决方案搭建智能运维平台/工具。数据来源:中国信息通信研究院 图图 1212 团队搭建智能运维平台团队搭建智能运维平台/工具工具的方式的方式 中国 AIOps 现状调查报告(2022 年)20 多数企业内部组建了专职团队负责 AIOps 能力建设。根据本次调查结果,25.84%的受访者所在企业

24、组建了专职团队/部门负责智能运维能力建设,此外还有由多个团队/部门联合组建(13.17%),各团队/部门分别建设(13.06%)和联合第三方厂商/外包组建(12.45%)等多种团队模式,共研(19.81%)或者采购第三方服务的形式(16.55%)搭建智能运维平台/工具。数据来源:中国信息通信研究院 图图 1313 企业企业智能运维能力建设智能运维能力建设组建团队组建团队/部门部门情况情况 中国 AIOps 现状调查报告(2022 年)21 智能运维解决方案丰富而多样,反映了市场的创新活跃性和多元化发展。本次调查统计了目前中国市场已有的智能运维解决方案提供商(数据仅根据问卷调查结果统计,不涉及市

25、场份额情况,仅供参考):智能运维解决方案提供商 新炬网络 ZnAiops 智能运维管理平台 腾讯蓝鲸智云 BMC Helix 数字化服务智能运营平台 阿里云 AIOps 智能监控解决方案 亚信全域智能运维平台 AISWare AIOps 华为云 AOM 浪潮云云泽智能运营平台 西骏数据 MC-Stack 统一运营管理平台 擎创夏洛克 AIOps 智慧运营平台 必示智能运维平台 博睿数据智能运维算法能力平台 Swift AI 建信金科孔明产品 紫羚一体化智能移动 IT 运营管理平台 宝兰德 Opslink AIOps 解决方案 云杉网络 DeepFlow 云原生可观测性平台 百度智能运维平台 日

26、志易智能日志中心 广通优云智能运维管理平台 AIOps 中国 AIOps 现状调查报告(2022 年)22 华青融天鹰眼 EZSonar 业务监控系统 浩鲸 WhaleDI IntelliOps 智能运维平台 IBM Watson AIOps 解决方案 听云北冥 LinkedAIOps 根因分析 爱数 AnyRobot Family 3 基于机器数据的场景化运维平台 鼎茂科技 AIOps 智能运维平台 ARCANA PaaS 思特奇图南智维平台 创新奇智 AIOps 智能运维平台 中国电信翼维智能平台 7x OPS 翼维智能平台 星眼一体化运维平台 绿盟智能安全运营平台 ISOP 睿象云 戴尔

27、科技集团 CloudIQ(AIOps)星汉未来云原生基础治理平台 SchedulX 云新信息 iBSM,DCOS 金蝶天燕 AIOps 智能运维平台 中国 AIOps 现状调查报告(2022 年)23 智能运维,数据先行,数据是智能运维的“原料”,是搭建智能运维能力的基础。多数企业仍处于智能运维场景的探索和实践阶段:开始关注和梳理运维数据,建设数据规范化能力,为下一阶段运维数据的智能化分析做准备。目前企业智能化运维重点还在于数据的采集和规范方面。根据调查显示,37.84%的受访者认为开展智能运维最优先的能力是对数据采集分析,其次是对数据的规范化能力(22.54%)和工具平台的支持(21.09%

28、),在此基础上完善算法能力(9.79%)。数据来源:中国信息通信研究院 图图 1414 智能运维的前置条件智能运维的前置条件 中国 AIOps 现状调查报告(2022 年)24 将现有监控平台、大数据平台等多种数据源接入智能运维工具/平台,进行多场景数据融合是当前比较常用的智能运维实践方式。目前近一半(46.21%)的受访者所在企业采用数据接入方式,同时也有一定比例(37.85%)的智能运维工具/平台具备数据采集能力。数据来源:中国信息通信研究院 图图 1515 智能运维工具智能运维工具/平台数据获取方式平台数据获取方式 中国 AIOps 现状调查报告(2022 年)25 当前企业的智能运维系

29、统/工具更多集中于对系统(服务器、操作系统)监控数据和业务/应用监控数据的处理和分析。根据本次调查显示,目前 57.39%的企业智能运维系统/工具处理分析的数据中包括应用指标、日志等数据,53.35%涵盖系统监控数据,其次占比 42.50%的是网络监控运维中关注的流量类型数据,最后是动力环境监测数据,占比 20.14%。数据来源:中国信息通信研究院 图图 1616 智能运维工具智能运维工具/平台分析的数据平台分析的数据种类种类 中国 AIOps 现状调查报告(2022 年)26 多数企业采用第三方提供的智能计算引擎为 AIOps 系统提供算法能力支持。根据本次调查结果统计,目前 78.57%的

30、受访者所在企业均已搭建了计算能力引擎,主要以自研(37.63%)和采用第三方提供(40.91%)两种方式为主,在使用第三方提供的计算引擎的基础上,20.96%的受访者所在企业根据业务需求进行了定制化开发,更好的适配业务场景需求。数据来源:中国信息通信研究院 图图 1717 企业智能运维计算能力引擎企业智能运维计算能力引擎 中国 AIOps 现状调查报告(2022 年)27 大部分企业已经在数据分析和算法模型分析方面已经逐步开始场景探索。智能运维中的计算分析能力,包含了常用的数据分析方法和算法模型分析,从目前的应用情况来看,企业实践普遍集中于在部分典型场景进行试点及应用。并且已有 15.61%和

31、 11.07%的受访者所在企业将数据分析方法和算法模型应用于大部分业务场景。数据来源:中国信息通信研究院 图图 1818 企业当前运维工作中数据分析与算法模型应用情况企业当前运维工作中数据分析与算法模型应用情况 中国 AIOps 现状调查报告(2022 年)28 围绕智能运维,大量的算法模型被尝试和应用。在本次调查中,我们统计了目前智能运维领域中使用较为广泛的数据分析和模型分析方法。运维工作中常用的数据分析方法,包括密度聚类 DBSCAN、相关系数 Pearson、正态分布N-sigma、统计学分类 Bayes 等方法。数据来源:中国信息通信研究院 图图 1919 企业目前运维工作中常用的数据

32、分析方法企业目前运维工作中常用的数据分析方法 运维工作中常用的算法模型分析方法,包括深度学习 LSTM、聚类分析 K-means、关联规则挖掘 Apriori、趋势预测 Arima、孤立森林 Isolation Forest、时间序列预测 Prophet 等算法。数据来源:中国信息通信研究院 图图 2020 企业目前运维工作中常用的算法模型分析方法企业目前运维工作中常用的算法模型分析方法 中国 AIOps 现状调查报告(2022 年)29 (二)AIOps 场景应用情况 根据由中国信通院牵头制定的行业标准云计算智能化运维(AIOps)能力成熟度模型 第1 部分:通用能力要求 中的 AIOps

33、能力建设分级要求,可以将智能化运维整体能力从感知、分析、决策、执行、知识更新五个维度进行级别划分,系统的参与程度随智能化程度逐级递增,并结合智能运维应用场景特点,形成 AIOps 能力成熟度模型。图图 2121 AIOpsAIOps 能力成熟度级别划分能力成熟度级别划分 从目前的发展情况来看,现阶段 AIOps 能力大多集中在 L2 级别,主要以系统辅助分析,帮助人工进行决策和操作为主,较为领先的能力实践可以达到 L3 级别,而 L4 和 L5 级别随着 AIOps 的技术发展和能力的逐步增强,将是未来智能运维能力建设的发展方向和目标。中国 AIOps 现状调查报告(2022 年)30 AIO

34、ps 仍处于初期发展阶段,受访者对目前 AIOps 能力水平的评价与期望超过其所在企业实际应用的情况。从整体来看,参与本次调查半数以上的受访者自评企业目前智能运维处于辅助智能化(30.27%)和进阶智能化阶段(28.61%)。此外,21.47%的受访者自评处于初始智能化运维阶段,13.72%的受访者自评已达到全面智能化运维阶段,5.92%的受访者自评达到了高度智能化运维阶段。数据来源:中国信息通信研究院 图图 2222 企业企业 A AIOIOpsps 发展阶段发展阶段 中国 AIOps 现状调查报告(2022 年)31 不同 AIOps 能力成熟度阶段的企业关注领域各不相同,达到全面智能化运

35、维阶段的企业更加关注在效率和安全领域的智能化运维能力建设。根据本次调查结果显示,自评为初始智能化运维阶段的受访者更多的是从质量领域开始进行场景探索(50%),质量领域的关注度远超其他部分。自评为辅助智能化运维阶段的受访者持续增加了质量领域(61.97%)的关注度,并且开始探索成本(52.47%)和效率领域(46.62%)的实践。而自评为全面智能化运维的受访者在质量、成本领域的关注度比较均衡(49,60%,45.16%),并且关注度逐渐向效率领域(55.65%)倾斜,以及增加了对安全领域(40.32%)的关注和投入。最后自评为高度智能化运维阶段的受访者认为在质量、成本、效率、安全四个领域的关注度

36、接近一致,也说明未来要达到高度智能化运维阶段需要逐步完善各个领域及场景的智能化运维能力。数据来源:中国信息通信研究院 图图 2323 各阶段智能运维场景关注情况各阶段智能运维场景关注情况 中国 AIOps 现状调查报告(2022 年)32 智能运维在质量、成本、效率、安全四大运维领域均已开展部署和应用,其中质量领域最受关注,调查显示,54.79%的受访者所在企业当前智能运维着重关注质量领域(包括异常检测、告警收敛、根因分析、故障处置等)能力建设,其次是效率领域(45.77%)、成本领域(45.49%)和安全领域(30.82%)。数据来源:中国信息通信研究院 图图 2424 企业当前智能运维重点

37、关注领域企业当前智能运维重点关注领域 中国 AIOps 现状调查报告(2022 年)33 质量领域最先考虑的智能运维场景是异常检测(62.26%)和告警收敛(57.55%),其次是故障预测能力(46.76%)、故障自愈(43.72%)、根因分析(42.67%),最后是故障预防(33.04%)。数据来源:中国信息通信研究院 图图 2525 智能运维能力智能运维能力-质量领域应用情况质量领域应用情况 中国 AIOps 现状调查报告(2022 年)34 成本领域的场景建设较为均衡,资源优化(44.49%),成本评估(40.40%),容量预测(40.40%),但有 20.59%的受访者所在企业表示还未

38、开展成本部分内容,也是这四大场景中占比较高的。数据来源:中国信息通信研究院 图图 2626 智能运维能力智能运维能力-成本领域应用情况成本领域应用情况 效率领域最先考虑的智能运维场景是效率评估(37.52%)、知识构建(36.58%)、智能变更(34.42%),智能问答(30.99%),舆情分析(16.60%)。数据来源:中国信息通信研究院 图图 2727 智能运维能力智能运维能力-效率领域应用情况效率领域应用情况 中国 AIOps 现状调查报告(2022 年)35 安全领域最先考虑的智能运维场景是风险可视化(40.12%)、威胁感知(32.82%)、安全知识图谱(31.10%),其次是脆弱性

39、感知(24.02%)、SOAR(20.09%)、UEBA(16.05%)。数据来源:中国信息通信研究院 图图 2828 智能运维能力智能运维能力-安全领域应用情况安全领域应用情况 中国 AIOps 现状调查报告(2022 年)36 随着智能运维能力的持续完善以及应用场景的不断深入,将明显感知到智能运维带来的效率提升。相较未引入智能运维能力,在使用工具链、智能运维工具/平台处理一次典型的故障(如核心系统的一次故障发现到完全修复),整体故障处理时间大概有多大提升。从数据来看,53.96%的受访者还是可以感知到智能运维带来的效率提升,其中 25.4%的受访者表示有一定效果提升(15-25%),16.

40、77%的受访者表示提升效果明显(30-50%),还有 11.79%的受访者感受到效果十分显著。数据来源:中国信息通信研究院 图图 2929 故障恢复时长与效率提升的感知情况统计故障恢复时长与效率提升的感知情况统计 通过使用智能运维算法,可快速提升运维智能化、自动化水平,大幅降低故障平均检测时间,加速平均修复时长。通过调查发现,目前已经有 11.95%的受访者所在企业核心系统故障服务恢复时长可以达到 10 分钟内的水平,并且还有 11.23%已经达到 15 分钟内进行恢复。大部分受访者所在企业处于 15-30 分钟的恢复时间(18.76%)和 30-60 分钟进行故障服务恢复(17.54%),仅

41、有 7.86%的受访者所在企业恢复时间超过 4 小时。中国 AIOps 现状调查报告(2022 年)37 (三)AIOps 发展趋势与挑战 智能运维发展道路欣欣向荣,通过调查我们发现,绝大多数的领导层已经对智能运维能力建设加以重视并付诸行动,但在智能运维的建设过程中仍有诸多困难与挑战,主要是在不同运维场景中的实践探索中产生的。比如“能力定制化,难以跨业务应用或泛化成本高”(35.81%),“场景有限,大量运维场景没有成熟的方案”(33.98%),“新场景建设周期长”(30.71%)。技术应用方面,如“数据集成与标准化成本过高”(27.95%),“模型效果难以维持,持续优化成本高”(23.46%

42、)。企业内部环境和组织架构方面,如“环境复杂,难以支持智能运维建设”(19.76%),“受限于 AI 团队规模”(18.43%)。此外还包括了智能运维的运用和价值体现,“运用困难,不了解如何使用智能运维的分析结果指导运维决策与管理”(17.49%),“智能运维的建设价值难度量和体现”(16.93%)。数据来源:中国信息通信研究院 图图 3030 智能运维建设过程中遇到的困难智能运维建设过程中遇到的困难 中国 AIOps 现状调查报告(2022 年)38 需求驱动能力升级,除普遍关注的质量场景,运维下的安全场景成为更多企业未来关注和提升的方向。根据本次调查结果,我们将运维系统中需要进一步完善和提

43、升的能力按照场景进行划分,质量场景仍然是主要提升方向,其中包括提升故障的根因定位效率(36.75%),提升故障修复速度(32.82%),完善故障预测能力(31.82%)以及建立故障处理流程规范(23.52%)。成本场景中,包括需要进一步优化资源配置与成本优化(33.31%),建立系统健康度评估(29.88%),完善对变更过程的检测(19.98%)。效率场景中,涵盖运维知识库的构建与相关解决方案的关联(32.15%,23.63%),并同时将舆情信息纳入运维场景分析(26.34%)。安全场景得到更多的关注,其中需要加强对安全事件的快速响应以及相应的防范措施的建设(40.79%)。数据来源:中国信息

44、通信研究院 图图 3131 目前企业使用的运维系统改进方向目前企业使用的运维系统改进方向 中国 AIOps 现状调查报告(2022 年)39 企业不断优化现有场景能力,提升稳定性、易用性,持续探索智能运维新场景并加强人员与技术方面投入是未来发展趋势。47.76%的企业将在目前已有的智能运维场景中继续优化改进,提升效果。44.71%的企业将在易用性、可用性、稳定性等方面持续改进。40.73%的企业将在更多新场景的应用中建设智能运维能力。32.1%的企业将研究与探索新技术/场景以满足未来业务的增长需求。27.67%的企业将加强人员方面投入,对技术人员进行 AIOps 相关培训。数据来源:中国信息通

45、信研究院 图图 3232 未来企业智能运维未来企业智能运维建设建设方向方向 中国 AIOps 现状调查报告(2022 年)40 三、AIOps 实践案例 (一)运营商篇 随着国内企业数智化转型的深入推进,电信行业运维从传统的基础设备运维逐渐转为软硬件结合的综合管理,运营和运维工作面临着越来越大的压力。运维人员数量无法随着设备数量线性增加,每万台服务器运维人员的数量持续下降,亟需引入智能化运维手段,解决人力不足的矛盾。同时,也需要借助智能化工具提高资源的可用性,提升用户使用体验。案例 1 智能运营平台应用 联通数字科技 智能运营平台是联通数字科技有限公司自行研发的一款基于动态基线算法进行设备监控

46、的产品,在业界得到了广泛的应用。该平台采用人工智能技术,根据基线动态配置浮动阈值,参照实际业务场景配置安全范围,对不同设备的时序数据进行强针对性监控。国家开放大学的实验学院信息化改造项目选用了联通数字科技有限公司开发的智能运营平台,对国家开放大学三个校区(五棵松、魏公村、东直门)200+台 IT 设备及动环设备进行集中监控管理。智能运营平台在三地的部署图 中国 AIOps 现状调查报告(2022 年)41 该项目实现了故障诊断、问题定位、分析结果自动化,结合运维知识库,确定处置方案;实现了自动完成故障感知、决策、执行的全过程,实现自动扩容、流量调度等操作;实现了对性能数据进行特征提取、分类,利

47、用机器学习算法进行集成学习,动态分析设备运行参数的变化趋势,针对重要特性数据进行预测算法学习,预测网络流量、性能趋势、磁盘容量以及故障发生的可能性,规避潜在系统风险;实现了对人工无法覆盖范围的延展,对客户动环指标进行全方位移动式环境监测、周期巡检;实现了定期检测资源的能耗指标,计算资源能耗,自动生成能耗报告,运用机器学习算法对未来资源能耗进行预测。通过预设能耗管理模型,结合业务负载情况,动态调整 IT 设备的上下线、关机、启动,达到绿色节能的目标。智能运营平台帮助客户解决了监控手段匮乏、故障发现滞后、动环监控死角、能耗管理落后、运维重要趋势无法预测等问题。案例 2 基于指标异常检测在云平台网元

48、健康度判断的应用 浙江移动 随着系统架构逐步虚拟化、容器化、微服务化,IT 云资源池规模及技术栈类型也在逐步增加,指标数据日益增大;网元间的业务差异性要求网元评分标准“千人千面”,同参数模型精确度差;独立参数配置虽然能部分解决问题,但需要极高的维护成本;为了解决数字化转型出现的问题,结合 AI 算法、大数据技术、自动化操作能力等打造了晴雨表产品。晴雨表系统采用可视化展现层、应用分析层、数据采集层三层架构。评分结果通过页面实时展示,同时结果回写至 Kafka 后再存入 ES 集群进行长久保中国 AIOps 现状调查报告(2022 年)42 存,整个过程无需等待指标采集上报。系统架构部署方案 通过

49、大数据运维,AI 算分,自动化操作发现低分故障网元,推送故障详情信息到 kafka,自愈系统消费到 Kafka 数据后匹配到对应的自愈脚本执行自愈,实现自动化故障恢复,减少人工干预。晴雨表以交付类产品进行输出,支持一站式解决方案部署。目前已在浙江移动、新疆移动、集团大数据 BG、浙江创新研究院等多个环境投入生产使用。接入流程图 新疆移动于 21 年 4 月在本地部署了晴雨表,对接现场数据采集能力,通过内置模型及个性化模型编排耗时一周成功上线,解决了系统实时监控盲区,故障感知率提升 90%。集团大数据 BG 于 21 年 12 月在一级 IT 云哈尔滨资源池部署了晴雨表,用于行程码系统日常监控保

50、障,截止目前使用良好。晴雨表目前打分覆盖 33000 余个网元,基本涵盖云平台所有组件,日均评分网元约 10w 个,平均每年规避 G4 及以上故障 50 起,平均先于用户 5 分钟中国 AIOps 现状调查报告(2022 年)43 感知发现故障,有效缩减了用户断服时长,提升了用户感知。晴雨表中基于OCDT 算法的智能异常检测模型,目前已在参与评分的千余条指标中进行运用,提高了晴雨表 16%的查准率,大大减少误报情况。案例 3 业务端到端故障智能发现诊断自愈 中移动信息 云原生技术的引入使得 IT 系统规模庞大、架构复杂,IT 运维迎接新的挑战,IT 业务系统集群规模越发庞大,传统的告警不能及时

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 行业资料 > 其他

移动网页_全站_页脚广告1

关于我们      联系我们       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号  |  icp.png浙ICP备2021020529号-1 浙B2-2024(办理中)  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服