收藏 分销(赏)

2022年算网大脑白皮书.pdf

上传人:宇*** 文档编号:3150471 上传时间:2024-06-21 格式:PDF 页数:32 大小:1.17MB
下载 相关 举报
2022年算网大脑白皮书.pdf_第1页
第1页 / 共32页
2022年算网大脑白皮书.pdf_第2页
第2页 / 共32页
2022年算网大脑白皮书.pdf_第3页
第3页 / 共32页
2022年算网大脑白皮书.pdf_第4页
第4页 / 共32页
2022年算网大脑白皮书.pdf_第5页
第5页 / 共32页
点击查看更多>>
资源描述

1、算网大脑白皮书算网大脑白皮书(20222022 年)年)中国移动中国移动通信集团有限公司通信集团有限公司前前言言随着社会数智化转型不断深入,算力规模出现爆发式的增长,算力供给方式向集群生态转变,为促进算力和网络的深度融合发展,中国移动提出算力网络一体化信息基础设施和信息服务体系。而算网大脑作为算力网络的编排管理核心,通过人工智能技术实现算网智能感知、智能编排调度、算网自智,促进算网一体、算网共生发展。本白皮书旨在提出中国移动对于算网大脑的愿景、发展路径、关键技术、体系架构和产业倡议。希望能够为产业在规划设计算网大脑相关技术、产品和解决方案时提供参考和指引。本白皮书的版权归中国移动所有,未经授权

2、,任何单位或个人不得复制或拷贝本建议之部分或全部内容。中国移动算网大脑白皮书(2022)目目录录1.算网大脑愿景.11.1 驱动力.11.2 愿景及定位.32.算网大脑发展路径.42.1 初始期:构筑算网大脑雏形,双入口协同编排.52.2 成长期:构建统一算网大脑,融数注智.62.3 成熟期:多要素感知融合统一,体系化智能升级.63.算网大脑关键技术.73.1 多要素融合编排.83.2 原生编排.83.3 算网感知.103.4 算网智能.103.5 算网质量保障.113.6 算网能力开放.124.算网大脑体系架构和功能.134.1 构建思路.134.2 设计原则.144.3 体系架构.154.

3、4 系统功能.184.4.1 算网大脑能力开放中心.184.4.2 算网编排中心.204.4.3 算网智慧中心.214.4.4 算网调度中心.214.4.5 算网感知中心.224.5 部署架构.235.产业倡议.24缩略语列表.27参考文献.29中国移动算网大脑白皮书(2022)11.1.算网大脑愿景算网大脑愿景1.11.1驱动力驱动力数字经济的浪潮席卷全球,算力已成为全社会数智化转型的基石,直接影响数字经济的发展速度,决定社会智能的发展高度。随着数智化转型的不断深入,算力需求的不断增加,算力规模将出现爆发式的增长。据 IDC 预测,2025 年全球物联网设备数将超过 400 亿台,产生数据量

4、接近 80ZB,预估未来五年全球算力规模将以超过 50%的速度增长,到 2025 年整体规模将达到 3300EFlops4。这其中,人工智能、边缘计算等新型算力的占比不断增长,据 IDC 综合 15 个国家的算力支出来看,AI 算力支出占总算力支出从 2016 年的 9%增加到 12%,预计到2025 年将达到 25%。全球边缘计算服务器支出占总体服务器比重将从 14.4%提升到 24.9%5。与此同时,算力的供给方式也正在从单点生态向集群生态迈进,算力服务提供的不仅仅是单台设备的计算能力,还包括集群系统的整体算力、存储、网络等资源,即集群的整体有效协同能力。面对算力和网络的深度融合发展以及

5、ICT基础设施面向云网融合、算网一体的技术演进趋势,2021 年 11 月中国移动发布算力网络白皮书,提出新型的一体化信息基础设施,构建“连接+算力+能力”的新型信息服务体系。网络化算力需要与之匹配的中枢调度决策系统,为新型信息基础设施对外一体化服务提供能力支撑,其主要需求和技术驱动力来自于如下几个方面:1.随着算力需求的不断增长、算力供给方式的改变以及以智能化、边缘计算为主的新型业务的发展,传统的云网业务已经无法满足多样泛在、即用即取的业务需求,算力业务和网络业务呈现出深度融合的发展趋势。而现有的、各自独立的云和网编排调度系统无法满足复杂的算网融合业务的管理需求,需要一个跨算网各域的、智能化

6、的系统来实现灵活高效的算网统一编排调度。中国移动算网大脑白皮书(2022)22.算力需求由原来单一集中的算力资源池承载向多样化的算力资源承载方式发展。根据不同的算力需求和应用场景,可以是集中化的超级计算中心;可以是泛分布的边缘、端算力节点;也可以是超算、智算和社会算力等多样化的异构算力。需要实现跨越物理分布、云边端分层协同和异构融合的算力资源统一调度。同时在网络层面,通过算、网一体化编排管理实现网随算动、以网强算。3.算力网络包含的资源类别和资源数量规模庞大,算网业务种类丰富,因此算力网络呈现高度的复杂性。传统的数据采集、编排调度、运维方式已无法满足这种高度复杂性的算力网络的需求。在数据感知方

7、面,需要快速获取分析全域实时的计算、存储、网络、数据资源,以及云、边、端分布情况和运行情况;在编排方面,业务的创新和随选要求算网编排层实现更加灵活、自动和智能化的编排;在运维方面,高复杂度、高动态的算网环境,以及算网的多管理对象、业务的高精度 SLA 需求均对运维智能提出较高要求。因此,算网编排管理需要提高算网感知、编排和运维的自动化和智能化水平,实现面向算力网络的数据智能感知、算网智能编排、智能运维。4.当前,算力域和网络域有着各自特有的数据感知体系,并且长时间独立发展,自成一派,暂未打通融合。算力网络缺少统一、全局性的算、网状态实时采集、感知、呈现能力;亟需构建算网感知能力,逐步融合、统一

8、现有的算、网感知体系,制定算网一体化感知模型体系。5.算网多要素融合编排和协同调度控制依赖于对于底层基础设施的能力抽象和模型化,需要构建一体统一的算网调度机制,并促进算网基础设施具备自身独立编排能力及跨域协同编排能力,且能够对外提供标准化封装、可自动执行的原子能力和服务。6.为了赋能算力网络价值,支撑更加丰富的算网业务场景,算网生态的构建尤为重要,需要多方合作共同参与到算网业务/服务的设计和开发中来。算网生态的构建需要算网的编排管理具备高度的开放性,支持多维度、中国移动算网大脑白皮书(2022)3多层次的算网能力开放。综上,算网大脑的总体需求是实现算力网络算力供给能力、数据处理能力、网络连通能

9、力、业务供给能力的最大化。1.21.2愿景及定位愿景及定位算力网络以“算力泛在、算网共生、融数注智、一体服务”为目标,推动算力网络成为与水电一样,可“一点接入、即取即用”的社会级服务1。基于当前的算网业务发展,算网大脑需要适配的算网业务场景主要包括在开通阶段的以企业入云业务为代表的现有资源类算网业务;以东数西存、社会算力并网等业务为代表的弹性资源类算网业务;以东视西渲、东数西训等业务为代表的任务服务类算网业务。以及在运行阶段的动态控制类业务,比如动态扩容、动态分布等场景。算网大脑作为算力网络的编排管理系统,面对丰富的算网业务场景、高复杂度的算网环境及按需定制、灵活高效的需求特性,通过资源业务建

10、模、模型驱动、算力解构、泛在调度等技术协同、调度算网资源,实现灵活高效的算网统一编排;通过 AI、大数据、数字孪生、意图网络等新技术增强算力网络自动化、智能化能力,实现算网感知和自智,最终达成算网大脑“多样算力可泛在部署多样算力可泛在部署、极致网极致网络可智能调度、算网资源可全局优化、算网能力可一体供给络可智能调度、算网资源可全局优化、算网能力可一体供给”的愿景。图 1-1 算力网络体系架构中国移动算网大脑白皮书(2022)4算网大脑定位为整个算力网络体系的算网大脑定位为整个算力网络体系的“智能中枢智能中枢”,是算力网络编排管理,是算力网络编排管理层核心层核心,是算网共生发展的关键系统是算网共

11、生发展的关键系统。在横向上,算网大脑对算网资源、算力服务以及算网应用等算力网络各层的多种原子能力进行抽象、封装,通过按需、灵活的组合方式及规则,形成可以由上一层调用的产品化和模块化的服务;纵向上实现从资源、服务到应用的自下而上的统一协同编排,按需组织各层能力,实现算网各层原子能力效能的最大化。算网大脑面向算网基础设施层实现算网全领域资源拉通,面向算网运营服务层实现算网融合类全业务支撑,并融合人工智能技术提升产品设计、编排调度、运维优化等方面的智能化能力。算网大脑具有“统一编排、跨域调度、动态感知、融数注智、闭环控制、灵活开放”的主要特征:统一编排:横向算力网络全要素资源,纵向从资源、能力、服务

12、到应用跨层的统一协同编排。跨域调度:对算力网络各域提供的原子能力的协同、灵活、高效地调用执行,驱动各域根据需求使能域内基础设施提供所需服务。动态感知:对算网全领域环境的感知,包括资源、性能数据的采集和分析,既包括静态环境数据的收集,也涵盖动态环境数据的感知。融数注智:引入人工智能、大数据分析、数字孪生等技术,融合算网全域数据感知和分析,为算网大脑提供智能分析和智能决策能力,使算网大脑成为真正的智能中枢。闭环控制:通过问题自动发现或预测、自动定位、自动排障或优化的自动化、智能化闭环控制实现对算网业务及性能持续的保障、优化。灵活开放:为支持更丰富的算网业务或满足更多定制化算网业务需求而具备灵活多样

13、的、对外开放的算网大脑能力和数据。2.2.算网大脑发展路径算网大脑发展路径算网大脑构建采用渐进的方式,初期主要实现云网资源和业务的统一编排调度,中远期逐步增加对端算力、社会算力的编排能力,并逐步引入 AI、大数据、中国移动算网大脑白皮书(2022)5意图引擎、数字孪生等技术,构建智能闭环体系,最终过渡成为覆盖网(网络)、云(云计算)、数(数据)、智(智能)、安(安全)、边(边缘)、端(终端)、链(区块链)的算力网络统一编排、调度、管理和运维系统。图 2-1 算网大脑发展路径2.12.1初始期:初始期:构筑算网大脑雏形,构筑算网大脑雏形,双入口协同编排双入口协同编排初始期构建算网大脑雏形,承接算

14、力网络初始期需求,网络编排与云编排分别调用网络能力及云能力,同时开放互相调用接口,支撑“云+网”一体编排调度。以云为主的算网业务可以通过网入口和网络编排器直接调用云的编排调度能力,实现资源互调,同时以网络为主的算网业务可以通过云入口和云管直接调用网络的编排调度能力,满足用户一站式业务开通需求;实现云网互调的自动化和可视化。在云网双入口协同的同时,提升算和网的能力,网络方面实现云间、入云网络的自动编排调度以及网络能力的开放,算力方面实现算力的自动编排调度以及算力能力的开放。阶段目标:构建算网大脑雏形,实现云网资源高效互调构筑算网协同编排基础,算网业务一站式开通初步构建算力网络产业生态。服务升级:

15、从云和网独立的运营和编排管理服务向云网一站式运营,云网协同编排产品服务升级。技术演进:补齐当前算、网堵点断点,从云、网独立专业域的资源编排和管理向跨域跨专业的云和网资源拉通,统一编排管理、统一呈现演进、算网能力开中国移动算网大脑白皮书(2022)6放。2.22.2成长期:成长期:构建构建统一统一算网大脑算网大脑,融数注智,融数注智在初始期高效互调、协同编排的基础上,成长期构建算网大脑,向上实现算网融合类业务支撑,向下实现一体化算网全领域资源拉通;拓展算网编排对象的范畴,纳管边缘云、三方云、端算力和社会算力、国家算力枢纽等不同的集中或分布算力;算网编排管理和决策、算网感知与 AI 技术的全面融合

16、,实现算网资源智能感知、智能规划、智能编排及自优化运维。阶段目标:构建算网大脑,融数注智,实现多样化算力、分布式算力与网络深度融合、智能化协同编排,促进算力网络走向成熟。服务升级:从单一化、场景化编排服务向多样化定制化的算网融合编排产品服务升级;从手工化、自动化运营运维到智能化闭环运营运维服务升级。技术演进:单一和集中化算力的编排管理向多样化、分布式泛在算力和网络的融合编排调度演进;算、网资源及数据的采集和统计向算网智能态势感知演进;应用大数据、AI 等技术,算网大脑向智能化编排调度演进;通过构建算网大脑智慧中心,使算网大脑中智能化技术从单一点状应用向多样、平台可规模化复制模式演进。2.32.

17、3成熟期:多要素成熟期:多要素感知融合统一感知融合统一,体系化智能升级,体系化智能升级在成长期实现多样泛在算力和网络编排调度的基础上,成熟期增加对于安全、区块链等 ABCDNETS 其他元素的编排调度,实现覆盖算力网络全要素融合能力供给;算网大脑体系化人工智能升级,形成算网大脑编排、调度、感知的完整智能体系,最终演进为超级算网大脑。阶段目标:实现覆盖网、云、数、智、安、边、端、链多要素融合能力供给,构建完整算网大脑生态体系和实现面向全领域体系的算网一体、在网计算、算智共生的技术形态。服务升级:从运营商通信领域服务向全行业、跨专业领域算网泛在服务升级;中国移动算网大脑白皮书(2022)7技术演进

18、:从多样算力和网络资源的融合编排向 ABCDNETS 全覆盖的演进;单点智能技术向体系化人工智能的技术演进并通过意图引擎、数字孪生、算力路由等新技术的引入,实现向算网一体、在网计算、算智共生的技术演进。3.3.算网大脑关键技术算网大脑关键技术算网大脑作为算力网络编排管理层的核心系统,需要在编排、调度、数据和运维管理各方面实现包括多要素编排、原生编排调度、算网感知、算网智能、算网质量保障和算网能力开放等关键技术在内的全面的技术支撑。编排方面,多要素融合编排技术实现网、云、数、智、安、边、端、链等多要素深度融合编排,在算网业务需求和基础设施约束之间实现最优供需匹配。调度方面,原生编排调度是算网大脑

19、构建符合业务需求、多要素可灵活组合/封装的一体化编排能力的基础。算网基础设施需要提供标准化封装、可自动执行的原子能力和服务,供算网一体编排层使用。数据方面,算网感知技术实现算网一体化感知模型体系,实时精准捕捉算网业务与资源的动态特性,为算网提供底层感知数据服务基础。智能方面,智能化则是面向超大规模、高复杂度、高动态的算网环境的必然选择。通过算网智能技术,提高算网感知、编排和运维的自动化和智能化水平。算网质量保障技术实现算网 SLA 质量保障和故障自愈,使算网大脑具备持续的算网业务维护能力,确保算力网络业务不中断地向客户提供有质量的服务。同时,算网生态的构建需要算网大脑具备高度的开放性,支持多维

20、度、多层次的算网能力开放技术。算网大脑系统层面,需要充分考虑和实现算网大脑自身的系统安全,主要包括接入权限控制、系统软硬件安全、系统数据安全和防外部攻击等几个方面:实现统一的安全身份认证和权限控制机制;系统硬件故障恢复和安全性保护措施;防止系统软件的非法删改、复制和窃取,避免系统软件遭泄密和破坏;防止系统数据、用户数据的非法篡改、盗用或破坏;防止来自外部的饱和攻击、病毒、木马等侵害等。中国移动算网大脑白皮书(2022)83.13.1多要素融合编排多要素融合编排5G 时代,在网络基础能力增强的同时,边缘计算、网络切片等特性提供了更为灵活、更高质量的网络与算力之间的连接能力。网络与算力的连接模式由

21、原来的云网协同的连接演进到“云-网-边-端”的分布式泛在连接。随之而来的挑战是如何在泛在的算力节点找到网络加算力的最优组合并进行高效精准的编排调度从而满足用户需求,为用户提供更高质量的服务。在此过程中,算力的地理位置、算力成本、算力节点资源容量、网络质量(带宽、时延、可靠性等)、数据中心 PUE、上架率等都将成为算网编排需要考虑的因子,需要算网编排具备多要素融合编排能力。算网多要素融合编排就是对算力网络的网、云、数、智、安、边、端、链多种要素的融合统一编排调度,从而实现在算网业务需求和算网各基础设施资源之间寻求最优供需匹配。在网络和算力编排调度方面,针对业务和 SLA 需求,算网大脑通过算力解

22、构,将多样化、大粒度、复杂的算力任务分解成小粒度、独立的算力任务,综合考虑计算、存储等算力因素,带宽、时延等网络因素,以及能耗、位置等环境因素进行一体化的编排以及统一各方因素的策略调度。同时,结合人工智能、大数据和安全等其他要素,算网大脑将这些要素与算力网络基础的网络和算力要素灵活地组合、对原子能力进行统一编排,利用 AI、大数据和安全等能力提高算力网络资源效率和安全保障,寻求算网资源最优匹配,提供更为丰富的算力网络产品和服务。面向近期,多要素融合编排主要实现算力网络多要素编排模型构建,算力和网络的协同编排,攻关泛在资源调度算法、算力解构等技术;中期逐步构建人工智能、大数据等要素的融合编排能力

23、;远期实现覆盖算网 ABCDNETS 全要素的融合编排能力,并引入意图驱动等前沿技术提升算网大脑智慧编排能力。3.23.2原生编排原生编排算网大脑需要编排调度多专业域的、不同种类的、数量繁多的算网基础设施,中国移动算网大脑白皮书(2022)9即使在同一专业域内也可能面向不同的基础设施提供方。基础设施向算网大脑所提供的可调度能力的范围、颗粒度、层次都可能存在较大的差异。在这种异构的算网环境中如何减小算网编排调度的复杂性,减小算网大脑面向基础设施的适配消耗,提高算网大脑多要素融合编排的效率和精确度是算网大脑在调度上面临的较大问题。原生编排指算网基础设施层自身具备本专业域独立管理调度能力的同时能够对

24、外提供标准化封装、可自动执行的原子能力和服务。通过原生编排,算网大脑可以构建一体统一的算网调度机制,实现各专业域原子能力的灵活组合和自动、高效的调度。针对原生编排能力的构建,因为原生编排主要依靠基础设施层各专业域封装的抽象能力,对于各专业域发展至今已有的实现依赖度较高,而不同领域间也存在较大的个体差异,因此不同专业域原生编排能力构建的方式和侧重点也不尽相同。对于当前以云为主的算力域,单一云内管理系统与资源的结合紧密,耦合度高,云管系统的北向开放能力相对完善。但在不同的云之间,对算力的度量、开放的原子能力以及可调度的算力资源层次和粒度上存在比较大的差异。因此针对以云为主的算力域的原生编排能力构建

25、,在难以打破云管系统与资源紧耦合的前提下,重点需要考虑不同云之间能力的差异化适配以及在算力度量、调度层次和粒度上的标准化。对于网络域,各网络专业域内的网络设备、资源与网络管控平台已基本实现解耦。网络管控平台已经具备一定的跨设备、资源的统一拉通管理能力,已构建一定的基于网络协议定义的原子化能力,但在租户级管理和网络管控层北向接口的标准化方面仍存在不足。因此在网络域的原生编排能力的构建上,主要是完善基础设施层网络协议定义外的原子化能力构建、网络管控层北向接口的标准化以及增强租户级业务管理和开放能力。面向近期,为了快速构建算网大脑融合调度能力,对于算、网基础设施能力的调度主要通过差异化适配的方式实现

26、;面向中期,在算网基础设施能力抽象和模型构建方面逐步完善,实现完整的、标准化的服务化接口定义和调用方法;面向远期,通过调度智能化升级,引入意图驱动等技术实现智能的、意图化的原子能力调度。中国移动算网大脑白皮书(2022)103.33.3算网感知算网感知算网大脑进行多要素智能编排与一体化运维,需要提供对业务与算网资源状态实时捕捉、理解以及预测的感知能力,因此感知是算网大脑实现智能编排调度、算网自智、数字孪生的重要基础能力。但如何构建算网一体化感知模型体系;如何实时感知大规模算网资源的状态;如何实现感知体系与异构的基础设施的同步发展是算网感知面临的主要挑战。算网感知根据各类算网业务售前、售中、售后

27、的业务场景,抽象业务场景间通用的感知场景,围绕感知场景延伸现有算、网资源模型,统一算网感知对象,分主题、分层次、分维度构建一体化的算网感知模型,实时捕捉算网业务与资源的动态特性。并通过对算网数据的采集、存储、处理等环节的一体化编排,实现数据服务能力的弹性与扩展性,保障算网感知信息传递的及时性、有效性,为多要素智能编排与一体化运维提供感知能力基础。算网感知能力的构建需重点考虑以下几方面,一是针对梳理明确典型算网感知场景,围绕感知场景构建算网一体化感知模型;二是推动采集工具进一步向轻量化、敏捷化演进,以实现对算网资源状态的实时采集,契合算网环境的动态特性;三是持续完善针对新型算力(如GPU、FPG

28、A 等)与网络协议(如 RoCE)的状态感知方案,构建分层次、分维度的指标体系,统一量化异构算力节点可用性、连接可用性、网络负载状态等指标。面向近期,算网感知重点关注对算和网的一体化感知体系构建,将网络和算力的数据纳入统一的算网数据感知体系;面向中期,实现算网资源状态的实时捕捉、理解以及预测能力,为算网的实时感知和动态调整能力提供数据支撑;面向远期,构建实现算网数字孪生和算网自智的算网数据感知体系。3.43.4算网智能算网智能当前的网络和计算类业务都分别呈现出多样化、综合化、自动化和智能化的特点,而随着多要素深度融合的算网业务的发展,这些业务特点将变得更为突出。如何向算网用户提供更加智能的算网

29、业务成为算网大脑智能化的主要驱动力。另中国移动算网大脑白皮书(2022)11一方面,对于算网大脑自身,在多要素、多因子的融合编排管理的过程中,因为管理对象种类多、数量大、区域广,其高度的复杂性也需要通过与 AI、大数据等技术深度融合,提升算网大脑自身自动化、智能化的管理水平,实现智能编排调度、智能感知、智能决策、智能闭环保障等管理能力。算网大脑需要在平台、能力和应用三个层面构建算网智能化体系。平台层面,算网智能化平台提供 AI 数据处理、训练、推理等 AI 平台能力以及网络智能、算力智能等原子化平台能力,为上层的算网大脑智能化提供智能数据接入和处理、算网智能模型算法研发、算网智能能力、应用研发

30、和运营等功能,为算网智能化应用和能力生命周期管理提供平台支撑。能力层面,支持算力网络预测、感知、决策、诊断、控制等算网智能能力供给,并可通过算网大脑能力开放平台开放算网智能能力供外部系统调用,实现算网智能能力的共享和快速复用。支持对算网智能化能力的体系化管理。应用层面,基于规划、建设、维护、优化、运营五大运维流程与智能化的深度融合,提供算网智能化运维运营能力,支持智能算网编排调度、智能算网感知、智能算网运维管理等从算网部署、推广到运营运维全周期的智能化应用。面向近期,算网智能化重点攻关分层的算网智能化体系架构研究,理清算网能力和应用规划,通过在已有的网络智能化平台基础上扩展算网智能化能力,构建

31、基础的算网智能化平台;面向中期,支持算网智能感知、智能编排调度、智能决策能力,实现基础的算网智能;面向远期,逐步支持覆盖规、建、维、优、营全周期智能化维护能力,实现用户意图感知、业务开通、质量保障、故障自愈端到端自治服务能力。3.53.5算网质量保障算网质量保障算力网络的目的就是为了提升用户的算网业务体验,在用户获得“一点接入、即取即用”的极致、快捷算网服务的同时,提供高质量、高可靠、有保障的算网业务服务。因此,对于算力网络的编排管理,除了完成算力网络业务基础的生命周期管理外,算网大脑还需要具备持续的算网业务的维护能力,确保算力网络业中国移动算网大脑白皮书(2022)12务持续地向客户提供有质

32、量保障的服务。当出现算网业务服务质量的下降和中断时,算网大脑需要具备自动的调整和调度能力使故障自动恢复。算网业务质量保障首先依赖算网大脑具备业务质量和故障的感知和预测能力,能够对算网业务的状态和 SLA 业务质量进行持续的监控,及时发现故障或质量下降。同时,需要能够对未来可能出现的故障或业务质量下降进行预测,提前发现问题。算网业务质量保障需要算网大脑具备自动决策、自动执行的能力,根据感知到的故障,根据决策模板能够自动、快速的给出分析结果和给出解决措施,转换为对南向专业域的调度或配置。智能化技术驱动算网自治更加自动、准确、灵活和高效,算网业务质量和故障的智能感知、智能预测,智能分析和智能决策都依

33、赖于 AI 技术与算网业务维护管理的深度融合。面向近期,主要构建算网业务质量的感知能力和质量保障的自动化能力,可以基于一定的固化策略进行算网业务的自动调整;面向中远期,构建更加自动化和智能化的闭环调整和控制能力,基于 AI 技术的智能预测、智能感知和智能决策来实现智能的算网业务质量保障。3.63.6算网能力开放算网能力开放算网大脑管理的资源和能力覆盖面广泛,算网业务种类丰富且灵活,这同时也意味着,客户需求的差异化可能会比较大,定制化的算网业务需求会比较多。同时,在数据需求和呈现方面,面向算网运营、运维的外部系统及不同角色的用户对算网大脑的数据需求也存在较大的差异性。这就要求算网大脑需要具备多样

34、、灵活的开放能力。算力网络是一个层次化的网络,而实现算力网络编排管理功能的算网大脑,在开放能力上也需要支持多层次能力的开放,包括:算网大脑北向开放给运营层的算力网络资源和数据以及基础设施层各专业域的能力。从而支持全面的能力开放、灵活的组装能力和丰富的组合形态。算网大脑开放的内容包括算网的资源、数据、能力(编排能力、调度能力、AI 能力,数据能力等)、服务和流程等,满足外部用户/系统的调用、编程和数据获取。在能力开放的方式上,算网大脑中国移动算网大脑白皮书(2022)13可具备 API 调用、文件传输和开源等多样的开放方式适应能力消费者的不同调用需求。为提高能力开放效率,赋能更为丰富的算网智能化

35、能力,算网大脑应具备智能化的开放能力,一方面包括能力开放本身的智能化,如意图驱动的能力开放;也包括了算网大脑所包含的 AI 能力、智能数据分析能力等的开放。在能力开放的管理层面,算网大脑需要具备完善的能力开放管理功能,包括:能力使用者的管理、授权;能力本身的维护和生命周期管理,如能力增删改查、能力目录管理和能力发布;对能开接口的运行监控、性能分析、异常告警或预警、API 服务的状态等。面向近期,算网能力开放重点构建面向算网运营层的算力网络资源和数据开放能力;面向中期,构建完整的算网能力开放体系架构,支持资源、数据、能力、服务和流程等全面的能力开放对象和内容;面向远期,逐步构建智能能力开放、意图

36、驱动的能力开放,开源能力等。4.4.算网大脑体系架构和功能算网大脑体系架构和功能4.14.1构建思路构建思路算力网络包含多种内核异构、空间异构和逻辑异构的算力基础设施,包含多种跨领域、跨层次的网络基础设施,以及安全、区块链等众多其他要素。同时,算力网络上承载各类快速变化的算网融合类业务。这些共同决定了算力网络的高复杂度和高动态性。算网大脑作为算力网络的中枢决策调度系统,需要基于算网业务需求和算网基础设施的情况实现业务方案的设计和各类资源的优化调度。算网大脑所处的高复杂度和高动态性的算网环境以及在这种环境中算网大脑所需的准确、高效决策调度的场景与广泛应用于高复杂度和高动态性的 OODA循环模型所

37、应用的场景高度一致。OODA 循环模型描述了决策者收集态势信息和数据(Observation),依据数据对态势进行评估并对相关态势数据进行处理(Orientation),再依据评估和处理结果制定并选择行动方案(Decision),最后实施行动(Action)的过程。中国移动算网大脑白皮书(2022)14算网大脑体系架构的构建可以将 OODA 循环模型作为参考:图 4-1 算网大脑的循环决策模型设计OODA 模型中 Observation 观察是指通过各种设备和网络收集信息,对应在算力网络中,需要设计算网感知模块,实现对于算网基础设施信息和周边相关的环境信息的感知,实现对于外部因素和状态等各类信

38、息的收集、汇总、整理能力。Orientation 判断是指结合经验,将数据转化为有用的信息,进行综合分析判断,对应在算力网络中,需要设计算网数据智能分析模块,实现对于算网感知信息的数据分析,将感知到的信息数据转化为有用的数据,为后续决策提供依据,通过引入大数据和人工智能技术更可以提升数据价值转化效率和能力。Decision 决策是指明确制定方案,下达操作命令,对应在算力网络中,需要设计算网编排模块,实现基于算网业务需求,制定算网业务模型,并基于算网业务模型实现算网业务的生命周期管理能力,下达生命周期过程中对于底层算网基础设施的需求指令。Action 是执行行动,对应在算力网络中,需要设计算网管

39、控模块,接收算网编排模块下发的指令,并对接算网基础设施层完成指令执行。基于 OODA 模型设计的算网大脑系统包含算网感知、智能分析、算网编排、算网管控四方面关键能力,协同向上支撑算力网络业务需求,向下完成对于算力网络基础设施的调度和配置能力。4.24.2设计原则设计原则算网大脑体系架构和系统功能设计建议遵从“五个充分”原则:中国移动算网大脑白皮书(2022)151.充分发挥运营商网络优势:算网大脑设计应充分发挥运营商网络优势,做好面向未来以算力为中心的网络(即算网大脑调用的,连接算力的网络)的规划设计,使用 SD-WAN、SRv6、OXC 等网络技术连接和调度各类算力,依托运营商广泛的网络分布

40、、强大的组网能力和端到端全面的网络管理能力,通过算网大脑统一编排和调度,实现 Overlay 和 Underlay 网络跨层次协同,既实现业务的灵活开通和配置,也保证业务的网络运行性能,“以网强算”带动算力发展。2.充分利用现有网管/云管手段:算网大脑构建应充分利用已有系统,复用和整合现有网管、云管对算力和网络的编排/调度/运维/管理功能,快速构建算网大脑,支撑算网业务发展。3.充分融合前沿技术:算网大脑应面向未来,充分融合前沿技术,构建融数注智的算网大脑。发挥云网边端的智能编排调度的技术优势,通过引入人工智能、大数据、数字孪生、意图驱动等前沿技术,进一步提升算网大脑智能化水平,形成超级“算网

41、大脑”。4.充分吸收三方及社会算力:利用丰富完善的网络能力和强大的网络编排能力,充分连接和调度第三方公有云/私有云、国家算力枢纽、端算力、社会 PC算力、社会空闲集群算力等社会及三方算力,并保障服务质量,优化服务体验,从而提升网络对算力的连接和支撑能力,构建算力网络生态环境。5.充分适配业务场景:算网大脑应充分适配算力网络业务场景,满足东数西算、云边端、异构算力调度等业务需求,提供 ABCDNETS 融合的全面适配能力,提供“一点接入、即取即用”的社会级服务。4.34.3体系架构体系架构整个算力网络的管理体系由算力网络运营层、算网大脑、算网管控和算力网络基础设施层等组成。中国移动算网大脑白皮书

42、(2022)16图 4-2 算网大脑体系架构算力网络运营层是算力网络的服务提供的入口,面向算网用户实现算网产品的一体化服务供给,使客户享受便捷的一站式服务和智能无感的体验;算网大脑是算力网络实现多要素融合编排、算网智能管理的系统;算网管控包含各专业域运维工作台、云管等,它们执行算网大脑决策,进行专业域内管理调度。算网管控对底层基础设施进行能力抽象和模型化,向算网大脑提供服务化接口以及资源、性能数据;算力网络基础设施层提供多样化的网络、算力等 ABCDNETS 多要素资源。算网大脑北向对接算网运营层,提供一体化运营运维能力,实现面向用户的服务能力开放,提供可供运营层调用的原子功能及服务,同时向运

43、营侧提供端到端的资源、性能视图呈现,性能、告警指标上报;南向对接算网管控,通过算网管控的能力接口,实现算网资源信息互通,获取网络拓扑、资源信息变更、状态监控等内容,实现策略下发、配置管理,完成算网基础设施层的算网资源的一体化编排调度。算网大脑主要包含算网大脑能力开放中心、算网编排中心、算网智慧中心、算网调度中心、算网感知中心等五部分功能:算网大脑能力开放中心算网大脑能力开放中心:对接算网运营层,接收业务需求,进行业务需中国移动算网大脑白皮书(2022)17求解析并根据业务类型分发业务;开放算网一体化业务能力,完成开放能力的管理、调度以及监控;综合统一呈现算力网络服务目录、资源布局、运营状态、成

44、效评估等指标;算网编排中心算网编排中心:实现算网融合类业务的一体化编排及算网业务的全生命周期管理;算网智慧中心算网智慧中心:结合 AI、大数据等技术,实现算网智能编排、算网业务智能感知调优等智能化能力;算网调度中心算网调度中心:算力网络基础设施在算网大脑注册能力的管理;算网大脑编排结果的执行,实现算网大脑编排结果翻译、适配成南向各专业域的控制指令,向各专业域下发完成执行;算网感知中心算网感知中心:算力网络全专业运维管理域数据的采集、处理、存储、共享、建模以及分析,实现算网资源和质量数据统一纳管。一个典型的算网大脑业务流程如下图所示:图 4-3 算网大脑典型流程中国移动算网大脑白皮书(2022)

45、180.算网感知中心持续感知算力网络基础设施层的各类算力、网络等信息,并向算网智慧中心提供用于智能分析的算网数据。1.算网大脑能力开放中心接收来自算网运营层的算网业务订单。2.算网大脑能力开放中心分解业务需求,如果是非算网业务的订单转给其他系统处理,如果是算网业务需求则发送给算网编排中心。3.算网编排中心从算网感知中心获取算网资源信息和状态,获取备选资源数据。4.算网编排中心通过算网智慧中心根据业务策略和备选资源数据进行智能分析决策,选中该算网业务订单的算网资源。5.算网编排中心根据业务模板对算、网资源进行组合编排形成满足订单需求的算网业务资源组合的实例。6.算网编排中心通过算网调度中心完成对

46、算网业务实例中所有算、网资源的调度和配置,使能底层基础设施。7.算网调度中心在完成了对于基础设施层的资源的调度和配置后,向算网编排中心返回结果。8.算网编排中心根据订单完成算网业务的开通,通过算网大脑能力开放中心向算网运营层反馈订单处理结果及算网业务开通的信息。4.44.4系统功能系统功能4.4.14.4.1算网大脑能力开放中心算网大脑能力开放中心算网大脑能力开放中心对接算网运营层,接收业务需求,进行业务需求解析并根据业务类型分发业务。开放算网能力与数据,完成算网能力的管理、调度以及监控。算网大脑能力可向第三方开放算力和网络能力,算力能力包含诸如计算、存储、云内网络等算力资源和服务的申请、变更

47、和停闭的能力,AI 训练和推理、Serverless 无服务器应用等算力服务能力以及客户使用算力的资源、性能、运行等数据可视能力,网络能力包含如入云网络、接入、专线、专网等网络资源和服务的申请、变更和停闭等能力,网络安全服务能力、内容分发能力、通信能力中国移动算网大脑白皮书(2022)19以及客户使用网络的资源、性能、运行等数据的可视能力。同时,也包含算、网作为整体的整个算力网络的资源、数据、服务、中间件、流程等开放能力。同时,算网大脑能力开放中心综合统一呈现算力网络服务目录、资源布局、运营状态、成效评估等指标。运营管理运营管理:对接上层算网运营层,接收从算网运营层下发的业务订单,解析业务需求

48、,将订单按算力网络口径业务、传统移动云业务和传统网络业务进行分类;根据业务订单类型,将业务订单向编排层分发,算力网络口径业务分发至算网编排中心,传统移动云业务分发至移动云管,传统网络业务分发至网络业务编排系统;对定单生命周期进行管理,包括定单接收、定单校验、定单驳回、定单需求解析和定单归档等。能开管理能开管理:为算网运营层和其他第三方的应用系统提供能力调用服务,并对能力进行相关资料的维护和生命周期管理,包含能力新增、能力变更、能力暂停、恢复、能力下线、能力目录管理和能力发布。运行管理运行管理:实现对 API 接口能力的运行监控,性能分析,异常问题的实时告警和预警,接口服务运行的统计分析,并呈现

49、被调用的 API 服务的状态。租户管理租户管理:按照能力的使用方和运营方,算网大脑能力开放中心的用户角色可分为能力使用者和运营者。租户是能力使用者,通过在能开平台创建租户,并且获得运营者能力授权后,可使用授权范围内的能力。租户管理实现对租户的能力授权、账户的创建、修改、删除等功能。运营信息呈现运营信息呈现:呈现订购业务的企业主体信息,包含租户名称、租户编码、租户细分行业、租户地址、租户联系人信息等;呈现当前算网大脑承载的业务订单信息;展示算力网络业务质量保障等级信息,包含业务需求的计算、存储等算力指标,带宽、时延、可靠性等网络指标。统一资源呈现统一资源呈现:对算力资源、网络资源和存储资源的统一

50、展示,形成算力、网络、存储资源地图。算网能力呈现算网能力呈现:对算力网络具备的业务、服务、资源等各类能力进行统一展示,具体包括:可提供的算网业务能力、可提供组成算网业务的服务能力、算力中国移动算网大脑白皮书(2022)20资源可提供的原子能力、网络资源可提供的原子能力和存储资源可提供的原子能力等。运维信息呈现运维信息呈现:对算网业务性能指标、各专业告警信息、各类运维工单信息进行统一展示。效能评估呈现效能评估呈现:对数据中心算力效率、PUE 指标和能耗等信息进行统一展示。4.4.24.4.2算网编排中心算网编排中心算网编排中心实现算网融合类业务的端到端高阶流程的设计和一体化编排能力,完成算网业务

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服