收藏 分销(赏)

2022年算力网络科技创新成果.pdf

上传人:Stan****Shan 文档编号:1297089 上传时间:2024-04-22 格式:PDF 页数:34 大小:3.14MB
下载 相关 举报
2022年算力网络科技创新成果.pdf_第1页
第1页 / 共34页
2022年算力网络科技创新成果.pdf_第2页
第2页 / 共34页
2022年算力网络科技创新成果.pdf_第3页
第3页 / 共34页
2022年算力网络科技创新成果.pdf_第4页
第4页 / 共34页
2022年算力网络科技创新成果.pdf_第5页
第5页 / 共34页
点击查看更多>>
资源描述

1、 算力网络科技创新成果(2022)中国移动通信集团有限公司 前 言-i-前 言 着新一轮科技革命和产业变革的深入发展,数字经济已成为继农业经济、工业经济之后的主要经济形态和引领增长的重要引擎。数字经济发展速度之快、辐射范围之广、影响程度之深前所未有。算力作为信息社会的基础,已成为数字经济时代的核心生产力,对于做强做优做大我国数字经济、拓展经济发展新空间,具有重大的战略意义。面对新形势、新要求,作为信息通信领域的领先运营商,中国移动深刻洞悉算力发展趋势,把握算力时代脉搏,充分发挥中央企业“网络强国、数字中国、智慧社会”主力军的作用,深化创世界一流“力量大厦”战略,以网强算,提出了“算力网络”全新

2、理念,引起业界的广泛关注和热烈讨论。算力网络作为“东数西算”工程、全国一体化数据中心的关键组成部分,是支撑国家“双碳”战略、推动行业数智化转型的基础底座。创新发展算力网络,将有助于我国突破单点算力瓶颈,提升整体算力水平,实现数字经济高质量发展。一年来,中国移动锐意进取,持续开拓创新,在资源布局、产品服务、算网大脑、技术攻关、标准开源、创新试验、产业生态等方面取得一系列进展,现将成果汇编成册,以加强业界对中国移动算力网络的理解,汇聚行业力量,共同推动算力网络的快速发展。随目 录-ii-目 录 1 继往开来,全面推进算力网络构建.1 1.1 算力网络发展历程.1 1.2 算力网络内涵进一步丰富.2

3、 2 形成一套技术栈,布局三十二大核心技术方向.4 2.1 算力网络核心技术体系.4 2.2 算力网络重点创新技术成果.4 2.2.1 新型算力.4 2.2.2 新型网络.11 2.2.3 算网一体.14 2.2.4 绿色安全.16 3 构建一系列标准体系,开创算力网络首个开源社区.21 3.1 构筑国内外标准体系.21 3.2 培育开源产业生态.21 4 建设一个跨区域、多主体互联的试验装置,孵化技术与应用.22 4.1 打造算力网络试验示范网 CFITI.22 4.2 构建新技术、新业务实验床.22 4.2.1 东数西算类业务验证.23 4.2.2 CHBN 类业务场景验证.23 4.2.

4、3 创新技术类验证.24 4.3 构建算力网络科学装置.27 5 打造一个多元融合的算力网络新生态,促进产业健康发展.29 5.1 践行链长责任推动产业薄弱环节突破.29 5.2 联合产业构建算网融合的新生态.29 6 乘势而上,开启算力网络新征程.30 1 继往开来,全面推进算力网络构建-1-1 继往开来,全面推进算力网络构建 1.1 算力网络发展历程 自算力网络概念首次提出至今已经一年有余,中国移动正以算力网络为重大发展方向,不断深化算力网络顶层设计、攻关关键技术、完善资源布局、构建服务体系,持续推动算力网络稳步快速发展。2021 年 8 月杨杰董事长首次提出了算力网络的理念愿景,2021

5、 年 11 月中国移动联合十余家产业合作伙伴共同发布算力网络白皮书,全面阐述了算力网络的定义内涵、总体架构、愿景目标、演进路径等,向业界正式提出了算力网络全新发展理念。2022 年1 月,算力网络进一步融入到公司整体发展战略,成为中国移动力量大厦新台基和“连接+算力+能力”新型信息服务体系中关键一环。2022 年 6 月,中国移动发布算力网络技术白皮书,创新提出算力网络十大技术发展方向和核心技术体系,进一步明确了技术发展路线和产业发展方向。一年以来,中国移动围绕算网基础设施构建、CHBN 业务融合创新、创新技术引领三条主线,不断推动算力网络成熟发展。面向算网基础设施构建,中国移动紧密围绕算力在

6、物理空间、逻辑空间、异构空间的“三个融通”,深入推进算网规划布局。在物理融通方面,积极融入国家“东数西算”战略,持续完善数据中心布局,在京津冀、长三角等热点区域及内蒙古、贵州等地建立超大型数据中心,与各省市数据中心一起形成“热点集约、跨区辐射、边缘覆盖”的梯次布局体系,数据中心机架超 120 万架;在逻辑融通方面,建设超过 1500 个 CDN 节点,发展1000 余个边缘计算节点,形成云边协同的算力体系;在异构融通方面,进一步加快异构算力供给,多样化算力服务器规模超 60 万台,满足不同场景算力需求。同时,以算为中心优化网络架构,构建基于 OXC 的新一代光电联动全光网和统一 IP 算网底座

7、,打造骨干(20ms)、省域/区域(5ms)、城市(1ms)三级时延圈网络,形成覆盖全国 320 多个地市的云专网,推进枢纽节点间网络带宽向单波 400G 演进。面向 CHBN 业务融合创新,中国移动以推动算力成为“一点接入、即取即用”的社会级服务为目标,加快算网产品能力升级和运营服务体系构建。中国移动以产品算力化和1 继往开来,全面推进算力网络构建-2-算力产品化为主线,融合云、网、边、端等多要素重塑产品能力,提供云游戏、云魔百和等算力产品,打造云专线、云组网、云主机等资源型产品,做强云桌面、云视讯、云空间等算网融合型产品,提供东数西算、中训边推等场景化即时性任务式服务,切入行业热点领域,打

8、造云数智人、港机远控、工业质检、远程手术等一体化解决方案。2022 年 7 月发布算网服务 1.0,赋能千行百业数字化转型,开创算网服务新模式。为进一步提升算网运营和服务能力,中国移动加快构建算网大脑,已初步实现移动云、边缘云、省内行业云等跨层次算力资源和云专网、SPN 等跨域网络资源的统一编排调度,在 2022 年 12 月发布 算网大脑白皮书,向业界系统阐述了算网大脑的总体架构、功能要求、演进路线等,推动算网大脑产业成熟。面向创新技术引领,中国移动持续推动算力网络技术的创新突破,构建算力网络核心技术体系,加快新型智算中心、400G 等技术的试点和落地应用,超前布局存算一体、算力原生、800

9、G、算网一体等创新技术,联合产学研协同攻关,全面推进算力网络标准体系制定和开源生态构建。同时,中国移动建设了算力网络创新试验示范网,锚定新技术实验床、国家示范基地、产业聚合平台和新业态孵化器四大定位,形成“1+9+9”多节点互联的 AB 双平面引擎,验证新技术、孵化新应用、探索新模式,加速算力网络技术与应用成熟。1.2 算力网络内涵进一步丰富 中国移动提出“算力网络是以算为中心、网为根基,网、云、数、智、安、边、端、链(ABCDNETS)等深度融合、提供一体化服务的新型信息基础设施。”一年来,在推进算力网络构建的同时,中国移动对算力网络的定义内涵有了更为深入的认识。算为中心:算力是数字经济的核

10、心生产力,给数字经济带来丰富的新内涵和强劲的内驱力。一是算不单是裸计算能力,而是一种业务服务的原动力表达,任何数智化服务都是算的一种外在表现形式。从更高层面来看,算力是能量和信息融合的载体,是人类文明发展到数字文明之后的核心驱动力。二是算推动网络发生重大转变,使网络正在发生从通信网络向信息通信网络转变的重大变革。三是“算为中心”是运营商的一次自我革命,是向信息服务提供商转型的关键,同时也是中国移动向世界一流信息科技创新公司转型的关键。1 继往开来,全面推进算力网络构建-3-网为根基:网络是我国的核心优势,以网强算,是发展算力网络的根本路径。算力与网络融合程度不断加深。算力网络推动算力从有界变成

11、无界、网络从刚性变成柔性、算网从分立变成一体。一是网络使能算力边界无极限,推动算力突破单点性能瓶颈,可无限生长。二是算力赋能网络平台化升级,算力承载的网络灵活度更高、服务能力更强。三是算力网络推动算力与网络一体共生发展,打破算网边界,最终实现算在网中、网在算中。多要素融合:算力网络不是简单的云和网的融合,而是技术要素、能力要素、资源要素等多要素有机融合的新型信息基础设施。技术要素是指最基本的存、算、网的基础要素,存力、算力、运力三者同等重要,呈现深度融合一体共生之势;能力要素是指 AI、大数据、区块链等,结合底层技术要素实现融合供给;资源要素是指更加广阔的能源、土地、经济等,实现融通发展。算力

12、网络推动不同领域的要素从孤立到融合再到一体的新发展范式。一体化服务:算力网络融通各层资源与能力,为用户提供多要素融合、任务式极简、算力普惠的一体化服务。一是多要素融合统一的一体化服务,算力网络通过对技术、能力、资源等多要素的统筹调度和灵活组合,提供统一供给和一体化服务。二是智能无感极简的任务式服务,算力网络推动服务模式由“资源式”向“任务式”演进,使用户享受一致性服务质量保障和智能无感的极致体验。三是多方算力并网的社会级算力服务,算力网络汇聚全社会算力资源,实现智算、超算、通用算力和终端算力的全面贯通,屏蔽地域分布、内核形态、供给主体等差异,提供社会级普惠算力供给。2 形成一套技术栈,布局三十

13、二大核心技术方向-4-2 形成一套技术栈,布局三十二大核心技术方向 2.1 算力网络核心技术体系 为进一步凝聚产业力量,加速技术和产业成熟,2022 年 6 月,中国移动携手 12 家产业合作伙伴共同发布了算力网络技术白皮书,创新提出了算力网络十大技术方向,明确了核心技术体系与技术路线。算力网络十大技术发展方向包括了泛在智能的新型算力、以数据为中心的多样性计算架构、光电联动的全光网络、超低时延驱动的确定性网络、算网深度融合的原创技术、融数注智的算网大脑、可信共享的算网服务、端到端的绿色低碳技术、算网一体化全程可信和空天地一体的星云算网,覆盖了算力、网络、算网一体、算网大脑、算网服务、绿色安全、

14、空天地一体等领域,全景式的展示了中国移动对算力网络技术发展趋势的判断。同时,中国移动通过对算力网络的关键技术进行体系化的梳理和深度挖掘,围绕算力网络十大技术发展方向,重点聚焦存算一体、算力原生、算力度量、算力路由、在网计算等三十二大核心技术,构建形成算力网络核心技术体系,横向映射算力网络三层体系架构,纵向串联各技术栈,打造算力网络技术的领先优势。2.2 算力网络重点创新技术成果 中国移动深入推动算力网络技术的创新与应用,在新型算力、新型网络、算网一体、绿色安全四个主要领域取得了一系列技术成果。2.2.1 新型算力 中国移动正加快构建以数据为中心的新型计算架构,围绕数据中心的第二颗大芯片GPU

15、和第三颗大芯片 DPU 开展深度攻关,提升多样化算力供给能力;超前布局,推动算力原生、存算一体技术成熟,屏蔽异构硬件差异,提升算能算效;拓宽算力供给,加快社会算力并网方案的探索与实践,构筑社会级算力服务能力。2 形成一套技术栈,布局三十二大核心技术方向-5-新型智算中心 智能算力是以 GPU、TPU、NPU 等智能计算芯片为基础,以多样化海量数据为对象,以算法为驱动,以提升 AI 效能为目标的关键计算能力。新型智算中心以智能算力为基础,专注于大规模 AI 模型训练的需求,已成为未来 AI 基础设施发展新趋势。目前新型智算中心发展存在多条技术路线,生态割裂问题突出,底层硬件差异导致业务开发、迁移

16、、部署的成本居高不下。为应对上述系列挑战,推动国内智算产业生态健康、长远发展,中国移动针对性地打造了智算技术架构、评估评测标准以及生态体系:一是完成智算中心整体设计方案的制定。通过计算、存储、网络、高密基础设施四大资源横向协同设计,实现智能算力极致性能释放。在计算方面,明确以 XPU+CPU 异构计算范式为主硬件技术路线,将复杂逻辑运算、高并发矢量、矩阵和张量运算模式特征结合,打造 CPU 与 XPU 协同机制。在存储方面,制定分布式融合存储方案,要求一套存储系统支持块、对象、文件等多种协议。在网络方面,为顺应数据、AI 模型的巨量化趋势,设计服务器节点内多卡互联网络和多服务器节点间网络互联方

17、案。其中,节点内的多卡互联方案以 PCIe、OAM 高速互联等标准互联协议为主;节点间网络方案将基于 RoCE 的以太网络技术搭建,实现池化资源间总线级交互,保证数据访问的极低时延。在数据中心基础设施方面,采用高密度功率机柜、高效制冷技术以实现绿色低碳目标。二是完成软硬协同框架设计和平台原型构建。兼顾软件平台与硬件资源的纵向协同设计,打造广泛支撑智能化应用场景的能力。明确以算力原生为技术锚点,AI 框架优化为辅的跨架构开发、编译、优化环境技术路线,从算子粒度上屏蔽底层智能硬件差异,对下使能智算应用跨架构无感迁移,对上释放 AI 框架协同运用效能,破解竖井式异构生态发展难题。三是联合产业构建了自

18、主评测体系,牵引 AI 异构产品能力有效迭代。为客观反映 AI芯片部件能力,中国移动已完成统一的功能、性能评估方案制定,通过打造训练、推理全场景验证环境,持续牵引产品优化升级,同时将评估体系纳入“芯巢”多样性算力孵化平台,通过高要求业务牵引芯片能力迭代,进一步支撑跨行业应用推广。为加快算力网络智算基础设施能力建设,2022 年 12 月,中国移动成立了新型智算开放实验室,围绕技术标准制定、产品评测验证、智算原生体系构建、智算平台应用赋能四2 形成一套技术栈,布局三十二大核心技术方向-6-大目标,与产业合作伙伴开展深度合作,共同挖掘智算新需求,推动智算技术及产业成熟。新型数据处理芯片(DPU)D

19、PU 是当前数据中心新兴的第三颗大芯片,专注于数据处理,可有效分担 CPU 的网络、存储、计算、安全等云化工作负载,达到卸载、加速和应用隔离的效果,在提高算效、降低能耗的同时,更好地支持裸金属弹性发放等服务,是算力网络以数据为中心的全新计算架构底座。当前,受限于软件的关联和硬件的适配,技术架构不明晰、软件标准不健全、硬件定制化严重已成为 DPU 行业健康发展需要解决的问题。为应对上述系列挑战,推动 DPU 产业稳步健康发展,中国移动针对性进行了体系化攻关:一是完成了 DPU 算力基础设施架构设计。DPU 算力基础设施由服务器硬件层、DPU软硬融合层、平台应用层三层组成,包含管理、网络、存储、计

20、算、安全五大基础功能系统。其中管理功能要实现虚机、容器、裸机的统一管理运维,网络功能要实现高性能vSwitch 转发、支持 RDMA 无损网络,存储功能要实现云盘灵活挂载和 NVMe 高性能存储加速,计算功能要实现 Hypervisor 卸载和虚机的安全隔离,安全要实现分布式 FW 卸载和网络数据加解密增强等。图 1 DPU 算力基础设施架构 二是明确了 DPU 软件标准化的关键领域,围绕 DPU 算力基础设施架构中的五大方面展开 DPU 软件功能及接口标准化工作,目标实现向上与云平台的解耦。网络方面,制定 vSwitch、RDMA 功能要求以及 vSwitch 控制面与转发面、RDMA 兼容

21、性编程接口等关键接口;存储方面,制定存储网络协议 iSCSI、NVMe-oF 卸载标准方案;计算方面,2 形成一套技术栈,布局三十二大核心技术方向-7-制定 Hypervisor 前后端分离架构与 libvirt 接口标准,管理方面标准化弹性裸金属发放流程和虚机、容器、裸机统一管理运维要求,安全方面,制定网络数据加解密和虚拟化安全增强要求。结合技术成熟度和中国移动业务需求,制定了中国移动 DPU 软件标准化发展两步走的发展路径,即一阶段重点关注弹性裸金属与 vSwitch 卸载相关功能,二阶段重点关注统一运维管理、高性能存储、无损网络、零信任安全等功能实现。三是确立了 DPU 服务器标准化“四

22、个统一”的方向,围绕 DPU 冷机自运行、远端重启服务器等核心功能在服务器整机结构、供电、散热等方向制定了标准要求,目标实现向下与服务器的解耦。包括统一整机结构及供电最大能力,约束服务器可支持卡的最大结构规格、最大功耗门限以及卡在服务器未开机状态启动;统一散热能力,约束服务器支持未开机状态对卡进行散热及调速;统一边带信号定义及管理功能边界,约束服务器能够提供给 DPU 的边带信号,逐步收敛带外管理设备的交互框架;统一运维策略,定义裸金属场景上下电、复位、固件升级、异常下电、故障处理等场景的开关机流程及处理策略。为固化相关成果,中国移动牵头在 CCSA 推进 DPU 相关标准立项,构建算力卸载软

23、硬件标准体系。2022 年 7 月,在世界数字经济大会上联合十余家产业合作伙伴发布了 中国移动 DPU 技术白皮书,系统性地阐述了基于 DPU 的算力基础设施架构、软件功能接口、服务器硬件三大标准化方向,旨在凝聚行业共识,推动 DPU 产业稳步健康发展。2022 年 12 月,中国移动联合产业合作伙伴成立 DPU 创新开放实验室,锚定业务场景孵化器、技术方案实验床、产业聚合平台三大定位,发挥中国移动产业链链长责任,拉通产业合作,引导业界产品成熟落地。算力原生 随着业务多样化需求的增长,以 CPU 为主的通用计算逐渐难以满足计算性能的要求,以 CPU、GPU、FPGA 等不同架构计算单元组合而成

24、的异构计算开始出现,用于满足通用计算和专有计算的不同需求。当前不同异构芯片的开发生态相对独立,应用的跨架构开发和迁移困难,不利于应用的创新以及算力资源的合理规划和高效利用,亟需通过开源、开放的方式建立可屏蔽底层硬件差异的跨架构开发平台。中国移动面向算力网络中远期的发展,原创性的提出了算力原生概念,通过构建标准统一的算力抽象模型及编程范式接口,打造开放灵活的开发及适配平台,实现各类异构硬2 形成一套技术栈,布局三十二大核心技术方向-8-件资源与计算任务有效对接、异构算力与业务应用按需适配、灵活迁移,充分释放各类异构算力协同处理效力、加速智算应用业务创新,实现异构算力资源一体池化、应用跨架构无感迁

25、移、产业生态融通发展的目标愿景。一年以来,算力原生技术受到了产业界及学术界的高度关注,为加速技术成熟,中国移动联合业内伙伴加大投入,持续对技术架构、演进路径及关键技术等进行了体系化研究攻关:一是完成了算力原生总体技术架构制定。明确了算力原生技术栈由算力池化层、算力抽象层两层组成。其中算力池化层对应用调用底层算力资源的请求进行重定向和再调度,从而实现应用对底层算力资源位置和数量的无感使用,支持业务可根据动态负载情况进行算力资源的弹性调度,充分应对潮汐效应和业务量突发等场景。算力抽象层一方面建立统一原生算力抽象接口及多模混合并行编程模型,以算力原生统一编程 API 及一组编译、优化、适配的核心工具

26、进行呈现,构建可嵌入式融入用户业务的开发环境,辅助用户生成可跨架构流转、无感迁移和任务式映射执行的算力原生程序;另一方面构建包含原生运行时、编程模型转换工具的硬件原生堆栈,完成原生程序的加载、解析,保障计算任务与本地计算资源的即时互映射,按需执行。图 2 算力原生总体架构 二是明确了算力原生三阶段技术演进路径。阶段一的核心目标是实现异构算力资源池化,通过构建分厂家分类型的异构资源池,引入对应用调用底层算力资源 API 的重定向技术,实现同厂家算力资源细粒度的定制化分配和灵活调度;阶段二的核心目标是实现应用的跨架构迁移,通过引入跨架构转译工具,实现将基于特定芯片厂家开发的应用转换成算2 形成一套

27、技术栈,布局三十二大核心技术方向-9-力原生中间原语,结合算力原生运行时和各厂商工具链,生成可跨架构互识、流转的算力原生程序,最终实现向多厂家芯片上无感迁移和映射执行;阶段三的核心目标是实现全局泛在融通,基于一二阶段实现池化和跨架构无感迁移的基础上,通过打造算力原生统一接口和开发平台,形成统一编程模型及开发环境,使能应用开发者实现跨架构的混合并行编程,加速应用和服务创新。三是确立了算力原生的三大关键技术。包括算力抽象技术、跨架构编译优化技术和原生运行时技术,其中算力抽象技术着重针对统一编程模型、数据模型、同步机制等领域进行攻关,使开发者在编程时既可以充分利用丰富的异构资源、又不必考虑复杂的系统

28、细节;跨架构编译优化技术着重攻关原生代码自动生成、数据自动管理和模型的多级并行等方向,降低开发复杂度,提高程序的可移植性;原生运行时技术重点针对任务的队列调度及再映射机制、数据共享与同步等方面进行攻关。为加快算力原生技术成熟,中国移动与产业合作伙伴共同开展技术攻关,完成算力原生原型系统的设计和研发,已初步实现图像识别、视频流分析等 AI 应用的跨架构迁移部署。2022 年 11 月,中国移动联合产业合作伙伴发布面向智算的算力原生白皮书,明确了算力原生的定义及愿景,系统性阐述了总体架构设计和关键技术攻关方向,为算力原生技术的发展指明了方向。同时,中国移动已牵头在 ITU、CCSA 完成算力原生标

29、准立项,并积极推进 OIF CFN 开源社区算力原生子工作组的建设,加速构筑繁荣的算力原生产业生态。存算一体 存算一体是实现算力网络数据高效处理的创新技术,通过拉近计算与存储单元距离,直至在存储器中完成计算功能,突破冯诺依曼存算分离“存储墙”、“功耗墙”瓶颈,可广泛应用于 AI 等访存密集场景。当前,存算一体正处于从学术界向工业界转化的关键窗口期,存在多种路线选择,需要从器件制造、电路设计、芯片架构、工具链、软件算法等各方面拉通产业链上下游密切协作。为推动存算一体技术更快实现产品化,中国移动从多方面开展攻关:一是统一广义存算一体概念和技术分类,形成多路径探索策略。联合产业定义广义存算一体概念,

30、提出近存计算、存内处理和存内计算三大分类和技术发展建议,推动业界形2 形成一套技术栈,布局三十二大核心技术方向-10-成共识。对 SRAM、RRAM、MRAM 等多种器件及其存内计算展开深入研究,并推进多项研发工作。目前已与企业开展面向 SRAM 的存内计算合作研发,与科研院校开展面向物联网端边计算的 RRAM 存算一体技术联合研发。二是完成存算一体芯片通用架构设计,并初步构建软件工具链。面向端边云不同规模算力需求、不同算法需求,设计了具有持续演进能力的存算一体通用芯片架构,结合2.5D/3D/Chiplet 等先进封装技术,将不同器件、不同制程的存内计算芯片相融合,实现优势互补,适配更多应用

31、场景、提供更大芯片算力。三是推动建立存算一体链式合作平台,进一步加强与产学研联合攻关,推进芯片制造、设计、EDA 等核心环节互促,推动存算一体全产业链成熟。为加快实现存算一体核心技术突破,2022 年 12 月,中国移动联合产业合作伙伴共同发布存算一体白皮书,旨在聚合产业力量,共同攻关关键技术,推动存算一体技术落地应用。此外,中国移动推动“如何实现存算一体芯片工程化和产业化”提案成为中国科协“2022 十大重大产业技术问题”之一,受到了产业界的高度关注。算力并网 数字经济时代下,我国算力规模虽持续扩大,但是算力分布不均、供需失衡等问题,导致社会算力利用率难以提升。通过多方算力并网,广泛吸纳全社

32、会算力资源,在商业模式上打破传统的算力供给方和消费方的界限,有助于盘活社会算力,在提升资源使用效率的同时,实现算力普惠。算力并网作为算力网络运营服务体系的关键技术,对于实现社会级算力供给,打造全新的算网一体服务能力有重要的意义。当前,算力并网仍在探索阶段,中国移动系统性地进行了攻关研究:一是明确了算力并网的四种模式。中国移动结合算力并网业务需求,对于不同的算力类型,包括三方云池、服务器以及超算/智算等算力,按照技术实现由易到难、管理程度由弱到强,明确了包括转售、运营层对接、编排管理层对接及小型算力纳管四种并网模式。其中转售模式是指通过运营平台嵌入第三方售卖链接,通过运营跳转,由第三方进行算力的

33、售卖,已应用于对接三方公有云;运营层对接指通过运营平台调用第三方算力运营平台接口,实现对三方算力的初步管理并进行售卖,该模式正探索用于对接三方超算/智算中心;编排管理层对接指通过云管平台对接第三方云管平台接口,实现对三方算力的强管理,2 形成一套技术栈,布局三十二大核心技术方向-11-并通过运营平台进行三方算力售卖,该模式正探索用于对接三方公有云和小型三方云池;小型算力纳管指通过向三方服务器植入插件或代理,实现分布式基础设施的统一管理和多集群调度能力,并通过运营平台统一售卖,当前正在探索用于纳管三方小型服务器算力等。二是完成了算力并网交易原型平台研发,并在多个省份开展了算力并网模式的探索。算力

34、并网交易原型已在中国移动算力网络试验示范网进行部署,完成了包括算力并网、多方可信交易等关键技术验证,加快了算力并网技术方案的成熟。此外,中国移动浙江、河南、山东、广东等省公司也同步开展了多种并网模式的探索,为算力网络打造社会级算网服务能力奠定了基础。三是持续推动算力并网交易的标准化工作。中国移动牵头在 CCSA 推进相关标准立项,加快推进算力注册、接入、度量、分级、交易等并网关键技术环节的规范化和标准化工作,推动行业形成共识,加快多方算力交易生态构建。未来,中国移动将与产业合作伙伴进一步深入合作,共同攻关算力并网和算力交易技术,探索运营服务模式。同时,综合考虑算力并网技术的成熟度和市场业务需求

35、,分阶段逐步开展算力并网工作,面向近中期加快推进运营调用、云管对接方案的规范化和标准化,面向远期加快实现小型算力资源池纳管方案商业闭环。2.2.2 新型网络 我国提出的全国一体化大数据中心体系对网络能力提出新的要求,东数西算、东数西渲、东数西训等跨省、跨区域业务将成为未来重要的业务场景。中国移动积极推进G-SRv6、新一代 SD-WAN 技术的应用,实现用户敏捷接入和网络端到端服务质量保障,加快400G/800G 技术的攻关和验证,满足东数西算场景下长距离、大容量的网络需求。G-SRv6 SRv6 是新一代 IP 网络的核心协议,具备可路由属性和可编程能力,可简化域间路径创建,满足灵活的网络和

36、业务功能需求,SRv6 结合 SDN 技术使能可编程的网络,为网络基础服务、增值服务提供了技术基础。但由于原生 SRv6 面临在长路径编排情况下报文头开销过大,带宽利用率较低,对芯片要求高等一系问题,对现网设备的性能及规模应用带来一定挑战。2 形成一套技术栈,布局三十二大核心技术方向-12-为解决上述问题,中国移动主导原创了 G-SRv6 技术,对 IPv6 报文头的基础帧格式和基本转发机制进行创新,通过压缩冗余前缀提升封装效率,在兼容原生 SRv6 的同时,彻底解决了原生 SRv6 存在的转发效率低、部署难度大的问题。为推动 G-SRv6 技术的快速成熟,实现从技术方案到产品落地和产业推广,

37、中国移动在标准制定和产业生态建设两方面共同推动:一是推动 G-SRv6 成为国际网络标准。中国移动在 IETF 推动成立 SRv6 头压缩设计组,主导完成 SRv6 头压缩需求、方案分析标准立项,推动 G-SRv6 成为 SRv6 国际基础标准之一,实现我国在 IP 网络基础协议方面的突破。二是实现 G-SRv6 技术产品化和标准化。积极推进 G-SRv6 全产业链生态的构建,牵头完成包括芯片、设备、控制器、测试仪等国内外十多家厂商互联互通验证,推动整体技术成熟。通过在 5 个省进行现网试点,完成了 G-SRv6 基础转发机制、业务保障、跨域互联多场景及多厂家互通能力验证,标志着 G-SRv6

38、 已具备现网规模部署能力。中国移动正加快完善统一 SRv6/G-SRv6 协议栈的 IP 算力网络底座,推进 SRv6/G-SRv6 规模部署,同时构建基于 G-SRv6 构建技术创新体系,开展随流检测技术标准制定和试点验证,进一步提升业务感知能力,并结合切片技术,为算力网络业务提供确定性的网络质量保障。新一代 SD-WAN 随着企业数字化转型的不断加速,传统的 Underlay 专线由于业务开通周期长,人工对接多,已越来越难以满足企业诉求。基于 Overlay 的 SD-WAN 虽然通过网络集中管控极大缩短了业务开通周期,但由于管理控制触点多,在提供差异化、确定性 SLA 服务的时候仍面临局

39、限。相对于传统 SD-WAN,新一代 SD-WAN 通过 Overlay 和 Underlay 网络协同大幅增强差异化质量保障能力,基于统一的 SRv6/G-SRv6 实现端到端网络可编程,通过应用感知能力实现差异化的网络服务,利用业务质量感知技术进行 SLA 闭环控制实现网络质量可靠保障,并采用业务链技术提供连接增值服务。为推动新一代 SD-WAN 技术的快速成熟,实现从关键技术到迭代验证再到产业推广的闭环,中国移动从标准、产品、生态三方面共同推动:2 形成一套技术栈,布局三十二大核心技术方向-13-一是完成新一代 SD-WAN 标准在 BBF、CCSA 立项。提出 SRv6/G-SRv6

40、面临的入云、无线/有线任意上行、VPN 安全隔离等系列问题的解决方法,实现基于统一 SRv6/G-SRv6 协议体系的应用驱动、泛在接入、差异化连接、安全可靠、算网一体的能力。要求防火墙能够支持 SRv6/G-SRv6 报文解析,并规定 CPE 发出的 SRv6/G-SRv6 报文的填充内容,以实现防火墙穿越;采用隧道封装的方式,使报文可实现无线/有线任意上行;采用源地址验证等方式保证 VPN 安全性。二是完成新一代SD-WAN方案制定和跨厂商测试验证,推动产业成熟。通过推动CPE、PoP、控制面全面解耦,提供端到端隧道、端到端加密、应用感知、业务链等服务。联合多家设备厂商开展多厂家实验室测试

41、,推动跨厂商互通问题解决,为大规模组网奠定基础。当前,新一代 SD-WAN 已实现 Underlay/Overlay 融合的网络连接拉通能力,未来将进一步聚焦于运维、管控、转发的闭环,提供基于业务质量意图的确定性保障能力,同时重点推动算力增值服务和连接服务的协同,基于业务链技术打造算网多要素融合产品。400G/800 全光高速互联 400G/800G 光传输技术是指在波分复用系统(WDM)中使单波长传输速率达到400G 或 800G、光纤总容量达到 32T 或 64T 的传输技术,是超高速大容量光传送网的重要演进方向,能够进一步提升网络带宽并降低每比特传输成本。随着“东数西算”工程正式启动,我

42、国算力网络基础资源设施建设已全面展开。如何实现超长距离、超高速的传输,满足大量东部地区用户在西部地区进行数据中心存储、AI训练、渲染等算力应用时提出的大带宽、低时延传输需求,成为业界面临的问题。中国移动加快推动 400G 技术验证与应用,同时超前布局 800G 技术,从多个方面开展技术攻关,取得了一些初步验证结果:一是持续推进 400G 传输关键技术研究和验证。目前 400G 长距传输存在多种技术路线,决定 400G 技术选择的核心是高波特率光管芯,中国移动联合业界实现调制、频谱、基础设施全面技术革新,完成了全球首个 400G QPSK 准实时系统模拟现网真实参数传输验证。二是创新设计单载波

43、800G 传输系统方案,有效抑制信号传输性能恶化。联合采用大有效面积(130um2)超低衰耗 G.654.E 光纤和拉曼放大方案,实现超过 2000km 极限2 形成一套技术栈,布局三十二大核心技术方向-14-传输距离,为 800G 传输技术的发展提供了重要的方向指引。三是开展新型光纤技术研究与验证。与科研院校联合攻关,实现了空芯光纤上 40 波800Gb/s PM-64QAM 大功率光信号传输,进一步提升光纤通信系统的容量,降低传输时延。中国移动将持续推动 800G 超高速传输技术、核心器件、新型光纤的技术实现和产业化,在长距大容量传输、C6T+L6T 超宽谱波段扩展、光电联动全光组网技术等

44、方面开展技术攻关,推进超高速率、超长距离、超大容量、超宽频谱等关键技术研究和突破,助力光传送网向大带宽、低时延、高效灵活、安全可靠演进,实现算力网络全光高速互联和全光灵活调度。2.2.3 算网一体 算网一体是计算和网络两大学科交叉融合形成的新型技术体系。中国移动以算力网络化和网络算力化为推进方向,重点攻关算力路由和在网计算技术,在明确技术架构与技术路线的同时开展原型验证,加快技术成熟。算力路由 算力路由作为算网一体的标志技术,旨在通过网络来感知、调度、编排算力,融合计算和网络形成新的架构和协议,进一步推动基础设施走向算网融合,使海量的应用能够按需、实时调用不同位置、差异化的算力资源,通过连接和

45、算力的全局优化,实现用户体验、资源利用率和网络效率的最优组合。算力路由需要网络域、计算域协同创新,当前算力和网络各自的技术体系、架构实现和发展路径不同,编排调度、运营优化相对独立,算网一体的统一架构、技术标准和开源生态等还不完备。为应对上述系列挑战,中国移动从顶层设计出发,原创地提出算力感知和路由技术体系,并从技术、标准、产业多方面持续推进:一是完成了面向算网一体演进的算力路由架构和技术体系的制定,包括一体化调度、一体化协议、一体化设备和一体化服务,推动计算和网络两大学科融为一个体系,共生发展。确立了算力路由 Overlay 和 Underlay 两种技术体系,Underlay 实现算力和距离

46、向量的融合创新;Overlay 实现选路决策从一维变多维,进行算、网、业务多目标联合优2 形成一套技术栈,布局三十二大核心技术方向-15-化。二是明确了 Underlay 和 Overlay 并行探索的算力路由技术路线。面向近期,构建算网协同感知技术体系,初步形成基于多维资源感知及SRv6选路的集中感知路由调度能力;面向中期,探索演进算力路由方案,Underlay 基于 IPv6/SRv6 等已有协议扩展增强,Overlay 基于应用层优化,形成 Underlay 与 Overlay 协同的智能路由调度方案;面向远期,设计新型算力路由协议体系和算路算法,实现更加优化的多要素叠加融合路由。为推进

47、算力路由技术创新和应用,中国移动与产业合作伙伴共同开展技术攻关,于2019 年和 2021 年先后发布系列算力感知网络技术白皮书,逐步明确了算力感知和路由场景需求、概念、架构和关键技术,为算力路由技术发展奠定了基础。2022 年 8 月,在业界首发算网一体架构及技术体系展望白皮书,系统性阐述算网一体架构及技术体系。同时,联合产业伙伴共同推进算力路由创新技术试验验证,初步搭建端到端算力路由验证系统,完成阶段性功能测试和性能测试。在 IETF、CCSA 牵头完成算力路由标准立项,积极推进算力路由需求、场景和关键技术达成共识,加速算力路由技术成熟。在网计算 在网计算将应用相关的计算卸载至网络设备,在

48、完成数据转发的同时实现部分数据处理,提升了系统的计算效率,降低通信延迟,减少总体能耗,同时有效地提高了网络设备利用率。作为具有重要应用潜力的算网一体关键技术,在网计算可灵活按需卸载多种计算、网络、存储、安全相关功能,如数据在网聚合、在网缓存、分布式系统一致性在网校验等,在网计算将为算力网络发挥关键作用。当前,在网计算产业实践仍处于探索初期,面临技术路线不清晰,应用前景不明确,软硬件功能不统一,标准体系不完善等问题。中国移动体系化布局在网计算的研究和产业化技术路线,面向近期和远期分别开展研究实践:一是明确了在网计算的发展思路,分阶段推动在网计算从特定场景到通用场景计算任务承载。初期以智算中心分布

49、式 AI 模型训练和通用数据中心云网关功能灵活卸载两个典型应用场景切入,设计在网计算系统架构和技术方案,在专用场景中验证在网计算的技术优势。面向远期,研究构建通用的在网计算能力,为更广泛的应用场景提供能力支撑。二是面向典型应用场景制定了在网计算方案,通过可编程网络设备实现部分功能的卸2 形成一套技术栈,布局三十二大核心技术方向-16-载,完成系统原型验证。中国移动构建分布式 AI 在网计算原型系统,相比业界主流的集中式参数服务器架构,在 8 台 GPU 服务器的计算规模下,可以将 AlexNet、VGG 等标准AI 模型训练速度提升 1 倍以上。基于 x86 CPU、FPGA、ASIC 设计构

50、建算网融合网关,可实现对传统服务器负载均衡、防火墙、NAT、VPN 等网络功能的卸载,进一步提升资源使用效率。三是面向通用场景开展标准化工作,加快通用在网计算能力构建,推动在网计算从局部应用走向全局泛在。在网计算在分布式 AI 计算加速、分布式存储系统优化以及云网络功能卸载等方面具备一定共性特征,中国移动正通过挖掘在网计算的共性能力,不断推进在网计算相关标准化函数接口的设计工作,为不同应用服务提供按需的在网计算服务。图 3 在网计算技术架构 中国移动不断推进产业实践工作,2022 年 9 月,联合业界产业共同发布了P4 超融合网关技术白皮书,推动在网计算基础设施产业生态成熟。标准化方面,202

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服