1、N510 云边端融合的算网架构在智慧园区中的应用研究宋今1张河翔2(1.中国移动通信集团有限公司,北京 100032;2.中国移动通信集团重庆有限公司,重庆 401121)摘要:随着全社会数字化变革的持续推进,利用云计算、边缘计算、人工智能、大数据、物联网等技术为各类园区赋能,打造新型智慧园区已成为趋势。然而,各类园区普遍占地规模大、入驻单位众多、持续建设周期长,在信息化系统建设领域存在重复建设、“信息孤岛”、网络架构复杂、算力不足且分配不均、缺乏统一算力调度体系等问题。同时,多种高算力需求技术应用越发普遍,算力和网络融合调度不足或成为制约园区数字化转型效果的基石性问题。基于此,从园区算网现状
2、、云边端融合的算网架构、算网融合赋能智慧园区的具体案例等维度研究云边端融合的算网架构在智慧园区中的应用。关键词:云边端融合;算力调度;算网融合;智慧园区;数字化转型中图分类号:TP183;TP393 文献标志码:A引用格式:宋今,张河翔.云边端融合的算网架构在智慧园区中的应用研究J.信息通信技术与政策,2024,50(2):55-62.DOI:10.12267/j.issn.2096-5931.2024.02.0090 引言当前,各地智慧园区建设如火如荼,人工智能(Artificial Intelligence,AI)、云计算、边缘计算、大数据、物联网、数字孪生等信息化技术在各类型产业园中持续
3、应用。值得关注的是,智慧园区中信息化系统重复建设、“信息孤岛”以及缺乏算力统一调度的情况并不罕见。近年来,随着 AI 等技术的快速迭代,园区对各类 AI 大模型、通用视频图像分析、数字孪生等高算力要求的应用需求越来越大。因此,相对低水平的算网调度体系与越来越高的算网需求之间形成了新的矛盾,并已成为制约园区智慧化、数字化水平提升的关键所在。本文认为,云边端融合的算网调度体系将逐步成为突破智慧园区发展瓶颈的核心数字底座。中国信息通信研究院研究报告显示,算力由云端加速向边侧、端侧扩散,边端计算能力持续增长。如何将智慧园区已有的云端算力、边缘算力、前端算力进行联通,同步实现算力与网络结合,打造出云边端
4、融合的算网架构体系,成为事关新型智慧园区数字化转型成败的关键。1 智慧园区算网现状分析1.1 园区特点分析本文调研了分布于重庆、四川、浙江、宁夏 4 地 13个不同类型(含工业类、科创类、医疗类、文旅类、港口类、物流类等)且处于建设中的智慧园区,发现在园区管理上普遍有占地面积大、入驻企业多、建设周期长、管理部门多、信息化需求大等特点,在园区信息化则面临着算力和网络需求大、数据协同难度大、需求种类多、重复建设多、“信息孤岛”等问题。1.2 园区算力需求分析经调研发现,13 个智慧园区的信息化需求存在共性55E0需求和特色化需求,但最底层的算力需求基本趋同,即对算力的需求愈发旺盛,需要更智慧的算力
5、网络(见表1)。1.3 园区算力现状分析本文分析 13 个智慧园区的算力现状后(见表 2),发现以下 4 个共性问题。一是园区普遍租用了不同云提供商的云服务;二是园区普遍具有可视化指挥展示中心,需要对数字孪生模型等进行渲染;三是园区各类自建小机房遍布,甚至一些弱电设备间也放置了服务器;四是园区终端侧算力鱼龙混杂,传统终端和智能终端并存。1.4 园区网络现状分析网络是实现智慧园区算力调度的基础。调研发现,网络的复杂现状对实现园区数据协同提出了更高要求(见表 3)。各园区网络涵盖类型复杂,包含内网、互联网、电子政务外网、数据专线、固定电话、5G/4G网、无 线 局 域 网(Wireless Loc
6、al Area Networks,WLAN)等。多数园区由于规划不足,尚未实现“一张网”统领,且各种局域网、外网、专网协同不充分。此外,园 区 支 持 软 件 定 义 网 络(Software Defined Network,SDN)及网络功能虚拟化(Network Functions Virtualization,NFV)的智能化设备占比低,网络智慧化程度不足,但是也有少数园区正在实现“一张网”统领,使用了支持 SDN 技术的融合网关类产品,园区网络的智能调度初见雏形。表 1 园区算力需求分析信息化需求各类应用园区算力需求共性需求智慧安防、物业管理、规划建设管理、物联网平台、大数据分析平台特
7、色化需求(定位不同而产生)智慧科创、智慧文旅、工业互联网、车联网、智慧农业、智慧物流从数字底座上进行剖析:园区视频图像分析、数据挖掘、数字孪生、海量数据资源处理等带来越来越高的算力需求表 2 园区算力现状算力类型算力分布共同特点云侧普遍租用公有云、部分自建私有云边缘侧部分有统一的数据中心加分散在各个楼栋的小机房,指挥中心普遍带有配套算力、甚至弱电间也分布了算力终端侧常规不带算力终端占比超过 95%亦有少量带算力终端缺乏算力摸底算力不足缺乏调度,各自为战、资源浪费智慧化不足,没有根据不同应用而发挥不同算力的特点表 3 园区网络特点园区网络特点具体现象网络类型复杂有线网(光纤、综合布线、电力载波等
8、)、无线网(WLAN5G4GNB车联网等)公网(互联网出口等)、专网(园区内网、5G 专网等)协同不足部分园区有线网和无线网未打通、园区网与入驻企业自建网缺乏互通带宽不足且不平衡部分接入点带宽不足部分网络带宽利用率很低智慧不足SDN/NFV 等技术运用不足65N510 2 云边端融合的算网架构基于园区越来越高的智能算力需求与算力和网络普遍不足的现状之间存在的矛盾,本文将进一步提出更适用于智慧园区未来各类智慧化需求的云边端融合算网调度体系2,研究以云边端融合的算网架构助力园区现有算力和网络,在新增投资有限的基础上,用较小的升级改造成本提升园区智慧化水平3。2.1 园区云边端融合的算网融合架构关键
9、技术2.1.1 园区算力网络基础设施摸底及感知对算力和网络等基础设施进行摸底、分类、感知,是搭建云边端算网融合架构的基础工作。常见的算力摸底及感知,应首先分析园区当前及规划中的算力及网络的基本情况(见表 4),包括但不限于算力资源分布的位置在云端还是本地,算力适合通用计算还是专用计算,算力当前可用状态及当前负载情况;网络的承载形式、时延、带宽利用率等。表 4 园区算力网络等基础设施摸底园区算网基础设施摸底常见使用场景摸底信息云端算力训练、挖掘、综合存力运力等边缘算力推理、筛选、分析等前端算力感知、简易计算网络状况云边端的协同等算力 规 模、部 署 位置、算力特点、算力负荷、超融合/SDN/NF
10、V 等 能 力、带 宽利用率、网络的承载形式、时延等2.1.2 园区算力度量及简易标识算力摸底后,需进一步对园区算力进行分类度量和标识4。通常,可根据处理对象不同,将园区算力分为通用算力和专用算力,同时在硬件层面也存在不同的异构芯片与二者对应,如 CPU 作为通用算力的代表更擅长进行常规计算,而 GPU/DPU/TPU 等专用算力代表更擅长 AI 计算等5,需要区分对待。解决异构算力的度量及标识问题是业界一大难题,但对于园区而言,其算力规模和算力需求相较大型云服务商和运营商的数据中心而言更加简易,在算力的度量和标识上相对简单。本文主要考虑园区普遍使用的通用算力(不考虑园区存在少量的异构算力),
11、将基于 X86 架构的 CPU 算力和园区普遍需要的用于视频图像分析的 GPU 算力作为度量重点;将园区刚需算力的单位统一换算成每秒能完成的浮点运算次数(单位:FLOPS);并将其他诸如服务信息、位置信息、算力需求、带宽需求等信息同时进行标注,为后续的算网解析以及不同节点间的调度提供依据。为确保这种园区简易标识的有效性,一般需在园区规划设计时进行明确。2.1.3 云边端算力协同云计算、边缘计算以及各类终端前置算力各有其特点和适应场景。如终端功能单一但能耗更低;边缘侧算力时延更低,可做到数据不出园区;云端则拥有强大的计算、存储资源但位置远离园区。云边端协同可通过云上、边缘、终端在算力上的互补,提
12、升算力效率,但若“各自为战”,或导致多数复杂应用场景无法实现,以及诸多资源浪费和重复建设问题。在当前大部分园区都在降本增效的经济背景下,实现云边端融合的算力调度显得迫在眉睫。云边端协同后,园区的智能终端除可将感知数据传给边缘侧外,还可根据指令直接进行简易计算,效率更高;园区边缘计算更接近应用现场、时延更低,可初步处理执行云端的下沉任务,同时又为云端筛选出更科学和更有价值的数据;园区云端可依托更丰富的算力、存力等,实现更优的业务应用模型构建和全局管理,如在进行 AI 深度学习模型的训练时,将训练好的结果下发到边缘端,让边缘端更快速执行推理等动作,同时在云端进行海量和长周期的数据存储、大数据的挖掘
13、分析工作等6-7。2.1.4 园区算力融合及简易算力路由算网融合是算力和网络后续发展趋势。与传统网络和传统算力相比,算网融合后的算力网络可同时分析算力开销和网络路由开销,并依据网络和算力两个维度综合判断出最优调度规则,解决了传统算力调度中“重算力、轻网力”的问题。算力网络的一个关键技术是算力路由。早在 2018 年,中国移动就牵头提出了“算力路由”的概念8,并在标准制定和应用推广方面取得重大进展。算力路由在以往单一网络寻址的基础上,叠加算力信息进行联合路由,改变了传统网络的路由方式。但是,由于改造成本大、标准尚未统一等原因,当前算力路由尚未规模化普及。然而,聚焦于园区更简易的组网范围(相较于运
14、营商的庞大网络而言),算力路由能以相对简单的方式落地。实现园区级简易算力路由主要取决于两点。一是75E0确保园区算力的协同。如前文所述,当前影响园区算网底座发展的一个核心痛点是园区算力分布复杂且算力协同不足。完成算网情况摸底后,需立即对园区网络进行统一改造,实现各个算力节点的协同,如通过园区内网协同实现边缘算力节点之间的协同,云专线实现边缘节点与云端节点间的协同。二是应用基础的算力路由技术。可通过在园区关键节点添加算力路由器或者融合调度网关的方式来搭建园区级简易算力路由体系(如图 1 所示)。+U图 1 园区算力协同及简易算力路由示意图2.1.5 园区算力网络简易编排器实现算力网络的融合调度还
15、需要一个“算网大脑”进行统一编排。“算网大脑”多见为运营商级别的核心算网融合编排系统。但对园区而言,其算力网络相对简易,没有足够资源及需求驱使其建立运营商级别的、完整的算网编排系统,因此,一种适用园区应用的简易算力网络编排器应运而生。这种简易编排器是园区实现算网调度的中枢,可清晰展示出园区算力与网络的分布、标识、状态等信息,并通过简易的算力路由进行调度,进而对整个园区的算力资源(包含租赁的云服务资源)进行统一的标识、解析及调度9。当前,大部分园区尚无能力开发自己的简易算网编排器,可暂时通过主流设备厂商提供的算网融合调度网关等硬件产品逐步展开简易的算网编排调度工作,从手动编排的方式开始,逐步向订
16、单式编排甚至智能化编排的方向持续演进。2.2 园区基于云边端融合的算网架构通过园区云边端算力基础资源摸底和感知、算力资源协同、园区级简易算力路由、云边端算力协同、简易的算网融合编排器等系列技术的运用,一套基于云边端融合架构的算力网络调度架构基本成型(见图2)。这个算网架构可获取园区当前可用的算力、存力、网络等资源以及其在云边端分布情况,并可初步实现算力网络的灵活调度10。例如,园区可结合具体应用需求,同时或分阶段使用云边端的算力资源,并根据不同的算力需求特点进行高效调度。同时,这种算网调度体系可根据当前可用算力的情况、网络负载情况,动态地计算出更优调度策略,如实现先来先计算、最高优先级计算、保
17、密计算、最低时延计算等。这种园区级云边端算力网络融合架构,可以根据园区自身算网基础,采用手动调度、订单式调度、智能化调度的方式实现。这些调度不是一成不变的,可根据业务属性的不同保障等级、不同时延要求、不同频率要求等进行动态调整。3 云边端融合的算网调度架构赋能某智慧园区3.1 园区算网特点以重庆某面积近 10 km2、当期信 息化投资约5 000 万元规模的智慧园区项目为例,本文进行了云边端融合算网调度体系的应用研究及落地,在多个应用85N510 场景取得了较好的效果。该园区拥有 1 个边缘数据中心、9 个在不同时期配套信息化系统自建的小型数据机房、7 种网络承载形式(含互联网专线、数据专线、
18、5G专网11、物联网等)。该园区也是国家级车联网先导区组成部分和西部重要的科技创新示范高地。3.2 园区改造后的基于云边端融合的算网架构体系首先,园区通过网络改造实现了“一张网”统领,算力资源的全面摸底及统一的标识,并达成了云边端算力资源全面的协同(见图 3)。同时,该园区充分考虑应用特点、算力实际情况、建设维护成本和未来扩展性等因素,将园区应用和云边端算力进行精准匹配(见图 4)。根据终端是否具有算力,在终端侧分别进行数据采集或简易计算处理;在边缘数据中心部署了一些关键系统,用于对实时性和保密性要求较高的数据进行处理,如 GIS/BIM 系统、视频分析平台、物联网平台等;在云端,则通过强大的
19、算力等资源进行 AI 模型训练、大容量数据存储、海量数据汇集后的挖掘分析等。3.3 园区基于云边端融合算网架构的关键算网应用通过算网融合调度,该园区聚焦痛点问题,实现了十几项关键算网应用落地。如通过在本地边缘数据中心部署轻量化的 GIS/BIM 系统,园区内可随时随地使 WLAN/5G图 2 云边端融合的算力网络调度架构CPECMNET 5G 5G MEC Wi-Fi 5G/VPN NB-IoT 图 3 某智慧园区算力和网络拓扑图95E0用基于 GIS/BIM 系统的智慧规建等应用,低时延快速操作各种大型 BIM 模型文件(见图 5)。此外,在云端为该园区量身定制了科研政策 AI 分析器,每天
20、自动抓取全行业政策性网站的公开政策信息,匹配不同科研需求向科研人员推送政策通知日历,包括各类政策申报条件、起止日期等信息(见图 6),获得了园区科研人员的一致好评。同时,为针对性解决园区存在缺少带算力的场景化智能摄像头、本地边缘侧算力不足以及园区的视频分析需求大且变动多的视频分析痛点(见表 5),园区建设了视频图像智能分析平台。通过云端训练、本地推理、终端感知的方式实现了云边端协同的算网融合调度,以相对较低的成本实现了对园区图像、视频的快速分析处理(见图 7)。当前园区实现了人员聚集、人员是否佩戴安全帽、按楼栋统计到访人数等 26 种分析算法。视频分析平台算法及分析报警界面在园区应用情况如图
21、8 和图 9所示。5G L4 GPUCPU AI 5G AI GIS/BIM 00D400图 4 某园区云边端协同算力应用对应分布图图 5 在边缘数据中心部署的 GIS/BIM 系统截图未来,该园区将对部分云端 AI 训练模型进行科学裁剪,在训练提速同时,使其卸载至边缘侧时能更高效地实现推理分析等功能,更敏捷响应园区快速迭代的视频分析诉求。图 6 使用了云端算力的科研政策 AI 分析器截图06N510 表 5 某园区视频分析需求情况园区摄像头摸底情况视频分析需求前端摄像头5 000 余个分布 5 个地块涉及 7 个品牌95%不带算力边缘数据中心GPU 服务器 3 台空余算力不足40 TFLOP
22、S云端算力按需租用云 GPU 等20 余项常规视频分析需求,并持续动态更新(如违规停车、佩戴安全帽、非常规聚集、违规钓鱼、楼栋人员数量统计等)Error=?图 7 视频图像智能分析平台云端训练、边缘推理示意图图 8 某园区视频智能分析平台算法图 9 某园区视频智能分析平台4 结束语基于云边端融合的算网架构充分发挥了算力调度、算网融合、云边端融合、AI、大数据等技术的优势,深入解决了园区当前普遍存在的算力分散、终端多样、网络复杂、应用众多、协同不足等痛点,将智慧园区在多年建设中产生的分布在云端、边缘侧、终端侧的存量算力资源进行协同,并实现统一管理。同时,结合简易的算力路由、算网融合编排等技术,让
23、算力的调度更加灵活和高效。经实践表明,云边端融合的算网架构能够助力智慧园区实现数字化转型,并成为智慧园区降本增效、持续迭代优化的坚实数字底座。16E0参考文献1 闫成群.智慧园区的总体规划与研究J.智能建筑与智慧城市,2020(12):84-86.2 孙頔,杨锦洲,夏璠.AI+工业互联网模式的应用探析J.信息通信技术与政策,2023,49(11):2-7.3 杨露溪,刘熙明.数字技术赋能产业园区高质量发展:理论机制与实践路径J.科技创业月刊,2023,36(8):123-126.4 金程,沙默泉,郭中梅,等.基于 CIM 的智慧园区建设探析J.信息通信技术与政策,2020,46(11):34-
24、38.5 班有容,王锦涛,王鹏,等.DPU 技术在算力网络中的思考与实践J.通信世界,2022(17):46-49.6 孙杰,马国华,朱多智,等.新型云网融合编排与调度系统架构与分析J.信息通信技术与政策,2022,48(11):59-68.7 岳靓,郑松.面向多智能体系统的“云网边端”一体化架构J.指挥与控制学报,2023,9(3):263-273.8 中国移动通信集团有限公司.算力网络技术白皮书R,2022.9 何涛,杨振东,曹畅,等.算力网络发展中的若干关键技术问题分析J.电信科学,2022,38(6):62-70.10 吕书玉,马中,戴新发,等.云控制系统研究现状综述J.计算机应用研究
25、,2021,38(5):1287-1293.11 王继梅.5G 网络技术在智慧园区中的典型应用J.中国新通信,2021,23(8):23-24.作者简介:宋今 中国移动通信集团有限公司客户服务部高级项目经理,主要从事数字化转型与数智客服等领域的研究工作张河翔 中国移动通信集团重庆有限公司城二分公司网络部副经理、高级工程师,主要从事算网融合、智慧园区等领域的研究工作Research on the application of cloud-edge-device integrated computing network architecture in smart parksSONG Jin1,ZH
26、ANG Hexiang2(1.China Mobile Communications Group Co.,Ltd.,Beijing 100032,China;2.China Mobile Communications Group Chongqing Co.,Ltd.,Chongqing 401121,China)Abstract:With the continuous advancement of digital transformation throughout society,it has become a trend to use cloud computing,edge computi
27、ng,artificial intelligence,big data,and the Internet of Things to empower various types of new smart parks.However,due to the large space occupation,the large number of settled units,and the long continuous construction period,many parks have problems in information system construction,such as redun
28、dant construction,information isolated island,complex network architecture,insufficient quantities of computing power,and the absence and shortage of a unified computing power scheduling system.Meanwhile,with the deepening application of various high-computing-demand technologies,the absence and sho
29、rtage of a unified computing power scheduling system may become a fundamental issue restricting the digital transformation of a park.This paper studies the application of cloud-edge-device integrated computing network architecture in smart parks,from the dimensions of the current situation of comput
30、ing networks,the computing network architecture of cloud-edge-device,and specific cases of integrated computing network architecture in smart parks.Keywords:cloud-edge-device integrated computing network architecture;computing power scheduling;computing network integration;smart park;digital transformation(收稿日期:2023-12-27)26