收藏 分销(赏)

泛在计算服务白皮书.pdf

上传人:宇*** 文档编号:4167482 上传时间:2024-08-09 格式:PDF 页数:34 大小:1.74MB
下载 相关 举报
泛在计算服务白皮书.pdf_第1页
第1页 / 共34页
泛在计算服务白皮书.pdf_第2页
第2页 / 共34页
泛在计算服务白皮书.pdf_第3页
第3页 / 共34页
泛在计算服务白皮书.pdf_第4页
第4页 / 共34页
泛在计算服务白皮书.pdf_第5页
第5页 / 共34页
点击查看更多>>
资源描述

1、 泛在计算服务白皮书(2020年)云计算开源产业联盟 OpenSource Cloud Alliance for industry,OSCAR 2020年10月 II 版 权 声 明 版 权 声 明 本白皮书版权属于云计算开源产业联盟,并受法律保护。转载、摘编或利用其它方式使用本调查报告文字或者观点的,应注明“来源:云计算开源产业联盟”。违反上述声明者,本联盟将追究其相关法律责任。本白皮书版权属于云计算开源产业联盟,并受法律保护。转载、摘编或利用其它方式使用本调查报告文字或者观点的,应注明“来源:云计算开源产业联盟”。违反上述声明者,本联盟将追究其相关法律责任。编写说明:编写说明:牵头编写单位

2、:牵头编写单位:中国信息通信研究院、中国移动通信集团有限公司研究院 参与编写单位:参与编写单位:北京亚信创达科技有限公司、中国联合网络通信有限公司研究院、中兴通讯股份有限公司、中国移动通信集团浙江有限公司、上海云轴信息科技有限公司、烽火通信科技股份有限公司、华为技术有限公司、普元信息技术股份有限公司 编写组成员:编写组成员:中国信息通信研究院:栗蔚、徐恩庆、董恩然 中国移动通信集团有限公司研究院:张婷婷、王升、郭莎莎、李莹、班有容 北京亚信创达科技有限公司:李飞 中国联合网络通信有限公司研究院:曹畅、李建飞 中兴通讯股份有限公司:李响 中国移动通信集团浙江有限公司:顾黎斌 上海云轴信息科技有限

3、公司:付丽丹 烽火通信科技股份有限公司:张傲,邹素雯,石志凯 华为技术有限公司:高巍 普元信息技术股份有限公司:孟庆余 I 前 言 自云计算的概念首次由谷歌前CEO埃里克施密特在2006年8月的搜索引擎会议上提出,已有近14年的时间,这些年来,云计算已经成为信息技术产业发展的战略重点,全球的信息技术企业都纷纷向云计算转型,享受“云”服务带来的优势。丰富而集中化的云服务理念和IT架构方式已经深入企业的各个应用领域。与此同时,互联网发展正逐步从消费互联网向产业互联网转变,随着智慧工厂、云游戏、自动驾驶等新兴应用的出现,某些应用出于对低时延或安全性的考虑,需要数据就近处理和分析,驱动计算从云端下移到

4、接近数据源的边缘。伴随着边缘计算的快速发展,当前ICT产业面临着由“云、网、端”三级向“云、网、边、端”四级架构转型的变革,分布式云与核心云之间的云边协同、云网协同,分布式云之间的边边协同等问题场景也越来越成为业界关注的焦点。在计算服务分布式化的过程中必然形成产业生态的分化,政府、企业、高校等各自建设的基础设施计算服务能力过剩,利用率水平参差不齐,社会性计算资源的统筹和服务能力尚不完全。因此从传统信息基础设施传统信息基础设施到纵向应用拉通,横向资源的协同的融合信息基础设施融合信息基础设施新基建模式将成为必然,如何促进社会各产业计算资源的融合共享,计算服务能力流动,形成满足应用无感知的共享式社会

5、性计算交易服务成为新型计算服务模式需要考虑的重要问题。云计算、边缘计算以及终端芯片工艺制程的发展必然驱动整个社会的计算资源和能力分配更加分散、更加泛在化,即距离用户不同距II 离会散布着不同规模的算力。如何高效利用这些算力,保证云边端算力的无缝协同,同时借助5G无损、确定性网络使数据与算力得到快速的连接、处理,使算力也能像电力、热力一样成为基础资源,用户可以随用随取而不必关心它的产生与位置,进而赋能社会,这正是泛在计算服务尝试回答的问题。本白皮书以云计算、边缘计算发展理念为基础,在新基建基础设施促进计算+连接的信息基础设施背景下,顺应ICT产业转型需求和业务发展趋势为,向业界系统阐释泛在计算服

6、务的产生背景驱动、整体架构、关键技术及发展方向。我们倡议业界联合对泛在计算服务技术的方案、架构、演进路线等进行深入研究和实践,共同推进泛在计算服务的成熟,实现算网融合的一体化交付,计算能力与信息空间、物理空间、社会空间的深度融合。III 目目 录录1 泛在计算服务产生的驱动力泛在计算服务产生的驱动力.1 1.1 架构驱动:算力泛在化,呈现云网边端多级计算服务架构架构驱动:算力泛在化,呈现云网边端多级计算服务架构.1 1.2 需求驱动:应用和平台的普适多样算力需求已成趋势需求驱动:应用和平台的普适多样算力需求已成趋势.2 1.3 社会驱动:区块链传递信任与价值使计算可信共享服务成为可能社会驱动:

7、区块链传递信任与价值使计算可信共享服务成为可能.3 1.4 产业驱动:算网一体融合趋势,是新基建基础设施服务商可持续发展的新途径产业驱动:算网一体融合趋势,是新基建基础设施服务商可持续发展的新途径.3 2 泛在计算的概念与技术特征泛在计算的概念与技术特征.5 3 泛在计算服务的愿景泛在计算服务的愿景.8 4 泛在计算服务的商业模式泛在计算服务的商业模式.9 5 泛在计算的整体架构与关键技术泛在计算的整体架构与关键技术.10 5.1 泛在计算的整体架构泛在计算的整体架构.10 5.2 泛在计算的关键技术泛在计算的关键技术.13 5.2.1 基础设施层关键技术.13 5.2.2 管理调度层关键技术

8、.15 5.2.3 计费运营层关键技术.16 5.2.4 算力分级关键技术.17 5.2.5 安全关键技术.19 6 泛在计算的关键流程泛在计算的关键流程.20 6.1 算力节点接入与认证流程算力节点接入与认证流程.20 6.2 算力连接交易流程算力连接交易流程.21 7 泛在计算的应用场景与实践泛在计算的应用场景与实践.22 IV 7.1 高性能计算(高性能计算(HPC)场景)场景.23 7.2 云游戏场景云游戏场景.23 7.3 泛在计算当前业界实践泛在计算当前业界实践.25 8 展望与呼吁展望与呼吁.26 云计算开源产业联盟 泛在计算服务白皮书(2020)1 1 泛在计算服务产生的驱动力

9、 1.1 架构驱动:算力泛在化,呈现云网边端多级计算服务架构 在产业应用在不断寻求着计算效率和计算成本平衡的驱动下,计算作为信息化处理的基础,随着其载体芯片单体算力的不断提升,其发展的历史也是合久必分,分久必合的螺旋式上升,推进着信息化调度系统的不断变革和优化(如图1-1所示)。随着计算密度越来越高,分布越来越广泛,未来集中与分布式的界限将变得更模糊,更为泛在,因此未来也必将形成一个集中和分散的统一协同泛在计算能力框架。图1-1 计算演进的螺旋式发展 边缘计算正在加速布局,边缘处理能力未来几年将高速增长,尤其是随着5G网络的全面建设,其大带宽和低时延的特征,将加速算力需求从云端向边缘的扩散。同

10、时,随着芯片工艺制程从7nm向5nm演进,端侧的算力又将迎来提升,未来随着物联网终端节点的种类丰富,个人PC甚至家庭网关都将可能作为参与算力对外提供的节点,这些泛终端设备的普及形成了一些数据就近处理的场景,由此也必将 2 促进用户周边信息化空间内,不同距离、不同规模的算力形成凝聚和协同,计算服务分布整体上将呈现云-管-边-端四级架构,形成分布式加集中协同的新型信息基础设施。1.2 需求驱动:跨应用和平台的普适多样算力需求已成趋势 随着新型应用的不断涌现,对算力精度、强度、时延转发等不同方面的需求各异,因此云数据中心出现了CPU、GPU、FPGA等多种硬件平台。与此同时国内IT市场硬软件百花齐放

11、,也在大力推动国产IT软硬件发展的过程中云平台的异构化已经是一个必然的趋势。但当前各种异构加速芯片生态封闭,编程工具、语言专用,当前各种异构加速芯片生态封闭,编程工具、语言专用,一个应用需要基于多种异构芯片开发不同代码,且代码无法跨芯片移植。对开发一个应用需要基于多种异构芯片开发不同代码,且代码无法跨芯片移植。对开发者来说,不仅加重了开发负担,当硬件升级、应用迁移时,可能都需要对开发代者来说,不仅加重了开发负担,当硬件升级、应用迁移时,可能都需要对开发代码进行更新;对云服务商来说,需要采购各种异构硬件来满足不同应用的需求,码进行更新;对云服务商来说,需要采购各种异构硬件来满足不同应用的需求,可

12、能导致可能导致不同异构硬件的利用率差异较大,硬件持有成本高企但效率低下。同时,不同异构硬件的利用率差异较大,硬件持有成本高企但效率低下。同时,统一的异构算力管理涉及不同加速芯片的加载、抽象、虚拟化、挂载、删除等一统一的异构算力管理涉及不同加速芯片的加载、抽象、虚拟化、挂载、删除等一系列生命周期管理工作,需要较长时间演进成熟。因此,对应简化应用开发而言,系列生命周期管理工作,需要较长时间演进成熟。因此,对应简化应用开发而言,能能对算力架构算力架构的将异构性进行屏蔽,实现一套代码在不同架构的计算芯片上的有进行屏蔽,实现一套代码在不同架构的计算芯片上的有效运转,是当前云服务商和云化应用关注的方向之一

13、。效运转,是当前云服务商和云化应用关注的方向之一。目前设备厂商与云服务商之间相互配合,云服务商在业务层面做出创新的同时,广泛接受应用和大众对计算服务的差异化需求的同时,对设备厂商所提供的硬件提出通用要求。另一方面,设备厂商也可以综合多家云服务商需求的特点,提供通用型或专用一体化设备。综合看来,以云服务商领头,设备商作为后盾的组合适配应用多样化通用需求形式,将可能是泛在计算的未来主力军。云计算开源产业联盟 泛在计算服务白皮书(2020)3 1.3 社会驱动:区块链传递信任与价值使计算可信共享服务成为可能 区块链正驱动网络从“信息互联网”到“价值互联网”的变迁,作为互联网的第二次革命,它给数字世界

14、带来了“价值表示”和“价值转移”两项全新的基础功能。区块链已经不仅仅是一项技术、一种工具,更是一种思维方式,区块链作为一种新型的技术组合,其去中心化、难以篡改、不可抵赖、面向场景等特点可以为泛在计算带来一种全新的信用模式,也使其数字服务更具竞争力。因此,泛在计算的服务化可以考虑结合区块链来实现可信交易,促进共享经济式算力服务模式的商业模式实现。泛在计算的终端或云资源池都可以注册在链上,由泛在计算交易平台将这些算力源的使用情况记录上链,并给予算力源一定的“奖励”或真实金额结算,链上的算力源都具备权限查阅自身的“代币”或交易账单,并可以使用“代币”兑换奖励。在共享经济繁荣的社会背景下,区块链技术的

15、使用可以激发算力服务提供方提供算力共享服务的积极性,并对算力消费者进行交易结算公开透明的账单,甚至也可以基于区块链的区块信息进行算力追溯和服务保障,使能可信的泛在计算服务。1.4 产业驱动:算网一体融合趋势,是新基建基础设施服务商可持续发展的新途径 在新基建背景下,未来融合基础设施的提供者可以是云服务商、运营商甚至是中小企业的数据中心建设者和设备商。随着泛在计算的云网边端大架构融合,云服务商在寻求5G网络服务的增强和加持(如AWS、阿里云、腾讯云等);运营商也在依托强大的网络资源积极布局云计算服务转型信息化服务商(如电信、移动、联通等);设备商依托各自的硬件技术栈和生态积极拓展服务化的平台能力

16、(如华为、浪潮等)。而这个过程中也给了一些中小企业算力提供者以机会,通 4 过加入泛在共享的算力交易服务提升自己的价值和售卖市场。总体而言,产业生态正在加速算网一体的融合,积极谋求可持续发展,只是不同的产业角色切入点不同。从运营商的角度,作为ICT行业技术演进的重要参与者,运营商依托“NFV/SDN”技术,已实现了对核心电信数据中心的网元虚拟化与网络的智能化管理编排。通过网络的渗透化和联接价值,初期电信数据中心产生的算力是为了连接网络而存在的,而网络的价值仅仅在于连接个体,集中化算力只有云网两级架构。但随着5G的建设与边缘计算的发展,边缘云拓展了云计算的边界,呈现云-管-边三级分布式架构,算力

17、下沉并分散,网络为算力服务,价值在于连接不同位置、不同层级的边缘云。因此运营商也希望可以依托边缘海量的机房或第三方云池甚至是端侧算力,打开生态,借助B5G/6G的确定性、无损、时延敏感的网络优势,向全社会售卖一种算力+确定性时延网络的产品,与业务关联却又适度解耦,实现从服务消费互联网到服务产业互联网的转型。这个阶段的特征是呈现云网边端四级架构,算力具备专业化、智能化、均衡化、可交易等特征,运营商可以充分利用社会的泛在算力,协同调度,赋能社会。从传统云计算厂商视角来看,服务从云计算中心层层向外推送,成长路径是自顶向下,由内而外。基于其自身强大的IaaS和PaaS能力,云计算企业采用分布式技术将算

18、力和存储向外拓展和延伸,而控制中心仍牢牢地掌握在中心节点。但随着计算架构的分布式化,如今以个人为主体的消费互联网已经发展到了相当规模,人口红利带来的流量增长几近耗尽。互联网公司需要向资本市场证明自己的成长空间,最好的商业模式就是打开一个新的市场空间,找到新的成长方向。携消费互联网时代建立起的数字化光环,找到期待数字化变革的行业客户,进一步满足移动性、高算力等行业应用客户的需求。因此用基于边缘计算演进的泛在服务的理念说服行业客户进行探索,拿客户实例证明这是云计算发展的新空间。也将为云计算公司力开启新的商业逻辑,进一步打开其计算服务生态的新方向。云计算开源产业联盟 泛在计算服务白皮书(2020)5

19、 从芯片/设备制造商等硬件厂商视角来看,也在从硬件制造商逐步向上渗透软件开发和运行环境的生态,目前主要有两条路径:一种是瞄准特殊计算应用(如自动驾驶、安防)的SoC专用芯片,另一种是通用加速器做独立芯片。前者事实上竞争已经白热化,华为、高通、寒武纪等公司都纷纷推出专属的SoC搭载AI加速模组,这类公司属于端到端业务全栈模式,强调的是全栈最优;后者虽然刚刚起步,但在未来在泛在计算的互操作性和灵活性提升上空间更大,目前许多公司在这个市场布局主要是培养开发者生态,推出开发版、软件编译环境和运行态环境,例如Intel,xilinx等均在各自优势领域形成软件开发生态。一旦能够实现多硬件环境的适配和抽象,

20、也将极大驱动泛在计算服务实现硬件无关性以及无形调度迁移,开辟更广阔的市场环境。2 泛在计算的概念与技术特征 泛在计算并不是一个新的概念,早在20世纪80年代,泛在计算之父,Mark Weiser博士就提出了泛在计算的概念:在本世纪初,清华大学徐光祐教授也给出了泛在计算的定义:Mark博士定义的泛在计算是一个强调和环境融为一体的计算概念,而计算设泛在计算(又叫普适计算)即建立一个充满计算计算和通信通信能力的环境,同时使这个环境与人们逐渐的融合融合在一起。-Dr Mark weiser 1988 泛在计算是信息空间信息空间与物理空间物理空间的融合,在这个融合的空间中人们可以随时随地、透明地获得数字

21、化的服务。-清华大学 徐光祐教授 2003 6 备本身则从人们的视线里消失。在徐光祐教授的泛在计算定义中,“随时随地”指人们可以在工作、生活的现场就可以获得服务,并不需要离开这个现场去面对、操作计算设备,计算就像空气一样无所不在;“透明”指获得这种服务不需要花费很多注意力,即这种服务的访问方式是十分自然的甚至是用户本身注意不到的。两人对泛在计算的定义虽有不同,但核心思想是一致的,即构建一张无处不在,万物互联的计算网络,在推动各种物端设备具备自通信、计算能力(即物端计算或物联网)的同时,将充斥在自然人环境中的所有计算能力抽象出来,为人类和社会赋能,人们无需感知计算本身便能获取算力服务。本白皮书中

22、描述的泛在计算更偏向于如何通过算网一体提供计算服务。其中的计算服务为大计算概念,参考云计算可包括的计算、存储、网络甚至更丰富的抽象封装的算力服务(例如抽象的算法)等。其定义如下:通过自动化、智能通过自动化、智能化调度,人们可在任何时间任何地点无感知的将计算化调度,人们可在任何时间任何地点无感知的将计算(算力、存储、网络等算力、存储、网络等)需需求与云求与云-边边-端多级计算服务能力连接适配,通过多方算力贡献者和消费者共同端多级计算服务能力连接适配,通过多方算力贡献者和消费者共同参与,实现算力从产生、调度、交易到消费的闭环,实现算网一体、算随人参与,实现算力从产生、调度、交易到消费的闭环,实现算

23、网一体、算随人选、算随人动的可信共享计算服务模式。选、算随人动的可信共享计算服务模式。物联网技术、社交网络、移动互联网、智能终端、感知及交互技术的迅速发展,推动了信息空间、物理空间和社会空间的融合;随着基础设施的广泛部署和智能终端的泛在嵌入,计算能力以前所未有的程度深入到人们的生活,由此将衍生出大量围绕人的服务。因此泛在计算将成为人、环境和万物互联的新型数字化基础设施,助力数字化新生态系统的形成,其包含的主要特征如下:1)算网融合:云边端三级算力与无损网络的融合算网融合:云边端三级算力与无损网络的融合。从云计算、边缘计算、到泛在计算的发展大趋势下,未来社会中会在靠近用户不同距离遍布许多不同规模

24、的算力,通过全球网络为用户提供各类个性化的服务。从百亿量级的智能终端,到全球十亿量级的家庭网关,再到每个城市中未来 移动边缘计算(MEC)带来的数千个具备计算能力的基站,以及数百个 网络功能虚拟化(NFV)带来的云云计算开源产业联盟 泛在计算服务白皮书(2020)7 中心机房(Cloud CO),以及每个国家数十个大型的云数据中心(DC),形成海量的泛在算力从各处接入互联网,形成计算和网络深度融合的趋势。伴随着 5G 网络、新型计算应用的不断落地,云和网络正在打破彼此的界限,相互融合,云在网上、网在云中、网随云动。泛在计算依赖确定性、无损的网络能力将这些计算资源拉通共享,形成算网融合的一体化产

25、品。2)算随人选:根据需求自动选择算力资源。算随人选:根据需求自动选择算力资源。传统云计算模式下用户使用算力的流程大都通过云服务商门户(Portal)进行分区(Region)选择,从算力资源申请到网络地址的发放,算力源的位置对于用户是可感知的,并且算力源并不会随着业务位置的变化而变化。然而泛在计算环境中的算力资源呈现分布式、无序化特征,如果还需要用户从海量的算力资源池中去挑选适合的节点,这将是灾难性的体验。泛在计算通过业务系统对用户算力需求进行解析,将需求分解为详细的算力资源需求、网络能力需求甚至算法依赖需求,由调度系统从海量算力池中自动选择一个最适合用户的算力节点来承载用户业务,这一切对用户

26、来说都是透明无感的。3)算随人动:算力的移动性管理。大算随人动:算力的移动性管理。大量 2B/2C 类边缘计算业务如云游戏、自动驾驶等,数据源处在不断的移动过程中,为保证用户体验,算力源与数据源的连接也需要随用户位置不断变化更新。一个服务对于使用者来说,应该是透明、无缝、无感的,正如语音通话服务一样,作为使用者不用去关心基站的位置、基站的切换等网络的功能。所以对于云边端多级的算力基础设施来说,泛在计算需要像一个算力操作系统一样,自动、智能、动态的去调配服务,完成对算力的管理与无缝使用。泛在计算系统通过连接运营商侧的能力开放平台,获取用户的位置、连接状态、移动信息等,同时结合不同边端节点的算力情

27、况,根据算法拉起或迁移服务应用,实现人(数据端)与算(算力端)的实时连接与动态调整。4)可信共享:支撑算力资源共享交易的可信的营帐交易系统。可信共享:支撑算力资源共享交易的可信的营帐交易系统。算力的泛在化决定了算力资源的提供者是多方的,而隶属于多方的算力的使用、释放、营 8 帐、计费、结算等多个流程需要公开透明、可靠可溯、计费准确、满足审计要求的营帐交易系统,来解决不同算力提供者之间、算力提供者与泛在计算运营系统之间的信任问题。泛在计算计费运营系统收纳各个资源提供者的算力报价,当算力用户在统一的运营 Portal 上输入了算力请求后,系统完成解析,给出一系列算力资源列表与相应的报价,由用户自由

28、选择;当用户选择了某个算力资源,并完成了算力使用后,系统会自动生成算力结账报表,该报表基于区块链平台生成,不同的算力提供者的交易节点都可以上链,查询各自算力资源的使用情况与营帐报表。同时,计费系统扣除泛在计算平台的抽成之后,剩下的费用返回给算力资源提供者作为报酬;需要强调的是,整个泛在计算的交易是以“代币”形式完成的,“代币”与“法币”之间存在着某种映射关系。3 泛在计算服务的愿景 泛在计算的愿景是:聚焦于高效利用全社会泛在的、多级的、无序的算力,将之变为可整合、可调配、可交易的资源,保证云边端算力的无缝协同,同时借助5G无损、确定性网络使数据与算力得到快速的连接、处理,并使算力、网络可随用户

29、需求的流动动态调整,使算力也能像电力、热力一样成为基础资源,用户可以随用随取而不必关心它的产生方式与位置因素。算力用户从提出算力需求到算力部署完毕,连接成功,需要整个泛在计算架构从云网边端四级生成一致性协同策略,执行协同操作,完成算力应用部署到网络打通等一系列工作。为实现这个理想,在云网边端之上,需要一个多级的算网管理编排器做全网的算力与网络的调度、匹配,成为一个“算力操作系统”,将整个社会的算力节点与网络管理纳入统一的体系,每个边缘节点,每个云池,甚至是每个端设备,都是这个统一管理编排体系中的一个算力节点,就好像整个社会是一个数据中心一样,从而构建“Computing power as a

30、Datacenter”。云计算开源产业联盟 泛在计算服务白皮书(2020)9 4 泛在计算服务的商业模式 泛在计算是以平台型共享经济服务模式为核心,数字化网络为依托,搭建计算服务交易平台,构建计算服务和消费方的桥梁,盘活新建和存量计算资源,实现”人人“为”人人”的开放化解决方案,从而形成计算界的类似京东或淘宝的共享交易模式。计算服务提供方:可以包含各类中大型云服务商,提供网络和边缘云服务的运营商、存在闲置算力的中小企业、各大超算中心,甚至个人终端PC或路侧泛终端设备。计算服务消费方:可以包括任何有临时或长期资源需求的个人、科研、企事业单位、政府和中小企业。他们在计算资源的需求特性上具有高算力、

31、广域链接、移动性、临时性等不同特征,均可通过泛在计算服务平台获取到所需的技术服务。在计算服务的调度和提供过程中可通过深度融合的算网一体服务进行调度,对应时延敏感性应用也可基于底层的6G确定性网络来进行承载,以增强算力服务的精准性和服务质量。10 5 泛在计算的整体架构与关键技术 5.1 泛在计算的整体架构 基于分级调度的泛在计算架构以NFV/SDN集中管理和云计算的调度理念为基础,通过集中化和分级化扁平平台实现对泛在计算设备的算力和网络信息收集、应用管理调度和部署分发,为用户提供最优的算力分配及网络连接方案。该架构具备以下主要特征:1.对社会泛在计算设备和云边端三层多级算力的集中管理调度,实现

32、控制与数据平面的分离。2.不改变当前底层网络架构与IP协议实现,通过平台自身的多级调度能力实现互联协同,通过松耦合的平台调度逻辑实现调度。3.一方面可以兼容当前单体业务和应用的架构的粗粒度调度,同时也能支撑云计算开源产业联盟 泛在计算服务白皮书(2020)11 各类轻量化微服务架构的细粒度调度。但均需要提供能屏蔽底层异构硬件的新型开发环境。4.由于采用集中调度架构,调度模块将不占用边缘计算节点有限的空间、供电和算力资源。泛在计算的分级调度逻辑架构由(算力和网络)基础设施层、算网管理调度层和计费运营层组成,三层之间通过标准API互通,完成算力生成、调度和交易的闭环。网络基础设施层提供网络资源并实

33、时上报网络状态,包括数据中心各级SDNC、网管设备与相应的网络设备,构建低时延,敏捷无损的算力传输管道。算力基础设施层聚焦算力的生成与抽象,包括核心云节点与边缘计算节点,第三方云池以及泛在终端等,其中数据中心相关的网络与算力信息可通过云管理器和网络管理器北向接口获取,终端设备的网络和算力状态可通过在终端放置探针的方式获取。管理调度层主要负责算力的注册,算网资源的整合,根据需求进行算力路由调度,根据算网状态的变化或用户位置的更新进行移动性管理和算力动态调整;根据资源拓扑进行算力分解,合理拆分算力需求;预留资源,下发镜像,部署应用,配置网络等;同时,管理调度层还需要具备安全、策略、资源等管理功能。

34、其南向接口接受基础设施层的算力注册请求与算网状态报告,生成算力与网络拓扑,并实时更新,北向接受计费运营层的算力需求输入,结合自身的算力调度算法、必要时分解算力需求,筛选出最合适的部署节点,完成算法框架的安装,应用的部署,网络与安全策略的配置。同时,当算力基础设施层的算网资源状态发生变化,或算力用户的位置发生了更新,管理调度层需要根据更新的资源拓扑或用户位置进行应用的迁移或重建。12 计费运营层主要由三大模块组成,分别是运营模块、记账模块和计费模块。运营模块主要包括算力分级、需求解析和算力测量等功能,并提供交互界面、应用商店和开发平台等。记账模块使用区块链平台实现,作为联盟链超级节点成员,负责所

35、有交易数据的上链、出块、记录和智能合约的生成。计费模块主要根据交易数据生成相应的计费结果。基于分级调度的泛在计算架构如下图 5-1 所示:图5-1 泛在计算技术架构 图5-2是一张泛在计算系统部署的构想图,图中每个管理调度系统的部署都为多级部署,且下级管理调度系统向上级调度系统周期性上报所纳管资源的实时变化情况,并接受上级管理调度系统的调度指示。如5.2示意图所示,如果运营方是以省为单位作为主体运营方,那么每个省的算网管理调度平台分为两级,省级(二级)和边缘级(三级),所以无论是最上级的大区云节点(一级)还是下边的边缘云节点或是三方节点或是终端设备,最终的算力注册信息都会汇聚到省级算网管理调度

36、平台,由这个平台作为算力调度的关口,而每个省也都有各自的算力交易营帐运营系统,不同省的算力用户都就近接入各省的算力交易营帐运营平台,完成算力交易;不同省之间的算力交易营帐系统,或者不同运营商之间,甚至是不同云服务商之间的算力交易系统都可以使用联盟链,参与记账共识与生成智能云计算开源产业联盟 泛在计算服务白皮书(2020)13 合约,解决交易的信任问题。这里要强调的是,对于端侧与三方云池的算力上报,当端侧与第三方云池的数量过大时,为了防止对边缘算网管理调度平台的冲击,可以算力通过边缘云节点进行上报,这时候边缘云节点充当算力代理角色,初期当这个数量不大的时候,端侧与第三方云池可以直接向边缘算网管理

37、调度平台直接上报。图5-2 泛在计算系统部署架构(仅为示意图)5.2 泛在计算的关键技术 5.2.1 算力抽象技术 泛在计算的基础设施层主要提供应用所需的算力资源、存储资源与网络连接,其中算力资源由多种不同类型指令集、不同体系架构的异构硬件提供。随着新型应用的不断涌现,通用处理器的计算性能已经不能满足业务需求,云数据中心的计算架构呈现出CPU、GPU、FPGA等多种硬件异构化部署的趋势。在泛在计算云、边、端组合提供算力的模式下,异构算力资源更加丰富,不同厂商、不同种类的计算硬件可能同时提供算力服务。目前,不同厂商以及不同类型的硬件要求开发者维护独立的代码库,这些代码库的开发使用了不同的编程语言

38、、14 类库以及软件工具。这使得在某一款硬件上开发的应用代码只能在该款硬件上部署,将大大降低泛在算力的整体利用率,使管理调度更加复杂。同时,代码在不同硬件上的迁移成为了一项极其复杂、耗时的工作,难以实现算随人动、算随人选。具体而言,在当前的异构计算架构下,某一应用既利用CPU做虚拟机,又使用了GPU来做深度学习或者人工智能。此时,应用扩容或迁移,综合应用需求调度了FPGA提供算力资源,那么已有的代码需要大幅更新并重新编写。因此,为提高算力基础设施层的通用性、易用性,实现应用基于算力而非硬件类型的部署,提升泛在算力的整体利用率,繁荣泛在计算生态,需要降低应用开发者在异构硬件上的开发复杂度,屏蔽底

39、层计算硬件的差异(算力抽象)。当调用算力时,应用开发者无需了解底层硬件的具体信息,理想目标为开发者的一套代码可以在任意底层硬件上执行。为此,需要在软件层面提供跨硬件、跨厂家的标准、开放的编程环境与编程接口。如图5-3所示。图5-3 算力基础设施层算力抽象 除了算力资源以外,基础设施层还需提供存储以及网络资源。存储需要满足应用的容量需求,网络主要是带宽和时延性能。由于应用部署一般需要计算、存储和网络三类资源,因此在为用户分配算力时需要对基础设施层提供的资源进行综合考虑。云计算开源产业联盟 泛在计算服务白皮书(2020)15 5.2.2 管理调度技术 管理调度层主要聚焦于在运行态对算力和应用进行调

40、度与部署,根据算网状态或用户位移进行实时算力调整,因此管理调度层主要关注如下关键技术:算力注册算力注册:核心数据中心、边缘数据中心、三方云池、智能终端、泛 PC设备等可提供算力服务能力的设备,在提供算力服务之前,首先需要接入算力管理调度系统,完成注册。注册信息包括需要设备的类型、能力、可提供时长、状态等。其中核心数据中心、边缘数据中心、三方云池的计算能力可由虚拟基础设施管理器通过北向 API 上报至管理调度系统,网络能力可由各域 SDNC 或网管设备通过标准 API 上报,完成较大规模、稳定的算力池的计算、网络信息的获取;针对一些小型云池、智能终端、泛 PC 设备,通过在云池、终端设备中放置

41、agent 探针的方式,探针实时获取算力与网络状态,并周期性同步至管理调度系统。该算力探针与端侧设备系统松耦合,即插即用,可获取相应的算力与网络状态,实时性的向管理调度系统中的服务端上报,管理调度系统根据服务端收到信息更新算网拓扑。算力调度算力调度:通过算力注册,管理调度系统具备了全网算力与网络资源拓扑,这是算力调度的前提。根据用户实际的算力、存储、网络需求,管理调度系统依靠自身的装箱(filter)称重(weight)调度算法,将满足用户业务需求的算力提供节点过滤出来,这个算力提供节点可以是核心/边缘云计算平台,也可以某个或多个泛在终端设备的组合。算力分解算力分解:终端设备、边缘节点、核心节

42、点各级算力提供者能够提供的算力存在较大差异。当算力调度无法调度出合适的节点可以承载全部需求时,管理调度平台可以将算力分解,通过自动化、智能化的算法将某个大块的算力需求进行切割,分别调度部署于不同的算力节点上来满足用户整体的业务诉求。16 算力调整与移动性管理:算力调整与移动性管理:终端设备、边缘节点、核心节点的算力与网络资源状态处在动态变化之中,同时,业务的负载也会随着闲忙时高低不同,再加上移动网络中算力用户的移动性,因此,动态变化的算力需要与流动的用户实现智能化、自动化联动。具体的说,当用户从一个边缘节点覆盖区域移出时,管理调度平台需要实时感知用户位置(可通过能力开放网元获取),并结合边缘云

43、节点的算网状态决定是否迁移应用或迁移到其他边缘云节点。资源及应用生命周期管理:资源及应用生命周期管理:管理调度平台可以在用户提出算力部署需求时,将算力资源锁定,并将用户的应用部署在合适的计算节点上,自动化拉通网络。用户算力需求变化时,将应用做相应的扩缩容。用户不再有算力需求时,将应用删除,释放算力资源进入算力拓扑池给下一个用户使用。5.2.3 算力交易区块链关键技术 计费运营层当前主要关注区块链技术在泛在计算体系中的应用。当前,区块链的实现形式有公有链、私有链、联盟链三种。其中,公有链的主要特征是“完全去中心化”,公开透明,不可编辑,不可篡改,世界上任何个体或者团体都可以在公有链上发送交易,任

44、何人都可以获得全部账本并竞争记账权,但TPS(每秒交易数)较低。私有链由单独个体完全控制链上交易数据并控制账本查阅权限,可以减少无价值出块共识所带来的算力损耗;如果集团内部各公司自建区块链平台,可实现“公司内部去中心化”,如菜鸟与天猫搭建的商品物流全链路追踪区块链平台,但本质是“区块孤岛”。联盟链是指有若干机构或组织共同参与管理的区块链,他们各自运行着一个或多个节点,联盟链上的信息对每个人都是只读的,只有超级节点有权利进行验证或发布智能合约,实现的是“部分去中心化”。当前面向行业应用的区块链形式多以联盟链承载,如R3区块链联盟和超级账本等。泛在计算的算力交易模式可以考虑以联盟链承载:云计算开源

45、产业联盟 泛在计算服务白皮书(2020)17 多方参与的算力交易需要部分去中心化。泛在计算的大块算力提供方包括云服务商、其他运营商和第三方企业自建云等,多方参与的算力交易需要通过区块链建立信任机制;泛在计算较零散的算力提供方如泛PC终端和移动设备等,不具备参与出块的能力与必要,但希望查阅自身交易信息。算力交易需要较高的交易速度,联盟链的共识节点较少,可以实现较高的TPS.泛在计算的算力交易模式需要保证安全可控与数据隐私,联盟链只有超级节点具有全部账本的查看权限,便于监管审计 可控性较强,超级节点之间达成共识即可对所出区块进行更改。因此,在算力交易方面需要开展基于联盟链的区块链平台的具体架构、共

46、识机制与算法和智能合约的具体实现等方面的研究。5.2.4 算力分级关键技术 算力是推动智能社会发展的主要驱动力。目前各种已经兴起的(例如VR/AR)和潜在的(例如自动驾驶)智能业务,均对算力提出了较高的要求。算力分级是指将业务所需的算力需求按照一定分级标准划分为多个等级,以便算力提供者设计业务套餐时进行参考,或作为算力平台设计者在设计算力平台时的依据。如图5-4根据2019年IDC的分析预测,未来智能业务对算力的市场增长需求主要来自于边缘推理。分析清楚不同的AI业务对边缘推理算力的需求,是提供算力服务的基础,目前比较热门的AI业务包括物联网的人机智能交互,移动互联网的 18 消费类应用,安防的

47、图像视频检测和自动驾驶的综合场景等。图5-4 推理和训练对算力需求的市场预测 鉴于智能应用对算力的诉求主要是浮点运算能力,如用于AI和图形处理的每秒浮点运算次数(FLOP/S),一些互联网厂家已经将算力作为服务提供给客户。从1 FP32 TFLOPS 或 8 FP16 TFLOPS到 4 FP32 TFLOPS或32 FP16 TFLOPS的AI推理加速服务,简单的语音语义识别或单流视频分析8 FP16 TFLOPS即可满足,复杂的推荐引擎或者风险检测则需要32 FP16 TFLOPS。如下表5-1所示,根据当前常见的推理类业务所需算力的大小,将算力分级为小型、中等、大型和超大型四个级别。表5

48、-1 不同AI推理应用对算力的需求 算力等级 算力水平描述 典型推理场景 32位浮点运算 16位浮点运算 内存 小型 1 TFLOPS 8 TFLOPS 4 TFLOPS 32 TFLOPS 4 GB 推荐引擎、风险预测 从推理应用看算力分级,未来算力的分级应该考虑诸多因素,除了计算能力,也需要将存储需求、网络需求等联合考虑,实现更合理的算力分级。同时,算力分级需要与硬件芯片以及软件架构密切配合,才能保证算力的真正应用,并为用户提供及时有效的算力服务。5.2.5 安全关键技术 泛在计算作为一种全新的商业模式重新定义了计算体系系统中云、管、边和端的关系,但由于泛在具有计算分布广、环境复杂和数量庞

49、大等特点,很多应用在设计之初未能完备的考虑安全风险,包括算力用户数据的安全和算力提供者基础设施的安全等,传统的安全防护手段已经不能完全适用泛在计算的安全防护需求;一旦被攻击控制,可能会带来较大的安全风险,影响用户的数据的资产安全,甚至阻碍行业的发展。泛在计算的安全体系不是单一的部件,也不是单一的层次,而是一个涉及到端到端开放平台安全。泛在计算网络架构的变迁必然也对安全提出了全新的需求,为了支撑泛在计算环境下的安全防护能力,需要满足如下安全需求特征:安全功能应能够动态(智能)适配泛在计算架构,且能够灵活部署与扩展;能够容忍一定程度和范围内的功能失效,但基础功能始终保持运行,且整个系统能够从失败中

50、快速自愈;安全功能和服务可以随应用动态部署到各种类型的泛在设备中。如:IoT 设备中;20 在关键的泛在节点设备实现网络与域的隔离,对安全攻击和风险范围进行控制,避免攻击由点到面扩展;持续的安全检测和响应无缝嵌入到整个泛在计算架构中。泛在计算的安全框架设计需要统筹考虑信息安全、功能安全、隐私安全、可信安全及需求特征,在不同层级提供不同的安全特性,将泛在计算的安全问题分解和细化,安全防护对象应覆盖泛在计算基础设施、网络、数据、应用、以及泛在计算安全生命周期管理等多个层次,针对不同层级的安全防护对象,提供相应的安全防护功能,进而提供差别化的安全服务。对于有高安全要求的泛在计算应用场景,还应考虑如何

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服