收藏 分销(赏)

2022年云计算白皮书.pdf

上传人:Stan****Shan 文档编号:1302318 上传时间:2024-04-22 格式:PDF 页数:45 大小:1.89MB
下载 相关 举报
2022年云计算白皮书.pdf_第1页
第1页 / 共45页
2022年云计算白皮书.pdf_第2页
第2页 / 共45页
2022年云计算白皮书.pdf_第3页
第3页 / 共45页
2022年云计算白皮书.pdf_第4页
第4页 / 共45页
2022年云计算白皮书.pdf_第5页
第5页 / 共45页
点击查看更多>>
资源描述

1、No.202210 中国信息通信研究院 2022年7月 云计算云计算白皮书白皮书 (20222022 年年)目目 录录 一、全球云计算市场增速反弹,我国保持高速增长.1 二、我国云计算展现中国特色,产业呈现五大特点.4 三、云原生技术和能力不断成熟,加速企业 IT 要素变革.8(一)云原生技术生态渐完善,为企业 IT 要素提供技术保障.8(二)云原生能力模型渐丰富,为企业 IT 要素提供运维保障.9(三)云原生深度融合基础设施,促进企业 IT 要素全面升级.10 四、云服务向算力服务演进,助力算力经济高质量发展.13(一)算力服务是云服务的升级,呈现“三化”特点.13(二)算力服务技术快速发展

2、,全新体系雏形初现.15(三)算力服务成为算力经济高质量发展必经之路.18 五、云上系统稳定性面临挑战,技管结合助力能力提升.20(一)系统上云面临多重挑战,稳定性保障迫在眉睫.20(二)建设云上业务安全生产体系,完善流程管理机制.22(三)构筑全流程稳定性保障体系,提升技术保障能力.22 六、云安全聚焦应用新技术理念,构建上云全流程安全体系.25(一)云计算面临新的安全需求,云上安全机制亟待改进.25(二)上云前完善供应链入口管控机制,规避云计算引入风险.27(三)上云中应用零信任理念构建安全体系,保障云上资源可信访问.28(四)上云后建立统一安全运营能力,充分释放安全资源价值.30 七、云

3、成本优化治理势在必行,流程贯穿上云用云全生命周期.32(一)云资源浪费现象普遍,优化治理面临挑战.32(二)人员、工具和机制是云成本优化的关键要素.34(三)云成本优化流程贯穿上云用云全生命周期.37 八、发展展望.39 图图 目目 录录 图 1 全球云计算市场规模及增速.1 图 2 中国公有云市场规模及增速.2 图 3 中国私有云市场规模及增速.2 图 4 中国公有云细分市场规模及增速.3 图 5 2021 年中国公有云 IaaS 市场份额占比.4 图 6 企业 IT 建设目标、要素与云原生技术、能力关系示意图.11 图 7 算力服务技术体系.16 图 8 IaC 技术示意图.17 图 9

4、算力交易过程示意图.18 图 10 应用多活技术架构.24 图 11 上云全流程安全机制.26 图 12 零信任云上防护场景.29 图 13 企业云成本优化能力建设框架.34 表表 目目 录录 表 1 不同上云模式下软件供应链安全入口管控要求.28 表 2 SOC 与 XDR 优势对比.32 云计算白皮书(2022 年)1 一、全球云计算市场增速反弹,我国保持高速增长 全球云计算市场逐步回暖,增速实现触底反弹。随着经济回暖,全球云计算市场所受影响逐步减弱,至 2021 年已基本恢复到疫情前增长水平。根据 Gartner 统计1,2021 年以 IaaS、PaaS、SaaS 为代表的全球公有云市

5、场规模达到 3,307 亿美元,增速 32.5%。来源:Gartner,2022 年 4 月 图 1 全球云计算市场规模及增速 我国云计算市场持续高速增长。2021 年中国云计算总体处于快速发展阶段,市场规模达 3,229 亿元,较 2020 年增长 54.4%。其中,公有云市场继续高歌猛进,规模增长 70.8%至 2,181 亿元,有望成为未来几年中国云计算市场增长的主要动力;与此同时,私有云市场突破千亿元大关,同比增长 28.7%至 1,048 亿元。1 Forecast:Public Cloud Services,Worldwide,4Q21,Gartner,2022 年 4 月 云计算

6、白皮书(2022 年)2 来源:中国信息通信研究院 图 2 中国公有云市场规模及增速 来源:中国信息通信研究院 图 3 中国私有云市场规模及增速 我国公有云 IaaS 及 PaaS 保持高速增长,SaaS 稳步发展。2021年,公有云 IaaS 市场规模达 1,614.7 亿元,增速 80.4%,占总体规模的比例接近四分之三;PaaS 依然保持着各细分市场中最高的增长速云计算白皮书(2022 年)3 度,同比增长 90.7%至 196 亿元;SaaS 市场继续稳步发展,规模达到370.4 亿元,增速略微滑落至 32.9%,预计在企业上云等相关政策推动下,有望在未来数年内随着数字化转型重启增长态

7、势。来源:中国信息通信研究院 图 4 中国公有云细分市场规模及增速 厂商份额方面。据中国信息通信研究院调查统计2,阿里云、天翼云、腾讯云、华为云、移动云占据中国公有云 IaaS 市场份额前五3;公有云 PaaS 方面,阿里云、华为云、腾讯云、百度云处于领先地位。2 市场规模为 2021 年全年数据统计,主要依据企业财报,人员访谈,可信云评估,历史数据等得出。对于市场数据不明确的领域,只发布头部企业整体情况,不做具体排名。3 因为 IaaS 和 CDN 是两种业态,需要分别获得互联网资源协作服务业务牌照和内容分发网络业务牌照,所有 IaaS 不包括 CDN 收入,只统计计算、存储、网络等基础资源

8、服务收入。云计算白皮书(2022 年)4 来源:中国信息通信研究院 图 5 2021 年中国公有云 IaaS 市场份额占比 二、我国云计算展现中国特色,产业呈现五大特点 云计算作为信息技术发展和服务模式创新的集中体现,已成为企业及产业实施数字化转型的重要基础。近年来,我国高度重视云计算产业发展,并在政策标准、产业布局、部署模式、行业应用等方面形成一些中国特色:一是政策指引转向深度上云用云,标准建设拓展至新技术应用。政策层面,国务院、工信部发布多项政策促进企业深度上云用云。2021年的 中华人民共和国国民经济和社会发展第十四个五年规划和2035年愿景目标纲要和“十四五”数字经济发展规划提出,实施

9、上云用云行动,促进数字技术与实体经济深度融合,赋能传统产业转型升级。2022 年 4 月,工信部启动企业上云用云实施指南(2022)编制工作,持续深化企业上云行动,进一步提升应用云计算的能力和效果,推动企业高质量上云用云。标准层面,经过多年发展,云计算标云计算白皮书(2022 年)5 准体系不断完善,涵盖了云计算框架和术语、技术和架构、软件和服务、安全和开源、运维和运营等多个领域。同时,云计算相关国家标准、行业标准和团体标准制定工作有序推进。一方面,云计算标准不断向云原生、云网融合、云边协同、高性能计算、算力服务、软件工程、数字化、开源等技术方向拓展,促进云计算产业持续创新发展。另一方面,政务

10、、金融、工业、交通、医疗等行业应用标准数量显著增加,在规范各行业云计算平台和应用建设的同时,推动云计算向行业深度应用落地。二是产业集聚效应明显,布局发展从东部向中西部逐步扩散。当前,我国云计算产业已形成京津冀、长三角、大湾区三大热点区域。这一特征和我国经济区域分布高度重合,经济发展水平与云计算产业活跃程度彼此促进、相辅相成。根据腾讯研究院统计,2021 年一季度全国用云量同比增长率呈现中部最高、西部次之的特征,这从侧面反映出云计算产业正在由东部向中西部加速扩散的特点。另外,随着2022 年 2 月“东数西算”工程正式启动,云计算将成为“东数西算”中算力的关键载体与主要服务形式。在多重因素刺激下

11、,中西部正在加大云计算领域的投入,云计算产业加速“下沉”,区域间的“数字鸿沟”预计将会进一步缩小。三是市场需求持续更迭,多种部署模式并存发展。随着企业上云程度持续加深,用户在服务形态、平台性能、数据安全、建设成本等方面的需求层出不穷。由此,在原有公有云、私有云、混合云的基础云计算白皮书(2022 年)6 上,市场又催生出分布式云、专有云、托管云等新型部署模式。1)分布式云,企业可依托分布式云,按需租用不同物理位置的云服务,将近场应用部署于边缘云,资源消耗较大的主应用和管理平台部署于中心云,即满足边缘节点应用和数据采集需求,又能满足大规模计算要求,获取无处不在的算力服务。2)专有云,企业可采用专

12、有云,通过兼具物理资源独享和弹性按需的云服务,满足企业业务资源灵活性的需求以及更高的数据安全要求,同时降低企业信息化建设运维成本。3)托管云,企业可采用托管云,将部分应用、业务的运维和运营托管给云服务商,满足企业对近地存储计算和系统安全的需求,实现企业轻资产上云、低成本用云。四是行业应用水平参差不齐,阶梯状发展特点明显。我国云计算应用已从互联网拓展至政务、金融、工业、医疗、交通等传统行业,但各行业应用水平参差不齐,应用深度呈现阶梯状分布。位于第一梯级的互联网和信息服务业已基本实现云计算的深化应用。这些行业基于自身具备 IT 属性的先天优势,充分将人工智能、大数据、区块链等新兴技术与云原生能力融

13、合,提升企业业务智能化水平。位于第二梯级的金融、政务、交通等行业云化改造能力持续加深。以金融行业为例,普遍采用容器、微服务、中间件等云原生技术进行底层架构的云化升级,构建敏捷高效的研发运维体系,加大云原生应用重构能力的力度。位于第三梯级的能源、医疗、工业等行业的核心系统云化改造程度有待提升。上述行业云化改造主要针对非核心系统开展。如医云计算白皮书(2022 年)7 疗行业的云化改造主要针对信息及门户系统、档案及医事服务等系统,通常采用专有云或混合云部署;能源行业的生产环境大多处于边远地区,对分布式云的应用尚不足,仍需运用云边协同进行边缘侧云化改造。与此同时,过去一年我国云计算产业在技术、模式、

14、应用、安全、管理等方面呈现出新的发展特点,具体表现在:一是技术方面,云原生持续加速企业 IT 要素变革。云原生技术在企业侧的应用持续深化,正在加速企业信息系统由烟囱状、重装置和低效率的架构向分布式、小型化和自动化的新一代软件架构的转变。云原生改进了企业 IT 技术和基础设施,也深刻改变着组织和流程、软件架构和设计的发展走向,成为企业用云的新范式。二是模式方面,算力服务助力构建全新算力经济范式。算力服务以云服务为基础,推动云网边端融合协同,实现算力的普惠化、泛在化和标准化。算力服务将在赋能传统行业的同时加速新型算力产业化的进程,成为推动算力经济发展的重要引擎。三是应用方面,稳保能力有效降低云上系

15、统故障影响。随着上云业务量的持续提升,企业系统面临着容量管理难、服务关系调用复杂等问题,对稳定性带来了巨大挑战。稳定性保障能力通过事前规划、事中检测、事后管理形成的流程闭环,将信息化手段与传统方式相融合,能够有效保障业务系统的稳定性和连续性。四是安全方面,全流程安全体系积极应对云上新型威胁。面对各云计算白皮书(2022 年)8 类新技术应用带来的云计算新威胁,云上安全机制亟待改进。上云企业利用新理念、新技术,不断优化安全机制,以软件供应链安全、零信任、统一安全运营等为切入点,构建上云全流程安全体系。五是管理方面,云优化治理助力企业成本长效管理。企业用云程度不断加深的同时也带来了资源浪费的问题,

16、围绕成本因素开展优化治理成为企业当前的重要课题。以人、工具和运作机制为核心构建的云成本优化体系将贯穿企业战略规划、资源采购、上云路径、用云管控、持续运营等多个环节,助力企业降本增效。三、云原生技术和能力不断成熟,加速企业 IT 要素变革(一)云原生技术生态渐完善,为企业(一)云原生技术生态渐完善,为企业 IT 要素提供技术保障要素提供技术保障 云原生技术生态日趋完善,细分技术项目不断涌现。相较于早期云原生技术主要集中在容器、微服务、DevOps 等领域,现如今其技术生态已扩展至底层技术(如服务器无感知技术 Serverless)、编排及管理技术(如基础设施即代码 IaC)、安全技术、监测分析技

17、术(如扩展包过滤器 eBPF)以及场景化应用等众多方面,形成了完整的支撑应用云原生化构建的全生命周期技术链。同时,细分领域的技术也趋于多元化发展,如在容器技术领域,从通用场景的容器技术逐渐演进出安全容器、边缘容器、裸金属容器等多种技术形态。这之中,Serverless、IaC 技术与云原生的理念高度契合,在简化运维、加速软件功能解耦方面发挥了重要作用。云计算白皮书(2022 年)9 IaC 能够简化运维,显著提升部署的敏捷性。为了满足业务应用敏捷迭代和稳定运行的要求,IaC 基础设施即代码作为云原生声明式操作思想的具体实践,可以帮助基础设施环境具备极致弹性、自动化配置、一致性部署等特性,简化整

18、个应用程序生命周期的操作,减少开发人员的工作量,降低基础设施管理的成本,并提升部署的敏捷性。Serverless 能够实现业务和基础设施分离,提升用户业务创新能力。为了保障软件架构微服务拆分后的功能解耦,通过采用多种服务器无感知技术,将基础设施抽象成各种开箱即用的服务,以 API 接口的方式提供给用户按需调用,真正做到按需伸缩、按使用量收费。这种架构可以消除传统业务中持续在线服务的海量计算资源的需求,降低开发和运维的复杂性,减少运营成本并缩短业务系统的交付周期。(二)云原生能力模型渐丰富,为企业(二)云原生能力模型渐丰富,为企业 IT 要素提供运维保障要素提供运维保障 基础设施管理方面,云原生

19、构建统一的调度、管理和运行维护能力。通过统一资源管理和统一集群调度,实现中心云、边缘云和数据中心的统一管理调度,全面覆盖边缘自治、混合多云、云边一体的典型资源使用场景。通过统一流量治理,实现东西流量、南北流量的统一治理策略管理,支持跨云、跨集群的拓扑监控能力。通过统一运行维护,实现多中心的不同集群的完整运维能力协同,将云上监控、日志、审计能力延伸至混合多云架构。云计算白皮书(2022 年)10 应用管理方面,云原生构建统一的治理和分发能力。通过统一应用治理,实现独立灵活的策略和应用配置,保障了应用的一次构建多次部署运行,同时可根据资源利用情况实现多集群间的弹性部署。通过统一数据治理,实现一站式

20、高度标准化数据基础资源设施,获得高资源利用率、弹性伸缩、动态扩展与高密度部署的能力,增强数据服务的易用性。通过统一生态管理,实现平台的非自有能力组件的快速上架、发布、订阅、部署、运维等全生命周期管理,实现跨云的部署和分发。通过统一应用分发,实现应用负载、对外发布、环境差异和数据存储等特性的应用抽象描述,基于统一的分发机制,在不同数据中心间获得一致的发布运行体验。运维管理方面,云原生构建统一的安全防护和优化能力。通过统一安全治理,可将云端的微隔离、漏洞治理、威胁情报处理、云原生应用保护平台等安全能力下放至分布式节点,实现安全的统一能力纳管、统一攻击防护、统一响应和统一运营,快速提升分布式接入节点

21、的安全能力。通过统一成本治理,并结合资源预测、智能弹性和混合部署等技术能力,可实现资源使用情况的自动巡检,根据历史情况进行智能化的弹性预测,最大限度地提升全域资源的利用率。(三)云原生深度融合基础设施,促进企业(三)云原生深度融合基础设施,促进企业 IT 要素全面升级要素全面升级 云原生理念最早是在 2013 年被提出的,它是先进架构技术和管理方法的思想集合,致力于帮助企业实现降低开发维护成本、降低高云计算白皮书(2022 年)11 频部署引发的运行风险、加速业务市场增长的目标。过去几年,企业对云原生的应用多局限于技术和基础设施能力的改进,而忽略了架构和设计、组织和流程等其他 IT 要素的考量

22、。一方面是因为用户对云原生的理解认知趋于片面,没有考虑技术与业务的融合联动;另一方面是因为云原生核心技术的发展尚未成熟,无法提供满足业务发展的技术能力支撑。随着云原生技术和能力不断完善,其将驱动企业组织和流程、架构和设计、技术和基础设施等 IT 要素的全面升级。来源:中国信息通信研究院 图 6 企业 IT 建设目标、要素与云原生技术、能力关系示意图 云原生促进组织和流程向团队自治、流程敏捷自动化发展。为了实现云原生的业务价值,团队需要在业务和 IT 之间快速协调,以更自动化的方式将更改部分提交到生产环境,并对所交付的内容负责。这需要业务团队采用敏捷的协作方法,即采用 DevOps 原则和流程自

23、云计算白皮书(2022 年)12 动化工具,并赋予团队一定程度的自治权。敏捷方法使去中心化的自治团队能够缩短变更周期,更紧密地结合业务需求,从而具备迭代周期缩短和数据驱动反馈等特点。这些特点的实现依赖于代码生命周期自动化的程度,即通过持续集成、持续交付部署和持续采用三个关键流程的建设优化,实现自动化的效率提升。在敏捷和自动化的基础上,需要持续提升团队自治能力,来加速创新能力和生产力的提升,这包括了所有权去中心化、技术自由和自助配置等。云原生促进架构和设计向分布式、微服务化发展。云原生将传统的、烟囱式的、有状态的粗粒度应用程序组件拆分解耦,以分布式的形态部署到基于容器的云基础设施上。为了更好的发

24、挥云原生的优势,需要考虑软件架构的设计原则,使其能够充分利用底层云基础设施,同时兼顾灰度发布的能力以保障更新部署的稳定性。首先需要将应用架构微服务化,解耦成细粒度组件,以获得可单独变更的灵活性、组件级独立伸缩的能力,使充分解耦下的独立运行单元互不干扰。这需要细粒度组件适当的解耦、组件间具备清晰的所有者边界、规范化的接口定义和持久化存储能力。基于不可变部署,实现解耦组件统一部署和管理,极大的简化运维,这保证了代码始终与其所有依赖的配置一起部署,提高了测试可信度,更加简单快速地重建环境。云原生促进技术和基础设施向灵活弹性、自动化发展。云基础设施将底层硬件抽象出来,使业务应用能够快速地自助配置和扩展

25、,这需要云基础设施能够使用相同的操作技能管理不同的语言和产品运云计算白皮书(2022 年)13 行时,促进操作自动化,并提供一个可观测性的框架。管理基础设施的平台需要提供一种通用的机制,屏蔽部署过程中的非功能性问题,同时具备弹性资源管理能力、不可知部署操作和默认安全设置的特性。要实现操作敏捷性,需要相关组件尽可能简单和轻量,这需要引入轻量级的运行时,来保证组件的快速启停和部署。基于云原生容器镜像的部署方式,保障了代码及其运行时的统一,借助 IaC 等技术可实现通过编写代码的方式部署、扩展和维护业务应用,大幅提升操作的自动化程度。四、云服务向算力服务演进,助力算力经济高质量发展(一)算力服务是云

26、服务的升级,呈现“三化”特点(一)算力服务是云服务的升级,呈现“三化”特点 当前,云服务作为通用算力已成为赋能企业业务单元转型的关键,但随着企业数字化程度不断加深和数字应用日益多样,用户对算力种类数量、有效感知、高效利用等提出了更高的要求,云服务也逐渐向算力服务演进。算力服务指的是以多样性算力为基础,以算力网络为连接,通过云计算技术将异构算力统一输出,并与大数据、人工智能、区块链等技术交叉融合,将算力、存储、网络等资源统一封装,以服务形式(如API)进行交付的模式。一方面,算力服务以云服务为基础,体现出“泛在化”、“普惠化”、“标准化”的特点。一是云计算整合异构算力促进算力服务普惠化。云计算能

27、够屏蔽不同硬件架构(CPU、GPU、FPGA)的差异,输出不云计算白皮书(2022 年)14 同类型的服务(常规计算、智能计算、边缘计算),实现大规模异构计算资源的统一输出,更加普适性地满足不同量级或不同硬件架构下的算力需求,实现算力的普惠化。二是云计算覆盖多层级算力促进算力服务泛在化。云计算正从单一集中式部署模式向分布式、多层级部署的新模式演进。云网边一体化可以统筹网络的状态、用户的位置、数据的流动等要素,满足不同时延不同场景的需要,扩大算力服务的覆盖范围,全面提升算力服务的调度能力,实现算力服务的泛在化。三是云计算统一算力输出标准促进算力服务标准化。云计算能够实现资源标准化,是算力时代各类

28、软件应用的“插座”。一方面,云计算所具备的硬件解耦、标准化封装部署等自身特性实现了算力能力的标准化输出;另一方面,云计算促使异构算力应用建立统一输出标准,避免软件被固定形式的算力需求所捆绑,实现算力应用的标准化落地。另一方面,算力服务呈现出与云服务不同的业态模式。一是算力服务内涵更加丰富,涵盖云边端全部算力。云服务多以虚拟化提供的x86 架构的通用计算为主,而算力服务除通用计算外,还包括智算、超算、量子计算、个人电脑和移动终端的算力,满足企业不同场景下多种算力融合使用的需求。二是算力服务供给更加全面,以用户为中心提供服务。云服务通常为集中式计算供给,尚未实现不同云平台间的互联互通,用户往往只能

29、选择一到两个云服务商,先确定选用什么样的云服务,然后再来选择适配的网络资源。而算力服务能够将一个个独立的算力节点联结起来,通过对用户位置、资源分布、成本控制云计算白皮书(2022 年)15 等多维度需求进行统筹分析,提供多元的、不同归属的算力服务,是一种更为全面的服务供给方式。三是算力服务应用场景更加多样,有利于传统行业转型升级。云服务主要面向“通用”计算场景,更适用于数字原生企业,面对传统企业数字化转型通常缺乏有效的行业解决方案,而算力服务从信息获取和信息处理两方面,对基础设施化入手,通过物联网+泛在算力的方式实现行业普惠性的多样应用。四是算力服务构筑全新产业链条,更符合算力经济发展要求。算

30、力经济并不过分关注云计算、人工智能等单一数字技术产业的发展程度,更强调从算力生产者、算力调度者、算力服务商以及算力消费者在内的算力产业链出发去衡量数字经济发展程度,是一种全新的经济范式,算力经济的核心产业将更依赖算力服务发展水平。未来,云服务商、区块链厂商等以计算能力为基础的服务商都可能升级为算力服务商,融入算力经济新生态。(二)算力服务技术快速发展,全新体系雏形初现(二)算力服务技术快速发展,全新体系雏形初现 近年来,我国在芯片、服务器硬件、云原生、云边协同和算网融合等算力关键技术方面发展快速。为应对市场对算力服务的全新诉求,算力服务技术已形成初步体系。云计算白皮书(2022 年)16 来源

31、:中国信息通信研究院 图 7 算力服务技术体系 网络控制与转发方面,SRv6(Segment Routing IPv6,基于 IPv6转发平面的段路由)、确定性网络等技术打破算力与网络的边界。用户通过云边端三级架构中的任一网关接入网络,设备节点根据应用服务的需求,综合考虑网络和计算资源的实时状态,将不同的应用调度到合适的计算节点上进行处理,通过 SRv6、确定性网络等全新网络技术,解决当前网络难以感知业务需求、算力和服务难以良好匹配的问题。同时引入定制化转发设备和可编程芯片等技术,降低组网成本,保证业务体验。算力管理方面,IaC(基础设施即代码)正在成为构建算力“插座”的重要技术。IaC 可以

32、通过代码而不是手动流程来管理和配置基础架云计算白皮书(2022 年)17 构,它将算力服务管理从数据中心内的物理硬件过渡到虚拟化、容器和云计算,实现了多样性算力资源的标准化抽象,为超大规模算力服务的转化、分配和应用部署提供了基础,实现算力服务的自动化,解决市场对多样性算力难以整合的问题。来源:中国信息通信研究院 图 8 IaC 技术示意图 算力服务与运营方面,算力交易平台重要性凸显。与云服务一对一租赁模式不同,算力服务通常采用“算力供给-算力交易平台-算力需求”的三方供给模式。算力交易平台以云平台为基础,融合人工智能、区块链等技术,起到算力的收集、调度、规范的作用,是算力服务交付过程的全新角色

33、。该模式下算力交易链条将会涉及更多的角色,算力的供给方与提供方除了是企业与服务商外,个人也可能变为是重要的参与者,彻底重塑信息产业格局。云计算白皮书(2022 年)18 来源:公开资料整理 图 9 算力交易过程示意图(三)算力服务成为算力经济高质量发展必经之路(三)算力服务成为算力经济高质量发展必经之路 算力经济成为衡量数字经济活力的关键指标。根据中国信通院统计4,算力发展指数每提高 1 个点,GDP 增长约 1293 亿元(约占全国GDP 的 1.3),随着算力发展指数分值的增加,对 GDP 的拉动倍数也将提高,这种通过算力发展拉动数字经济发展的全新经济形态被称作算力经济。作为数字经济的重要

34、组成部分,算力经济主要以数据为关键生产要素、以算力为核心生产力,从两方面促进数字经济发展。一是算力经济赋能传统行业,助力数字经济发展。算力经济带来的资本与技术投入不仅为制造、交通、零售等多个传统行业带来产值增长,还伴随着生产效率提升、商业模式创新、用户体验优化等延伸 4中国算力发展指数白皮书,中国信息通信研究院,2021 年 9 月 云计算白皮书(2022 年)19 性效益,对数字经济增长的拉动作用愈加凸显。以制造业领域为例,以云计算、边缘计算、智能计算为代表的算力投入和规模应用可以从研发、采购、生产、营销、售后等产业链环显著提升生产效率。二是算力经济形成算力新产业,刺激数字经济迸发新活力。算

35、力服务的发展使得市场上出现了包括算力交易、算力管理等众多全新类型算力服务商,对芯片、操作系统、网络、云计算等信息技术产业进行重塑与整合,带来全新的算力产业,让算力经济在数字经济发展中发挥更大的作用,从而刺激数字经济迸发全新活力。当前,我国算力经济发展也遭遇了一些挑战,例如算力作为生产力,资源配置不合理且调用效率低,致使算力经济生产配置失调;同时算力应用的各个行业丰富度欠缺,经济产业结构单一等等。针对以上问题,发展算力服务将成为推动算力经济发展的重要引擎。一方面,算力服务可以有效盘活社会闲置算力,协调算力经济发展。当前,全球存在较多企业自行建立算力资源的情况,导致过度建设,利用率较低的现象。据

36、Gartner 统计5,全球约 40%的企业或组织的算力基础设施建设规模是实际算力需求的两倍,截止 2021 年底,闲置算力资源浪费达到 210 亿美元。算力服务通过对算力资源的服务化交付(如 API、公、私有模式部署),同时引入算力交易的机制与算力并网技术,实现社会闲散算力、多样化算力的吸纳,完成全网算力 5https:/ 年 11 月 云计算白皮书(2022 年)20 注册、管理与高效调跨区域调度,解决了算力资源作为生产力的生产配置问题,从而有效协调算力经济发展。另一方面,算力服务可以加速算力应用的产业渗透,丰富算力经济产业结构。随着算力服务化进程的加快,算力市场也逐步迈向跨地域、跨运营主

37、体算力资源交易,存量算力得以盘活,单位算力使用成本和门槛降低,使其不断向更广、更宽的方向发展,丰富了算力经济的产业结构。从第三产业内部来看算力经济的中心逐步从科学计算领域和互联网行业走向政府、服务业、金融、教育、制造、运输等行业。从其他产业的角度看,算力经济的产业结构也逐步覆盖第二产业和第一产业的工业、建筑业和农业等,算力经济的产业结构不断得以完善。五、云上系统稳定性面临挑战,技管结合助力能力提升(一)系统上云面临多重挑战,稳定性保障迫在眉睫(一)系统上云面临多重挑战,稳定性保障迫在眉睫 当前,我国云计算市场快速发展,企业应用和系统上云已经成为趋势。然而,云计算在为应用的开发测试、发布变更、容

38、量管理、服务治理等环节带来效率提升的同时,其复杂的技术架构也给系统稳定性带来了新的挑战,具体表现在:一是云上系统复杂度提升。云上系统深度应用微服务等云原生技术架构,应用之间存在错综复杂的依赖关系,服务性能瓶颈难以分析,故障影响范围难以评估,故障根因难以定位,为技术人员带来了诸多困难;云上系统的故障率会随设备的增加而呈指数级增长,单一节点问题可能会被无限放大,日常运行过程中不可避免的伴随异常发生;云计算白皮书(2022 年)21 云上系统节点分布范围更广、数量更多,高度依赖网络质量,给日常运维过程中的日志采集、变更升级等都带来了新的挑战。二是新旧系统的共存和过渡带来的潜在风险。受益于 DevOp

39、s、Kubernetes、微服务、服务网格等云原生技术红利,应用的上线下线、发布变更、容量管理、服务治理等运营效率获得了极大提升。但是从传统系统迁移至云上不是一蹴而就的,相当长时间内会存在多种系统云上云下共存的局面,因此如何做好新旧系统共存状态下的稳定性保障成为重要命题。三是核心业务上云进程加速,故障影响范围更广、后果更严重。在全面数字化背景以及云计算技术优势的吸引下,企业核心业务加速上云。核心业务系统作为支撑用户服务的关键,往往具备业务连续性要求高、并发请求量大、业务激增随机性强的特点,一旦发生故障,其影响范围更大,后果更严重。在此背景下,云服务商及企业亟需对云上系统稳定性有所认知,可以从管

40、理与技术两方面协同发力,构建安全生产和稳定性保障双体系,推动云上系统的稳定性持续提升。流程管理方面,企业应以云上业务系统安全生产为核心目标,从组织、人员、制定、规范、流程、预防、监控和应急等多个维度构建完整的体系化方法论,覆盖组织管控、事前、事中和事后全过程;技术建设方面,企业应以故障的视角分析,从故障发生前、中、后三个阶段开展稳定性保障能力建设。云计算白皮书(2022 年)22(二)建设云上业务安全生产体系,完善流程管理机制(二)建设云上业务安全生产体系,完善流程管理机制 信息系统故障来源复杂,云上业务安全生产保障易被忽视。当信息系统遭遇操作变更、代码缺陷、平台故障、外部环境变化等引起的故障

41、或不可用影响时,往往会导致系统崩溃、业务受损、经济受损,甚至对国计民生造成巨大影响。企业应对信息系统故障带来的影响,通常会采取多种措施手段进行故障预防、规避,比如提前配置峰值流量所需资源、多机房多云分布式部署、制定数据冗余与备份等方案。但是业务系统故障往往存在不可预测、不可控、复杂性高等特点,相关故障预防、规避措施不但无法根本消除所有故障,而且成本高昂,甚至还会造成更多未知风险。制定体系化、系统化的云上业务安全生产保障方案,有助于规范故障处理流程,健全应急保障机制,为云上业务系统持续稳定的运行保驾护航。体系化构建安全生产机制,规范化处理系统故障。一是事前的主动防御,通过完备的故障分析、风险检测

42、、全局管控等事前风险防护治理手段,变被动为主动,尽量减少故障风险发生的概率;二是事中的全局监控,通过深度应用大数据、人工智能等技术,对信息系统进行全局监测和预警,实现实时风险态势感知;三是事后的应急保障,将信息化手段与传统方式相融合,多种应急方式,最大程度降低业务系统故障导致的损失和影响,有效保障业务系统的稳定性和连续性。(三)构筑全流程稳定性保障体系,提升技术保障能力(三)构筑全流程稳定性保障体系,提升技术保障能力 稳定性保障工作贯穿软件生命周期的全过程,主要目标是降低故云计算白皮书(2022 年)23 障发生的概率、减轻故障发生后带来的影响。以故障的视角分析,可从故障发生前、中、后三个阶段

43、开展稳定性保障能力建设。事前做好规划工作,设计高度韧性系统。在软件设计阶段,重点关注系统架构和容量规划的设计,同时配合混沌工程实验持续保持、提升系统韧性。从系统架构设计角度来看,规避系统单点问题,包括但不限于硬件单点、网络单点、存储单点和机房单点;优化系统依赖设计,高等级服务不允许强依赖于低等级的服务或资源(内部服务、外部服务、数据库、基础技术组件等等);完善数据保护,数据保护的主要目的是提升数据安全性,核心目标是尽可能缩短数据恢复时间,避免数据丢失。从容量规划角度来看,需要利用多种手段进行容量决策、资源调度,确保容量可满足业务需求。规避流量洪峰带来的潜在风险,通过容量画像、容量风险管理,可以

44、预测并探知业务流量洪峰,提前做好资源扩容准备,规避大流量场景下系统资源不足等潜在稳定性风险;探明全链路节点容量边界,应用全链路压测技术保障高压场景下系统性能,通过探明系统中的流量瓶颈,提前进行优化与改善,提高软件系统在高压场景下的稳定性。应用混沌工程技术探测系统稳定短板性,通过开展混沌工程实验,模拟随机的基础设施层、业务层等各个层面的故障,联合观测系统表现验证分布式系统的稳定性和可靠性,尽早发现系统潜在的问题,为提高分布式系统稳定性提供参考和建议。云计算白皮书(2022 年)24 来源:中国信息通信研究院 图 10 应用多活技术架构 事中全方位检测,提高系统故障逃逸能力。可观测性技术助力及时发

45、现故障、辅助解决故障。通过采集多样的监控数据,可观测性平台可以在第一时间发现系统运行中的异常状态,并及时向运维人员发出告警,有效提高故障发生时的应对速度。通过对链路中各环节运行数据的整合及联动,在故障发生时帮助运维人员迅速定位故障原因,最大化利用系统的观测数据辅助进行根因分析,实现高效的故障修缮与恢复。应用多活成为保障业务连续性的关键抓手。“应用多活”是“应用容灾”技术的一种高级形态,通过在同城或异地机房建立一套与本地生产系统部分或全部对应的生产系统,所有机房内的应用同时对外提供服务,当灾难(含基础设施故障)发生时,多活系统在分钟级内实现业务流量切换,有效保障业务系统持续稳定运行,提升系统故障

46、逃逸能力。目前,中国信息通信研究院已牵头编写应用多活架构能力要求标准,该标准旨在促进应用多活技术在产业生态环境中云计算白皮书(2022 年)25 标准化、规范化、持续化发展。事后构建故障闭环,降低故障复现率。完善故障管理机制,故障管理机制包括规范管理故障响应流程、故障升级机制、故障复盘机制,规范技术人员在应对突发故障时的操作流程,明确职责边界,提升沟通效率,推动故障解决,提升故障处理效率。构建并持续维护故障库,以业务线为单位维护故障库,持续将测试及生产环境中发现的典型故障加入故障库,同时配合使用混沌工程工具将已发生过的故障作为演练场景反馈到软件开发、测试、运维阶段,降低故障复现率,持续提升系统

47、稳定性水平。六、云安全聚焦应用新技术理念,构建上云全流程安全体系(一)云计算面临新的安全需求,云上安全机制亟待改进(一)云计算面临新的安全需求,云上安全机制亟待改进 云环境面临多样化攻击手段。一是利用云计算新技术的漏洞发起攻击,容器、微服务等技术的应用导致企业资源暴露面增加,成为攻击主要目标,如 2020 年 Azure 用户因 Kubeflow(基于 Kubernetes 的组件)未授权访问漏洞被部署恶意容器。二是通过云计算的软件供应链进行攻击,2021 年 Docker Hub 上的部分容器镜像被内置挖矿程序,下载总数超 2000 万次;同年 5 月云供应商 Everis 被入侵,导致北约

48、云平台相关数据泄露。政策标准向云安全聚焦,合规要求更加清晰。一是部分应用较为成熟的安全标准修订增加了云安全内容,2022 年 3 月 ISO/IEC 云计算白皮书(2022 年)26 27002:2022 完成修订并发布,将使用云服务的信息安全作为新增控制项之一。二是政策指南积极引导关注云安全新问题、新手段,2021 年5 月,美国总统拜登签署的关于改善国家网络安全的行政命令要求美国联邦政府向云迁移时采用零信任架构,以提升云安全防御能力;同年 10 月,美国国家安全局、网络安全和基础设施安全局发布5G云基础设施安全指南:确保云基础设施完整性为 5G 云安全建设提供指导。优化上云全流程安全机制已

49、成当务之急。面对日益多样化的威胁攻击,在政策标准要求指导下,上云企业应利用新理念、新技术,不断优化安全机制,构建上云全流程安全体系。一是软件供应链入口的安全管控,在上云前通过安全措施降低云计算引入的风险;二是零信任、统一安全运营等理念、技术的应用,在上云中同步规划,上云后进行持续保障。来源:中国信息通信研究院 图 11 上云全流程安全机制 云计算白皮书(2022 年)27(二)上云前完善供应链入口管控机制,规避云计算引入风险(二)上云前完善供应链入口管控机制,规避云计算引入风险 企业上云通常分为三种方式:购买公有云服务、采购私有云软件或基于开源软件自研。无论采取何种方式,都会增加企业软件供应链

50、的安全风险。因此,需要通过增加软件供应链入口安全管控机制,来规避引入云计算的风险。应用云计算带来三大软件供应链安全挑战。一是开源风险突出。无论是云服务商还是上云企业,开源都已成为行业的主流开发模式,在加快研发效率的同时也将安全问题引入到软件供应链当中。二是云服务商成攻击突破口,木桶效应明显。相较于传统针对软件自身漏洞的攻击,云服务商作为软件供应链上游,其编码过程、开发工具、设备等均是供应链受攻击面,攻击者只需突破一个点,即可撕开上云企业的整套防御体系。三是不安全的分发渠道影响大。通过网络进行私有云软件交付、开源软件分发以及补丁下发已成为常态,分发渠道作为软件供应链中较为脆弱的一环,其安全影响重

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服