收藏 分销(赏)

云原生实战指南.pdf

上传人:Stan****Shan 文档编号:1240828 上传时间:2024-04-19 格式:PDF 页数:91 大小:21.51MB 下载积分:25 金币
下载 相关 举报
云原生实战指南.pdf_第1页
第1页 / 共91页
云原生实战指南.pdf_第2页
第2页 / 共91页


点击查看更多>>
资源描述
封面页(此页面将由下图全覆盖,此为编辑稿中的示意,将在终稿 PDF 版中做更新)目录 一、云原生激活应用构建新范式.4 二、容器服务助力企业精益用云.14 三、云原生可观测套件:构建无处不在的可观测基础设施.27 四、传音移动互联可观测体系设计与落地.32 五、应用 Serverless 化,让业务开发心无旁骛.38 六、优化 20%资源成本,新东方的 Serverless 实践之路.46 七、心动网络算法平台的 Serverless 探索之路.50 八、以服务治理为基石构建可管可控互联网应用架构.56 九、禾连云原生微服务治理实践.67 十、消息队列 RocketMQ5.0:从消息服务到云原生事件流处理平台.72 十一、云原生技术中台 CNStack2.0 正式发布 助力企业高效用云.83 十二、数字化安全生产平台 DPS 重磅发布.88 一、云原生激活应用构建新范式 4 一、云原生激活应用构建新范式 作者:丁宇,阿里巴巴集团研究员、阿里云智能云原生应用平台总经理 11 月 5 日,2022 杭州云栖大会上,阿里巴巴研究员、阿里云智能云原生应用平台总经理丁宇在云原生峰会上发表主题演讲,提出云原生激活应用构建新范式,并表示 Serverless 将引领下一代应用架构。阿里云将坚定推进核心产品全面 Serverless化,帮助客户最大限度的减轻运维工作,更好的实现敏捷创新。云计算时代,企业上云后,应用构建依然面临很多挑战,如何保障系统资源的弹性、降本增效;如何做到应用敏捷开发,实现业务快速迭代;如何保障系统的稳定以及业务的连续性,这些问题没有完全解决。我们看到,云原生已经变成非常流行的技术趋势,从上云到用云,云原生能够从 PaaS层面帮助企业解决应用构建的一系列问题。具体有三大范式正在成为现实:一、云原生激活应用构建新范式 5 第一个范式是全面容器化。因为容器形成了运维的标准,成为企业上云用云的新界面,也变成开发者和应用系统交互的新界面,有利于构建高弹性、可伸缩的系统,从而实现降本增效。当下所有的负载都在容器化,包括耳熟能详的微服务、在线应用到整个数据库、大数据、AI、中间件等,所有的工作负载都在容器化。通过容器,我们可以享受到运维标准化、弹性架构带来的好处,也带来了软件可以无处不在的部署交付,标准化的管理运维。第二个范式是整个行业应用的核心技术互联网化。我们正在用互联网的技术、互联网的架构思想来重构应用系统,从而带来了很多好处:分布式可扩展,支撑业务敏捷迭代,构建弹性架构,从容应对流量高峰。举例来说,准备一场促销活动、一场跨年晚会,都可能有不可预期的流量高峰,数字化系统需要应对不确定的流量,必须要用互联网架构来实现;此外保障系统高可用、高可靠,保障业务的连续性,也是互联网技术能够带给企业的红利。第三个范式是应用的 Serverless 化。从技术角度来看,能够实现技术组件分层解耦,让应用可以做到全托管免运维,提升系统的可运维性,降低成本。通过极致弹性,能够把所有的组件覆盖,在云上构建应用变得非常简单。以前构建应用,需要买 ECS 实例,搭建开源软件体系然后维护它,流量大了扩容,流量小了缩容,整个过程很复杂繁琐。用了 Serverless 服务以后,这些问题都简化了,从半托管到全托管,所有的服务 API 化,无限容量充分弹性,可以组装使用,能够感受到生产力大幅度的改变。也会在软件开发的全生命周期进行优化,升级研发模式,让开发者更多的聚焦在业务上,加速迭代。以上这三个范式代表着云原生非常主流的演进方向。一、云原生激活应用构建新范式 6 1.全面容器化:容器服务进入智能化时代 Gartner 预测,到 2022 年,超过 75%的全球组织会在他们的生产环境中运行容器化的应用,而这一数据在 2020 年才不到 30%。我们看到,容器技术已经跨越鸿沟,从早期的互联网行业到现在的千行百业,都在生产系统中使用。虽然 ACK 大幅降低了 K8s 的门槛,但管理和运维一个大规模、分布式的集群依然充满挑战,比方说,如何调度应用,在保障稳定的同时,提升资源利用率;如何对应用进行成本规划、分析优化;当集群出现问题后,如何及时的定位和修复。智能化可以解决这些问题,智能化是容器平台发展的必然趋势。阿里云基于过去 10年的大规模容器实战经验,通过数据化手段和智能化算法,推动容器服务 ACK 走向智能化。其中有三个升级:第一个升级,智能化的混部调度,新一代调度系统 Koordinator,帮助用户提升整体资源利用率,智能化混部调度助力识货 App 节省 20%资源成本。第二个升级,智能化的成本治理,容器服务 FinOps 套件,帮助用户实现上云成本可见、可控、可优化,中华保险基于容器 FinOps 套件实现资源闲置率从 30%降低到 10%。第三个升级,智能化的运维体验,容器服务 AIOps 套件,帮助用户实现数据驱动诊断决策,助力故障防御定位,自动化诊断可以覆盖 90%以上的问题,得物 App 基于容器 AIOps 套件定位问题时间从周缩短到小时。这些能力升级,会进一步降低容器技术的使用门槛,让 ACK 做到普惠化,服务更广泛的客户群体。2.核心技术互联网化 互联网中间件产品有三个特点:第一个就是开源全兼容,完全没有厂商锁定,像微服务、消息、服务注册发现、网关等,都是跟开源完全兼容的。一、云原生激活应用构建新范式 7 第二个特点是大量的企业级特性加持,包括性能、稳定性、扩展性等。互联网分布式技术的先进性需要非常好的场景锤炼,阿里云的优势就在于多年双 11 复杂场景的打磨,基于双 11 的加持以及海量客户的应用,使得阿里云互联网技术在企业级特性上有非常强劲的优势。第三个特点有丰富的技术类解决方案,包括异地多活,应用容灾的方案、技术中台、业务中台的方案,以及混部、混沌工程和全链路压测方案等。云原生中间件实现了开源、自研和商业化的三位一体,能够助力更多企业使用标准开放的技术实现数字化转型。重磅发布一 微服务再升级:新增云原生网关开源 云原生时代,微服务面临着新的诉求和技术挑战,尤其是在性能、高可用性和安全性方面。今天,阿里云正式开源云原生网关 Higress,它是业内首个标准化、高集成、易扩展、热更新的云原生网关。标准化:随着 K8s 的普及,K8s Ingress 逐渐成为云原生时代 API 事实标准,Higress全面支持该标准,并且在服务治理方面(包括灰度、限流、预热、超时、重试)做大幅增强,引领标准演进方向。一、云原生激活应用构建新范式 8 高集成:Higress 首次将流量网关、微服务网关、安全网关三合一,打造高集成网关,在入口建立高性能、安全防线,后端支持 K8s/Nacos/ECS/Serverless 多种运行时路由,打造功能最强大网关实现。易扩展:Higress 提供最丰富插件扩展机制,满足客户灵活路由和安全定制需求,支持最全面语言扩展机制;当然我们为了降低客户使用门槛,默认集成了数十个插件,并且通过插件市场方便开发者贡献通用能力,产生良性互动。热更新:由于传统 Nginx 更新规则需要 reload 会导致链接抖动,导致流量损失,对实时通信、视频、IoT 无法容忍,因此 Higress 从证书、路由、安全规则、插件全部采用热更新机制,毫秒级生效且业务无感知。除了开源云原生网关之外,阿里云全面升级微服务引擎 MSE3.0,包含三大核心能力:第一大能力是注册配置中心,相比 Nacos 等主流开源方案,性能提升 40%,提供70+的监控指标,提供健康检测,帮助客户实现服务异常自治,例如禾连健康这家医疗行业的SaaS企业,通过MSE注册配置中心,提升开源注册配置中心性能达50%,解决了业务高速发展中的扩展性问题,保障全国 200 多个城市、2000 多家医院体验业务的稳定性超 99.99%。一、云原生激活应用构建新范式 9 第二大能力是微服务治理,沉淀了阿里巴巴 10+的实践经验,帮助客户缩短 30%微服务治理落地周期,提升 50%开发测试效率,消除 80%线上风险。例如纺织产业互联网企业致景科技,未修改任何代码就接入了 MSE 微服务治理所有能力。微服务实施周期下降 30%,构建开发测试环境从天降低到分钟。第三大能力是云原生网关,阿里云将流量网关、微服务网关、安全网关三合一,架构上也做了升级,将实例级防护升级至路由级防护,整体性能相比传统网关提升90%。例如移动支付企业费芮互动利用 MSE 构建了零信任架构,大幅提升业务入口安全性,通过软硬一体完成 TLS 卸载,性能提 90%,并采用软硬件一体化,响应时间下降 50%。重磅发布二 可观测再升级:让可观测数据价值最大化 云原生时代,系统架构日趋复杂,提升可观测能力成为降低复杂度的唯一手段。今天可观测能力成为度量企业 IT 水平的标准,成本治理、业务连续性、业务增长都需要可观测技术。因此阿里云推出云原生可观测套件 ACOS,从应用监控到链路追踪,帮助企业实现成本管理、风险治理、智能运维、保障数字化业务高效稳定的运行。本次云栖大会,阿里云云原生可观测套件 ACOS 三大组件也迎来重要升级。首先,Prometheus 已成为不少企业的观测首选。作为容器观测事实标准的Prometheus 监控,已成为阿里云 50 多款云产品的默认观测基础设施,并与应用实时监控服务 ARMS 的 APM 指标、eBPF 指标、OpenTelemetry 指标联通,将观测范围从专精容器延伸到全栈可观测。其次,作为观测界面的阿里云 Grafana 服务也将迎来 9.0 焕新升级。全新的Prometheus 和 Loki 查询语句生成器及强化后的搜索 Explore 功能,让用户获得更强的数据查询与分析能力。同时,为了应对越来越丰富的异构可观测数据源,Grafana 服务与日志服务 SLS、Elasticsearch 等 20+款可观测存储服务集成,帮助企业更简单的构建统一观测界面。一键导入/导出自建实例、自动数据导出报表,一键数据备份、恢复,用户操作审计等企业特性得到进一步增强。最后,为了帮助企业的云上应用开启多维度观测视角。应用实时监控服务 ARMS 在数据采集方面,OpenTelemetry与Prometheus生态全面融合,通过OpenTelemetry补充业务、自定义组件埋点,在完善观测维度的同时,实现厂商无锁定。并借助TraceExplorer 实现多来源 Trace 统一查询。一、云原生激活应用构建新范式 10 重磅发布三 RocketMQ5.0 全面升级:从消息服务到云原生事件流平台 消息队列一直是企业互联网架构的核心组件,阿里巴巴早在 2012 年就基于电商场景打造了国内流行的消息中间件 RocketMQ,并贡献到 Apache 社区。历经十余年的打磨,RocketMQ 取得了众多成果。Apache RocketMQ 的社区非常活跃,全球拥有 700+的贡献者,超过 75%的头部企业选择使用 RocketMQ,同时超过 80%的主流云厂商提供了 RocketMQ 的商业托管服务;阿里云作为 RocketMQ 的发起方和核心贡献者,十多年以来,累计服务了来自互联网、零售、汽车等 20 多个行业、10w+万企业客户;承载千万级 TPS,万亿级消息洪峰。当下,阿里云 RocketMQ 5.0 正式商业化,从内核到生态全面拓宽,全新升级为云原生事件流平台,深耕事件驱动和事件流处理两大核心场景。在未来,企业开发者基于 RocketMQ 事件流平台,既可以轻松驱动微服务、Serverless 应用;也可以基于RocketMQ 重构当下的流处理任务,以更加轻量化、低代码的形态,高效的完成 CDC、ETL 等流处理需求。3.Serverless 奇点已来:引领下一代应用架构 随着企业用云的深入,云的能力也在不断升级,过去企业用云就是去买资源、买实例、买规格、搭应用。我们一直在说“云计算是像水电煤一样的基础设施,但是现 一、云原生激活应用构建新范式 11 在这一点还没有完全实现。阿里云一直在推动产品形态、研发方式的升级,希望从提供资源到提供服务,这个服务就是即插即用的能力,企业不需要管理和维护,可以实现自动伸缩免运维,平台全托管,按用量计费,真正实现了服务化、模块化,这也是云产品升级演进的方向。可以说,Serverless 奇点己来,所谓奇点,就是由平稳发展转向高速发展的转折点,预示着行业落地开始爆发。目前,阿里云已经有 20 多款的 Serverless 产品,并且会推进核心产品全面 Serverless 化,Serverless 是云提供能力的最佳实现方式,也是让云计算基础设施落地到千行百业的最佳范式。回顾阿里云在 Serverless 领域的演进历程:2017年推出的函数计算是一款FaaS产品,这是一种以事件驱动的全托管计算服务,用户只需编写代码并上传,函数计算就会自动准备好计算资源,以弹性、可靠的方式运行代码,并提供完整的可观测能力,大幅简化开发运维过程。2018 年推出的 Serverless 应用引擎 SAE 是业内首款面向应用的 Serverless PaaS 平台,屏蔽底层 IaaS 和 Kubernetes 的复杂度,提供了零代码改造、成本更优、效率更高的应用托管方案,帮用户实现单体 Web 应用、微服务应用以及定时任务的Serverless 化。一、云原生激活应用构建新范式 12 同年领先业界推出 Serverless 容器服务 ASK,基于弹性容器实例 ECI(Elastic Container Instance),可以实现 1min 扩容 2000 个 pod,降低了 Kubernetes 使用门槛,让用户更专注于应用程序,而不是管理底层基础设施。2020 年阿里云开源 Serverless Devs,成为业内首个支持主流 Serverless 服务/框架的云原生全生命周期管理的平台。2022 年 9 月该项目正式进入 CNCF Sandbox,也成为业内首个入选的 Serverless 工具项目。除了产品形态的改变之外,Serverless 同样带来了软件研发范式的改变。随着阿里云提供越来越全面的 Serverless 产品以后,很多云产品都变成模块化、API化、服务化,它可以进行组装,通过拖拉拽的方式就能够构建应用。所以说在Serverless 架构下,研发方式升级到组装式研发,组装式研发可以做到流程编排、事件驱动,甚至可以做成可视化,这就彻底颠覆了原有的软件研发方式,大幅提升研发效率,灵活应对业务挑战。根据权威机构调研统计,组装式研发相比传统模式,可为研发提效 50%以上。以南瓜电影为例,因为一场热映电影,南瓜电影一小时用户增加了一百万,流量暴涨引发网站服务一度中断,临时云上扩容也无法及时满足巨大的流量。传统架构没有改变云上的效率,南瓜电影开始转向 Serverless 架构,三天时间完成了核心应用的上线,第五天 100%的切换,第六到七天把核心的 30 多个应用切换到 Serverless 一、云原生激活应用构建新范式 13 上,最终带来扩容效率提升 10 倍,成本下降超过 40%,研发效率提升 70%,这就是 Serverless 带来的价值:真正让开发者回归业务本身,让企业做得更少而收获更多。未来,阿里云在云原生领域将持续的引领标准,不断突破,推动领域和产业快速发展。二、容器服务助力企业精益用云 14 二、容器服务助力企业精益用云 作者:易立,阿里云容器服务负责人 容器技术已经跨越鸿沟,广泛应用于金融、通讯、制造、交通等千行百业。Kubernetes支撑的工作负载也从早期单一的互联网应用发展到数据库、AI、大数据等等,并覆盖了公共云、专有云、边缘云等多样化、动态的云环境。11 月 5 日,2022 杭州云栖大会上,阿里巴巴研究员、阿里云智能云原生应用平台容器技术负责人易立在云原生峰会上发表主题演讲,发布阿里云容器服务全面智能化升级,帮助企业精益用云,以增效促降本,实现 IT 架构在云上的高质量发展。1.容器服务助力企业数字化创新 经过 7 年的发展,阿里云容器服务产品线已经成为企业的云原生操作系统。基于阿里云容器平台,阿里集团实现了 100%业务云原生上云。二、容器服务助力企业精益用云 15 2021 年,阿里云发布了 ACK Anywhere,进一步拓展产品的宽度,覆盖从公共云、边缘云、到本地数据中心的各个场景。让所有需要云能力的地方,都能基于统一的容器基础设施之上。得益于阿里集团和阿里云的大规模容器应用实践,阿里云容器产品能力得到了业界的广泛认可。2022 年 1 季度,在权威咨询机构 Forrester 发布的全球公共云容器平台分析师报告中,ACK 稳居全球领导者象限,这也是中国科技公司首次进入该象限;2022 年 2 季度,在 Omida 发布的全球容器管理解决方案报告中,由于在公共云、专有云、混合云等环境完善的产品体系,ACK 成为全球领导者,产品能力与规模国内领先;2022 年 8 月,在 CSDN 2022 中国开发者调查报告中,有 52%的国内开发者选择阿里云容器云平台。过去几年,降本增效成为了众多企业 IT 管理者关注的重要问题。企业已经到了精益用云的时代,提升资源效率、研发效率,IT 管理效率成为关键。2.四大全新升级,阿里云容器服务迈入智能化时代 智能化是容器平台发展的必然趋势。今天,阿里云基于过去 10 年的大规模容器实战经验,通过数据化手段和智能化算法,推动容器服务 ACK 面向基础设施层、容器编排层、应用架构层和运营治理领域 4 大维度全面升级,迈入智能化新阶段。二、容器服务助力企业精益用云 16 升级 1:新算力 在基础设施层,利用面向云原生优化的新算力,提升计算效率。2021 年,阿里云发布了新一代云原生 CPU,倚天 710,基于 ARMv9 架构,已经在电商、阿里云内部规模化应用,实现了卓越性价比。相比 X86 芯片,典型 Web 应用性价比高 50%,视频编解码应用性价比高 80%。倚天芯片面向云原生优化,vCPU 采用独立物理核,没有超线程架构中的性能争抢。可以提供更加确定性的性能。ACK 通过对芯片微架构的拓扑感知调度优化,相比开源 K8s 实现,帮助 Web 应用吞吐提升 20%。为了更好支持 AI、HPC 等 I/O 密集型应用。ACK 正式提供了对 eRDMA 高性能容器网络支持。通过软硬一体优化的网络实现,可以提供更高的带宽与更低的延迟。应用在 AI 训练加速 20%,微服务吞吐提升 10%。ACK 支持多容器高效复用 eRDMA 设备,满足了容器应用部署密度的需求。二、容器服务助力企业精益用云 17 为了更好支持有状态应用容器化,阿里云发布新一代容器网络文件系统 CNFS2.0,它采用全链路加速技术,可以实现:容器应用对后端存储系统的访问并行化,提升网络带宽的利用率。对远程 NAS存储的吞吐可以提升 100%,满足高性能 AI 训练和基因计算的需求。利用元数据缓存和独有的 lease 机制,使得远程文件存储的元数据访问性能,提升了 18 倍,非常适合 Web 应用和 CI/CD 等需要对海量小文件进行访问的场景。支持文件的透明生命周期管理,可以自动将低频访问的冷数据放置在低成本的NAS 低频介质或 OSS 中,降低存储成本 50%以上。它支持对 NAS/CPFS/OSS 全链路可观测,帮助开发者更好诊断和优化 I/O 性能问题。二、容器服务助力企业精益用云 18 企业与个人对数据隐私保护日益关切,机密计算技术应运而生。其中一个重要的技术是通过芯片的可信执行环境(TEE)实现数据保护。在 TEE 内执行的应用,不用担心来自其他应用、其他租户或者平台方的威胁。为了进一步推动机密计算的普及,阿里、蚂蚁团队在 Kata Container 社区与红帽、Intel 等公司进行合作,将容器计算与可信执行环境相结合,推出机密容器Confidential Container 项目,同时为 Intel SGX、Intel TDX 等不同的 TEE 实现,提供了一致的容器界面。基于新一代的机密容器架构,开发者可以确保应用是通过可信软件供应链进行构建和分发的;容器应用运行在可信执行环境中,具备更小的攻击面,而且所有内存中数据是加密的并受完整性保护;应用对数据的访问是基于加密的可信数据存储服务。机密容器可以在需要隐私数据处理的场景中,如金融风控、医疗健康等,提供高效的隐私增强型算力。升级 2:新平台 在容器编排层,通过智能化、云边端一体的新平台,提升资源利用率和运维效率。二、容器服务助力企业精益用云 19 K8s 目前已经成为云时代的操作系统。希望充分利用多种应用负载之间的削峰填谷,提升 K8s 集群资源利用率。这也是大家常说的“混部”能力。阿里巴巴早在 2016 年就启动了云原生混部技术研发,历经多轮技术架构升级和双11 锤炼,目前已实现全业务规模超千万核的云原生混部,日常 CPU 利用率在 50%左右。阿里云今年开源了云原生混部项目 Koordinator,它包含三大核心能力:差异化 SLO 保障:在 Kubernetes 之上提供面向 QoS 的资源调度机制,比如延迟敏感型的在线类任务,和可抢占的计算任务。通过对不同 QoS 应用的合理调度,可以在保障应用的稳定性的同时,提升资源利用率。QoS 感知调度:包括 CPU、GPU 拓扑感知、资源画像、热点打散等精细调度能力,帮助应用优化运行时性能效率,提升稳定性。任务调度:提供了大数据与 AI 相关的任务调度,比如批量调度、优先级抢占以及弹性 Quota 等,可以更高效地支持计算任务。Koordinator 项目完全兼容标准的 K8s,无需做任何侵入式修改。ACK 也内建了Koordinator 产品化支持:二、容器服务助力企业精益用云 20 通过混部调度,在典型场景可以提升资源利用率 100%。通过差异化 SLO 保障,在提升资源利用率的同时,让低优先级的任务对延迟敏感型任务的影响5%。Kubernetes 的复杂性是阻碍很多客户采用的一个重要因素。为此,ACK 发布 AIOps套件,通过智能化手段实现故障预防与快速定位。基于阿里团队 10 年大规模容器运维经验沉淀,通过专家系统和 AI 算法相结合的方式,提供了全栈巡检、升级检查,智能诊断等三大功能。智能诊断目前包含 200+诊断项,覆盖 90%的常见问题场景。以容器网络问题诊断为例,排查链路长,复杂度高,非常耗时耗力。在得物的业务场景中,利用智能诊断,可以快速定位由于网络栈异常导致的偶发性抖动问题;再如 e 签宝,利用智能诊断,可以在分钟级完成对 Ingress、容器网络、应用和 OS 的全链路问题排查。二、容器服务助力企业精益用云 21 ACK One 是面向多地域多集群的分布式容器平台,可以统一管理中心云、本地云、边缘云和客户 IDC 的 K8s 集群。今年阿里云在 ACK One 基础上,发布如下功能:提供托管的 ArgoCD 服务,开发者可以通过 GitOps 方式来实现应用的跨地域自动化交付。通过弹性感知的调度器实现,为混合云场景提供灵活的弹性算力。支持对多集群安全策略的统一管理,保障企业系统统一安全基线。来看一个具体案例,在智联招聘的业务高峰期,借助 ACK One 弹性调度策略可以在数分钟内弹出数万核 ECS 和 ECI 等计算资源补充到 IDC 的在线服务集群,有效应对流量洪峰。二、容器服务助力企业精益用云 22 ACKEdge 是面向云边端一体协同的容器应用平台,基于阿里云开源的 OpenYurt项目,今年对 ACKEdge 进行全新升级:在云边协同场景,阿里云推出了增强型网络边缘节点池,实现安全、稳定的云边网络互联方案。国内知名游戏企业,莉莉丝,利用增强型边缘网络节点池,让海外多地域服务器与云上 VPC 安全互通。相比专线网络资源成本降低 30%。在云端协同场景,阿里云推出了轻量化接入功能,可以通过 K8s 管理资源受限的设备上的容器应用。元戎启行是一个自动驾驶 Startup 公司,通过 ACKEdge管理车载设备应用,接入资源开销占用降低50%,发布运维效率提升60%以上。升级 3:新架构 在应用架构层,利用服务网格等新架构,提升应用的敏捷性、弹性与韧性。服务网格已经成为云原生应用的网络基础设施。阿里云服务网格服务 ASM 在 4 个维度进行了全新的升级:支持多种服务治理框架,可以实现 Spring Cloud,Apache Dobbo 等微服务应用与服务网格应用的互联互通和平滑迁移。二、容器服务助力企业精益用云 23 为应用服务提供统一的身份定义,简化零信任策略的构建与实施。提供开箱即用的 Envoy 插件市场,可以拓宽服务网格的应用场景,包括身份认证、AI Serving 等场景。可以基于服务 SLA 指标,实现更加精准的弹性扩缩容。震坤行工业超市是一家数字化的工业用品服务平台,为众多企业复工复产保驾护航。借助于 ASM 服务网格,提升了平台的性能。基于 ASM 的软硬一体优化技术,提升TLS 握手性能 75%,以及 QPS 30+%。关于相关技术细节,可以参阅 Intel 和阿里云一起编写的技术白皮书。专注餐饮行业数字化的合阔智云,其业务中台的核心生产系统 100%全部切换到服务网格 ASM,提升应用发布效率 70%,降低异常排错成本 80%。升级 4:新实践 在运营治理领域,将通过一系列最佳实践的产品沉淀,提升企业 IT 在成本管理、安全治理等方面的管理效率。为了帮助企业上好云、用好云、管好云,阿里云本次发布了云原生 landing zone,为企业云原生上云提供最佳实践。它包含架构规划、安全管理、财务管理、自动化运维等等 8 大模块。二、容器服务助力企业精益用云 24 通过云原生 landing zone 最佳实践,已经帮助众多国内外企业客户构建了上云架构,满足企业对安全、稳定性和成本等多方面的业务诉求。围绕 LandingZone 中财务管理部分,阿里云结合业财一体化实践和 FinOps 理念,推出 ACK FinOps 套件。通过数字化手段和智能化方法,帮助企业实现成本可视化、可优化、可控制。中华保险作为国内互联网金融行业的领导者,通过 ACK FinOps 套件,将企业 IT 成本治理周期从季度缩短到天级别,资源闲置率从 30%降低到 10%以内。识货团队通过应用混部和弹性等技术优化,将集群的资源利用率提升 10%;整体降低计算成本 20%以上。围绕 LandingZone 中安全防护部分,ACK 与 ACR 提供完备的 DevSecOps 的产品能力,为企业提供安全可信的软件供应链。二、容器服务助力企业精益用云 25 今年,阿里云推出了集群容器安全概览,可以帮助安全管理员对集群安全水位有更好地感知,可以对集群配置、应用镜像、容器运行时的安全风险,及时发现与处置。全球领先的 SaaS 厂商 Salesforce,在阿里云上提供先进的 CRM 服务应用。基于云原生 DevSecOps 能力,半年内实现数千次风险镜像拦截阻断,1 万次工作负载部署策略阻断。基于全自动化软件供应链安全流程,应用安全交付效率提升 3 倍。二、容器服务助力企业精益用云 26 未来,希望更多的企业能和阿里云一起,利用云原生技术精益用云、增效降本,在云端进行业务创新。三、云原生可观测套件:构建无处不在的可观测基础设施 27 三、云原生可观测套件:构建无处不在的可观测基础设施 作者:周小帆,阿里云智能资深技术专家 1.Gartner:可观测性成为数据驱动型决策最强支撑 近日,全球权威 IT 研究与顾问咨询公司 Gartner 发布 2023 年十大战略技术趋势报告。报告围绕优化、扩展和开拓三大主题展开,应用可观测性再次成为其中热门趋势之一。Gartner 杰出研究副总裁 Frances Karamouzis 表示:“为增加盈利,企业 IT 高管在持续加快数字化转型的同时,需将目光从节约成本转向新的卓越运维方式。可观测性以高度统筹与整合的方式将用户数字化操作所产生的可观测数据进行反馈并创造决策循环,提高组织决策有效性。如能在战略中予以规划并执行,可观测性将成为数据驱动型决策的最强支撑。”但伴随着 IT 技术高速发展,企业在落地可观测过程中必然遭遇三大阻隘。首先,蓬勃发展的开源/商业可观测产品生态与逐渐无法满足云原生 IT 运维需求的传统企业监控体系,造成新老工具、数据与工具的割裂。如何选择与平衡成为 CTO、CIO 必须面对的选择题。其次,当微服务架构以及分布式架构被越来越多应用于企业业务,以日志为例的典型可观测数据,计算成本与存储成本以指数级增长。在行业形势愈发严峻的当下,可观测成本投入高昂且难以预估,应用场景往往停留在单点排查或基础监控告警上,大张旗鼓的落地可观测基础设施,回报价值未知。以上几点,这都难以说服 CTO、CIO 们投入愈发吃紧的运维预算与人力进行可观测性建设。为解决以上难题,深耕可观测领域的阿里云于今年 6 月推出阿里云云原生可观测套件 ACOS,该产品套件由阿里云 Prometheus 服务、阿里云 Grafana 服务、链路追踪 OpenTelemetry 组成,这三款开源流行度最高、生态集成最广的事实标准是云原生可观测套件 ACOS 的“核心”,旨在通过开放标准打通所有阿里云可观测产品实现全链路数据标准化,并连接企业存量可观测数据资产,与阿里云应用托管平台集成。三、云原生可观测套件:构建无处不在的可观测基础设施 28 全面覆盖用户体验(UEM)、应用观测(APM)、云服务观测、成本管理、应急协同效率等场景。帮助企业高效构建开放、高质量、低成本的统一可观测体系。2.云原生可观测 ACOS 的独特价值 相较于其他可观测商业化或开源解决方案,云原生可观测套件在采集、存储、计算、告警、查询、可视化六大环节做到与开源标准的全面兼容与优化提升。同时,将阿里巴巴集团以及阿里云服务海量用户的可观测经验进行产品化输出。这包含超过 50款阿里云主流云服务的运行指标、大盘和告警规则预置模板。从基础设施到容器,从应用到用户体验,从成本分析到运维效能分析,在接入第一天就做到全链路高质量观测。自发布以来,众多行业客户借助阿里云原生可观测套件 ACOS 快速构建统一可观测体系。以友邦人寿为例,友邦人寿对应用进行容器化、微服务化改造,以适应业务与性能要求。但随着访问链路与部署复杂度提升,观测微服务和 K8s 运行,并构建全栈可观测能力成为巨大挑战。借助 ACOS,友邦人寿将可观测性覆盖研发生产全周期,将研发态与运维态指标关联与展现,从而有效度量研发效率。同时,将多容器集群及应用服务的观测进行统一,将应用性能指标、全局调用链、日志相融进行快速根因定位的同时,形成指挥决策、仪表盘展示、告警推送的多维度观测能力,大幅提升运维服务效率。三、云原生可观测套件:构建无处不在的可观测基础设施 29 3.云原生可观测 ACOS 焕新升级 本次云栖大会,阿里云云原生可观测套件 ACOS 三大组件也迎来重要升级。首先,作为容器观测事实标准的阿里云 Prometheus 监控,观测范围从专精容器延伸到全栈可观测。为了帮助更多企业构建统一观测体系,Prometheus 监控已成为阿里云 50+款云产品默认观测基础设施,并与应用实时监控服务 ARMS 的 APM 指标、eBPF 指标、OpenTelemetry 指标联通,以及将企业的 ECS(非 K8s 集群)、K8s 集群、非阿里云集群进行 Prometheus 实例聚合,帮助企业一键开启全球与异构架构下的统一可观测中心。在服务外部客户同时,阿里云 Prometheus 监控不断通过内部场景进行打磨,目前已能够支持千万核的容器观测及数十亿级别时间线的时序存算能力。对于时序监控场景的核心技术难点,如海量动态监控对象采集能力、高基数时间线发散收敛、长周期查询、突发流量下误报漏报等场景进行针对性优化,使得阿里云 Prometheus监控真正成为无处不在,大规模生产可用的可观测基础设施。在赋予企业强大观测能力的同时,Prometheus 推出全新包年包月计费形式,同等业务规模下,平均相较于自建成本降低 60%。满足不同业务规模用户的观测需求,并尽可能减轻企业的运维成本压力。三、云原生可观测套件:构建无处不在的可观测基础设施 30 其次,作为观测界面的阿里云 Grafana 服务也将迎来 9.0 焕新升级。全新的Prometheus 和 Loki 查询语句生成器及强化后的搜索 Explore 功能,让用户获得更强的数据查询与分析能力,更低门槛的创建可视化大盘与告警。同时,为了应对越来越丰富的异构可观测数据源,Grafana 服务与日志服务 SLS、Elasticsearch 等 20+款可观测存储服务集成,帮助企业更简单的构建统一运维&业务观测界面。一键导入/导出自建实例、自动数据导出报表,一键数据备份、恢复,用户操作审计等企业特性进一步增强。最后,为了帮助企业的云上应用开启多维度观测视角,应用实时监控服务 ARMS 也迎来巨大升级。在数据采集方面,在完整支持 Opentelemetry SDK 的同时,指标数据可完全通过与 Prometheus 标准进行存储与计算,补充业务、自定义组件埋点。在完善观测维度的同时,避免厂商锁定。并借助 TraceExplorer 实现多来源 Trace 统一查询。与此同时,eBPF 技术以及 Continuous Profiling 作为目前可观测领域最为热门的细分领域,阿里云可观测团队也进行积极探索。本次大会阿里云可观测团队开放基于 三、云原生可观测套件:构建无处不在的可观测基础设施 31 eBPF 技术的“轻量版应用监控”预览,帮助企业快速获得无侵入、全语言的应用监控能力,并及时感知集群全局拓扑结构。同时,与 Alibaba Dragonwell 团队联合推出 Continuous Profiling 功能,能够以极低功耗持续分析代码级别的性能开销,覆盖传统链路、指标和日志覆盖不到的细节,实现代码级生产环境性能问题定位及全天候主动剖析,让应用观测视角更丰富,观测颗粒度更细致。在不断探索更多可观测场景服务阿里巴巴集团以及海量企业用户的同时,阿里云可观测凭借其完备的产品能力与良好的生态集成能力及出色的成本优势,收获了国内外行业机构的高度认可。阿里云应用实时监控服务 ARMS 在今年获得中国信通院首批可观测产品先进级认证。同时,阿里云连续两年进入 Gartner APM 与可观测魔力象限,今年更是成为唯一入选的中国厂商。万物皆云的时代,可观测性让云计算更易用高效,最大程度释放业务稳定性、安全性、经济性价值。“观测力”已成为每个 IT 人的必备核心竞争力。不止于观测,可观测帮助企业分析、洞察并实现高质量的决策与业务创新。而阿里云将不断推动可观测技术演进与落地实践,帮助企业获得最具性价比的可观测性,真正实现高质量数字化转型与创新。四、传音移动互联可观测体系设计与落地 32 四、传音移动互联可观测体系设计与落地 传音控股作为“非洲手机之王”,据 IDC 报告显示 2021 年占据非洲智能手机出货量的 47.9%。传音移动互联广告平台作为传音控股的重要业务之一,是非洲最为主流的营销平台之一。在技术架构方面,传音控股通过 SpringCloud 进行全面微服务化。同时,使用数据库、中间件等众多 PaaS 服务,应用运行在阿里云容器服务 K8S 之上,并分布在欧洲、亚洲等多个 region,真正实现多 region 服务体系。对于该套体系而言,要构建完整可观测体系,挑战非常大:首先,观测对象非常多。观测对象分布在不同技术栈、架构中,要对于众多观测对象实现全覆盖且有所侧重,是非常大的挑战。其次,调用链路复杂。由于已经使用微服务,因此业务结构非常复杂,调用链路复杂,出现问题难以排查。最后,业务快速上线带来的运维工作量。新业务上线频率极快,如果新上线服务无法自动化地接入这一套可观测体系,会带来非常大的运维工作量。四、传音移动互联可观测体系设计与落地 33 要构建观测系统,首先要梳理出一套指标体系,进行分层设计,同时自上而下对
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服