ImageVerifierCode 换一换
格式:PDF , 页数:53 ,大小:6.53MB ,
资源ID:1240835      下载积分:25 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/1240835.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(云原生架构容器&微服务优秀案例集.pdf)为本站上传会员【Stan****Shan】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

云原生架构容器&微服务优秀案例集.pdf

1、云原生架构容器&微服务优秀案例集云原生架构容器&微服务优秀案例集云原生应用平台2023前言I N T R O D U C T I O N云原生架构,特别是容器与微服务技术领域已经成为下一代技术演进的必经之路,同时也是各行各业快捷上云、高效用云的最合适的架构选择。虽然容器与微服务技术在开源领域已经有了长足的发展,但是如何把这些技术应用到生产体系,做好系统的安全性、稳定性以及支撑大规模并发业务,并不是开源能直接具备的。阿里云提供了开源兼容,具备SLA保障,生产可用,经过大规模验证的容器产品(ACK、ACR、ASM)、可观测产品(ARMS、SLS)以及微服务产品(MSE)等帮助客户在云上构建可应用于

2、大规模生产的云原生架构方案。本案例集是相关客户通过阿里云的云原生产品构建生产业务体系的经验分享以及最佳实践总结,为您构建合适的生产可用的云原生架构提供相应的成功案例参考,也希望帮助您更轻松实现云原生架构转型,助力业务腾飞!云原生应用平台产品家族ASSIST ENTERPRISES IN DIGITAL INNOVATION助力企业数字化创新(排列不分先后)目录CATALOGUE极氪汽车 APP全面升级云原生技术架构,高效提升用户出行体验23元戎启行 基于 ACKEdge 加速云端协同管理25云快充 云原生稳定性建设之路27致景科技 基于 MSE 一站式实现服务治理29来电科技 基于 MSE 无

3、侵入式实现微服务治理31传音 基于 ARMS 构建全球一体化可观测平台,高效支撑业务创新41完美日记 容器化改造实现增效降本43商米科技 借力 ASM 实现业务迭代大幅提效23TCL 拥抱云原生,实现 IT 成本治理优化35硅基仿生 业务全面 Serverless 容器化的增效降本之旅37苏打智能 借力阿里云 AHPA 轻松应对突发流量39餐道 基于 ACK 构建创新底座,加速 SaaS 规模化演进45三只松鼠 云原生架构升级,完美应对双十一47斯凯奇 通过 MSE 提升业务迭代效率,轻松应对线上大促49识货 基于阿里云容器服务实现云原生提效降本51波司登 云原生架构升级,实现数字化业务创新5

4、3震坤行 基于云原生高效提升应急供应链管理能力55厨芯科技 加速业务容器化进程,成功实现增效降本57vivo AI 计算平台的 ACK One 混合云实践01合阔智云 通过 ASM 轻松实现微服务治理03禾连健康 低容错业务的增效之路05站酷 基于 ASM 解决多语言技术栈下服务管理难题,实现运维提效07唱鸭 轻松玩转 DevSecOps,用 ACR EE 构建安全高效交付流程09任意门 基于云原生 AI 套件打造人工智能的社交网络平台11核桃编程 基于 ARMS 构建可观测体系,全方位提升用户体验13数禾科技 AI 模型服务的 Serverless 容器化之旅15当贝 借力阿里云落地云原生架

5、构转型,运维降 本效率稳定性双升17互联网01INTERNET小鹏汽车 基于云原生实现研发提效,加速探索未来出行19东风日产 借力 ASM 实现流量精细化管控21汽车/制造02AUTOMOBILE/MANUFACTURING零售/电商03RETAIL/E-COMMERCE众安保险 云原生架构升级,贯通行业数字化转型“快车道”67费芮互动 通过 MSE 完成移动支付应用稳定性和安全性双提升69金融05FINANCESalesforce 容器化改造,成功落地安全可信软件供应链71汇量科技 通过容器技术加快全球业务拓展73国际项目06INTERNATIONAL PROJECTS商龙科技 容器化上云,

6、保障业务稳定运行75万兴科技应用容器化改造,实现云原生转型升级77Landing Zone/咨询07LANDING ZONE/CONSULTING SERVICES申通 基于 ACKEdge 构建边缘 PaaS 实现业务全面提效59龙湖千丁 基于 ACKEdge 高效落地云边端一体化智慧停车业务61货拉拉 使用 ACK 轻松应对容器管理难题,实现精细化成本治理63丽迅物流 通过 ACR EE 管理大规模容器镜像,快速响应业务需求65交通/物流04TRANSPORTATION/LOGISTICS互联网INTERNET建设成果通过 ACK One 混合云的能力,该平台可将阿里云上的 GPU 主机加

7、入到客户自有集群,提供给用户在深度学习训练平台上使用,及时满足业务的算力需求。用户的使用习惯和之前保持一致。公共云资源根据不同业务的情况,使用周期在一个月到数个月。使用费用大大低于自行采购物理机的费用,有效降低成本。相关产品实施简单,成本低:客户原有集群无需改动,功能兼容,无需额外开发。提供一致性的体验:将云主机加入集群的流程和物理机基本一致。先通过公司云平台申请云主机,然后通过自动化平台将云主机初始化并加到集群中。提供更好的混合云网络:Kubernetes 的容器网络要求 pod 和 pod、pod 和宿主机之间通讯正常。该平台采用了 Calico+Terway 的网络方案,主要表现为在客户

8、机房内的工作节点采用 Calico BGP,阿里云上的工作节点采用 Terway 共享网卡模式,以获取更好的性能。vivo/互联网01客户简介客户痛点方案亮点vivo 是一家以设计驱动创造产品,以智能终端和智慧服务为核心的科技公司。采用 ACK One 方案,将云主机当做裸金属/物理机,加入到客户自有容器集群,集群使用人员体验感无差异,无需额外开发。云主机通过客户云平台申请,不改变当前资源申请流程。资源交付周期长:此前使用自建机房,新增资源的采购流程复杂,周期长,无法及时响应业务临时的大量算力需求,例如大规模参数模型的训练和在线服务的节假日活动扩容。同时由于服务器供应链形势严峻,网卡、硬盘、G

9、PU 卡等硬件设备都缺货,采购交付存在较大风险。需要更高性能的基础设施:AI 计算平台对网络、存储有更高的性能要求,在私有 IDC 里落地需要很高的时间和金钱成本。Vcontainer-混合云集群IDC 机房控制平面api工作平面专线物理机CalicoTerway物理机apinodenodeapiACKagent阿里云云主机云主机ACKACK控制台1分布式云容器平台 ACK One2容器服务 ACK02vivo AI 计算平台的 ACK One 混合云实践合阔智云/互联网03建设成果客户简介将 Linkerd 社区版本迁移到服务网格 ASM(阿里云提供的 Istio 云上商业版),高效解决了多

10、语言技术栈情况下应用链路调用复杂的运维难题,并解决了与云上其他产品搭配使用时的易用性问题,从而使运维效率提升了 40%。同时,借助 ASM 提供的丰富的企业级能力和完备的可观测能力,构建服务网格的实施周期缩短了 50%。相关产品配置推送优化资源利用率:通过 ASM 的配置推送优化,可以通过分析数据平面 Sidecar 产生的访问日志,获取数据平面服务之间的调用依赖关系,为每个工作负载自动推荐 Sidecar 资源,减少配置推送负担,提升资源利用率。合阔智云成立于 2011 年,核心是云原生和移动化设计的新一代全渠道“云端一体”履约中台和去中心化模式智能门店供应链业务中台。客户痛点方案亮点开源项

11、目易用性差:客户采用 Linkerd 社区版搭建 Service Mesh 基础设施,无法与阿里云提供的云上基础设施进行很好的融合。例如,Sidecar 使用默认配置,控制能力相对较少,在应对一些复杂的场景时无法灵活配置。Linkerd 的应用可观测性较简单,无法观测到偶发的链路熔断和某个端口无法访问的场景。链路调用复杂治理难:随着应用数量的增加,应用链路调用变得更加复杂。客户采用 gRPC 协议,但应用端没有做特别处理,导致基于 HTTP2 的长连接协议无法实现负载均衡,尤其是在单个客户端调用变大的情况下,服务端无法有效负载。应用本身比较薄,导致应用调用链路无法透明化,每次新的发布部署容易出

12、问题。数据平面集群的资源消耗大:客户的数据平面 Kubernetes 集群中的工作负载数量比较多。默认情况下,Sidecar 会增加对数据平面集群的资源消耗,同时控制平面会面临较大的配置推送负担,降低控制平面的效率和可用性。商业版架构和社区版一致,云上易用性强:服务网格 ASM 的架构与 Istio 社区版和业界趋势保持一致,并在托管的控制面侧提供了用于支撑精细化流量管理和安全管理的组件能力。控制面的托管解除了与所管理的 Kubernetes 集群生命周期的绑定,使得架构更加灵活,提升了系统的可伸缩性。自带的可观测面板清晰展现各种问题,例如不合理的应用补偿策略、不合理的应用部署、不合理的应用报

13、错。问题一清二楚,进而非常方便地推动应用架构的改造。企业级治理能力丰富,提升可用性:相比 Istio 社区版,ASM 提供了更加丰富的企业级治理能力,如流量标签、灰度发布、熔断、限流等能力。托管核心组件ASM Infra流量管理&协议增强可观测性&弹性伸缩零信任安全自适应xDS优化 软硬一体优化网络诊断智能分析Envoy Filter扩展中心异构服务注册集成Web用户界面/被集成能力:Open API/Terraform 声明式 API,兼容社区 Istio,支持控制面与数据面 Kubernetes API 访问为运行在异构计算基础设施上的服务提供统一的网格化治理能力ASM数据面多集群支持混合

14、部署多云混合云入口出口阿里云VPC其他公有云或IDCASM 网关Envoy 扩展证书管理协议增强Pod托管ASM控制面核心组件,标准/企业版架构统一,柔性架构、多版本支持、定制能力增强WAProxyServicePodWAProxyServiceECI PodWAProxyServiceECS VMWAProxyServiceENS PodWAProxyService外部集群WA数据面的扩展及运维Proxyless 支持及与 Proxy的互通网格 CNI 插件兼容优化eBPF 数据面性能加速ACK Kubernetes 集群&ECI 虚拟节点ECS虚拟机边缘集群外部注册集群Serverless

15、Kubernetes 集群1服务网格 ASM2容器服务 ACK3Serverless 容器服务4弹性容器实例 ECI04合阔智云通过 ASM 轻松实现微服务治理客户证言相关产品“我们以横向的订单、落单、数据同步为主,重新梳理了模块和服务,同时部署架构换成了 Kubernetes,并把用于服务治理的一些中间件替换成阿里云微服务引擎 MSE 这类云服务,这个时候,整个系统总体就比较稳定了。总结来看,围绕业务来构建微服务,结合云的优势,提升了开发运维效率和线上稳定性。”客户简介禾连健康成立于 2014 年,是一家从体检场景切入的健康管理服务公司,目前已经覆盖全国 200 多个城市,2000 多家医院

16、方案亮点禾连健康采用 MSE(Dubbo+Nacos)的微服务技术栈,提升了整体性能、减少了资源成本,并避免了一些安全风险。客户痛点自建性能低效:使用开源的 Dubbo2+Nacos 进行微服务重构,业务发布峰值触发 Nacos 性能瓶颈,导致服务异常下线,引发业务故障。人工运维风险高:客户服务 2000 家医院,每家医院的需求差异大、且变更频繁,会存在大量的特性开关,此类开关的人工运维操作非常危险,一旦出现误操作,会导致严重的线上故障。禾连健康/互联网05建设成果动态配置,无需重启:微服务引擎 MSE 的特性开关支持动态配置,无需重启应用,用户无感知,很好地解决了客户的痛点,提升了业务的稳

17、定性,同时集成 KMS 解决敏感配置存储问题。相比于自建,MSE 注册配置中心性能提升 50%,解决了业务高速发展中的扩展性问题,保障全国200 多个城市、2000 多家医院体验业务的稳定性超过 99.99%。性能强大、降低资源成本:微服务引擎 MSE 帮助客户扛住了频繁发布的压力,具有良好的兼容性,后续客户跟随社区升级至 Dubbo 3,解决了 Dubbo 2 服务模型的问题。另外,从内存视角看,MSE 具有出色的调优能力,使业务性能提升 4 倍,降低了客户的资源成本。服务观测(trace)服务实例隔离HTTP 协议转换网关DevOps特性开关加密配置阿里云 ARMS基于 Apache Sh

18、enYu 改造POST/GET-鉴权-Dubbo 调用MSE+KMSACK云效CI Kubernetes+镜像发布/回滚 持续集成运营端Dubbo ServiceA,v1C端Dubbo ServiceA,v2基于 Dubbo 版本微服务治理1微服务引擎 MSE2应用实时监控服务 ARMS3容器服务 ACK06禾连健康低容错业务的增效之路客户简介站酷(ZCOOL)深耕设计领域多年,聚集了 1500 万设计师、摄影师、插画师、艺术家、创意人,在设计创意群体中具有一定的影响力与号召力。业务使用了 Node.js、Java、PHP 等多种技术栈进行开发,开发、运维协作成本高。客户痛点站酷/互联网07建

19、设成果方案亮点通过使用 ASM,客户成功解决了多语言技术栈情况下的多集群应用服务管理难题,同时提高运维效率 40%。ASM 还提供了统一流量治理和全业务的实时观测能力,大幅度提升了线上业务的稳定性。相关产品高效管理多集群、多语言下的应用服务:通过使用服务网格 ASM,多集群、多形态、多语言服务的统一管理变得非常简单。ASM 是一种托管式服务网格,可用于多种异构类型计算服务的统一管理,提供了统一的流量管理、服务安全、服务可观测性和代理可扩展能力,构建出企业级能力。南北向和东西向流量的统一治理:在社区版 Istio 的网关基础上,ASM 企业版提供了更多的企业级高级特性,包括指标伸缩(HPA)、基

20、于 Intel MultiBuffer 技术的软硬结合性能优化、网关无损升级、SLB 优雅下线等。这些特性使得网关真正达到了生产可用级别,能够很好地支持各种企业级服务。ASM 可观测中心实现全业务的实时监控:在生产环境中,站酷主要利用了日志中心进行了网格可观测性的建设。ASM 通过与日志服务集成,提供网关与网格内 Sidecar 日志的自动采集,并针对网关与网格内 Sidecar 访问日志分别提供了日志仪表盘。这些仪表盘提供了实用指标监控,如请求错误率、P95 延迟等,实现了对多集群异构应用的统一可观测性。插件市场完善:服务网格 ASM 在插件拓展中心中提供了即插即用的插件市场。该市场针对各种

21、实际业务场景提供了多种即插即用的插件,通过简单配置参数即可快速启用数据面 Sidecar 的各种拓展能力。通过利用 ASM 插件市场,站酷在很短时间内就解决了业务迁移中遇到的问题。支持自动化 API 集成:作为阿里云云产品,服务网格 ASM 除了通用的 OpenAPI/SDK 集成方式之外,还提供了其他多样化的产品功能模块集成方式,包括 Kube API、Terraform 等。ASM 提供的各大功能模块不仅能够通过 ASM 控制台进行访问,还可以以 API 的形式集成到厂商的自有业务中台中,助力网格运维自动化。多语言、多集群服务统一纳管难:站酷面向互联网用户,提供站酷网、站酷海洛、站酷学习等

22、各项服务。这些业务使用了多种技术栈,例如 Node.js、Java、PHP,部署在多个 Kubernetes 集群中。如何通过统一的业务中台来纳管这些业务是一个巨大的技术挑战。可观测体系构建难:对于上述业务架构,实现不同应用服务的统一可观测体系,以及进行服务指标的统一实时监控,是一个难点。服务治理自动化集成难:由于站酷建设了统一的业务中台,需要对服务的部署、维护、治理等方面实现较强的自动化配置需求。在多集群服务治理的场景下,自动化集成能力也是至关重要的。1服务网格 ASM2容器服务 ACK3应用实时监控服务 ARMS08站酷基于 ASM 解决多语言技术栈下服务管理难题,实现运维提效客户简介作为

23、国内首款弹唱 App,唱鸭在产品创新的不断探索为音乐行业带来了全新的用户价值,包括弹唱、音效键盘等功能,让它迅速成为了拥有千万级别用户量的音乐产品。客户痛点唱鸭/互联网09建设成果相关产品唱鸭团队通过采用微服务架构、容器落地 DevSecOps,安全且高效地交付部署,提高了业务的敏捷迭代、降低了人工介入的成本。容器镜像服务企业版 ACR EE 不仅具备高效的镜像分发能力,也提供了安全的云原生应用交付链能力,使唱鸭可以从容不迫地完成每天 10+次的容器化部署,DevSecOps 的体验非常顺畅。唱鸭团队依然处于快速发展阶段,但团队充满创新力,整体架构选型紧跟技术前沿趋势。方案亮点轻松构建云原生

24、DevOps:业务开发将算法代码提交到 GitLab 代码托管平台,ACR EE 收到 GitLab 代码变更的 Webhook 通知后,可自动将代码构建成容器镜像并加密托管于实例中。高效安全的容器化应用交付:ACR EE 上创建了云原生应用交付链的 DevSecOps 流程。交付链将保障容器镜像自动安全扫描,如果发现高危漏洞则基于安全策略阻断后续的交付部署。如果通过安全扫描流程,则自动将镜像加签并触发后续不同环境的镜像部署。云上产品无缝集成:ACR EE 可与阿里云多产品实现无缝集成,唱鸭的 PAI-EAS 集群收到通知后,可自动从 ACR EE 实例中获取最新的镜像版本。唱鸭采用阿里云容器

25、镜像服务企业版 ACR EE,实现了应用与算法上云构建的镜像托管,更加便捷地构建了 DevSecOps 全自动化流程,具有以下优点:业务交付压力大:唱鸭团队人数大概 50+,研发人员 30+,唱鸭自身业务基于微服务架构,服务的日发布频率超过十次,需要提高研发迭代效率。容器安全风险:唱鸭业务采用大规模容器化部署,由于容器化存在高动态及高密度部署、不可信三方及开源软件引入的情况,容器安全风险很大。PAI-EAS 测试集群ACR EEPAI-EAS 预发集群PAI-EAS 生产集群DevSecOps云原生应用交付链开发GitLab提交代码提交代码构建容器镜像镜头加签触发通知安全扫描安全阻断容器镜像服

26、务 ACR1210唱鸭轻松玩转 DevSecOps,用 ACR EE 构建安全高效交付流程客户简介Soul 是任意门旗下基于兴趣图谱和游戏化玩法的社交 APP,属于新一代年轻人的虚拟社交网络。基于用户的社交画像和兴趣图谱,通过机器学习来推荐用户可能会产生的高质量的新关系,有丰富的AI 业务场景,包括语音匹配、聊天机器人、文本 OCR 识别、图像识别、多模态等。任意门在阿里云上,通过容器服务 ACK 云原生 AI 套件,构建了符合开源标准、自主掌控的 AI PaaS 平台,实现了以下特点:任意门/互联网11客户痛点方案亮点任意门 Soul 通过先进的算法驱动和数据分析技术,打造了“平行宇宙”中独

27、立的、沉浸式社区。作为下一代基于人工智能的移动社交网络平台,任意门 Soul 是中国社交 4.0 时代的领军者。其 AI PaaS 平台管理了从初期的数十张 GPU 卡到近千张的超大规模,日承载 AI 业务发布数百次,很好地支撑了业务的高速发展。建设成果相关产品AI 机器学习是公司核心业务,但在传统的虚拟机构建部署方式下,缺乏一个统一的管控平台,导致业务工作流不流畅,开发迭代效率低下,运维管理复杂且资源利用率低下,具体表现为:业务迭代速度慢:研发工程师需要花费大量时间在底层基础设施资源准备、业务集成部署、日志监控等 AI 工程化上,无法专注于业务开发,难以快速响应业务研发需求。运维工作重复:日

28、常需要处理安装 Nvidia GPU 驱动、CUDA 版本、OSS 数据源等环境问题,人力投入大,运维效率低。资源性价比低:CPU 机器处理速度慢,大量堆积机器,导致资源闲置浪费。GPU 机器虽效率高,但现有技术无法提升利用率,资源空置。全生命周期管理的一站式平台提升迭代效率:提升迭代效率,包括数据管理、AI 任务发布和模型评测等,开发迭代效率提升 25 倍。统一的异构资源管理和运维平台降低运维成本:降低运维成本,自动化管理 GPU 节点、算法代码与标准镜像解耦以及自动弹性推理,节省 1 倍运维成本。效率及资源利用率提升:提供专业的 GPU 共享及 Fluid 数据加速能力,同时提升业务效能,

29、成本节约 50%。语音合成语音合成数据管理开发Arena AI 工具集/SDK异构资源管理、弹性、可观测容器服务 ACK训练推理人脸匹配图像识别智能聊天CPUGPUOSSHDFS统一运维任务调度弹性伸缩数据库加速大数据集成工作流监控日志自愈多租户容器服务 ACK12任意门基于云原生 AI 套件打造人工智能的社交网络平台客户简介核桃编程作为少儿编程教育行业的领导者,致力于以科技手段促进编程教育,通过人工智能、自适应学习等先进技术和科学的教育方法,启发中国孩子的学习能力。核桃编程/互联网13客户痛点方案亮点降低运维工作量:相对于传统的前端日志埋点方式,ARMS 提供的前端可观测方案帮助核桃编程节省

30、了 30%以上的运维工作量。快速定位线上问题:定位线上问题的平均时长减少 60%。提升用户体验:通过前端可观测技术,全方面提升用户体验,带来了业务量的快速提升。核桃编程在成立后 3 年内付费学员数突破 200 万,并实现了单月营收过亿。建设成果相关产品随着核桃编程业务的快速增长,微服务架构变得越来越复杂,在提升用户体验方面面临很多困难。其中,出现以下问题:无法及时发现站点故障:用户体验是决定品牌形象的核心要素,但客户 IT 团队在多次用户投诉后才发现站点故障,导致用户体验下降。客户端监控手段缺失:相对于成熟的服务端监控技术,整个行业在客户端监控领域的技术方案一直比较欠缺,仅仅拥有服务端监控手段

31、很难第一时间确认问题的根源到底在于前端还是后端。实时洞察用户体验:全面并实时地了解应用端到端健康程度,包括 PV/UV 情况统计、页面加载速度情况、JavaScript 执行情况,API 请求成功率等多个方面。客户端信息多维度聚合:ARMS 前端监控能够从地理位置、浏览器、操作系统、分辨率、网络运营商、应用版本等多个维度,对客户端性能指标进行聚合分析,从而帮助核桃编程更好地定位性能瓶颈。前后端统一链路追踪:ARMS 前端监控能够自动生成 TraceID 串联前后端链路,这样可以从完整链路的角度洞察瓶颈点,对于排查系统故障和性能瓶颈带来了非常大的帮助。接入简单:只需在客户端 HTML 页面的

32、Body 元素中加入一段由 ARMS 提供的统计接入脚本(一段 JavaScript 代码),就能完成监控数据的自动上报。应用实时监控服务 ARMS页面渲染、交互过程前端监控领域关注点后端监控客户端服务端请求过程服务端状态123应用前端健康度访问速度页面运行稳定性服务调用成功率14核桃编程基于 ARMS 构建可观测体系,全方位提升用户体验数禾科技/互联网15通过对内部模型部署的 pipeline 进行改造后,目前数禾的所有新增模型均已通过 ACK+Knative 方式部署在线上提供服务,得益于 Knative 的多版本管理能力,快速解决了模型的灰度发布和多版本并存的问题。同时加之基于请求的自动

33、扩缩容能力,在多个版本并存的情况下,并没有对资源产生额外的消耗,而且极大节约了晚间的谷时资源。对比使用之前的方案,模型服务在应对突发批量流量的稳定性方便获得大幅提升,同时资源的使用效率也获得了显著提高,节约成本约 60%。“使用阿里云容器服务 Knative 和 ECI 虚拟节点配合部署,在保证线上模型应对突发流量的稳定性大幅提升的同时,又使资源利用效率获得了显著的提高,极大的节约了资源成本。”“数禾 DevOps 平台 BetterCDS 集成了阿里云容器服务 Knative,支持模型服务的多版本运行和弹性伸缩,在降低运行成本的同时,也提升了服务的可用性,极大地方便了运维人员和开发人员。”建

34、设成果相关产品方案亮点经过内部的沟通与调研,最终选择了基于 Knative 的 Serverless 服务方案:极致弹性,按需使用:基于请求的自动弹性、允许 pod 缩容到 0,按需使用算力资源。多版本管理,简化运维:Knative 支持多个版本管理、基于流量灰度以及回滚。快速集成,一键部署:由于数禾本身的技术架构都是部署在阿里云的底层资源上,而阿里云容器服务 ACK 又对 Knative 做了组件集成,可以支持一键部署,极大的减小了部署调试的时间成本。客户简介数禾科技以大数据和技术为驱动,为金融机构提供高效的智能零售金融解决方案,服务银行、信托、消费金融公司、保险、小贷公司等持牌金融机构,业

35、务涵盖消费信贷、小微企业信贷、场景分期等多个领域。客户痛点风险管理业务算力要求高:在风险管理业务中,根据公司的风险容忍度、风险偏好波动以及阶段性业务目标需要针对数禾客户进行风险属性的调整,这其中包括用户额度、定价、可借期限等相关要素。这不可避免的需要应用批量数据处理能力通过计算规则来对大量用户做调额、调价等。模型作为风险管理的重要组成部分也必不可少的会被运用至批量处理中。因此对于模型的计算能力就提出了很高的要求,包括计算速度、计算结果准确性、计算数据实时性等。底层应用资源无法快速响应:支撑模型计算的底层应用资源无法灵活且快速的根据请求量来智能化调整机器资源支持运算能力,这也是当前业务快速发展过

36、程中亟待解决的痛点。模型服务臃肿,管理难度大:随着模型在线推理服务数量的增加,数禾的模型服务也变得越来越庞大、臃肿,难以管理。这种状况不仅导致了资源浪费,还增加了维护和升级的成本。容器服务 ACK客户证言16数禾科技 AI 模型服务的 Serverless 容器化之旅模型平台阿里云ACK模型管理BetterCDS数禾DevOps平台制品管理拉镜像Knative管理模块CI流水线DockerFile拉DockerFile文件更新配置更新弹扩配置管理路由配置登记制品拉模型文件创建版本路由共享库发布流水线revision获取Knative配置,触发部署创建ksvc版本更新traffic观察日志Rou

37、tesPodAutoScalerDeploumentPodPodPod当贝/互联网17采取了全面上云的架构转型后,极大地解决了客户传统运维体系所带来的痛点,整体运维成本下降 80%,提效 500%,研发效率和稳定性都有极大提升。最关键的成果为,极快推动了客户中台化、微服务化的落地,借助 ACK+MSE 云原生网关的组合,当贝技术团队在几乎无需运维成本的情况下,实现了 1-5-10 和 99.95%的两大目标。“在云厂商的选择上,阿里云是国内云计算的布道师与发扬者,实力全球领先,对云原生技术发展的贡献有目共睹,同时其汇聚了业内最顶尖的人才、最丰富的经验案例、最可靠的成熟度,以及其 客户第一的价值

38、观,当当贝技术团队最终选择借力阿里云落地云原生架构转型。”建设成果相关产品方案亮点面对传统运维体系十分突出的三大核心痛点,为避免其在未来对当贝可持续发展的战略形成制约,客户技术团队进行了广泛研究、深入分析、积极调研,最终将目光瞄准在了阿里云云原生架构上。容器化上云降低业务风险:依赖容器服务 ACK 及其集成的大量产品,客户技术团队极快地完成了核心服务的容器化改造,并顺利完成灰度发布、全面切流等工作。完成上云后,核心服务从开发态测试态,变更与运行态,贯穿服务整个生命周期,效率都得到了极大提升。利用云原生 DevOps,完全避免人工运维干预的高风险性;利用 ACK 服务与服务器资源天然解耦的特性,

39、完全摆脱了基础设施运维的低效困扰;利用 HPA+CronHPA,从容应对流量高峰低谷。云原生网关提升 IT 系统稳定性:在引用 ACK 作为云原生的基础设施的同时,客户技术团队也引用了 MSE 云原生网关作为流量管理组件。相较于过去传统运维体系下自建网关而言,云原生网关更具备着高可用、高性能、弹性伸缩、更易用等优势,做到了网关层面完全免运维,减少人工干预的同时,大大提升了 IT 系统的整体稳定性。引入可观测体系降低运维成本:客户过去运维团队自建的可观测组件存在易用性差、稳定性差,且运维成本高昂、版本老旧等诸多问题,且对 ACK、MSE 云原生网关等云原生组件的支持存在适配成本。所以客户团队最终

40、决定采用阿里云的可观测解决方案,主要以 ARMS、SLS、Grafana、Prometheus、云监控等产品,依赖它们与 ACK、MSE 等云原生组件高度集成的能力,构建了当贝在云原生下的可观测体系,极大降低了运维成本。客户简介当贝成立于 2013 年 8,是目前中国知名的智能大屏增值服务提供商之一,致力于成为亿万家庭 AIoT 的核心入口和生活娱乐中心,是一家横跨软件、硬件和操作系统全生态的大屏端互联网平台型公司。客户痛点人工运维效率低,风险大,成本高,资产管理困难:由于传统运维体系下人工参与度高,从各环境代码发布,到高峰低谷的扩容缩容,再到各类证书、云服务器等云资产管理的环节中,风险逐渐提

41、升,即便运维人员有着超高水平,也很难保证长久情况下不出现任何失误或疏忽。同时,人工参与度越高,效率也就越低,协作成本越高。为保证稳定性,每一次线上系统变更,都需要协调大量跨部门配合。稳定性挑战大,异常排查及恢复成本过高:随着客户业务高速发展,流量往往以十倍乃至数十倍激增,对稳定性和容量规划形成极大压力。同时,在传统的运维体系下,当生产环境发生异常时,依赖链路复杂、排查难度大、定位时间久、牵扯人员广等成为核心痛点。对此客户定下了 1-5-10 快恢及 99.95%可用性两大要求。自建可观测体系落地复杂,易用性和稳定性差,运维成本高:在客户早期阶段,为保证各项系统快速上线、业务高速迭代,存在一些技

42、术架构考虑不周的情况,包括选型不一、业务高度耦合、调用链路过长、云资源选择不合理、管理不清晰等。这些因素组合在一起,形成庞大的历史包袱,使得当前面临着稳定性差、运维成本搞难度大、易用性差、体系不统一等各方面问题。客户证言18当贝借力阿里云落地云原生架构转型,运维降本效率稳定性双升投影/盒子电视业务流量静态请求动态请求APP/H5.HPACron HPAACRECI资源监控业务监控链路追踪告警中心ARMS音乐业务服务 ACK 集群健身影视市场.统一网关集群服务发现服务灰度服务探针高可用.HTTPDUBBO交易中台微服务 ACK 集群商品用户营销内容分发HTTPDUBBO可观测体系日志服务1容器服

43、务 ACK2Prometheus 监控服务3微服务引擎 MSE 4应用实时监控服务 ARMS 汽车/制造AUTOMOBILE/MANUFACTURING客户证言“小鹏汽车和阿里云携手共建自动驾驶智算中心 扶摇,为小鹏全场景智能辅助驾驶系统的训练奠定算力基础,我们相信跟阿里云一起能够更快更好更强的发挥作用。阿里云的技术支持,使我们的成本降低,在过去及未来的时间里,阿里云的可靠性和稳定性,都是小鹏汽车最好的选择。”相关产品小鹏汽车/汽车&制造19客户痛点客户简介数据处理链路复杂:自动驾驶车联网数据链路长且数据增长快,因此数据时效性要求高。自动驾驶 AI 服务资源利用率低:缺乏有效的 AI 模型 G

44、PU 训练和推理优化。可观测系统不完善:前端 Web 和后端服务缺乏有效的监控和分析,同时自建 Prometheus 稳定性不佳。支撑平台技术栈复杂:技术平台需要支持多种业务,并且需要建设如 Workflow CI 工作流、SRE 等工具平台,技术栈较为复杂。提升训练和仿真资源利用率:ACK 云原生 AI 套件支持了小鹏自动驾驶大规模训练和仿真任务的调度和管理,提高了训练和仿真资源的利用率。同时,AI 套件还支持了小鹏互联网技术中台和鹏行业务的 NLP、ASR 等推理业务。ACK GPU 共享调度和隔离能力,成倍地提高了 GPU 资源的利用率。全链路可观测保障业务稳定:小鹏基于托管在 ACK

45、上的全量业务,采用 ARMS Prometheus 服务、前端监控和 APM 等工具实现全链路监控系统,有效洞察业务稳定性风险,保障业务稳定性。统一云原生技术栈简化运维:除了通过容器服务 ACK 支持仿真、音视频转码、视频截图、图片处理、数据处理等相关业务外,小鹏还支持 Airflow/Argo workflow、Kubeflow/Arena 等工作流平台。采用统一的技术栈运行各业务及其支撑系统,简化了运维的复杂度。方案亮点阿里云云原生产品支持了小鹏汽车多个业务的技术平台建设。小鹏数据处理、AI 训练与推理服务、工作流、SRE 运维设施均通过 ACK 统一容器技术栈进行承载。小鹏汽车成立于 2

46、014 年,是一家专注未来出行的科技公司。一直坚持饱和式研发投入,构建全栈自研的核心能力,今天小鹏汽车已经成为中国领先的智能电动汽车公司之一。弹性算力支持复杂数据处理:通过容器服务 ACK 运行数据处理和数据脱敏任务,容器为实时任务提供了弹性算力。ACK Pro 容器服务计算、网络、存储云基础设施容器集群管理异构资源 集群管理和调度ARMS全链路监控统一存储管理日志管理ARMS Prometheus 监控计算能力(CPU/GPU)存储(OSS、NAS、CPFS)网络(VPC/CEN)云原生 AI 套件ACR EEAI 镜像服务GPU 共享与隔离Job 任务调度数据加速Job 任务队列数据处理和

47、脱敏大规模训练和仿真测试智能制造/鹏行智能在线推理服务车联网用户平台和业务基础 PaaS 服务技术中台1容器服务 ACK2应用实时监控服务 ARMS3容器镜像服务 ACR4Prometheus 监控服务20小鹏汽车基于云原生实现研发提效,加速探索未来出行客户证言“借助云的能力,不仅加速向业务的延伸,进一步提升业务价值,降低运维成本,而且通过服务网格实现了高效、低成本的资源供给。”相关产品东风日产数据服务有限公司(以下简称东风日产)成立于 2014 年,拥有员工 800 余人,是汽车全价值链数据服务供应商。专注为东风日产、东风启辰等品牌提供数营服务、销售服务,客户服务、商城运营服务,全渠道数据价

48、值挖掘分析及应用。客户简介东风日产/汽车&制造21方案亮点建设成果客户通过引入 ASM,高效解决 7 层流量的精细化管理难题,享受 Service Mesh 带来的技术红利,缩短 50%的服务网格技术落地周期,同时节省控制面的资源成本。客户痛点成本控制难:除了能够自动按需提供环境,还需要增量式部署以节省服务器资源,控制服务器资源成本等问题。生产环境灰度复杂度高:需要对 7 层流量进行精细化管理,可以按照设计的情况进行流量转发(例如 Header),命中对应需求的应用;否则,命中默认应用(基准环境)。服务鉴权机制缺乏:公司非常注重信息安全,需要一个端到端细粒度的安全授权机制。免运维、易升级、企业

49、级能力丰富:东风日产引入阿里云服务网格 ASM,构建了基于流量管理的无限生肖系统,满足了自动按需提供环境的诉求。基于 ASM 提供的免运维、易升级以及丰富的产品支持能力,让产研团队集中享受 Service Mesh 带来的价值。这有助于东风日产缩短服务网格技术落地周期,减轻异常排错成本,并节省控制面资源成本。数据安全更有保障:此外,东风日产数据服务有限公司非常注重信息安全。结合阿里云的云安全大数据能力,使用云防火墙保障业务和数据的安全。在对云资产的管理过程中,通过堡垒机的方式保障运维过程的安全,做到有据可依,有源可溯,切实保证云上应用和数据的安全可靠。流量负载均衡用户中心A用户中心商品中心B交

50、易中心B内容中心B商品中心线索中心交易中心数据中心内容中心服务网格ASMACK集群特性环境A基准环境特性环境B1服务网格 ASM 2容器服务 ACK22东风日产借力 ASM 实现流量精细化管控相关产品极氪汽车/汽车&制造23客户简介建设成果极氪汽车 APP 已全面升级为云原生技术架构,大幅提升了用户的出行体验,同时也助力 001 猎装轿跑成为高端纯电汽车销量冠军。通过深入的微服务化探索和云原生架构实践,极氪汽车 C 端业务系统的稳定性和敏捷性得到了极大的提高,为冲击更高的销量目标提供了坚实的技术支持。流量防护和容错提升微服务稳定性:利用 MSE Sentinel 实时监控和链路功能,快速定位慢

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服