【倚天实例迁移课程】演讲材料合集.pdf

资源描述

【倚天实例迁移课程倚天实例迁移课程】演讲材料合集倚天倚天CPUCPU架构以及产品特性介绍架构以及产品特性介绍杨平超平头哥倚天解决方案架构师Contents内容提纲倚天倚天710710芯片概述芯片概述0102倚天倚天710710的主要特点的主要特点03倚天倚天710710应用落地介绍应用落地介绍倚天倚天710710芯片概述芯片概述01ARMARM服务器芯片发展历程服务器芯片发展历程2008201120122013201620172018201920212023ARM 参与投资 StartupCalxedaARM 发布ARMv8 架构AMCC 公布自研架构 GeneARM V8发布一年后，ARM推出A57 重核Marvell Armada XP 4 核系列CPUBroadcomVulcanQualcomm Server CPU announcedAWSGraviton2发布阿里巴巴开始自研ARM服务器CPU阿里倚天710量产AWSGraviton3宣布第一波浪潮（20082013）Arm v7 32bit初创为主因为性能问题很快落下帷幕第二波浪潮（20112018）Arm v8 64bit 2018年底发布Arm SBSA主流芯片厂下场遭遇生态瓶颈，缺少兼容软硬件第三波浪潮（2019）Arm v9 Neoverse云厂商下场业务场景驱动主流性能定制化设计Ampere UltraMax 发布Google，Microsoft陆续宣布自研服务器CPU计划倚天倚天710710芯片规格芯片规格双 DIE结构，每个DIE 360 毫米2 两个DIE 600 亿晶体管业界首次使用ARM V9架构和CPU 核 Perseus 主频：3GHz 8 Channel DDR5 x4800 96 Lane PCIe 5.0 Max Power:300 W倚天主要特点倚天主要特点02倚天倚天710710：云原生高性价比：云原生高性价比CPUCPUX16X16X1664 coresdie0X16X16X1664 coresdie1倚天710 一个die有64个物理N2（perseus）core，1颗CPU有2个die 128 core 一个die包含4个DDR5/DDR4 channels，1颗CPU有8个 channels 一个die包含48个pcie5.0 lanes，1颗CPU有96个lanes 每个core包含64KB的Icache和64KB Dcache，包含1MB的L2 cache 支持SVE/SVE2(2x128bit)，以提升HPC、AI类工作负载的性能体验提供硬件支持的安全特性和RAS、MPAM等功能，以保护平台和数据的安全和完整性提供有竞争力的能效比算力64MB L364MB L3倚天倚天CPU N2 coreCPU N2 core架构优势架构优势V9新增MOP cache（通俗称L0 cache），MOP Cache的好处是如果在里面找到需要的指令，前面的电路模块都可以暂时由MOP Cache来替代，可以节省功耗提升性能。V9的综合性能得到了极大的增强，相对V8有40+%的性能提升。CPU 的 cache 往往是分多级的金字塔模型，如上图，L1 最靠近CPU，访问延迟最小，但 cache的容量也最小预取就是预先把程序需要的数据搬移到缓存中，而不必等到缓存缺失时再去搬运 V9新增Temporal预取算法增强了指针追踪类应用的预取，提升了Redis类应用性能有预取无预取倚天倚天CPUCPU核特点：核特点：SVE2SVE2加速引擎加速引擎ALUCacheAssisted instructionFrequencyCPU utility SVE包含以下关键特性：Scalable vectors Per-lane predication Gather-load and scatter-store Speculative vectorization Horizontal and serialized vector operations SVE2在SVE基础上扩展了SVE指令集，从而进一步提升HPC和ML领域的处理能力；SVE2可以增强ML机器学习、DSP信号处理能力，提升了未来5G、虚拟现实、增强现实以及CPU本地运行ML的性能，未来还会继续提升AI人工智能性能；SVE2和Matrix乘法可以极大地简化软件生态系统，并允许计算工作负载以更统一的方法向前迈进；倚天架构特点：高密计算更稳定不降频倚天架构特点：高密计算更稳定不降频124681012C8y-x2649.889.639.599.59.59.599.46C7-x26412.7511.978.577.357.227.177.029.889.639.599.59.59.599.4612.7511.978.577.357.227.177.0202468101214fps/coreEncoding for X264 FPS Per vCPU倚天710X86ALUCacheAssisted instructionFrequencyCPU utility视频编码数据压缩科学计算AI推理多任务高负荷场景，倚天性能线性度表现更好，支持高负载运行低功耗设计，无需降频控制TDP 典型场景：ALUCacheAssisted instructionFrequencyCPU utility倚天架构特点：独享物理coreALU*4vcpu1vcpu2vcpu1vcpu2InstructionPipelinePipelineALUALUALUInstructionX86YitianInstructionvcpu1vcpu2vcpu2L1/2CacheL1/2CacheL1/2Cachevcpu1Cache容量容量：L1 64K+64K，L2 1M per core时延：L1 4 cycle，L2 10 cycle，x86持平ALUCacheAssisted instructionFrequencyCPU utility倚天架构特点：独享L1/L2 cacheX86YitianCache容量X86YitianG7主频GHz百分比睿频3.5100%基频2.983%降频2.34567%G8y主频GHz百分比基频3100%集团业务平均峰值(无混部)App、RDS数据库视频云=70%，超算=95%DBCPU utility50%安全水位17%睿频-基频16%基频-降频17%ALU/Cache争抢30%健康水位20%突发水位CPU utility70%安全水位50%健康水位30%预留水位20%突发水位30%=睿频能力+HT争抢增加占用率，业务性能很少提高安全水位提升后收益=70%50%=140%WebAppALUCacheAssisted instructionFrequencyCPU utility倚天重新定义安全水位效率提升40%倚天倚天710710精简的架构和先进的工艺降低云数据中心精简的架构和先进的工艺降低云数据中心TCOTCO0.9360.49870.311x86-AARM-A倚天710W/SpecCPU 下图是倚天跟竞对的单位算力的功耗对比。倚天采用Arm精简指令架构，加上先进的工艺/封装，极限功耗300w，实际应用中功耗大约在100w150w之间，功耗优势明显下图是某数据中心在一定的生命周期内所支付的所有费用按照各个要素的占比分析图，从中可以看出电费占比约20%，倚天功耗优势将进一步降低TCO数据中心TCO（Total Cost ofOwnership）模型TCO=CapEx+Opex=Ci+Cs+Cn+Cp+CmCapEX：Cost of Infrastructure 机房/机位成本，Cost of Servers 服务器成本，Cost of Network网络成本。OpEX：Cost of Power 电费，Cost of Maintenance 维护/运维费用TCO breakdown17%50%5%20%8%Cost of InfrastructureCost of ServersCost of NetworkCost of PowerCost of Maintenance云原生CPU:基于CIPU的倚天ECS硬件架构CIPU倚天倚天ESSDVPC低延时NVMe以CIPU为核心系统架构硬件架构高密度：通过阿里云CIPU实现整机核的高密度，可达256core，未来会更高高性能：采用双单路架构避免了多路互联的性能损耗和跨numa访问高可靠：爆炸半径减半：独立OS，独立PCB软硬件故障互补影响eRDMADDR5PCIePCIe200G倚天倚天710710应用落地应用落地03倚天CPU全栈技术优化大数据网络中断优化Linux 内核配置优化应用配置加速软件加速倚天 CPUCIPU芯片OS+编译器ECS boost核心加速PAAS数据库视频WEBAI/HPC以客户体验为中心，打通基于CIPU+倚天CPU的全栈生态链，针对用户的应用进行端到端优化AlinuxDragonwell JDKcentosptg_optimizeZLIB/LZ4/ZSTDH264/H265X-SIMD基础加速压缩视频SIMD计算YCL行业场景生态迁移应用构建工具倚天迁移适配工具倚天社区大数据EMRODPS视频/图片视频云Web/安全ALBCFW数据库RDS云原生ACK倚天CPU业务应用情况阿里云产品on 倚天 ECS集团业务on 倚天ECS客户业务on 倚天ECSRDSACKEMR视频云电商蚂蚁ODPS存储广告短视频游戏大数据目前已有多款PaaS产品适配倚天ECS产品，即开即用，屏蔽生态差异RDS数据库实现性价比超越x86 25%，比国外顶尖云友商同类产品性能优50%EMR 10 TB数据量下,倚天架构下的集群Hive任务耗时相对X86架构下的集群减少约20%，Spark任务耗时相对减少约15%，Trino任务耗时相对减少约10%倚天ECS实例已经有效支持阿里618，99大促以及双十一压测等多个活动，涉及电商，数据库，存储蚂蚁支付多个业务场景。其中电商核心交易系统相比于x86竞对产品有20%30%的成本优势。倚天ECS实例在ODPS大数据业务侧相比x86竞品有30%以上性能优势X短视频客户，基于自身业务测试视频编解码场景，性能收益高达30%以上，性价比收益高达80%+Y游戏客户，基于自身游戏对于计算和网络的高要求，倚天c8y在客户实测中跑分是X86架构同级的120%，综合性价比近乎200%倚天的持续优化和演进倚天的持续优化和演进更极致的芯片优化和整机性能CPU核心主频DDR5软件优化Kernel，JVM更广泛的阿里云产品适配及相关优化下一代倚天产品在研，进步从未停止2021.112022.2.202022.11.11倚天710芯片发布公有云倚天云实例邀测集团电商双十一规模上线G8y倚天云实例正式上线2022.11.15Arm Neoverse软件生态介绍别再平安谋科技（Arm China）高级软件经理Arm Neoverse Introduction01Arm Neoverse Software Ecosystem02Arm Neoverse Software Migrations03Contents目录课程提纲01 Arm Neoverse Introduction25Transforming the cloud to edge infrastructure with Arm ecosystemEnabling partners to innovate and design a diverse set of solutions that solve complex compute challengesRobust Arm hardware and software ecosystem from the best design tools to the most advanced process nodesArms open standards and RAN initiatives make it the preferred architecture for 5G core networks for telco operators and vendorsBest-in-class performance,compute density,and co-design aspects make Arm-based Fugaku the#1 supercomputer in the worldArm ensures a cloud-native experience across a diverse and secure IoT and edge ecosystem with Project CassiniGreater performance and lower power consumption is driving cloud providers like AWS to adopt ArmData consumption is revolutionizing the infrastructureCloud Data Cloud Data CentersCentersEdgeEdgeEdgeEdgeEdgeEdgeArm Neoverse Momentum in Infrastructure:2018-Today201820192020 20212022Arm Neoverse momentum for 2022Clouds everywhere are deploying Arm-based serversArm Neoverse Platform RoadmapArm Neoverse Software EcosystemCloud Native Software Development on Arm 100s of OSS ProjectsNative Build100+ISVsCommercial Support100K+Docker Hub Images1M+CI/CD Build Minutes per MonthPerformanceScalable Neoverse CPU Cores EfficiencyBest$/throughput in the industryPlatform DiversityWidest possible choice of Edge Platforms OptimizationPurpose built use cases Arm Software Ecosystem DevelopmentMake Arm Neoverse the leading architecture of choice from Edge to the CloudOPEN-SOURCE LEADERSHIPMajor Arm R&D contributions across the ecosystemSOFTWARE PARTNERSHIPSISVs for Cloud,Edge and Telco DeploymentsFRICTIONLESS DEVELOPMENTEnable developer tools&platforms Drone.ioActionsGoogle Container Optimized OS15+Yearsof Investment100+ISVsCommercial Support100s of OSSNative Build Projects100K+DockerHub Images Cloud Leaders Accelerating Software on ArmArm Software EcosystemC/C+/Fortran toolchain for Neoverse PlatformsNeoverse IP PlatformGCC10N1/V1V1/N2V1/N2Poseidon and future coresN2/DemeterGNU Toolchain(GCC,Glibc,and GDB)+10%SpecInt17Arm v8.6-v9.0SVE2 support LLVM 10/11LLVM Toolchain(Clang,LLDB)Armv8.6-v9.0 SVE asmN1 support20.xArm Compiler for Linux(for HPC users)(Arm Compiler+Arm Perf Libraries)+5%to 46%for HPC workloadsSVE2 supportSparse matrix librariesGCC11SVE2 improvementsV1 and N2 supportLLVM 11/12Armv8.7-v9.1+2-5%SpecInt17V1 and N2 support21.xSVE/2 improvementsLLVM 11 basedGCC12Armv8.8-v9.3SVE2 code-gen+%Intrinsic perf+%Auto-vec at-O2LLVM 13/14Armv8.8-v9.3+3%SpecInt17SVE2 auto-vectorization22.xV1 supportSVE/2 improvementsLLVM 13 based compilersBLAS/LAPACK improvementsGCC13Armv8.9-v9.4SVE2 code-gen+%LLVM 15/16Armv8.9-v9.4SVE2 core scheduling modelComplex number auto-vec23.xDemeter supportLLVM 16 based compilersArmPL Batched/Sparse functionsGCC-nextArchitecture enablement Vectorized math routines SVE2 code-gen+%and librariesWorkload specific tuningLLVM-NextArchitecture enablement SPEC INT CPU +%SVE2 code-gen+%New LLVM Fortran FrontendLLVM backend+%to benefit other languagesVersion-NextDemeter+%for HPC workloadsNew LLVM Fortran frontend-based compilerSVE/2 improvements All%perf numbers are based on best possible flags and are relative to the previous compiler versionCloud Native Software Development on ArmDeveloper Experience,APIsBuild ManagementRelease ManagementObservabilityContainer RegistryContainer Orchestration EngineSecurity&HardeningContainer RuntimeContainer-Native StorageService MeshContainer-Native NetworkContainer-Optimized OSComputeStorageNetworkCI/CD PipelineCI/CD Ecosystem on ArmActionsArm Developer EcosystemArm Neoverse Software Migrations0341Getting(good)AArch64 performance under LinuxArchitecture BasicsArchitecture Compiler Interface-march=armv8.2-a+fp16+rcpc+dotprod+crypto-mcpu=neoverse-n1+crypto/-mcpu=nativeLarge System Extensions440.00%10.00%20.00%30.00%40.00%50.00%Max jOPSCritical jOPSCompiler OptimizationsCompiling with low optimization levels such as-O0 and-O1 produces inefficient code.By default both Clang and GCC will compile at O0.This is inappropriate for most release software.Optimization levels can be divided in to those for size(such as Os and Oz)and those for speed(such as O2 and O3)Optimization level O3 enables powerful optimizations such as automatic use of Arm Neon Technology45Compiler Optimizations-LTOTraditional compilation looks at one file at a timeLink Time Optimization looks across a whole programThis can enable new optimization opportunitiesLTO is used to build production software such as the Mozilla Firefox Platform46Neon:AArch64 Advance SIMD ISANEON is a wide SIMD data processing architectureElementsSourceRegistersOperationDestination RegisterRegisters are considered as vectors of elements of the same data typeData types can be:signed/unsigned 8-bit,16-bit,32-bit,64-bit,single/double prec.Float(Armv8.2-A also support half prec Float)Instructions perform the same operation in all lanesExtension of the ARM instruction setArmv8 NEON has 32 registers,128-bits wide.NEON Instructions perform“Packed SIMD”processingArchitecture SVEISA Feature which Si partners can implement at length 128 to 2048 bitsThe hardware sets the vector length0512In software,vectors have no lengthThe exact same binary code runs on hardware with different vector lengths=ACB+512-bit core+=256-bit core+=Gather-load and scatter-store1234555510106284+=predPer-lane predicationCMPLT nn-21010n-1nn+1INDEX ifor(i=0;i n;+i)1+2+3+41+2+3+437=12001100+pred12Predicate-driven loop control and managementVector partitioning and software-managed speculationExtended floating-point horizontal reductions512b512b512b256b256b256bSVE:the Scalable Vector Extension-mcpu=neoverse-n2Auto-vectorization and compiler intrinsicsConsult a Software Optimization Guide for instruction latencies,etc.Tools,Software and IDEs bl sogTools,Software and IDEs bl sogGetting ready for SVE with GCC11 Neon/SVE IntrinsicsIntrinsics are a manual interface to the Neon and SVE instruction setsThey can be enabled by including or They can be a good substitute for inline assembly,as they permit compilers to optimise around themSometimes they do completely the wrong thingThats a compiler bug wed be happy to see reported!#include#include float32x4_t normalize(float32x4_t a)/*t=a*a;*/float32x4_t t=vmulq_f32(a,a);/*m=sqrt(a0+a1+a2+a3);*/float32_t m=sqrtf(vaddvq_f32(t);/*return a/m;*/return vdivq_f32(a,vdupq_n_f32(m);fmulv1.4s,v0.4s,v0.4sfaddp v1.4s,v1.4s,v1.4sfaddp v1.4s,v1.4s,v1.4sfsqrt s1,s1dup v1.4s,v1.s0fdivv0.4s,v0.4s,v1.4sarm NEOVERSEThe Cloud to Edge Infrastyucture Foundationfor a World of 1T Intekkigent DevicesThank You!倚天开启云原生算力新时代倚天产品能力解析庞雄伟阿里云弹性计算产品专家Contents内容提纲智能时代算力需求爆发及挑战智能时代算力需求爆发及挑战0102ECSECS倚天实例产品能力介绍倚天实例产品能力介绍03ECSECS倚天实例应用场景落地介绍倚天实例应用场景落地介绍智能时代算力需求爆发及挑战01算力需求爆发对基础设施带来挑战数据爆炸式增长AI、视频等对算力要求高算力要求提升海量数据分析处理并发要求高持续提升基础设施性价比算力投入成本增加技术挑战摩尔定律减速摩尔定律减速功耗、成本攀升功耗逐代上涨处理器性能不足CPU HT争抢资源处理器性能迭代放缓大数据计算、AI推理、视频、压缩、科学计算算力密集业务比重增长单vCPU性能提升缓慢单服务器核数扩展降速每年服务器功耗上涨25%，10K$/kw硬件和芯片成本上涨ECS倚天实例产品能力介绍02ARM 服务器增长率最高全球大部分全球大部分IT公司推出基于公司推出基于ARM产品产品全球服务器出货量趋势图全球范围内，以Arm为核心架构的CPU已经开始显现出增长趋势。根据Omedia的研究，今年二季度，ArmArm服务器占比已创纪录地达到了服务器占比已创纪录地达到了7.1%7.1%，同比增长同比增长48%48%，20192019年至今，规模占比增长近年至今，规模占比增长近1010倍。倍。ARM VS Intel VS AMD市场占有率国内外等大部分IT公司均推出了基于Arm平台产品，依托ARM架构芯片优异的算力算力、低功耗低功耗等特性，有效帮助客户业务降本增效降本增效。ARM CPU架构以其开放性逐渐成为行业趋势2022CI/CDDrone.ioWorkloadsLanguage&LibraryContainer&VirtualizationOperating SystemNetworking在软件生态方面，ARMARM持续致力于开源软件开发和支持，已经支持100100多个开源项目，自下而上从网络、OS、虚拟化、容器，编程语言以及各种上层应用负载，Arm都有很完善的支持，典型负载覆盖Web、数据库、大数据、中间件等个场景。丰富的ARM开源生态已经覆盖主流业务场景倚天实例大幅提升产品性价比阿里云ECS倚天实例互联网生命科学电商交易交通物流性价比提升视频编解码 80%大数据 50%高性能计算 50%代码零改造仅需重新部署/编译支持主流开源系统软件原生支持多款PaaS产品云原生设计更高物理核性能多单路节点垂直场景加速中国首个云上大规模应用云原生处理器成本低功耗性能ARMv9 物理核（无HT）安全vTPM特性稳定双单路（降低爆炸半径）CoreHTHT48KBL1-cache48KBL1-Cache共享1.28MBL2 cacheCoreHT64KBL1-cache64KBL1-cache独享 1MBL2 cacheL3 cache48M/64vcpuL3 cache64M/64c*2dieIntel IceLake CPUYitian710 CPUecs规格：ecs.g8y.2xlarge1vCPU8c32g1物理core=2HT=2vCPU1物理core=1HT=1vCPU 倚天710每一个vCPU是一个物理core。X86 每个vCPU是一个HT，两个超线程共享一个物理Core。倚天710 CPU L1/L2/L3缓存Cache对比X86 CPU均有提升，且L2 cache独享。独享物理核，算力更加强劲物理核算力性能更加强劲CPU utility50%安全水位34%睿频-基频17%ALU/Cache争抢30%健康水位20%突发水位X8650%健康水位30%预留水位20%突发水位倚天CPU utility70%安全水位G7主频Ghz睿频3.5基频2.9G8Y主频Ghz睿频-基频2.75物理核算力性能更加强劲倚天710依托物理核优势，CPU安全水位可提升到70%，以承载更多的业务。倚天710基频2.75GHz，无睿频。重新定义CPU安全水位124681012C8y-x2649.889.639.599.59.59.599.46C7-x26412.7511.978.577.357.227.177.029.889.639.599.59.59.599.4612.7511.978.577.357.227.177.0202468101214fps/coreEncoding for X264 FPS Per vCPU倚天710X86物理核算力性能更加强劲多任务高负荷场景，倚天性能线性度表现更好，支持高负载运行低功耗设计，无睿频，随着用户业务压力增大性能稳定输出不下降计算密集型计算场景，性能更加稳定最新一代CIPU架构提升IO性能高密机型核密度高：底层物理机架构设计以CIPU为核心，通过CIPU连接2颗倚天CPU，整机密度256core，未来更高机柜密度高：采用1U紧凑设计，空间降低50%，低功耗CPU，部署密度翻倍高可靠性爆炸半径减半：采用独立双节点型设计方案，独立OS，降低爆炸半径，同时可以提升密度，保障产品稳定性。高性能CIPU：200G吞吐，ENI和ESSD性能更高eRDMA：VPC环境支持RDMA，比TCP时延降低一半NVMe：采用NVMe ESSD云盘，时延降低10%容器容器弹性裸金属VMVMVM神龙虚拟化DragonFly2.0以CIPU为核心系统架构倚天ECS产品倚天ECS底层架构CIPU倚天710倚天710存储资源网络资源网络存储IO加速基础设施倚天710双单路机型DDR52*100Gb网络内存QosPrefetch提升主频操作系统Alinux3CentosXPS中断绑核RFS基础软件Dragonwell弱内存增强GC锁优化智能识别ARM指令外部业务内部业务虚拟化层DragonFly2.0软硬协同，全栈优化迁移工具加速适配性能优化开箱即用云原生算力赋能业务行业场景由内及外技术复制电商、支付、大数据、数据库、视频云.广告类、在线教育、广电传媒、生命科学等软硬协同全栈优化提升产品性能应用软件EMRODPS视频云ALBCFWRDSACK大数据Web/安全数据库视频/图片云原生钉钉软件跨架构迁移的根本原因是指令集的差异编译型语言C/C+/Go/解释型语言Java/Python/PHP/丰富的计算机软件汇编语言二进制机器码指令集架构编译型语言：源码经编译、链接翻译成机器指令。机器指令必须与CPU的指令集匹配，在运行时通过加载器加载到内存并执行指令。编译型语言开发的程序在从x86处理器迁移到ARM64位处理器时，必须经过重新编译才能运行。解释型语言：源码由编译器/解释器生成字节码，再由虚拟机解释执行。虚拟机/解释器将不同CPU指令集的差异屏蔽，因此解释型语言的可移植性很好。解释型语言开发的程序在迁移到ARM64平台时，不依赖本地库则无需重新编译，若调用了本地库，则本地库需要迁移嵌入在高级语言中的汇编语言需要人工介入适配需要迁移，编译器生成无需人工介入X86与ARM64架构指令集区别大，是应用需要迁移的根本原因C/C+代码在ARM64平台编译的介绍C/C+是典型的编译型语言，主要是解决编译构建脚本及源码修改两类问题。从源码到可运行程序之间需经过如下步骤：详情参考：https:/ ARM平台char类型有符号，需要加上-fsigned-char 指定处理器架构换成armv8-a+sve2；CPU换成neoverse-n1Step3.ARM64平台有完善的OS包体系，X86平台使用的库基本可以平替，包的下载途径使用镜像自带，或一般免费/商业包管理平台即可，例如：阿里开源镜像站 Packages for Linux and Unix编译器推荐版本说明GCC10.2.1建议版本10以上，性能有大幅提升LLVMllvm13/clang13clang13依赖llvm13和gcc-c+GlibCglibc 2.3.2Step4.根据应用需求选择编译器，并通过编译器/OS的官方途径下载Java代码在ARM64平台编译的介绍Java源码迁移需关注三个阶段Java是解释型语言，理论上纯java应用可以跨架构运行。但实际上由于java应用经常通过JNI调用C编译的本地库，会来带兼容性问题，所以需要迁移。1.选择合适版本的JDKJava源码编译Java字节码2.Jar包3.部署运行1.根据客户需求有如下建议：无特殊版本需求，见右侧的推荐版本。有特殊版本需求，可针对性分析评估适配可行性。这里推荐Java8客户升级，有较好性能提升。2.Jar包内嵌C/C+库的场景：无源码的包，使用阿里提供脚本排查，并选择已适配ARM芯片的合适版本更新。若是有源码的包，建议安装C/C+迁移的指导进行编译更新。3.部署阶段，建议遵循ARM ECS Java优化建议，设置JVM运行参数调优。详情参考：https:/ v3.0,P002_si64_pw,

展开阅读全文