1、 1 智能驾驶计算芯片性能评测 标准化白皮书 2023.9 2 目 录 一、智能驾驶计算芯片产业现状.3 1、国内外智能驾驶计算芯片发展情况.3 2、智能驾驶计算芯片应用需求.7 3、智能驾驶计算芯片标准需求.8 二、智能驾驶计算芯片标准与评测.9 1、智能驾驶计算芯片国内外政策和标准现状.9 2、智能驾驶计算芯片性能评测标准.11 3、智能驾驶计算芯片标准典型应用案例.16 三、总结与展望.28 四、参考文献.29 3 一、一、智能驾驶计算芯片产业现状智能驾驶计算芯片产业现状 汽车产业正在被人工智能技术重构。如同蒸汽机之于工业革命的意义,智能驾驶已经成为人类社会自发明汽车以来的一大颠覆性创新
2、,持续推动汽车产品、整车市场格局和产业链变革,而数据和算力是驱动汽车智能化加速的两大动力。关于智能驾驶发展的趋势,业内普遍认同的观点是:智能驾驶汽车将在2025年前后开始一轮爆发式增长。智能驾驶汽车在传统驾驶的电子电气架构基础上,引入基于智能驾驶芯片的智能驾驶模块,搭载各类车载传感器、控制器、执行器等装置,并融合了现代通信、网络和计算技术,使得车辆具备复杂环境感知、智能决策、协同控制等功能,从而大大提升驾驶的自动化和智能化。未来,汽车将从最常用的交通工具变成最大的智能终端,具备高度电动化、网联化、智能化、共享化的特征,传统汽车企业势必将重新定义和塑造自身的商业模式,传统汽车行业的市场也将向芯片
3、厂商、互联网科技公司、造车新势力等逐步打开,生态格局不断走向开放。1、国内外智能驾驶国内外智能驾驶计算计算芯片发展情况芯片发展情况车载计算芯片成车载计算芯片成为行业竞争热点,国内外企业竞相发力为行业竞争热点,国内外企业竞相发力 随着智能驾驶技术的不断发展和汽车市场的逐渐开放,作为汽车智能化的核心,智能驾驶芯片的发展在全球范围内日益瞩目,市场也呈现出井喷式的增长态势。除了传统的汽车制造商,科技公司也开始在智能驾驶芯片市场布局。例如,英伟达的智能驾驶芯片“Drive”已经被包括奔驰、特斯拉和沃尔沃在内的多家汽车制造商采用。此外,谷歌旗下的Waymo、苹果、百度和滴滴也都在智能驾驶芯片领域进行了大量
4、尝试。可以预见的是,智能驾驶芯片市场的竞争将愈演愈烈。整车厂商对高算力智能驾驶芯片的需求使得芯片厂商间的竞争也进入白热化,近年来高算力智能驾驶芯片迭代速度显著加快。Mobileye、英伟达、高通等主流外资厂商相继推出能够满足L4级智能驾驶的芯片产品,特斯拉也有自研计算芯片。国内华为、地平线、黑芝麻等也在不断推出自己的智能驾驶芯片。英伟达、高通在高端市场发力,以高算力芯片抢占高级别智能驾驶赛道。英伟达2019年发布的旗舰产品Orin,称其具备254TOPS的高AI算力,凭借领先的AI 4 算力,Orin成为国内新势力车企下一代旗舰车型的主流选择,2022年蔚来、小鹏、理想等均将推出基于Orin的
5、量产车型。高通于2020年发布Snapdragon Ride平台,称其能够匹配从L1/L2级辅助驾驶至L4/L5级智能驾驶的场景需求,提供高能效、性价比出众的系统级解决方案。长城、宝马等车企已宣布与高通合作,预计2023年进入量产阶段。特斯拉作为全球智能驾驶领军车企,采取了自研芯片的路径以满足其对于智能驾驶的高性能需求,2019年4月正式发布FSD自研芯片及计算平台,称其单颗芯片算力达72TOPS,成为当时算力最高的量产芯片,为特斯拉全系车型的智能驾驶功能提供算力支持。国内华为、地平线、黑芝麻等芯片厂商自主研发高算力智能驾驶芯片,部分产品已实现量产上车。华为发布的MDC 610,称其算力达20
6、0TOPS,MDC系列产品已与多家主机厂展开合作,在多款新能源智能汽车上实现量产商用;地平线发布的征程系列第五代,称其算力达128TOPS,征程系列产品与比亚迪、一汽等展开合作;黑芝麻发布的华山A1000系列芯片中A1000和A1000pro算力分别达58TOPS和106TOPS,华山A1000系列芯片产品已与吉利、东风、江汽、一汽红旗、合创等车厂展开深度合作。此外,芯驰科技、超星未来、爱芯元智等AI芯片企业也迎来了新机遇,纷纷推出自动驾驶芯片方案;国外瑞萨、意法半导体、恩智浦等传统车规级MCU大厂,也在极力巩固各自的行业地位,正在筹算着切入AI汽车芯片领域;还有部分主机厂选择自主研发智能驾驶
7、计算芯片,如零跑汽车、百度(集度汽车)等,自动驾驶芯片将呈现百放齐放的局面。国内外典型智能驾驶计算芯片相关信息见表1。5 表表 1 1 国内外典型智能驾驶计算芯片国内外典型智能驾驶计算芯片 企业企业 芯片芯片 量产量产 时间时间 算力算力(TOPSTOPS)功耗(功耗(W W)能效能效比比(TOPTOPS/WS/W)制程制程(nmnm)适用适用 智能智能 驾驶驾驶级别级别 应用情况应用情况 特斯拉 FSD(HW3.0)2019 年 72 72 1 14 L3 自用 FSD(HW4.0)2022 年 216-7 L4/L5 英伟达 Xavier 2020 年 30 30 1 12 L2/L3 博
8、世、小鹏等 Orin 2022 年 254 45 6 7 L4/L5 百度、通用、谷歌、小马智行、亚马逊、滴滴、比亚迪、小鹏、理想、蔚来上汽、奔驰、奥迪等 Atlan 2025 年 1000-L4/L5-Mobileye EyeQ 4 2018 年 2.5 3 0.83 28 L1/L2 吉利、上汽、广汽、大众、哪吒、长城、理想、蔚来等 EyeQ 5 2021 年 24 10 2.4 7 L2/L3 宝马、吉利等 EyeQ 6 2023 年 128 40 3.2 7 L4/L5-EyeQ Ultra 2025 年 176-5 L4/L5-高通 SM8540+SA90 2022 年 360 65
9、 5.5 7 L2/L3/L4 长城、宝马等 瑞萨 R-CAR V3U 2023 年 60-12 L2/L3-Ti TDA4VM 2020 年 8 5-20 0.4-1.6-L2/L3 百度等 6 企业企业 芯片芯片 量产量产 时间时间 算力算力(TOPSTOPS)功耗(功耗(W W)能效能效比比(TOPTOPS/WS/W)制程制程(nmnm)适用适用 智能智能 驾驶驾驶级别级别 应用情况应用情况 华为 昇腾 610 2020 年 200 60 3.3-L3-L4-地平线 征程 2 2019 年 4 2 2 28 L1/L2 长安、奇瑞、广汽等 征程 3 2020 年 5 2.5 2 12 L
10、2 理想、哪吒、上汽 征程 5 2022 年 128 30 4.3 16 L4 比亚迪、一汽等 黑芝麻 A1000 2021 年 58 18 3.2 16 L2/L3 吉利、东风、合创、江汽等 A1000L 2021 年 16 15 1.1 16 L2/L2+一汽红旗等 A1000Pro 2022 年 106 25 4.2 16 L4 一汽等 A2000 2025 年 250+-7 L4/L5-芯驰 V9T 2021 年 1-16 L2-V9P/U 2022 年-16 L2-V9S 2023 年-16 L4/L5-7 2、智能驾驶智能驾驶计算计算芯片应用需求芯片应用需求智能驾驶业务多样化和智能
11、驾驶业务多样化和复杂场景,需要高性能复杂场景,需要高性能计算计算芯片芯片 智能驾驶业务是智能网联汽车最复杂的高价值应用,但也是最难度最大的应用。智能驾驶业务多样化、场景复杂,对智能驾驶芯片在感知、决策、和控制的能力提出很高的要求。(1)感知系统)感知系统 感知系统是利用车载传感器,及车联网技术来获取道路、车辆位置、障碍物、车辆自身位置等信息,并将获取的这些信息传输给车载控制中心,给自动驾驶汽车提供决策依据。感知系统的对象可以分为两类:一类是静态对象,即道路、交通标识、静态障碍物等;另一类是动态对象,即车辆、行人、移动障碍物等。对于动态对象,除了要了解对象的具体类别,还需对位置、距离、速度、加速
12、度、方向等信息进行追踪,并需要根据追踪结果来预测对象的接下来的预计位置。为了实现感知环境的任务,越来越多的传感器应用于高阶智能驾驶汽车。例如,特斯拉Model Y有20个传感器。问界M5智驾版27个传感器;小鹏G6共30个传感器。越来越多的传感器输入,对智能驾驶芯片的性能提出更高要求。(2)决策系统)决策系统 智能驾驶决策系统对汽车的速度、方向及车灯等进行控制。传统理解中,决策系统涵盖了环境预测、动作规划、路径规划、行为决策等。环境预测不仅仅局限于物理规律,还需通过对感知时车辆、行人等的瞬时动作,判断其下一步的动作,如速度、位置、方向等。动作规划根据对环境预测的结果,完成诸如转弯、避让、超车等
13、动作。同时对于交通的动作规划也必不可少,如在限速路段的车速控制、红绿灯情况下的停车行车、潮汐车道的车道线选择等,均需要提前进行规划。自动驾驶汽车还需要完成对行驶路径的规划不仅要耗时短,还要满足乘客需求,实现路径自定义。行为决策则是对自身的实时位置、速度、方向等信息,与环境预测中获取的交通信息、动作规划中完成的路径规划等进行参照,让自动驾驶汽车预判可能发生的危险及即将需求的动作,让自动驾驶汽车可以对自身动作进行调整。更智能的决策系统,对芯片算力要求越高。8(3)控制系统)控制系统 控制系统跟踪决策规划的轨迹目标,控制车辆的油门、刹车和转向等驾驶动作,调节车辆行驶速度、位置和方向等状态,以保证汽车
14、的安全性、操纵性和稳定性。相对于传统的控制方法,智能控制方法主要体现在对控制对象模型的运用和综合信息学习运用上,主要有基于模型的控制、神经网络控制和深度学习方法等,目前这些算法已逐步在汽车控制中广泛应用。实时准确的控制效果,需要更快、更高性能的智能驾驶芯片支持。由上可以看出,要满足智能驾驶业务的多样化和复杂场景,需要高性能的智能驾驶计算芯片。3、智能驾驶计算芯片标准需求智能驾驶计算芯片标准需求性能评价缺少共性能评价缺少共识,亟待识,亟待产业联合研究产业联合研究 当前智能驾驶行业普遍以“TOPS”为单位来评估自动驾驶芯片的理论峰值算力,各大芯片厂商也在通过不断刷新算力峰值彰显各自的技术实力,但各
15、家算力的计算方法却不尽一致,且声称算力与智能驾驶场景的算法评价性能也不能形成一一对应。以英伟达为首的芯片厂商多以“稀疏算力”声称,该计算方法会比“稠密算力”多出约1倍的算力数据。具体来说,稀疏算力把矩阵计算中部分数据值变为0,最终使矩阵乘法计算减半,从而提升算力表现数据。“稀疏算力”的计算量实为标称算力的一半,算力声称值比“稠密算力”多出约1倍的算力数据。“稀疏算力”本质上是对算法计算的优化,但此种优化方式只对特定的几个算子有效。智能驾驶场景中,稀疏化方法对摄像头数据优化优先,性能仅有约57%提升,远低于稀疏算力100%提升预期。除了算力的“稀疏”和“稠密”的区别,采用不同计算数据类型也会造成
16、算力表征的差别。大多数芯片公司一般采用INT8或者INT16作为统计算力的数据类型,少部分会采用INT4类型。相对而言,采用INT4数据类型能够实现的模型推理准确度相对较低,在将较大规模的神经网络转到更小的神经网络时的准确度损失相对较高;采 9 用INT8或者INT16数据类型的算力值相对较低,准确度损失也较低,在智能驾驶芯片计算时使用更为广泛。综上所述,算力标注的概念混淆、芯片价格混乱的主要原因是算力声称没有统一的标准,缺乏能够更客观的对比智能驾驶芯片能力的公正的测试基准算子或模型。因此,发展智能驾驶芯片测评标准与规范车载计算芯片标准迫在眉睫,这是车载芯片企业、整车企业以及正在生态体系的共同
17、需求。此外,评价智驾芯片的目标是为了了解芯片应用在智能驾驶场景的真实性能。那么适配应用场景的算法模型,才是评价智能驾驶芯片的最合理方式。按照智能驾驶的使用,算法可以区分为:图像/点云分类、图像/点云目标检测、深度估计、图像/点云分割等。再从各分类算法,选出更适用智驾场景的算法。用多维度算法模型,公开公正测试智能驾驶芯片,才能分辨智能驾驶芯片的真实性能。二、二、智能驾驶计算芯片标准与评测智能驾驶计算芯片标准与评测 1、智能驾驶计算芯片国内外政策和标准现状智能驾驶计算芯片国内外政策和标准现状(1)国外政策)国外政策 自2015年以来,各国相继探索出台了自动驾驶相关的政策或者高级别自动驾驶运营许可,
18、纷纷加速行业变革和商业化落地。从2016年开始,日本针对智能驾驶进行相关法律的修订,以推动智能驾驶制度的逐步完善,是全球第一个法律明确规定允许L3级智能驾驶汽车上路的国家。2017年5月,德国颁布了首部针对智能汽车的法律道路交通法(第八修正案),助力智能汽车在德国落地。2020年初,美国交通部公布了最新的智能驾驶汽车准则4.0,为各州和地方政府、汽车测试商以及所有利益相关者提供了统一指导。2021年1月11日,美国交通部发布智能驾驶汽车综合计划报告,是智能驾驶汽车准则4.0的延伸和落实,旨在确保其智能驾驶的全球领先地位,进一步明确了美国智能驾驶汽车产业发展的三大目标、五大优先领域及三类公共平台
19、。2020年6月,联合国通过了自动车道保持系统(ALKS)法规(以下简称“ALKS法规”),作为“L3级”自动化驾驶第一份具有约束力的国际法规,这标 10 志着智能驾驶技术发展的重要一步。2021年,德国奔驰成为全球首个获得联合国ALKS法规“自动车道保持系统认证”的汽车企业。(2)国内政策)国内政策 我国高度重视智能网联汽车法规政策推进、技术标准制定、产业生态建设,已在积极探索智能驾驶汽车上路法规的制定,并采取了地方试验立法在先,中央总结立法在后的模式。2021年7月,工信部发布关于加强智能网联汽车生产企业及产品准入管理的意见,规定了智能驾驶汽车及其生产企业的准入管理要求,为L3及L4级智能
20、驾驶汽车的规模化量产做准备。2022年11月,工信部会同公安部组织起草的 关于开展智能网联汽车准入和上路通行试点工作的通知(征求意见稿),将首次为开展智能网联汽车准入和上路通行试点工作提供政策依据。在测试示范方面,我国采取地方先行先试的模式。目前,北京、上海、深圳等多个城市已发布相关的道路测试与示范应用管理法规,其他城市相关细则也持续推进。2023年3月28日,工业和信息化部公开征求对国家汽车芯片标准体系建设指南(2023版)(征求意见稿)的意见,在该征求意见稿中,推荐制定智能驾驶计算芯片相关的行业标准,主要规范汽车用于人机交互、视觉融合处理、智能规划、决策控制等领域执行复杂逻辑运算和大量数据
21、处理任务的芯片的技术要求及试验方法。2023年7月26日,工业和信息化部、国家标准化管理委员会印发国家车联网产业标准体系建设指南(智能网联汽车),其中谈及2025年标准体系建设目标时也专门提及要制定高性能计算芯片标准,以满足智能网联汽车技术、产业发 展和政府管理对标准化的需求。(3)标准现状)标准现状 虽然国内外高度重视智能驾驶产业的发展,并纷纷出台相应政策,但是在智能驾驶计算芯片的“智能”评测相关标准上仍属空白,国内外尚无相关标准发布。在我国,2022年7月,中国电子技术标准化研究院牵头制定了面向自动驾驶应用的计算芯片 系列团体标准,并在中国电子工业标准化技术协会正式立项,在2023年4月发
22、布了该系列团体标准的征求意见稿,并拟于2023年发布该系列标准。该系列标准包含技术要求、车载异构计算测评规范、人工智能应用工具链、11 传感器接口要求等四个部分。此标准是国内外首系列针对智能驾驶场景对芯片的“智能”需求,完整的构建了智能驾驶计算芯片技术要求、测试方法、智能工具链和整体生态诉求等,及时填补了国内外智能驾驶计算芯片应用场景下“智能”领域的标准空白,使得智能汽车产业链内的企业在技术研发、标准选择、产品生产等流程上有章可依。在国家汽车芯片标准体系建设指南(2023版)(征求意见稿)等国家政策的指导下,基于上述系列团体标准,2023年4月,全国集成电路标准化技术委员会正式立项了中国电子技
23、术标准化研究院牵头制定的 面向自动驾驶应用的计算芯片系列行业标准,并在工业和信息化部工业和信息化部2023年第一批行业标准制修订和外文版项目计划中正式下达,该系列行业标准是目前智能驾驶芯片领域的唯一一份行业标准,意义重大。一方面,可以更好地助力智能汽车产业链各单位对智能驾驶计算芯片的应用需求,提高智能汽车行业的技术水平、促进产品质量的提升;另一方面,可以助力我国智能驾驶芯片标准相关重要政策、法规的落地,推进我国智能网联汽车的落地和应用。2、智能驾驶计算芯片智能驾驶计算芯片性能评测性能评测标准标准 面向智能驾驶应用的计算芯片 系列团体标准详细描述了面向自动驾驶应用的计算芯片主要涉及的产品本身、A
24、I应用工具链、传感器接口生态等技术领域及其异构计算测评等四个关键环节。其中,“第1部分:技术要求”规定了面向自动驾驶应用的计算芯片的可靠性和基本技术要求、软硬件要求以及功能、性能要求:硬件系统:应包括部分或全部以下硬件单元:a)通用处理器CPU,执行通用计算及控制程序;b)AI加速单元NPU,执行矩阵或向量密集的AI计算;c)图形处理单元GPU,执行图形生成、渲染等图形计算;d)微控制器MCU,执行实时运算和控制;e)数字信号处理单元DSP,执行数字信号处理;f)机密计算引擎Secure Engine,执行加解密计算,并支撑实现安全启动;12 g)内存控制器,访问片外主内存;h)视频/图像加速
25、单元,完成视频/图像的编解码、图像缩放等处理;i)图像信号处理单元ISP,处理片外摄像头采集到的图像信号;j)音频处理单元,处理片外音频信号;k)PCIe总线,与片外的PCIe设备相连;l)片上缓存,作为高速缓存保存SoC计算过程产生的中间数据;m)片上互连总线,应符合ASIL标准;n)CAN、SPI、以太网、闪存等控制器。图 1 智能驾驶计算芯片硬件系统参考架构 软件系统 面向自动驾驶应用的计算芯片应包括部分或全部以下软件系统:a)安全驾驶系统;b)数据处理系统;c)仪表显示域;d)虚拟化软件系统。13 图 2 智能驾驶计算芯片软件系统参考架构 此外,“第3部分:人工智能工具链”规范了面向自
26、动驾驶应用的计算芯片配套工具链应包含的内容、功能等基本要求及其可靠性要求;“第4部分:传感器接口要求”重点考虑了智能驾驶芯片生态角度的需求,规范了面向自动驾驶应用的计算芯片对适配的各类型传感器的基本要求和接口要求。通过对工具链和接口要求等生态性指标的衡量和规范,有助于智能驾驶计算芯片软硬件的进一步完善和应用。图 3 智能驾驶计算芯片人工智能工具链参考架构 14“第2部分:车载异构计算测评规范”规定了对面向自动驾驶应用的计算芯片进行不同关键模块的异构计算功能、性能测试的测试指标、测试方法和测试要求:通过该标准,重点评估以下三个维度的芯片综合性能:(1)以)以INT8数据类型的稠密数据类型的稠密算
27、力为代表评估芯片算力性能算力为代表评估芯片算力性能 算力主要采用TOPS作为单位:TOPS(Tera Operations Per Second),即每秒钟进行一万亿次(=1012)运算次数,1TOPS表示芯片每秒进行1012次运算。行业内各单位标称的算力不少为稀疏算力,但是稀疏化带来两个问题:1)稀疏化会到来准确度的下降,需要复杂的重训练来对准确度进行补偿;2)这种稀疏化只对部分算子有效,其他算子无法采用这种稀疏化的方法。因此,推荐使用稠密算力方式对芯片算力进行评估,稠密算力相比稀疏算力,并不是只针对特定算法性能表现好,而是更具有普适性,且稠密算力普遍更容易满足计算准确度的要求,避免了稀疏算
28、力的准确度补偿训练。另外,计算使用的数据类型有:INT4,INT8,INT16,FP16,FP32,BF16,TF32等。当前,在智能驾驶领域,INT4数据类型能够实现的准确度和范围较低,限制了其在神经网络计算的使用,会产生性能损失。FP32数据类型能够实现的准确度较高,但因为计算量较大,实际应用的效率较低。而INT8能够更好的兼顾效率和泛用性,被大多数芯片厂家采用,推荐以INT8数据类型为代表测试芯片算力,对齐算力标准,同时兼顾其他量化精度类型的算力,并标明测试结果的精度类型。综上,在本评测标准中,为了规范业内各种智驾芯片的算力对比,结合大多数芯片厂家的做法,明确指出统一采用INT8稠密算力
29、为代表,兼顾其他量化精度类型算力的方式来对芯片的算力进行整体性评估(见表2),对智能驾驶产业更有意义,可有效防止算力虚标和对比条件不统一造成业界困扰的问题。表 2 数据类型、算力和利用率参考表 数据类型 算力 算力利用率 INT4、INT8、INT16、FP16、FP32、BF16、TF32 TOPS 百分比 15(2)采用推理吞吐率()采用推理吞吐率(FPS)作为智能驾驶场景)作为智能驾驶场景AI性能的主要评价方法性能的主要评价方法 智能驾驶芯片的性能发挥看的是软硬件协同后的实际能力,而不是单纯取决于绝对算力数值,芯片厂商应更注重在最大硬件算力的前提下,在特定智能驾驶场景下是否可以达到较高的
30、芯片使用效率。由于推理吞吐率是针对具体模型的测试结果,更能反映车载智能芯片的真实计算性能。在智能驾驶场景下,可以选取智能驾驶场景中最经典、最通用、业界关注度最高的模型(见表3)来进行性能测试,从而真实反映智能驾驶平台软硬协同的整体处理性能。表 3 测试网络模型列表(参考)序号 网络名称 场景类别 1 ResNet50 图像分类 2 VIT 图像分类 3 DETR 图像检测 4 Efficientdet 图像检测 5 Regnet 图像检测 6 DETR3D 基于BEV的检测 7 SSD 目标检测 8 FCN8 语义分割 9 DeepLabV3 实例分割 10 MonoDepth 单目深度估计
31、11 SFA3D 点云检测 12 Pointpillar-YoloV5 点云检测 13 PV-RCNN 3D物体检测 14 RangeNet+点云分割 15 PointTrack 点云跟踪、分割 (3)兼顾)兼顾AI性能和整体端到端数据流整体处理能力性能和整体端到端数据流整体处理能力 AI计算单元不是智能驾驶系统的全部,AI算力也不能成为评价智能驾驶芯片的唯一标准。一般来说,智能驾驶系统包含通用计算单元、AI计算单元、图像处理单元以及互联单元等,其中,AI计算单元是智能驾驶系统中的主要处理单元,但整个芯片平台在智能驾驶场景中的性能发挥必须依仗各部分的协同才能实现。车企在选择智能驾驶芯片时会对多
32、项关键性指标进行综合性评估。芯片的AI算力高低固然重要,但主机厂在开发量产车型的过程中不会一味追求高算力的 16 芯片或平台,而是需要综合考虑智能驾驶芯片的算力和算效、适配性、软件开发难度、车规级安全认证等级、灵活性和全面性以及能效比等指标,最终根据车型的价位选择最具性价比的芯片。本系列标准还明确指出,智能驾驶计算芯片平台的关注维度不但要兼顾AI性能和整体端到端数据流整体处理能力,同时也要兼顾安全和效率。兼顾AI性能和整体端到端数据流整体处理能力意味着不仅仅关注智能驾驶计算芯片中AI处理单元的算力指标,更要着眼于车企和消费者更关注的整体智驾体验。同时,由于智能驾驶计算芯片的应用场景较为特殊,本
33、标准除了关注智能驾驶计算芯片的性能,还要关注功能安全。在信息安全和车辆安全遵循国际汽车芯片主流标准的基础上,本标准牵引智能驾驶计算芯片在可信计算环境的基础上,支持国密认证、安全启动、硬件加解压等功能,以满足智能驾驶计算芯片平台对相关能力的要求。总之,整体端到端数据流处理能力和智驾体验才是最靠近整车厂最终诉求的智能驾驶计算芯片评价指标,在车企的实际采购和使用中起到更好的参考和指导作用。本次测评暂不含端到端测试。端到端评测结果将在以后的活动中进一步展开和发布。3、智能驾驶计算芯片标准智能驾驶计算芯片标准典型典型应用应用案例案例 依据面向自动驾驶应用的计算芯片系列标准,本白皮书选用国内外代表性的智能
34、驾驶计算芯片应用案例。(1)国外代表国外代表 1)英伟达英伟达 2019年英伟达发布车规级芯片Orin并在2022年完成量产,其L2+级SoC,宣称采用全新的NVIDIA GPU及12核ARM CPU,功率45W,254TOPS算力;L5级别的全自动驾驶可以使用2路DRIVE AGX Orin+2组GPU的方案,性能可达2000TFLOPS,系统功耗能达到750W。17 图4 英伟达Orin SoC的系统架构示例 使用市场上采购的Orin开发平台套件,基于Nvidia JetPack 5.1.1-b56软件栈,在Ubuntu 20.04.5 LTS系统上对面向自动驾驶应用的计算芯片系列标准中的
35、部分典型场景用神经网络模型进行了性能测试,测试结果如表4所示:表表4 英伟达英伟达Orin开发平台开发平台部分部分典型场景性能典型场景性能 序序号号 模型模型 数据集数据集 英伟达英伟达 Orin 开发开发平台平台典型场景典型场景 性能性能(FPS)推理推理 准确度准确度 原始模型原始模型 推理准确度推理准确度 1 resnet50 ImageNet 1335.65 0.778(top1)0.793(top1)2 vit ImageNet 144.98 0.217 0.801(top1)3 yolov3 COCO 181.85 0.464(0.5:0.558(0.5:18 0.95mAP)0.
36、95mAP)4 yolov5m COCO 257.35 0.434(0.5:0.95mAP)0.501(0.5:0.95mAP)5 efficentdet-D0 COCO 248.23 0.361(0.5:0.95mAP)0.389(0.5:0.95mAP)6 detr COCO 59.88 0.376(0.5:0.95mAP)0.377(0.5:0.95mAP)7 segformer-B1 Cityscapes 27.97 71.93(mIoU)72.84(mIoU)8 rangenet+KITTI 222.30 0.289(IoU)0.305(IoU)9 pointpillar KITTI
37、 66.92 64.62(3d mAP)70.75(3d mAP)2)高通)高通 2020 年 1 月,高通发布了全新的自动驾驶平台 Snapdragon Ride,预计 2024 年将用于自动驾驶量产汽车中;随着高通加大在智能驾驶领域的投入力度行业竞争趋于激烈。高通第一代Ride SoC是SA8540P。高通的第二代Ride以SA8650为代表,这是完全针对自动驾驶的设计,SA8650可能有两个版本,宣称低版本的AI算力是50TOPSINT8,高算力是100TOPSINT8。19 图5 高通Ride芯片示例 基于该系列芯片的Snapdragon Ride平台覆盖可扩展SoC、集成式AD软件栈
38、和开发平台、工具,从而提供面向L2-L3级别自动驾驶的解决方案。Snapdragon Ride视觉系统预计将搭载于2024年量产的汽车中面市。利用已发布的Snapdragon Ride软件开发套件(SDK),汽车生态系统可进行下一代ADAS和AD解决方案及其驾驶策略的开发。长城汽车、通用汽车、宝马等车企已经宣布搭载Snapdragon Ride计算平台。该平台在场景应用时,可结合面向自动驾驶应用的计算芯片 系列标准,规范其应根据 面向自动驾驶应用的计算芯片 第一部分:技术要求具体来看,或宜提供的人工智能工具链,如高通Ride具备的软件系统、中间件、工具链、开发环境和各种算子库。3)德州仪器)德
39、州仪器 德州仪器是全球第一大模拟电路元件和数字信号处理器制造商,其模拟和数字信号处理芯片技术在全球处于领先地位,而其推出的TDA4系列芯片被许多汽车厂商和一级供应商选为计算平台,TDA4VM是面向新一代智能驾驶应用所推出的车规级芯片,主打高阶自动驾驶市场。TDA4VM可实现多级处理,支持深度学习和实时图像处理;同时在性能和功耗方面都有较大提升,可以提供8TOPS算力。20 配有包括Cortex A72、Cortex R5F、DSP、MMA等在内的不同类型处理器,由对应的核或者加速器处理各自擅长的任务,让计算平台的效率得以提高。此外能够在单芯片上接入并处理4到6个三百万像素摄像头的数据,增强车辆
40、感知能力和环视处理功能。2023年2季度量产的TDA4VH和TDA4AH是TDA4系列的旗舰产品,根据 面向自动驾驶应用的计算芯片 第一部分:技术要求具体来看,宣称具备32TOPS的AI算力,100K DMIPS的CPU算力,16K DMIPS的MCU算力,320 GFLOPS的DSP算力,4个4K60显示,内置4口以太网交换,2口PCIe交换。图6 德州仪器TDA4VM芯片架构示例 21 4)Mobileye Mobileye是英特尔2017年收购的列自动驾驶汽车技术公司,发布的EyeQ系列芯片EyeQ系列芯片产品截止2021年底已经总计出货接近一亿片。尽管在L3/L4领域被英伟达和高通压制
41、,但是在主流的L2级别ADAS市场,仍然是霸主,其市场占有率高达75%。2021年出货量高达2810万片。至今已经完成了超1亿件EyeQ芯片的出货。而其22年发布的EyeQ Ultra是一款专为端到端自动驾驶而打造的单封装自动驾驶汽车集成芯片超级计算平台。EyeQ Ultra基于经过验证的Mobileye EyeQ架构,通过优化算力和效能,宣称可达到176TOPS,功耗低于100w。在未来这款芯片很有可能搭载在吉利极氪的全系车型之上。根据 面向自动驾驶应用的计算芯片 第一部分:技术要求 具体来看,EyeQ Ultra采用一组包含四类专有加速器的设计,每一类都针对特定任务而设计。这些加速器与其它
42、CPU、ISP和GPU相配合,构成了一个高能效的解决方案,能够同时处理来自两个传感子系统(包括一个纯摄像头子系统和一个整合了雷达和激光雷达的子系统)以及车辆的中央计算系统、高清地图和驾驶决策软件的输入数据。图7 Mobileye的EyeQ Ultra芯片示例 22 (2)国内代表国内代表 1)华为华为 2018年10月,华为发布了自研的达芬奇架构AI芯片昇腾910和昇腾310。华为MDC计算平台的核心AI芯片采用的就是昇腾系列芯片。针对ADAS 与L4 并行的自动驾驶战略,华为相继推出多款不同的计算平台,其中MDC 610的算力宣称为200TOPS。为了进一步推动MDC 产品的系列化,以满足不
43、同客户的多样化需求。在已经亮相的华为MDC智能驾驶计算平台解决方案上,集成了自研的Host CPU芯片、AI芯片、ISP芯片与SSD控制芯片。图8 华为昇腾310芯片架构示例 华为MDC智能驾驶平台,已经与18家主流车企、Tier 1建立合作,智能驾驶的应用场景则覆盖了乘用车、商用车、特种车作业车等。使用华为MDC 610平台,基于华为MDC Core软件栈,在该平台上对面向自动驾驶应用的计算芯片 系列标准中的部分典型场景用神经网络模型进行了性能测试,测试结果如表5所示:表表5 华为华为MDC 610平台平台部分部分典型场景性能典型场景性能 序序号号 模型模型 数据集数据集 华华为为 MDC
44、610 性能(性能(FPS)推理准确度推理准确度 原始模型原始模型 准确度准确度 23 1 resnet50 ImageNet 2764.80 0.793(top1)0.793(top1)2 vit ImageNet 303.59 0.801(top1)0.801(top1)3 yolov3 COCO 373.74 0.545(0.5:0.95mAP)0.558(0.5:0.95mAP)4 yolov5m COCO 665.90 0.479(0.5:0.95mAP)0.501(0.5:0.95mAP)5 efficentdet-D0 COCO 385.99 0.374(0.5:0.95mAP)
45、0.389(0.5:0.95mAP)6 detr COCO 196.15 0.375(0.5:0.95mAP)0.377(0.5:0.95mAP)7 segformer-B1 Cityscapes 39.89 72.74(mIoU)72.84(mIoU)8 rangenet+KITTI 463.78 0.293(IoU)0.305(IoU)9 pointpillar KITTI 156.68 69.37(3d mAP)70.75(3d mAP)10 SCNN CULane 319.95 80.2(F1)81.9(F1)2)地平线地平线 地平线面向智能驾驶领域,推出征程系列芯片,自2018年4月
46、发布征程1芯片至今,量产产品已迭代至第三代征程5。征程5芯片是地平线推出的第三代芯片产品,采用台积电16nm制程工艺。采用8核心ARMCortex A5核心,支持 16 路感知摄像头、激光雷达、毫米波雷达等感知接入。目前征程5芯片已在理想L8 Pro和Air上实现量产上市,同时获得比亚迪、红旗、北汽、上汽多个定点项目。其中理想L8 Pro和Air车型上搭载的基于征程5打造的理想AD Pro驾驶辅助系统,已于2023年2月OTA推送NOA领航辅助驾驶系统。地平线相继推出基于征程2、征程5芯片的Matrix 2与Matrix 5计算平台,其中Matrix 5可满足ADAS、高阶自动驾驶、智能座舱等
47、多种场景需求,根据面 24 向自动驾驶应用的计算芯片 第四部分:传感器接口要求具体来看,其支持48GMSL2摄像头输入通路,最高支持多路8MP30fps、多路毫米波雷达、4D成像雷达、激光雷达、超声波及麦克风阵列的接入。图9 地平线Matrix 计算平台示例 3)黑芝麻黑芝麻 黑芝麻是行业领先的智能汽车计算芯片和平台研发企业,专注于车规级高性能计算芯片与平台技术领域的高科技研发。其研发的华山系列芯片不少款已经实现量产和商业化落地。根据面向自动驾驶应用的计算芯片 第一部分:技术要求具体来看,华山 A1000 采用 16nm 车规工艺,并可处理多达 16 路高清摄像头输入,支持 L2+至 L3 自
48、动驾驶集成泊车及驾驶的单芯片解决方案以及支持多个自动驾驶场景;华山 A1000L 为 L2 及 L2+自动驾驶设计,为华山 A1000 的轻量版,采用 16nm FFC 车规工艺,并可处理 8 路高清摄像头输入,也支持集成泊车及驾驶的单芯片解决方案,为入门级自动驾驶汽车提供高性价比方案;华山 A1000pro支持多达 20 路高清摄像头输入,支持从城市道路及高速公路驾驶到泊车的多种自动驾驶应用场景无缝集成。黑芝麻基于 A1000 系列芯片打造的 Drive Sensing 解决方案是可量产搭载单SOC 芯片的高阶行泊一体方案,搭配一个 MCU,实现单 SOC 支持 10V 的高阶行泊一体方案,
49、支持 L2+行车领航 NOA、泊车 HPA/AVP、3D 360 环视全景、多路 DVR 等功能。25 图 10 华山 A1000 外部系统方案框图 图 11 华山 A1000 内部功能模块框图 黑芝麻智能与东风集团、江汽集团、一汽集团、上汽集团、上汽通用五菱、博世、曹操出行、吉咖智能、亚太、保隆集团、经纬恒润、均联智行、所托瑞安、联友科技等在 L2、L3 级ADAS 和自动驾驶感知系统解决方案上开展了一系列商业合作。2023年,搭载华山A1000系列芯片的量产车将陆续发布,包括江淮、吉利、东风旗下品牌等更多车型。4)超星未来超星未来 26 超星未来由清华大学电子工程系与车辆学院跨学科联合成立
50、,以软硬件协同优化为核心思想,主要面向智能驾驶前装量产场景和边缘侧AI场景,提供芯片产品和行业解决方案。图12 超星未来惊蛰R1芯片示意图 根据面向自动驾驶应用的计算芯片 第四部分:传感器接口具体来看,惊蛰R1可提供多传感器接入能力和灵活的连接性,支持多路MIPI以及以太网接入,用户可以根据使用场景自由设计多摄像头、激光雷达以及毫米波雷达的接入,打造不同能力等级的智能驾驶系统。根据面向自动驾驶应用的计算芯片 第三部分:人工智能应用工具链,基于惊蛰R1和开发工具链“鲁班”,超星未来打造的智能计算平台开发套件“NE100”。全面支持各类传感器输入,适配多种深度学习算法框架,可高效实现感知、融合、预