1、证券研究报告证券研究报告行业深度报告行业深度报告特斯拉的特斯拉的FSD时刻时刻太平洋证券研究院|首席分析师刘虹辰执业资格证书编号:S11905240100022024年4月18日请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告特斯拉的特斯拉的FSD时刻时刻2特斯拉的特斯拉的FSD时刻时刻。V12.3端对端NN重塑FSD。FSD 用户的累计行驶里程从V11扩大推送后加速提升,V12推送后开始指数级提升,到今年4月已超10亿英里,特斯拉FSD迎来奇点时刻。FSD V12.3的推送实现端到端NN,HW4.0大幅提升算力,不再进行识别和标记,摆脱人为规控规则编码,大幅提高自动驾驶感知
2、决策能力。AI赋能赋能,加速加速Robotaxi。马斯克称Robotaxi将于今年8月8日落地,近期特斯拉启动了全球范围内的人员调整,自动驾驶预计将获得资源倾斜,大模型加持提升城市NOA感知能力、泛化能力,加速无图城市NOA落地,AI赋能,加速Robotaxi,特斯拉自动驾驶今年累计投资预计超100亿美元。数据鸿沟和算力要求,构成超算的核心壁垒。任何模型的训练都依赖于数量巨大、质量可控的训练数据,而特斯拉FSD自推出以来累计运行超过了10亿英里,为特斯拉训练模型提供了充足的数据。同时,大模型训数据需要强大的算力,特斯拉领先的超算中心,Robotaxi落地路径持续催化值得期待。无图城市无图城市N
3、OA重新定义智能汽车重新定义智能汽车。特斯拉FSD引领“Transformer+BEV”、“Occupancy、Lane算法”、“自动标注”、“超算中心建设”,实现路径收敛。华为ADS 2.0 OTA新增不依赖高精地图的城区智驾领航辅助,问界全系车型实现了全国都能开、有路就能开的City NCA。支持城市道路(主干路/次干路/支路等)、国道、县道、乡道等公开道路,可用路段高达99%,用户体验提升带来渗透率拐点快速提高。投资建议投资建议:智能汽车三条投资主线:域控制器:德赛西威,华阳集团,科博达。线控底盘:伯特利,保隆科技。智能整车:赛力斯,理想汽车,小鹏汽车。风险提示:风险提示:智能汽车渗透率
4、提升不及预期,国产替代不及预期,技术路线变更风险。请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告资料来源:太平洋证券核心逻辑核心逻辑3大模型加持提升城市大模型加持提升城市NOA感知能力、泛化能力,加速无图城市感知能力、泛化能力,加速无图城市NOA落地落地华为无图城区NCA全面OTA,特斯拉FSD北美,用户体验提升带来渗透率拐点快速提高。覆盖生活场景从高速NOA的10%到城市NOA的99%。特斯拉8月8日Robotaxi。法规:L3智驾政策。接下来一段时间的催化预期?接下来一段时间的催化预期?投资建议投资建议 域控制器:德赛西威、科博达、华阳集团。线控底盘:拓普集团,伯特利、
5、保隆科技。整车:赛力斯,理想汽车,小鹏汽车特斯拉引领技术路径收敛特斯拉引领技术路径收敛2D+CNNTransformer+BEV优化感知效果摆脱高精地图LANEOccupancy人工标注自动标注大模型效率提升几千甚至近万倍国内车企自建/合建超算中心特斯拉自建DOJO超算7月投产支持云端大模型训练大模型催化大模型催化FSD时刻时刻端到端算法有望提升规控准确性生成式AI提供高质量训练数据大模型蒸馏训练小模型减少计算资源消耗多模态模型有望优化感知 BOM成本下降成本下降华为ADS1.0到2.0显著变化为从3颗激光雷达减配至1颗,纯视觉与激光雷达路线之争逐渐走向“折中”方案。高阶辅助驾驶BOM成本持续
6、下降。CONTENTS目目 录录目目 录录特斯拉的特斯拉的FSD时刻时刻AI赋能,加速赋能,加速Robotaxi无图城市无图城市NOA重新定义智能汽车重新定义智能汽车投资建议投资建议风险提示风险提示0102030405请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告2024年3月,特斯拉先后推出FSD(Beta)12.3.2、12.3.2.1以及最新的FSD(Supervised)12.3.3版本。相比较于FSD 11,FSD v12创新性地采用了端对端的神经网络技术(端对端NN),可以更好地理解和处理复杂驾驶环境,减少驾驶人员的干预,提高自动驾驶的精确度和自动化度。FSD
7、v12中采用端到端中采用端到端NN(以前是(以前是AI感知感知+软件规控),大模型仅需软件规控),大模型仅需输入视频进行学习,而无需单独编码,更灵活更轻代码。输入视频进行学习,而无需单独编码,更灵活更轻代码。感知-决策-执行是FSD的基本流程,在v11中,感知阶段需要通过视觉方式/雷达方式获取周围物体信息并识别和标识分类,决策阶段则依赖于事先认为编写好的控制规则。但是v12采用了端对端NN技术,感知阶段不再需要识别和标识,决策阶段也不需要事先人为编写控制规则,只需要输入大量视频交给NN学习,就能分辨出在不同情况下需要做什么,这使得特斯拉在FSD V12中减少了100倍代码,使其更轻便、更灵活,
8、同时在没有网络连接的情况下仍能在不熟悉的地形上工作。V12同时兼容同时兼容HW3.0和和4.0,感知力和算力大幅提升。,感知力和算力大幅提升。v12在北美的已经适配装备HW4.0的model S、3、X和Y,在中国地区目前只有Model Y可以升级到HW4.0。从3.30号推送以来,截至4.9号,v12.3.3累计安装量达5780。目前,v12同时适配HW3.0和4.0。相比HW3.0,HW4.0在算力、摄像头数量和清晰度等方面具有大幅度的提升。摄像头为8个,算力提升5倍,素有摄像头像素由120万提升至500万。资料来源:TeslaFi,太平洋证券5特斯拉特斯拉FSD:V12.3端对端端对端N
9、N重塑重塑FSD图图 截至截至4.9号,号,HW3.0摄像头清晰度(左)摄像头清晰度(左)vsHW4.0摄像头清晰度(右)摄像头清晰度(右)请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告资料来源:特斯拉AI DAY,Not a tesla app,马斯克推特,Tesla_AI推特,太平洋证券特斯拉特斯拉FSD:累计里程指数级增长超:累计里程指数级增长超10亿英里亿英里,剑指百亿公里剑指百亿公里6时间时间版本进展版本进展版本重大变化版本重大变化22年12月FSD Beta测试版向北美40万人推送截至2022年12月,特斯拉已经向美国和加拿大的几乎所有买了FSD(约40万)的客
10、户发布了 FSD Beta测试版,FSD Beta测试版新增了大量新功能,并可以让特斯拉在城市环境中自动导航。根据马斯克推特,FSD可用于北美90%道路,计划未来在欧洲推送FSD BETA。23年2月FSD11.3版本合并城市驾驶与高速公路驾驶堆栈,提升辅助驾驶能力。FSD11.3版本于2023年2月向用户推送,单堆栈融合了城市和高速堆栈,单堆栈将使特斯拉能够将其在城市驾驶中的学习内容应用到其自动驾驶高速公路导航功能中。23年3月FSD11.3.3版本Vision Park Assist使用占用网络代替超声波雷达。自22年10月起,特斯拉逐步移除超声波雷达,此次推送的新功能,代表着特斯拉用视觉
11、占用网络算法替代被移除的超声波雷达,在摄像头的盲区通过记忆数据复现障碍物对车的距离。23年5月FSD11.4版本通过将自动标记车队数据集进一步增加 80k 个剪辑、提高自动标记算法的准确性以及调整训练监督的分布来实现以下优化:将部分切入的召回率提高了 39%,将由于变道到相邻车道而导致的假阳性切入的准确率提高了 66%,从而使整体变道预测错误减少了 33%。24年3月FSD12.3版本FSD v12.3采用端到端NN技术,不再进行识别和标记,摆脱人为规控规则编码,并实现了Autopark不依赖USS(超声波传感器)(最早在3.21发布的v11.4.9的更新中实现)图:图:3月推送月推送FSD
12、v12.3实现端到端实现端到端NN,大幅提高自动驾驶感知和决,大幅提高自动驾驶感知和决策能力策能力图:截至图:截至2024年年4月月6日,日,FSD 用户的累计行驶里程已超用户的累计行驶里程已超10亿英里,亿英里,23年年8月后加速上行(系月后加速上行(系v11扩大推送规模)扩大推送规模)请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告新版的新版的Autopark基于与基于与FSD v12相同的相同的NN技术技术,不再依赖不再依赖USS:自2022年特斯拉放弃USS而改用摄像头以来,未装备USS的新特斯拉的Autopark和Summon功能给用户带来的体验感远不如装备USS的
13、车辆。在今年3月21号推出的FSD v11.4.9的更新中,特斯来推出了新版的Autopark,并在之后的v12.3版本中沿用。在技术层面,与旧版不同,新版的Autopark使用了与FSD v12相同的NN技术,底层技术优于旧版,相比旧版有较大的提升,大幅度提升了泊车系统的视觉效果和自动泊车能力。显著改进视觉效果和自动泊车功能显著改进视觉效果和自动泊车功能,“Tap to Park”一键泊车降低人为干预需要一键泊车降低人为干预需要。之前版本的Autopark具有两大主要缺陷:1)很难检测停车位并将其显示在屏幕上,而且一次只能显示一个停车位。2)停车速度通常非常慢,如果周围有其他车辆,几乎很难完
14、成自动泊车。而新的Autopark基于NN技术,显著改善了这两个问题,停车速度更快,不仅可以在显示屏上勾勒出停车位,还可以同时显示各种停车位-包括平行空间。此外,这次升级,特斯拉真正实现了一键泊车(Tap to Park),当驾驶员选择好停车位后,点击“开始按钮”,特斯拉的车辆能够安全地倒车进入停车位,驾驶人员只需要保持关注并随时准备在必要时取消自动停车操作即可,大幅度降低了人为干预需要、提升用户体验。资料来源:not a tesla app,太平洋证券新版新版Autopark不依赖不依赖USS,“Tap to Park”大幅提升用户体验感大幅提升用户体验感7图图 新版新版Autopark不再
15、需要驾驶员操作方向盘。自动泊车功能不再需要驾驶员操作方向盘。自动泊车功能显著改进显著改进图图 新版新版Autopark视觉体验感显著强于旧版视觉体验感显著强于旧版Autopark请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告资料来源:not a tasla app,公开资料整理,太平洋证券HW4.0芯片算力大幅提升芯片算力大幅提升8芯片改用更先进制程:HW4.0 FSD芯片采用三星7nm工艺,HW3.0为三星14nm工艺,新的自动驾驶芯片性能将是现款自动驾驶芯片的5倍倍左右,这里的性能或为综合能耗/算力参数,或为单片算力(那么新平台总算力很可能达到新平台总算力很可能达到50
16、0TOPS)。摄像头或升级:摄像头数量或从9个减少到8个,但是摄像头的清晰度从120万像素提升到500像素,这使得HW4.0具有比3.0更强的感知能力,最远探测距离可达424米,扫除盲区和死角。预留雷达接口,但model Y目前未配备雷达:HW 4.0预留了装备雷达的空间,但是model Y在出厂时并不具备雷达功能,这可能与特斯拉更加偏好视觉方案、降低车辆出厂成本等因素有关,同时也为用户提供了一定的选择空间。CPU内核数量提升66.67%,FSD Computer 2数量增加到3个。CPU方面,HW4.0由3.0的12核,提升到了20核,内核数量提升66.67%。计算平台方面,虽然HW4.0仍
17、然采用的是FSD Computer 2,但是数量却增加到了3个。目前,海外HW4.0已经支持model 3、X、Y和S。国内,特斯拉为了应对竞争压力,开放了model Y的升级,并且是“加料不加价”。表:表:HW3.0和和HW 4.0关键参数对比关键参数对比HW 3.0HW 4.0摄像头9个,120万像素8个,500万像素雷达1个毫米波雷达,12个超声波雷达为安装雷达预留空间,但是Model Y目前未配备雷达计算平台FSD Computer 2FSD Computer 2计算平台数量13芯片三星的 Exynos架构三星的 Exynos架构CPU12核20核CPU频率2.2GHz2.35GHz神
18、经网络加速器双核三核神经网络频率2GHz2.2GHz最大算力100TOPS500TOPS制程14nm7nm请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告HW5.0或搭载第二代或搭载第二代 3nm N3P 工艺芯片:与工艺芯片:与N3E相比相比,N3P的晶体管密度更高的晶体管密度更高,从而提高了性能的同时降低了功耗从而提高了性能的同时降低了功耗。N3P 性能比性能比N3E 高高 5%,同时光学尺寸缩小了同时光学尺寸缩小了 2%,从而晶体管密度达到从而晶体管密度达到 1.04 倍倍。据Digitimes报道,特斯拉已向台积电第二代 3nm N3P 工艺芯片下达了异常大的订单,如
19、果此消息属实,HW5.0的性能将比HW4.0具有显著地提升。摄像头工艺再提升摄像头工艺再提升,加入加热镜头元件加入加热镜头元件、水滴排斥涂层和光圈控制技术水滴排斥涂层和光圈控制技术。1)加热镜头元件:加热镜头元件:三星开发的“Weather Proof”摄像头配备了8MP传感器,并采用了一种巧妙的镜头加热系统,能在不到一分钟内融化覆盖在镜头上的冰雪能在不到一分钟内融化覆盖在镜头上的冰雪。2)水滴排斥涂层:水滴排斥涂层:新型摄像头配备了防水涂层,可以防止水滴停留在镜头上,添加了防水涂层,以防止水滴停留在镜头上,这种涂层耐划痕和损伤,耐用性是现有解决方案的耐用性是现有解决方案的6倍倍。3)光圈控制
20、技术光圈控制技术(IRIS):三星开发的摄像头模块引入了光圈控制技术,允许摄像头根据不同的光照条件和自动驾驶需求动态调整进光量,优化图像质量和传感器性能。资料来源:Digitimes,三星官网,公开资料整理,太平洋证券HW5.0:或搭载第二代:或搭载第二代 3nm N3P 工艺芯片工艺芯片,摄像头或加入摄像头或加入加热镜头元件等加热镜头元件等9图图 光圈控制技术(光圈控制技术(IRIS)能够显著优化成像质量)能够显著优化成像质量CONTENTS目目 录录目目 录录特斯拉的特斯拉的FSD时刻时刻AI赋能,加速赋能,加速Robotaxi无图城市无图城市NOA重新定义智能汽车重新定义智能汽车投资建议
21、投资建议风险提示风险提示0102030405请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告马斯克称马斯克称Robotaxi将于今年将于今年8月月8日落地日落地,近期特斯拉启动了全球范围内的人员近期特斯拉启动了全球范围内的人员调整调整,自动驾驶预计将获得资源倾斜自动驾驶预计将获得资源倾斜,落地路径落地路径Roadmap持续催化值得期待持续催化值得期待。乘坐乘坐Robataxi的综合成本:的综合成本:我们将消费者乘坐Robataxi的综合成本划分成货币成本、安全成本、和其他成本。其中货币成本主要指打车费,安全成本则是消费者乘坐Robataxi所承担的比传统出租车更大的安全风险,
22、以及由此造成的乘客可能成本(如健康损失、医疗费用),其他成本则主要包括时间成本等(Robataxi可能因为速度或错误选择匝道进入等导致平均速度相对慢)等。综合成本降低是规模化落地的关键:综合成本降低是规模化落地的关键:Robotaxi面临的竞争对手是传统的出租车行业,其商业模式要想跑得通,就要从传统出租车Uber等公司抢客,客观需要其具有相对低的综合成本吸引顾客。Robataxi每公里货币成本已经显著下降,当前更重要的或是降低安全成本。自驾技术进步是降低综合成本的核心自驾技术进步是降低综合成本的核心,规模落地依赖规模落地依赖L4/L5技术技术,目前或局限于目前或局限于部分城市的部分区域路段部分
23、城市的部分区域路段。目前,国内外都存在Robotaxi的训练,但是仅局限于部分城市部分区域。在这一层级上,L3层级的自动驾驶技术可以满足需求。但是为了规模化推广,意味着自动驾驶技术要能适应更复杂的驾驶环境、降低综合成本,L4则是必须的。基于此,我们认为马斯克在8.8落地的Robotaxi或将局限于部分城市的部分区域,规模化落地仍有待自动驾驶技术向L4/L5方向进一步发展。外部条件:监管政策宽松和有关法律完善外部条件:监管政策宽松和有关法律完善。资料来源:公开资料整理,太平洋证券Robotaxi:8月月8日落地路径日落地路径Roadmap持续催化持续催化11货币成本安全成本其他成本主要指打车费所
24、承担的比传统出租车更大的安全风险所带来的可能成本时间成本等综综合合成成本本如祺出行:19年Robotaxi成本为23.3元/km,23年降至4.5元/km(载人出租车1.8元/km)请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告超算需巨额资金投入超算需巨额资金投入,马斯克预计特斯拉今年在有关领域累计投资超马斯克预计特斯拉今年在有关领域累计投资超100亿美元亿美元。在今年1月27日,马斯克在推特上表示,Dojo目前的算力进相当于1万个英伟达H100,如果想在AI领域具备竞争力,那么目前需要每年投入数十亿美元。随后在4月6号,马斯克再发言,表示特斯拉在训练计算、数据管道和视频存
25、储方面的累计投资将在今年超过100亿美元。AI赋能赋能,加速加速Robotaxi。数据鸿沟和算力要求数据鸿沟和算力要求,构成超算的核心壁垒构成超算的核心壁垒。首先,任何模型的训练都依赖于数量巨大、质量可控的训练数据,而特斯拉FSD自推出以来累计运行超过了10亿英里,这位特斯拉训练模型提供了充足的训练数据。其次,算力方面,大模型训数据需要强大的算力,特斯拉目前可能拥有3万-3.5万颗英伟达H100芯片,而下一代的Gork可能需要10万颗H100,如果按照单价4.5万美元/颗,那么10万颗H100总价值高达45亿美元,相当于300多亿人民币。资料来源:Twitter,公开资料整理,太平洋证券AI赋
26、能赋能,加速加速Robotaxi,特斯拉自动驾驶今年累计投资预计超特斯拉自动驾驶今年累计投资预计超100亿美元亿美元12图图 Dojo的数据流近存计算架构的数据流近存计算架构层级名称片上SRAM算力说明内核Dojo Core1.25MB1.024TFLOPS单个计算核心,64位宽度,具有4个8x8x4的矩阵计算单元,2GHz主频芯片级D1440MB362TFLOPS单芯片,核心数为354,面积645mm核心级Dojo Tile11GB9050TFLOPS 单个训练模组,每5x5个芯片包括一个训练模组整群级ExaPOD 1320GB1.1EFLOPS模拟训练的训练集群,每12个训练模组组成一个机
27、柜,每10个机柜组成ExaPOD,共计3000个D1芯片请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告华为华为ADS 2.0问世后问世后,城市城市NOA的竞争愈发向着无图化的竞争愈发向着无图化、全城市可用的方向发展全城市可用的方向发展。华为的ADS 2.0首次搭载在华为问界M5上,相比与ADS 1.0,ADS 2.0结合道路拓扑推理网络(RCR)和华为的先进算法,实现了不依赖于高精地图的高速、城区高阶智能驾驶功能。小鹏汽车宣布面向智驾经验用户即刻推送无限 XNGP 智能辅助驾驶功能,号称“不限城市、不限路线,有导航的地方就能用”。理想理想、比亚迪比亚迪、华为华为、小鹏等智驾
28、头部车企将自动驾驶放在优先发展战略地位小鹏等智驾头部车企将自动驾驶放在优先发展战略地位,我们认为原因如下:我们认为原因如下:智能驾驶的技术路径逐渐收敛,后发力者技术上具备后发优势。特斯拉的智能驾驶技术路线已得到成功验证,我们看到,当前时点,“Transformer+BEV感知大模型”、“Occupancy、Lane算法”、“自动标注”、“超算建设”等成为共识。从中长期看,纯视觉与激光雷达路线之争逐渐走向“折中”方案、“不依赖高精地图”有望降低智能驾驶软硬件BOM成本。我们认为在未来大模型将继续赋能自动驾驶我们认为在未来大模型将继续赋能自动驾驶。端到端算法有望提升规控准确性、大模型蒸馏训练小模型
29、减少计算资源消耗、生成式AI提供高质量训练数据、多模态模型有望优化感知。资料来源:各公司官网,太平洋证券AI赋能赋能,加速加速Robotaxi,无图全城城市无图全城城市NOA加速加速13品牌品牌高速高速NOA城市城市NOA24年计划年计划指定路线指定路线NOA功能功能小鹏不限城市/AI代驾阿维塔不限城市(阿维塔12)/AI代驾问界不限城市/AI代驾理想113城无图城市NOA预计2H全国开放通勤NOA蔚来726城预计Q2向所有NT2.0用户推送NOP+城区领航辅助特斯拉国外开通零跑预计2H推出腾势40+最快年底覆盖全国极氪深蓝宝骏记忆行车图:不同车企高速图:不同车企高速NOA及城市及城市NOA
30、Roadmap时间时间NOA特点特点2023.05华为 ADS2.01、配备1个顶置激光雷达、3个毫米波雷达、11颗高清摄像头以及12个超声波雷达,不受恶劣天气和光线影响,全天候感知信号。2、BEV+GOD网络(General Objective Detection通用障碍物检测),可以识别通用障碍物白名单外的异形物体。3、有图无图都能开,覆盖超90%城区2024.04小鹏无限 XNGP 不限城市、不限路线,有导航的地方就能用图:华为图:华为 ADS2.0和小鹏无限和小鹏无限XNGP都支持不限城市、无图都支持不限城市、无图NOA请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告
31、BEV+Transformer2D+CNN资料来源:特斯拉AI DAY,太平洋证券技术路径收敛:特斯拉引领技术路径收敛:特斯拉引领BEV+Transformer142021年年7月月AI DAY,特斯拉首次展示基于,特斯拉首次展示基于Transformer的的BEV感知方案,是感知方案,是大模型首次用于自动驾驶大模型首次用于自动驾驶,实时感知生成向量空间。,实时感知生成向量空间。BEV(Birds-eye-view)指俯瞰图视角,Transformer利用主干网络对各个摄像机进行特征提取,再利用Transformer将多摄像机数据从图像空间转化为BEV空间(向量空间)。Transformer
32、vs CNN:Transformer是一种基于注意力机制(Attention)的神经网络模型,通过注意力机制去挖掘序列中不同元素的联系及相关性,而CNN的局部感受野限制了它们在长距离依赖性建模方面的能力。BEV+Transformer vs 2D+CNN:BEV+Transformer可以消除遮挡和重叠,提高检测精度。BEV视角下的物体,不会出现图像视角下的尺度(scale)和遮挡(occlusion)问题。BEV能够实现“局部”端到端优化,感知和预测都在同一个空间进行,输出“并行”结果。图:自动驾驶跨摄像头和多模态融合背景下的图:自动驾驶跨摄像头和多模态融合背景下的BEV视角视角图:图:BE
33、V+Transformer可以消除遮挡和重叠,提高检测精度可以消除遮挡和重叠,提高检测精度请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告资料来源:特斯拉AI DAY 太平洋证券技术路径收敛:技术路径收敛:特斯拉特斯拉Occupancy感知引领华为感知引领华为、理想跟随理想跟随15图:图:通过通过Occupancy flow可以用于判断物体是否运动可以用于判断物体是否运动2D+CNN2022年年10月月AI DAY,特斯拉,特斯拉Occupancy感知进化,感知进化,不识别类别也能判断物体运动状态不识别类别也能判断物体运动状态,引领华为,引领华为GOD、理想、理想Occupa
34、ncy跟随。跟随。2022年10月1日的AI Day中展现了Occupancy Network 感知技术:基本的思想是将三维空间划分成体素voxel,通过0/1赋值对voxel进行二分类,实际中的赋值可以是概率值,表示voxel存在物体的概率。Voxel的属性除了是否被占据,还包含语义信息和速度信息(Occupancy Flow)等。其中速度信息是一个三维向量,用于表述voxel运动的速度和方向,通过occupancy flow可以用于判断物体是否运动。相较BEV+Transformer,Occupancy是又一里程碑式进步:占用网络相较于BEV,有了Z轴上的扩展,是一种通用的2D特征转3D特
35、征的转换,不局限于通用障碍物检测,可以扩展到更多3D空间任务。同时在引入速度信息后,动态描述向4D过渡。2Q23,华为、理想相继发布类似的算法,其中华为创新性地将激光雷达信息融入其GOD网络,理想Occupancy属于其三种重点感知算法之一。图中展示了一个两节的公交车正在启动的场景:蓝色表示运动的voxel,红色表示静止的voxel。Occupancy Network精确地估计出了公交车的第一节开始运动,第二节还静止。可预测道路起伏度可预测道路起伏度:在BEV空间生成统一体素,可以预测任意一个体素的占用概率,道路边沿的占据栅格和道路表面贴合。运动流,运动流,3D方便测算遮挡关系方便测算遮挡关系
36、:能够实时预测被遮挡物体的运动状态,可以为每个体素预测其运动状态,对随机运动进行建模。弱语义,强几何:弱语义,强几何:可以为每个体素生成对应的语义类别,即使不识别类别也能处理运动物体。Occupancy具有高效的存储和计算优势:具有高效的存储和计算优势:10ms内可以完成计算,各个位置的分辨率可调整,具备BEV空间变焦能力。优优势势请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告资料来源:特斯拉AI DAY,Neural Map Prior for Autonomous Driving,太平洋证券技术路径收敛:技术路径收敛:Tesla Lane感知车道拓扑感知车道拓扑,理想提
37、前提取复杂路口特征理想提前提取复杂路口特征16图:图:Lane神经网络同样基于神经网络同样基于Transformer模型,是模型,是摆脱高精地图的关键算法摆脱高精地图的关键算法,可生成道路间的拓扑连接关系可生成道路间的拓扑连接关系视觉组件:一组卷积层,注意力层,以及其他神经网络,输入8摄像头数据地图组件:用粗略地图增强,提供道路关系语义组件:输入密集张量,输出编码车道连接性的文本,利用NLP领域技术图:针对复杂路口,理想自研图:针对复杂路口,理想自研NPN网络提前进行路口特征的提取,网络提前进行路口特征的提取,当车辆再次行驶到该路口时,与车端感知的当车辆再次行驶到该路口时,与车端感知的BEV特
38、征层融合特征层融合请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告资料来源:特斯拉AI DAY,各公司官网,太平洋证券技术路径收敛:大模型自动标注效率是人工的技术路径收敛:大模型自动标注效率是人工的1000-45000倍倍17图:特斯拉采用大模型优化数据标注,从图:特斯拉采用大模型优化数据标注,从2018年只有纯人工的年只有纯人工的2维标注,维标注,2021年后年后建立自动标注系统可以取代建立自动标注系统可以取代500万小时的人工作业量万小时的人工作业量只有纯人工的2维的图像标注,效率非常低开始有3D label,但是是单趟的人工的采用BEV空间进行标注,重投影的精度明显降低
39、采用多趟重建去进行标注,精度、效率、拓扑关系都达到了极高的水准企业企业自动标注大模型应用及能力自动标注大模型应用及能力小鹏引入全自动的标注系统,对比人工标注,全自动标注系统效率高,过去2000个人一年的标注任务,现在用16天左右就能完成,效率可以提升45000倍理想使用软件2.0的大模型,通过训练的方式进行自动化标定,过去需要用一年做的事情,基本上3个小时就能完成,效率是人的1000倍比亚迪毫末智行在算法模型上,研发了智驾自动标注大模型华为华为云研发的标注大模型,基于海量典型数据进行预训练,通过语义分割、对象跟踪技术可以快速完成长时间连续帧的自动标注毫末智行DriveGPT的自动化标注能力,可
40、以降本98%数百亿4D Clips(环视连续数据Clips)的标注成本。商汤商汤科技公布了“日日新SenseNova”大模型体系,包含自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。图:国产新势力、比亚迪、华为、长城、图:国产新势力、比亚迪、华为、长城、AI公司纷纷采用公司纷纷采用自动标注大模型提升效率自动标注大模型提升效率请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告资料来源:特斯拉推特TeslaAI,各公司官网,太平洋证券技术路径收敛:特斯拉技术路径收敛:特斯拉Dojo投产投产,国内厂商建设超算中心国内厂商建设超算中心18图:特斯拉图:特斯拉D
41、OJO超算自超算自7月投产,计划明年在月投产,计划明年在DOJO上投入超过上投入超过10亿亿美元,当前美元,当前算力相当于算力相当于1万万+英伟达英伟达H100,预计到,预计到24年算力会相当于年算力会相当于30万英伟达万英伟达A100企业企业超算中心建设超算中心建设蔚来2022年就曾宣布与英伟达合作,基于A100打造自己的数据中心小鹏与阿里云合作在乌兰察布建设了智算中心“扶摇”,宣称云端算力可达600 PFLOPS毫末智行在算法模型上,研发了智驾自动标注大模型发布了和火山引擎合作的“雪湖绿洲”智算中心,称其算力规模为670 PFLOPS理想宣布了与火山引擎合作在山西打造智算中心,采购的公有云
42、服务算力达750P FLOPS;吉利汽车和阿里云在湖州成立了星睿智算中心,拥有810 PFLOPS 的算力。图:国内多家图:国内多家OEM和和Tier 1均在积极建设智驾数据中心均在积极建设智驾数据中心请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告车端计算资源有限难以部署大模型车端计算资源有限难以部署大模型,导致推理效果和泛化性能欠佳:导致推理效果和泛化性能欠佳:通常来说,规模较大的模型预测效果更好,但训练时间长、推理速度慢的问题使得模型难以实时部署,尤其在自动驾驶汽车等计算资源有限的设备上,响应速度显然不够用。规模较小的模型虽然推理速度较快,但是因为参数量不足,推理效果和
43、泛化性能没那么好。大模型知识蒸馏给小模型大模型知识蒸馏给小模型,可以实现更优的性能:可以实现更优的性能:知识蒸馏(knowledge distillation)是模型压缩的一种常用方法,通过构建一个轻量化的小模型,利用性能更好的大模型的监督信息来训练这个小模型,以期达到更好的性能和精度。目标检测是计算机视觉中的一个重要任务,知识蒸馏可以在不增加其计算消耗的前提下提升其表现。根据理想智驾VP朗咸朋,其认为GPT最大的好处是可以用大量的弱标注或者粗标注的样本,来获取一定的基础能力;然后再用精标的小数据去做调整,在某些任务上得到更好的结果,理想现在也在这么做。资料来源:Focal and Globa
44、l Knowledge Distillation for Detectors,太平洋证券大模型赋能智驾大模型赋能智驾GPT:大模型蒸馏有望解决车端算力不足带来效果欠佳问题:大模型蒸馏有望解决车端算力不足带来效果欠佳问题19图:学生模型通过蒸馏学到了教师的知识,并获得更好的特征,由此实现性能提升图:学生模型通过蒸馏学到了教师的知识,并获得更好的特征,由此实现性能提升请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告生成式生成式AI可以生成廉价的海量训练数据和极端驾驶场景可以生成廉价的海量训练数据和极端驾驶场景,高效地批量生产自动驾驶模型训练开发所需的海量数据高效地批量生产自动驾驶
45、模型训练开发所需的海量数据。Tesla、Wayve在2023年CVPR自动驾驶workshop上展示了利用大模型来生成自动驾驶相关的连续视频场景,Tesla命名为World Model,Wayve则命名为GAIA-1。资料来源:各公司官网,CVPR,太平洋证券大模型赋能智驾大模型赋能智驾GPT:生成式:生成式AI有望高效低价提供高质量训练数据有望高效低价提供高质量训练数据20图:图:Waymo GAIA-1和基于和基于GAIA-1生成的视频素材生成的视频素材图:特斯拉认为图:特斯拉认为World模型对端到端的自动驾驶实现非常重要模型对端到端的自动驾驶实现非常重要请务必仔细阅读报告尾部的投资评级
46、说明和声明行业行业深度报告深度报告资料来源:商汤官网,知乎小小将,太平洋证券大模型赋能智驾大模型赋能智驾GPT:“语言语言+视觉视觉+雷达雷达+地图地图+定位定位”或将赋能多模态感知或将赋能多模态感知21图:当输入图像时,图:当输入图像时,GPT-4可以生成理解图像的文本回答可以生成理解图像的文本回答图:商汤认为在通用大模型加持下,通用图:商汤认为在通用大模型加持下,通用AI时代人可以通过时代人可以通过语言语言和模和模型互动,人的反馈有助于提速自动驾驶的新技能解锁。型互动,人的反馈有助于提速自动驾驶的新技能解锁。“多模态大模型”或能“多模态大模型”或能显著提升感知效率显著提升感知效率CONTE
47、NTS目目 录录目目 录录特斯拉的特斯拉的FSD时刻时刻AI赋能,加速赋能,加速Robotaxi无图城市无图城市NOA重新定义智能汽车重新定义智能汽车投资建议投资建议风险提示风险提示0102030405请务必仔细阅读报告尾部的投资评级说明和声明行业行业深度报告深度报告特斯拉率先定义特斯拉率先定义,引领国内新势力布局不依赖高精地图的城市引领国内新势力布局不依赖高精地图的城市NOA,当前量产方案处于有图向无图的过渡期当前量产方案处于有图向无图的过渡期。特斯拉率先推送高速特斯拉率先推送高速NOA:特斯拉于2016年10月率先推出高速NOA(Navigate on Autopilot)功能,定义了高级
48、自动驾驶的进阶方向。2020年末起,蔚来、小鹏、理想相继向客户推送高速NOA。城市城市NOA重新定义智能汽车:重新定义智能汽车:特斯拉于2020年10月,首次向早期访问程序测试人员发布了其FSD BETA测试版,支持在城市道路使用NOA,标志着汽车智能水平的重新定义。2022年末,小鹏作为国内首家向广州用户推送了城市NGP。2023年3月,理想计划现在起all in自动驾驶,李想表示,“到2024年,有无城市NOA,将会像买了20-30层高层,有电梯和没电梯的区别。”理想表示,不依赖高精地图的城市NOA将会在2023年末落地百市,并于6月开启城市NOA(无图)内测。2023年5月,装配华为AD
49、S2.0的问界实现无图城市NOA,2024年2月,小鹏推出无限XNGP,紧跟华为实现全城市无图NOA。资料来源:各公司官网,维基百科,太平洋证券特斯拉特斯拉FSD,引领无图城市引领无图城市NOA重新定义智能汽车重新定义智能汽车23图:特斯拉及国内新势力图:特斯拉及国内新势力NOA进程进程宣布EA选装包推出标志性功能“Navigate on Autopilot”,它允许机器控制在受控高速公路上从入口匝道到出口匝道,无需驾驶员操纵即可改变车道,并且可以从一条高速公路换道到另一条高速公路,然后成功驶出。2016年10月2017年1月和2月2020年10月2021年1月2021年11月2022年HW2
50、 车辆更新了软件版本 8.0,其中包括在高速公路和城市道路上的Navigate on Autopilot和自动转向、车道居中,最高时速限制为 72公里/小时。特斯拉首次向早期访问程序测试人员发布了其 FSD BETA测试版,支持在城市道路使用NOA。FSD测试测试版 FSD 软件的员工和客户人数接近 1000。截至2022年7月,FSD 测试版已行驶 3500 万英里。同年11月,FSD 测试版向所有购买该选项的北美车主开放。特斯拉NOA历程参与 FSD BETA 的用户增加到 60000。国内新势力NOA历程小鹏推送高速NGP(Navigation Guided Pilot)小鹏国内首家推送