1、云服务新引擎,高效驱动自动驾驶数据闭环发展白皮书亿欧智库 https:/ reserved to EO Intelligence,September 2023亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)前言自动驾驶发展已进入“下半场”,高等级自动驾驶将逐步迈进现实,海量数据处理及高效挖掘成为企业必须解决的头等难题,数据闭环因此越来越受到重视,主机厂及 Tier1 纷纷搭建
2、起了自己的数据闭环体系。与此同时,大模型的爆发赋予了自动驾驶更多想象空间,并成为数据闭环发展的充要条件。然而,无论是高效数据闭环构建还是大模型赋能,都仍处在发展初期,技术演进留有空白,竞争格局未有定数。行业内众参与者百舸争流各显其长,纷纷入局。在此洪流中,云服务商因其智能化的基因与强大的数据处理能力,成为了现阶段自动驾驶产业发展的重要力量,以“第三方服务商”的身份与自动驾驶产业“双向奔赴”。通过云底座核心能力和云端大模型深度赋能数据处理全流程,构建全栈式自动驾驶开发平台,为主机厂、Tier1等企业提供更智能、更高效率的数据及AI服务,强化数据驱动能力,加速数据闭环,助力客户实现自动驾驶开发降本
3、增效和量产落地。亿欧智库联合华为云共同发布白皮书,深入洞察自动驾驶数据闭环发展,详细拆解数据闭环各环节,从技术、产品、商业模式等多个角度,分析数据闭环发展现状,同时探索具备专业积累及强大感知、计算、处理、存储等能力的云服务商可赋予各环节的价值。在高速发展的中国汽车产业背景下,车企及相关供应商应进一步开放合作,携手共建盛世繁荣的产业生态。u 云服务新引擎,高效驱动自动驾驶数据闭环发展白皮书核心观点u 云服务新引擎,高效驱动自动驾驶数据闭环发展白皮书简介中国智能汽车逐步向高等级自动驾驶发展,数据驱动开发模式下,构建高效数据闭环刻不容缓;自动驾驶数据闭环发展主要面临海量数据处理能力弱、基础设施研发成
4、本高和数据安全合规保障难三大挑战。云服务商凭借高效的计算、存储、训练、网络通信等能力赋能数据闭环,为自动驾驶研发提供完整有效的解决方案;云服务搭载大模型深度赋能数据闭环各个环节,如clip内容理解、自动标注、加速模型训练、生成高质量训练场景库与仿真场景库等;华为云从技术、服务、生态三方面构建自动驾驶数据闭环新范式。通过全面接入大模型、搭建底层AI算力,并提供模块化合作服务模式、助力中国车企出海,未来将进一步通过路端大生态的打通,构建基于云服务更大的数据闭环。2亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(
5、181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)目录C O N T E N T S自动驾驶发展机遇与挑战1.1 自动驾驶产业发展洞察1.2 自动驾驶产业发展面临新挑战1.3 自动驾驶发展需要更加高效的数据闭环01云服务赋能自动驾驶数据闭环2.1 自动驾驶数据闭环发展痛点分析2.2 自动驾驶数据闭环需要云服务赋能2.3 云服务加速数据闭环各环节高效运转2.4 自动驾驶数据闭环产业图谱及分析02云服务助力构建自动驾驶数据闭环新范式3.1 云服务助力构建自动驾驶数据闭环新范式综述3.2 云服务助力构建自动驾驶数据闭
6、环新范式解析03亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)目录C O N T E N T S自动驾驶发展机遇与挑战1.1 自动驾驶产业发展洞察1.2 自动驾驶产业发展面临新挑战1.3 自动驾驶发展需要更加高效的数据闭环01云服务赋能自动驾驶数据闭环2.1 自动驾驶数据闭环发展痛点分析2.2 自动驾驶数据闭环需要云服务赋能2.3 云服务加速数据闭环各环节高效运转2.4 自
7、动驾驶数据闭环产业图谱及分析02云服务助力构建自动驾驶数据闭环新范式3.1 云服务助力构建自动驾驶数据闭环新范式综述3.2 云服务助力构建自动驾驶数据闭环新范式解析03亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库:自动驾驶产业发展速度示意图5u 自动驾驶产业经过高速发展已进入逐步泛化阶段,高等级自动驾驶正逐步落地,海量数据处理与多元场景应用成为未来产业发展的核心。
8、也正是因为数据量的累积,对算力、算法以及商业模式提出考验,大模型的研发与应用恰逢其时,将从用户体验、技术研发等多个方面赋能自动驾驶产业发展。信息来源:华西证券、中金证券、亿欧智库1.1.1 自动驾驶发展进入下半场,技术逐步向高等级自动化发展领先试水创新起步逐步泛化广泛应用,跨越升级2009201320182023高速发展2015p 谷歌启动自动驾驶项目p 奥迪、宝马、福特等布局无人驾驶p 百度成立自动驾驶团队p 图森未来、智行者等公司成立p Waymo开始Robotaxip Uber无人驾驶汽车上路试验p 阿里、滴滴设立自动驾驶部门p 文远知行、小马智行、Momenta等公司成立p 华为成立智
9、能汽车解决方案业务单元p 多家自动驾驶企业陆续在北京、广州、深圳、长沙等地开始商业化测试p 四维图新获国内首个L3以上高精度地图订单p 华为发布鸿蒙车载OS系统;百度L4巴士量产p 头部企业开始投放L4Robotaxi运营p 城市NOA加速规模化应用p 高等级自动驾驶逐步落地应用自动驾驶从实验室转向商业研发,少数头部开始布局自动驾驶,代表技术包括:ACC(自适应巡航)、AEB(自动紧急制动)等步入平稳发展阶段,逐步转向高速、矿山、港口等封闭/半封闭场景应用,代表技术包括:HWP(高速驾驶引导)、TJP(交通拥堵领航)、NOA Highway(高速领航驾驶辅助)等进入快速发展阶段,电动化成为行业
10、竞争焦点,代表技术包括:APA(自动泊车辅助)、APO(自动驶出)、HWA(高速驾驶辅助)等智能化成为竞争焦点,大模型等技术发展助推自动驾驶迈向新的阶段,代表技术包括:NOA City(城区领航驾驶辅助)、AVP(自动代客泊车)等2023年,城区自动驾驶成为主要发力方向,多家Tier1、科技企业发布应用于自动驾驶和智能座舱的大模型,通过深度学习与反复训练,助推高等级自动驾驶。百度商汤毫末智行阿里科大讯飞华为中科创达OpenAI自动驾驶算力增长速度曲线自动驾驶产生数据增长速度曲线2013202320301TOPS10TOPS100TOPS5000TOPSPB级EB级亿欧智库:自动驾驶数据及算力增
11、长速度曲线示意图TB级500TOPS大模型势头正盛,助推自动驾驶向高等级发展自动驾驶发展前期,数据量从TB级增长至PB级,数据增长速度快于算力。中后期随着AI大模型的发展,算力等级将高速提升,远快于数据增长速度。远期,随着AI技术的成熟,数据将创造更多的数据,算力应与AI技术良好结合,才能发挥出最优解。数据与算力互促互进,助推行业智能化发展亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(1
12、81775)6u 软件定义汽车如今已经成为业内共识,智能汽车软件系统持续快速更新迭代。以特斯拉为例,其智驾系统经历了数次更新迭代,近期FSD升级版也即将面向中国开放。另一方面,在“重感知轻地图”的争议之下,BEV融合方案的出现赋予了不依赖高精地图的更大可能。亿欧智库注意到,国内自主品牌已经纷纷开启L4级自动驾驶量产落地计划,向城市级应用进发。信息来源:公开资料、亿欧智库1.1.2 汽车系统快速迭代,高阶智驾方案量产加速布局近两年,自主品牌已全面以高阶辅助驾驶功能作为其品牌智能化主打特色,并进行相关战略部署,这也意味着市场即将迎来以NOA为主打的高阶智驾功能的量产落地。自主品牌202120222
13、02320242025长安L2L2.5L2.9L4长城L2.5L2.9L4比亚迪L2L2.5L2.9L4一汽L2.5L3L4吉利L2.9L3L4广汽L2.9L4北汽L2.5L2.9L4上汽L2.5L2.9L4奇瑞L2L2.5L2.9L4东风L2.9L4亿欧智库:部分自主品牌车企智驾功能量产落地规划FSD/AP系统AP HW1.0AP HW2.0AP HW2.5FSD/AP HW3.0FSD HW4.0上线时间2014.092016.102017.082019.042023 H2(E)处理平台/主芯片Mobileye Eye Q3Nvidia Drive PX2Nvidia Drive PX2+
14、Tesla FSDTesla FSD 2代算力(Tops)0.2562020144(双芯片)预计性能将是HW3.0三倍左右功耗(W)25250300220图像处理能力(fps)361101102300亿欧智库:特斯拉自动驾驶系统更新周期及FSD版本迭代周期特斯拉自动驾驶系统经历近十年迭代,软硬件都有大幅提升。2023年5月,FSD Beta版本更新至11.4.2,对路面检测、切入切出、车道保持等功能进行优化。FSD入华也随着内外部条件的成熟而变得更加有可能性,将进一步刺激中国消费市场对高等级智驾的接受度。汽车智驾系统快速发展,BEV融合方案助力城市NOA规模化落地 近几年,“重感知轻地图”的争
15、议一直未有定论,随着BEV方案的出现,车企看到了不依赖高精地图的可能性,即通过GPS、IMU、轮速计以及导航地图,实现精准定位;通过BEV+Transformer,提升车辆感知和决策能力。摄像头激光雷达毫米波雷达结果输出映射到统一坐标系下融合原始数据特征提取原始数据特征提取原始数据特征提取训练学习轮速传感器IMU提供全局视野:俯视图视角少有遮挡,算法也可以对被遮挡区域进行预测,同时引入时序信息,让感知结果更连续稳定特征级融合:减少层层处理以及先验规则带来的信息丢失,让多模态数据特征在同一空间中融合,信息关联性更强4D数据:静态道路信息与动态道路参与方统一在同一个坐标系下,通过实时感知与转换,在
16、行驶中即可实时生成“活地图”亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)“建设数据要素创新研究院,支持数据驱动的科学研究。探索打造数据训练基地,促进研发自然语言、多模态、认知等超大规模智能模型。”关于更好发挥数据要素作用进一步加快发展数字经济的实施意见自动驾驶大模型DriveGPT示范应用:毫末智行、长城汽车城市大脑大模型示范应用:科大讯飞、中科大脑公司北京市科委、中关村
17、管委会发布北京市首批人工智能行业大模型应用案例进一步完善网联基础设施加快C-V2X、路侧感知、边缘计算等基础设施建设,建立基于边缘云、区域云和中心云三级架构的云控基础平台,形成统一接口、数据和通信标准,提升网络感知、云端计算能力深化测试示范应用启动智能网联汽车准入和上路通行试点,组织开展城市级“车路云一体化”示范应用,支持L3及更高级别自动驾驶功能商业化应用支持关键技术攻关支持重点大企业牵头,大中小企业参与,开展跨行业跨领域协同创新。加快关键芯片、高精度传感器、操作系统等新技术新产品的研发和推广应用,提升产业发展内生动力u 发展新能源汽车同时还具有高度的战略意义。中央及地方多方位立体式引导新能
18、源汽车产业各环节高质量发展,进一步延长新能源汽车车辆购置税减免政策至2027年底,从供需两端推动产业迭代升级。“车-路-云”一体化融合发展也将成为未来产业推进的关键所在,完善的云控基础平台及云端计算能力,能够从多方面推进智能网联以及高等级自动驾驶大规模、高质量发展。u 具体到城市层面,国内多个城市已开辟路测及试点区域,对道路设备进行装配升级,推动智能网联汽车落地应用。芯片、云基础设施、操作系统、大模型算法等关键技术的研发均受到城市级关注。国外相关政策也积极推动自动驾驶城市级应用的落地推广。7信息来源:公开资料、国务院新闻办、各城市智能网联汽车测试工作小组、亿欧智库1.1.3 政策引导助推自动驾
19、驶产业升级,城市落地验证新兴技术应用发展全国已建成17个测试示范区、16个“双智”试点城市、7个国家车联网示范区完成了7000多公里道路智能化升级改造,装配路侧网联设备7000余台套2022年具备组合辅助驾驶功能的L2级乘用车新车渗透率达到了34.5%2023年6月21日国务院政策例行吹风会:促进新能源汽车产业高质量发展国内外自动驾驶相关落地政策及城市应用最新进展英国允许无人驾驶汽车商用:2023年6月,英国初创公司Imperium Drive推出无人驾驶汽车租赁项目,该项服务通过操作员远程驾驶将待租车辆交付给用户,这也是英国首次允许无人驾驶汽车商用硅谷Robotaxi不受限运营:2023年8
20、月,加州议会的公共事务委员会宣判,允许谷歌旗下Waymo和通用旗下Cruise的Robotaxi在旧金山不受限制载客。7x24小时、区域不限、全无人、可收费北京开放路网里程:1143.8 km发放牌照:600+个上海开放路网里程:1800.0 km发放牌照:600+个广州开放路网里程:1749.8 km发放牌照:220+个深圳开放路网里程:201.4 km发放牌照:260+个武汉开放路网里程:1500.0 km发放牌照:200+个长沙开放路网里程:317.0 km发放牌照:55+个重庆开放路网里程:1486.8 km发放牌照:60+个亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)
21、亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)8u 中国车企出海已经不止于面向海外售卖整车及零部件产品,而是进入价值链全球化进程,在云服务的加持下,通过技术出海、服务出海、品牌出海、生产出海等多种方式,中国品牌以产品、服务及投资在全球各区域打造多样化服务生态圈,有望实现汽车生态的落地生根。信息来源:乘联会、中国海关总署、公开资料、亿欧智库1.1.4 国际市场逐年拓展,汽车及相关供应链企业出海大势在即主机厂动力电池车载雷达能源服务智能
22、座舱自动驾驶智能网联云服务软件基础设施后市场内饰整车出海,带动“全链”,电动化、智能化多领域迈向国际市场随着中国汽车工业的发展,主机厂出海越来越多,以技术、服务、品牌出海等方式,主动“走出去”,成功打响国际化品牌。在主机厂的带动下,多个相关细分领域也向海外市场延伸。自动驾驶、智能座舱、智能网联、动力电池、软件、车载雷达等,作为智能汽车的核心部分,都跟随整车出海,在国际市场上形成了一定的影响力。云服务商在中国汽车企业出海之路上搭建云端“基础设施”,以保证数据快速传输、高效存储,并为中国汽车产业链企业出海提供安全合规保障。亿欧智库:2018-2022中国纯电动、插电混动乘用车出口额及纯电动出口额占
23、比13361095561,363931689317139.6%45.6%61.7%85.7%88.9%2018年2019年2020年2021年2022年纯电动乘用车(亿元)插电式混合动力乘用车(亿元)纯电动乘用车出口额占比亿欧智库:部分自动驾驶企业出海事件p百度、SB Drive、金龙客车三方合力于2018年开发日本版“Apolong”;2022年,百度在美国加州进行自动驾驶出行测试里程已达3986km;p比亚迪、极氪、蔚来、小鹏等新势力车企都相继于2020年、2021年布局海外市场,并逐年加码;p宁德时代、中创新航等动力电池企业也较早布局海外;p速腾聚创等激光雷达企业自2021年就已开始出海
24、;p毫末智行成为中国首个AEB算法落地海内外的公司;p芯驰、纳芯微等诸多半导体企业都已开启海外业务布局;p华为云、腾讯云、阿里云等云厂商通过提供安全合规服务及自动驾驶数据相关服务助力车企出海;p盛弘股份、道通科技等能源服务企业稳步发展全球业务;p文远知行于2023年7月拿到中东首张国家级牌照亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)9u 如前述分析,在技术、商业、政策、
25、出海等多维度的推动下,自动驾驶产业近些年发展迅速,已迈向产业发展阶段的“下半场”,大量的数据收集与应用支撑产业的高速发展,未来很长一段时间,自动驾驶产业的竞争重点将聚焦在基于海量数据之上的智能化及量产落地上。1.1.5 多维因素助推自动驾驶产业迈向高等级发展阶段n 大模型势头正盛,AI技术加速助跑n 数据与算力互促互进,助推行业智能化发展n 头部企业领军智驾系统快速迭代n BEV融合方案助力城市NOA规模化落地,促进自动驾驶城市级应用技术“奠基”政策“助推”量产“加速”n 国内外政策引导高等级自动驾驶发展,助推L3及以上自动驾驶落地n 国内外城市级应用落地促发展出海“拓展”n 以主机厂为主整车
26、出海,树立品牌n 带动自动驾驶全产业链出海,电动化、智能化多领域迈向国际市场自动驾驶迈向高等级发展阶段,大规模城市级落地将成未来重点亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)10u 随着自动驾驶的级别提高、应用范围扩大,数据量急剧提升,相应的训练、传输、存储成本也大幅提升。海量数据规模以及自动驾驶性能提升,不仅对数据处理的效率提出要求,同样也为安全保障带来巨大挑战。信息
27、来源:自动驾驶数据安全白皮书(2020)、亿欧智库1.2 数据处理问题成为高等级自动驾驶需要解决的“头等难题”数据处理挑战数据采集难标注要求高模型训练久传输存储贵标准不一致安全要求高流动性多样性规模性非结构性涉密性包括汽车基础数据、基础设施、交通数据、地理信息数据以及大量车主的身份信息、状态数据、行为数据等融合来自汽车、道路、天气、用户、智能计算系统等多方面海量数据,类型众多,总量大不同来源数据格式不同,数据的非结构性和非标准性对数据聚合或拆分技术以及权限管理和安全存储带来挑战大量数据在用户端、车端、云端等多场景交互,且具有跨行业共享交换特点涉及大量地理信息数据,可能涉及涉密测绘成果,需要依法
28、分级管理高等级自动驾驶数据特点采集数据需要具备甲级或乙级图商资质并获得审批许可,采集门槛较高,复杂多变的驾驶场景与操作数据对采集的量级和有效性都提出挑战复杂长尾场景不断增加的前提下,高质量数据要求增加了标注及处理数据的难度。传统的人工标注成本高、效率低,无法支撑快速的Conner case训练算法训练需要有效的数据、丰富的场景、完备的模型,在此基础上需重复训练。但目前很多模型加载慢,训练时间长,由此导致模型迭代慢,市场缺乏成熟高效的训练模型数据去噪、清洗、统一格式、标注、处理等各步骤由不同企业执行,难以通过统一任务需求进行引导,因而口径不一,易造成信息损耗、数据丢失等情况感知、判断、决策、执行
29、等各模块间每秒数据传输量达数GB,车端与云端间同样要求稳定、高效的传输,由此产生的数据存储与流量费用十分可观道路、环境、司机、乘客等数据都有安全要求,未来在城市级铺开后,经过敏感地区所取得的信息若不能脱敏处理与安全托管,就有可能存在遭泄漏或篡改风险,造成安全隐患亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)环节流程完整、数据全程跑通、真值不丢失、反复循环进行训练,实现不断地
30、、持续的数据循环11u 从车端数据采集,到处理后形成有效数据集,再通过云服务器进行存储、运输,经过算法模型训练、验证后,将有效数据成果部署上车,各环节相互连接,形成自动驾驶数据闭环。未来发展成熟的数据闭环能够有效提高数据传输、处理效率,增强可控性,同时数据安全也更有保障。信息来源:亿欧智库1.3.1 高效挖掘、有效利用是自动驾驶面对海量数据的必选项,数据闭环因此逐步落地亿欧智库:自动驾驶数据闭环图示采集传输存储处理清洗训练标注验证部署仿真自动驾驶数据闭环数据集智能电动汽车云服务器算法模型亿欧智库:成熟的自动驾驶数据闭环特征流程自动化完整有循环处理效率高通过专业测试车队和社会化量产车辆采集其行驶
31、数据、位置轨迹、路况数据、场景数据等多种数据信息,处理形成数据集,经过清洗、标注等,基于智能云底座进行传输、存储等操作,结合仿真场景,在输入-训练-部署-验证的循环反复中,对自动驾驶算法进行迭代和升级,覆盖更多corner case,推动自动驾驶解决方案向成熟进阶,提升自动驾驶能力的快速闭环迭代,加速自动驾驶规模化量产落地。亿欧智库:自动驾驶数据闭环定义海量数据与算法能够双向赋能,以算法处理数据,数据训练算法,有效循环、高速迭代成熟的数据闭环将更多的使用自动化工具和算法对数据进行处理、清洗和转换,以减少人工干预亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(1817
32、75)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)12u 自动驾驶数据闭环建设并非一日之功,从仅限在少部分的测试车上开始,闭环通路1.0就已经初步构建完成,能够实现简单的问题反馈循环机制;随着技术的升级,自动驾驶进入高等级发展阶段,数据闭环的打造也顺势升级进入2.0阶段;未来,将向大规模量产的3.0阶段发展。u 如今,中国自动驾驶数据闭环已经走过了初步构建的第一阶段,正处于数据高效驱动的第二阶段,未来向搭建生态、催生商业化的第三阶段进发。随着阶段推进,处理数据
33、能力与自动化运转能力大幅提升,产业协同更加高效,云服务商扮演更重要的角色,支撑新的商业生态建设。信息来源:亿欧智库1.3.2 技术发展推进数据闭环不断升级,大数据与多场景逐步落地应用亿欧智库:自动驾驶数据闭环发展三阶段1.0阶段:2013-2017闭环通路初步构建2.0阶段:2018-2024数据驱动闭环升级3.0阶段:2025-2030场景催化商业落地自动驾驶数据闭环初步建立出现问题上传错误数据分析问题重写代码测试上线自动驾驶发展初期的数据闭环较为简单,只是简单的通路构建,主要在测试车上发现问题并上传,由工程师们分析错误报告,以找出问题原因,进而修改代码并在下次更新后予以解决。这是传统的、简
34、单的数据闭环,但效率不高,多个环节需要人工辅助。随着技术的进步和自动驾驶等级的发展,传统的数据闭环不能适应快速迭代的产业和指数级增长的数据量。这一阶段,面向更大规模数据的闭环及相应技术和服务被车企及供应商广泛应用。大规模训练大规模仿真大规模标注高频率部署大规模采集未来,自动驾驶数据闭环将进一步更新升级,逐步从测试车小规模量产大规模量产,面向多样化场景都能够流畅、安全的赋能自动驾驶,从车、路、云多端助力自动驾驶的终极实现。自动驾驶数据闭环生态体系z测试场景应用高速场景应用低等级自动驾驶场景量产应用城市级高等级自动驾驶场景量产应用云服务赋能车端闭环路端闭环201320182025亿欧智库-韩宇(1
35、81775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)目录C O N T E N T S自动驾驶发展机遇与挑战1.1 自动驾驶产业发展洞察1.2 自动驾驶产业发展面临新挑战1.3 自动驾驶发展需要更加高效的数据闭环01云服务赋能自动驾驶数据闭环2.1 自动驾驶数据闭环发展痛点分析2.2 自动驾驶数据闭环需要云服务赋能2.3 云服务加速数据闭环各环节高效运转2.4 自动驾驶数据闭环产业图谱及分析02云
36、服务助力构建自动驾驶数据闭环新范式3.1 云服务助力构建自动驾驶数据闭环新范式综述3.2 云服务助力构建自动驾驶数据闭环新范式解析03亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)L1L2L3L4L5原始数据:15-20TB/小时所需空间:3EB+14u 随着自动驾驶级别不断升高,平均所需配备的传感器数量增加,收集到的异构数据类型与规模都大幅增长。而未来所必须的大规模量产车
37、数据,相比测试车而言数量级更大、类型更多,车端所需存储的数据以及提升自动驾驶功能所需训练的数据随之大幅升高。u 在数据量增长之外,长尾数据问题也日渐重要。自动驾驶需要尽可能多地涵盖corner case,算法模型的升级迭代也需要新场景数据的不断投喂,而目前的长尾数据仍有很大一部分尚未覆盖,技术有待提升。信息来源:公开资料、专家访谈、亿欧智库2.1.1 数据闭环随自动驾驶升级挑战剧增,数据量指数级增长、长尾问题仍需突破数据量原始数据:1-2TB/小时所需空间:50-100PB亿欧智库:各等级自动驾驶汽车原始数据及所需存储空间示意图原始数据:200-300GB/小时所需空间:4-10PB原始数据:
38、4-5TB/小时所需空间:500PB-1EB环境天气、地理、道路、行政区划、停车场、充电桩位置及轨迹出租车、乘用车、商用车、手机、共享单车、交通拥堵及事故、热点区域、常驻地点用户身份信息、应用程序使用历史、驾驶习惯、制动习惯、智舱操作习惯、购买行为及偏好、职业年龄及教育水平、交通事故违规记录、维修保养信息车门状态、车内温度、胎压、雨刮器状态、油量/电池信息、电机速度,车灯/雾灯状态、传感器数据用户数据车辆数据当前业内普遍形成共识,自动驾驶的底层架构和大部分技术问题已经被解决,但由于现实道路场景复杂,即使现有技术已经实现绝大部分场景的自动驾驶,剩下的少数长尾场景始终无法覆盖。长尾数据问题是高等级
39、自动驾驶的核心问题数据尚未形成完整闭环,成了制约自动驾驶向高等级发展的最大难题。因此采集最后10%“极端工况”的长尾数据,让真正有用的数据被利用起来,才是数据闭环下一步应该具备的能力,也是高等级自动驾驶成败的关键点之一。90%驾驶场景复杂程度驾驶场景出现频率常见行驶场景:路况简单、易应对,出现频率高极端行驶场景:路况复杂、响应要求高,出现频率低亿欧智库:自动驾驶长尾数据示意图亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩
40、宇(181775)亿欧智库-韩宇(181775)u 自动驾驶数据驱动开发模式下,基于大数据技术的数据管理与基于机器学习的模型训练密不可分,数据闭环天然依赖数据与AI相互支撑、相互赋能,共同加速数据闭环,数字化与智能化融合已成为必然趋势。然而产业发展初期数据平台与AI平台仍呈割裂状态,相互赋能的正向循环未能构建起来。信息来源:公开资料、亿欧智库2.1.1 数据增长速度与处理能力不匹配,AI平台发展初期仍存“数”“智”割裂难题数据平台AI平台原本应紧密相连的数据平台与AI平台仍处割裂状态AI平台需要大规模准确数据哺育数据资源的优劣极大程度决定了AI应用的落地效果。过去企业自身搭建的传统数据治理体系
41、,多停留在对于结构性数据的治理优化,在数据质量、数据字段丰富度、数据分布和数据实时性等维度尚难满足AI应用对数据的高质量要求大量数据未被利用与托管自动驾驶等级越来越高,量产应用规模越来越大,采集、存储、加工等多个环节均有大量数据未被有效利用及托管,因此无法激活数据要素的潜能,原本应具有极高价值的数据不能完全兑换其价值15算力数据平台算法平台/AI模型数据的数量和质量算力规模亿欧智库:自动驾驶技术发展三要素自动驾驶在数据驱动模式下,海量数据、大规模算力与算法平台/模型是最为重要的三大元素,三者相互支撑、紧密相连。技术割裂自动驾驶数据闭环主要由数据管理和算法模型两部分组成,前者基于以大数据技术为核
42、心的数据平台,后者基于以AI机器学习技术为核心的AI平台,两者技术路线并不相同,易产生技术割裂数据孤岛自动驾驶数据类型繁多,数据格式各不相同,存储方式及管理方式亦不相同;多元异构数据使数据仓库、数据湖、AI数据等数据之间形成孤岛不可能三角自动驾驶数据闭环追求更大数据量、更低存储成本、更高计算效率,而这在传统架构中是无可实现的不可能三角问题治理困难从数据采集到模型训练再到仿真测试,数据闭环中数据生命周期漫长,导致数据极具复杂性,管理难度高、资源消耗大,且模型训练前的数据准备工作耗时耗力自动驾驶在向高等级发展的过程中,极速增长的数据带来了一系列处理难题亿欧智库-韩宇(181775)亿欧智库-韩宇(
43、181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)数据采集数据传输数据存储数据处理模型训练场景仿真测试评估部署L2L3L4最小车辆数最小里程数测试场景数2000+10亿公里10亿+200+1亿公里1000万+10+1000万公里10万+6-1010万公里1万+3-51万公里1000+2-31千公里100+16u 自动驾驶成本既包括解决长尾问题的研发成本,也包括相应的数据成本。在收集长尾数据、训练自动驾驶能力的过程中,硬件设
44、备的改装维修、算法模型的更新迭代、研发人员的雇佣维护以及海量数据带来的传输和存储都形成了数以百万、千万计的成本。而车企在不断冲刺高等级自动驾驶的同时,累积越来越多的里程与测试数据,进一步提高了发展成本。信息来源:专家访谈、亿欧智库2.1.2 数据处理需要大量资源及技术投入,研发与应用成本齐飙亿欧智库:高等级自动驾驶数据闭环各环节资源与成本消耗曲线采集车维护工程师成本数据压缩加密通信带宽费用存储空间费用 大量标注成本数据挖掘算法自建数据中心成本算法研发成本地图开发采购场景仿真搭建研发人力成本数据集群搭建 系统OTA传输亿欧智库:自动驾驶不同等级预估最小测试数据研发成本人力成本时间成本运维成本应用
45、部署成本 业内普遍认为,自动驾驶要到能够量产、足够安全需要积累约110亿km的里程,而拥有世界上最大无人驾驶车队的waymo十年才实现了3500万km;业界普遍认为开发自动驾驶平台理论上需要3个月,采集、标注、训练等环节都需要大量的时间成本 高级别工程师:算法模型需要工程师不断维护迭代 大量操作人员:标注等尚未完全自动化的环节,需要大量的操作人员雇佣成本(一天标50万张图/千人团队,人工成本3个月接近1000万元)自动驾驶汽车需要高频的更新与运维,包括海量数据存储、软件系统迭代、运维基础设施、硬件设备运维(假设一辆测试车采集到10TB的全部原始数据都存储,一年的成本将超过800万美元)自动驾驶
46、数据驱动研发环节多,需针对性设计开发工具,如数据挖掘工具、建模工具、仿真场景库搭建工具等(自建算力中心的初期投入预算普遍超过亿元,相关AI模型的成本如GPT-3训练费用超过1200万美元)功能开发过程中软件硬件适配、调试工作也需要很大的成本 海量数据在车端、云端上下传输,对实时性、带宽、稳定性都有极高要求;例如,L4-L5级自动驾驶汽车的所有数据传输到云端的成本高达数千美元成本主要在模型训练集群其次是仿真集群、数据存储以及数据处理与标注亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-
47、韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)17u 自动驾驶数据量级越大、涉及面越广,其安全隐患就越大。在多层级处理、流动中都暗含大量安全风险,一旦数据被攻击、窃取、篡改,将对企业、公民、社会乃至国家安全造成损害。信息来源:自动驾驶数据安全白皮书(2020)、亿欧智库2.1.3 海量数据类型复杂,各层级均存在安全风险隐患高等级自动驾驶数据安全要求严格恶意节点攻击(传感器节点与云端接口间、通信总线与ECU间缺少认证保护机制)内外传输风险(内部交互易阻塞或被篡改,导致反馈不及时,外部交互易受到窃听或攻击,泄露地理信息、敏感数据等)通
48、信协议风险(多种网络接口的通信协议安全漏洞威胁传输安全,可能遭到破解窃取)通信层平台安全风险(不同类型、不同级别的自动驾驶数据汇聚,数据价值较大,易成为攻击焦点)大数据处理风险(海量数据未经细粒度访问控制,可能被滥用,未经分类隔离、分级防护,数据融合易引发隐私泄露)隐私泄露风险(地理信息、个人隐私、商业化测试数据、仿真场景化数据、高精地图等可能流转外泄)越权访问风险(越权访问或滥用权限,非法获取造成数据破坏,篡改未加密升级包,阻止车辆安全漏洞、风险的修复)系统/软件漏洞(恶意修改平台系统及应用软件,获取用户隐私、驾驶数据甚至车辆控制权,降低车辆安全性、稳定性)平台层决策/控制安全(数据遭窃取或
49、篡改后,可用性和完整性被破坏,造成车辆失窃或失控)测试/仿真安全(遭到篡改导致数据集准确性降低,影响功能的安全性和可靠性)个人信息安全(越权访问、存储导致数据泄露,可能导致车辆被盗或被非法控制)应用层采集设备安全(测试车辆二次改装易造成组件丢失损坏,改装设备一致性差、性能不稳定)路测基建安全(路端基础设施改造成本巨大,数据安全防护机制设计部署不足)感知数据完整(传感器可能受到干扰而失灵,造成感知数据识别错误或污染,采集过程可能受到阻断)采集层亿欧智库:自动驾驶各层级数据安全风险用户隐私数据、测试场景数据、人机交互数据等不泄露给未授权的个人、实体、进程,并保证其不被利用。机密性自动驾驶决策控制数
50、据、动态交通环境数据等未被更改或破坏,保证车辆信息数据的正确生成、存储和传输。完整性已授权的个人、实体一旦需要就可以访问和使用自动驾驶数据和资源。可用性亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)亿欧智库-韩宇(181775)u 云服务从数据出发,综合云底座基础能力,尤其通过赋能大模型,对健全开发工具链提升自动驾驶研发效率,促进自动驾驶功能迭代落地,帮助企业实现降本增效和商业闭环,遵从法律法规保障数据