资源描述
2025汽车人工智能应用案例集联合牵头单位中国汽车工程学会人工智能分会国家智能网联汽车创新中心中国汽车战略与政策研究中心中国智能网联汽车产业创新联盟人工智能工作组协同单位中国汽车工程学会汽车智能座舱分会中央汽车企业数字化转型协同创新平台引言I N T R O D U C T I O N当前,汽车产业已进入智能化竞争下半场,2025年1月7月我国L2级乘用车新车累计销量达775.99万辆,渗透率高达62.58%,同比增长6个百分点,智能网联汽车发展进入快车道。在汽车智能化发展浪潮中,人工智能成为推动行业发展的重要力量。人工智能技术在汽车领域的应用呈现出“全域渗透、全链赋能、全线升级”的显著特征,正在深度赋能并将持续赋能汽车产品智能化和汽车产业数智化,与汽车产品和汽车全产业链广泛融合、深度融合。在人工智能赋能汽车驾驶自动化方面,端到端架构成为行业发展共识,通过将传统功能模块整合到一个神经网络中,实现了从传感器数据到车辆控制指令的直接映射。驾驶自动化的算法架构持续简化,规则算法持续减少。结合大模型技术的应用,对长尾场景的应对能力得到显著提升。在人工智能赋能汽车座舱智能化方面,智能座舱深度融合语音识别、自然语言处理、计算机视觉、多模态大模型等人工智能技术,以用户体验为核心,构建了多模态交互与个性化服务框架,人机交互模式由被动响应转变为主动交互,智能座舱向智能体方向发展。在人工智能赋能汽车研发生产方面,传统的汽车研发生产方式正在被快速颠覆。在人工智能、数字孪生等技术协同作用下,推动了研发流程从经验驱动转向数据驱动,显著缩短开发周期并降低试错成本;同时推动了柔性制造体系构建,支持多车型混线生产,显著提升工厂自动化和智能化水平。为进一步推动跨行业跨领域的技术交流与创新实践,推动人工智能技术在汽车领域的深度融合与创新应用,开展本案例集征集和编制工作。自3月启动征集以来,得到行业各界广泛关注。在此,对所有支持单位和提供宝贵意见和建议的专家表示衷心感谢!期待本案例集能够为行业提供研究和实践参考,为推动人工智能在汽车领域典型应用作出贡献。2025汽车人工智能应用案例集编委会2025年11月C O N T E N T S目录1驾驶自动化驾驶自动化01商汤绝影:绝影开悟世界模型02Momenta:飞轮大模型03地平线:基于国产大算力芯片的一段式端到端辅助驾驶系统04小马智行:第七代自动驾驶乘用车系统05卡尔动力:多任务深度学习重卡自动驾驶轨迹规划2座舱智能化座舱智能化06东风:多模态大模型赋能智能座舱认知智能07北汽:百模汇创中枢大模型平台创新应用模式08岚图:基于大模型Agent技术的语音交互解决方案09五菱:灵语AI大模型赋能智能汽车座舱升级10思必驰:天琴车载语音助手11星河智联:SYNCORE大模型智能座舱操作系统12博泰:全场景车内外智能感知与交互系统3研发生产智能化研发生产智能化13吉利:星睿智能体平台14T3出行:基于网约车的智能网联众源数据生产线15国家智能语音创新中心:智能座舱人机交互效果评测智能体16一汽:AI智造新范式:全价值链电器工艺数据智能管控平台17小米:汽车超级智能工厂20252025汽车人工智能应用案例集汽车人工智能应用案例集座舱智能化研发生产智能化驾驶自动化0101绝影开悟世界模型绝影开悟世界模型上海临港绝影智能科技有限公司上海临港绝影智能科技有限公司商汤绝影基于多模态大模型打造了绝影开悟世界模型,能够理解物理规则、交通规则,能够生成11V视角、时长150秒、1080P的视频。2023年开始,在Waymo Sim Agents全球竞赛中,“绝影开悟”连续两年获得第一名。“绝影开悟”支持多样化的辅助驾驶场景及Corner case的可控生成。基于1张A100芯片,“绝影开悟”每日生成的数据相当于500台量产车,并在业内率先应用于真值训练数据生产。目前,绝影20%的数据通过世界模型生产,并应用于多个智驾项目。主要能力:主要能力:1 1)面向量产的数据生成面向量产的数据生成“绝影开悟”具有多样性场景的可控生成能力,为模型训练提供了海量且丰富的训练数据。例如,“绝影开悟”能够从100多个维度组合生成万千Cut-in场景,包括不同光照类型、不同天气、不同道路等级、不同车型、不同的Cut-in距离和车辆速度等。此外,能够解决极端风险场景(如车祸、道路塌陷等)难以采集、成本高昂的问题,“绝影开悟”只需输入一段提示词,就可以生成极端风险场景。2 2)复杂场景自由复现复杂场景自由复现根据不同需求,任意修改和调整场景中各种要素。既可替换特定车辆、插入新的车辆、删除不需要的车辆,也可改变道路布局、车辆速度,创造稀缺复杂场景,从而丰富训练场景的多样性。3 3)近实时交互能力近实时交互能力比行业SOTA提升5倍之多,让仿真训练过程更加高效和逼真,车辆的决策和反馈能够几乎在瞬间得到响应;同时感知结果接近真实精标数据98%,能避免因数据风格差异带来的Sim-to-Real迁移时能力退化问题,为端到端模型打造了“云端虚拟训练场”。技术创新点技术创新点实施效果与应用落地情况实施效果与应用落地情况目前绝影20%的数据是通过世界模型生产,并应用于行业首批J6M辅助驾驶方案、绝影一段式端到端方案在东风汽车落地等项目。技术方案技术方案需求分析:需求分析:目前,驾驶自动化的研发范式转为数据驱动,模型对高质量数据需求暴增。特斯拉凭借“百万辆级量产车+超10万petaFLOPS算力”的AI基础设施构建数据回流体系,但其他车企因高阶辅助驾驶量产规模、算力资源受限,难以快速复制该模式,高质量的驾驶数据获取存在难度大、效率低、成本高的问题。世界模型被视为解决车企数据问题的核心技术,保持视频时空一致性是其难点,生成视角画面越多越难,还需克服鱼眼视角畸变,目前行业多生成1V或6V视角视频。“绝影开悟”世界模型能生成11V(含鱼眼和针孔相机)多视角时空一致视频,可灵活满足行泊全集场景需求,兼容适配性强。大模型技术方案:大模型技术方案:商汤绝影基于多模态大模型打造了绝影开悟世界模型,能够理解物理规则、交通规则,能够生成11V视角下、时长150秒、1080P视频。案例概述案例概述商汤绝影在辅助驾驶领域打造的虚实融合的数据范式,将会赋能具身智能领域,以人、物体、场景三者为核心,通过行业领先的大模型技术能力,生成时空一致的第一视角和第三视角数据,为具身智能的构建全新的4D真实世界。0120252025汽车人工智能应用案例集汽车人工智能应用案例集座舱智能化研发生产智能化驾驶自动化0201MomentaMomenta飞轮大模型飞轮大模型魔门塔魔门塔(苏州苏州)科技有限公司科技有限公司Momenta飞轮大模型作为量产智驾大模型,采用了高质量的大模型训练数据+低成本的训练方法,基于“数据驱动”策略,通过海量真实驾驶数据训练算法模型。Momenta基于数据驱动的“飞轮”技术洞察,以及量产辅助驾驶(Mass Production)与自动驾驶(Scalable Robo)相结合的“两条腿”产品战略,提供不同级别的解决方案,更高效快速地实现规模化落地,赋能更安全、便捷、高效的未来智慧出行。Momenta 2024年发布的第五代飞轮大模型创新性地将感知与规划整合为统一模型,实现一段式端到端的深度学习,采用了“长期记忆+短期记忆”相结合的模式,模拟人脑“直觉推理+逻辑分析”的问题处理机制,自动化问题解决率超过95%。极大地提升了辅助驾驶系统的可靠性和稳定性。2025年将推出的第六代飞轮大模型引入了“强化学习+闭环训练”,建立虚拟环境自主探索机制,将进一步带来安全、性能、体验的倍数级提升。持续的技术突破与产品迭代,形成了Momenta的核心竞争力,在实践中发挥着新质生产力驱动创新性可持续发展的关键引领作用。技术创新点技术创新点实施效果与应用落地情况实施效果与应用落地情况Momenta创新一条主线开发支持产品规模化,根据各大主机厂需求灵活打造定制化产品。目前,Momenta定点车型近130余款。预计2028年搭载Momenta飞轮大模型的量产车辆将达到1000万台。Momenta复用量产车型开展 Robotaxi业务,L2和L4采用统一的软件算法架构、统一的传感器方案,能够更早实现Robotaxi的规模化落地和商业闭环,目前计划在北京、上海陆续推出L4业务。技术方案技术方案需求分析:需求分析:产品安全可靠方面:产品安全可靠方面:基于规则驱动的传统方案无法解决自动驾驶的长尾问题,且算法迭代慢,复杂城市场景应对能力不足,未知风险场景难预判,亟需提升在极端场景下的技术可靠性。规模化推广方面:规模化推广方面:高阶辅助驾驶软硬件成本较高,影响向15万以下大众车型渗透,而大众消费者对驾驶自动化功能需求增加。另外,中国进入汽车产业出海关键阶段,智能辅助驾驶作为中国人工智能大模型技术的亮点名片,更需要满足全球不同区域差异化场景的落地,要求较强的泛化能力,兼具高效及成本可控的解决方案。大模型技术方案:大模型技术方案:数据驱动数据驱动+海量数据:海量数据:飞轮大模型作为一段式端到端大模型,能够处理解决基于规则驱动难以解决的极端案例,减少对人工编码的依赖,泛化能力更强,面对未知场景具备更强决策能力。即使在感知模型中没有对应的物体定义,系统仍能做出合理避让,解决长尾问题。同时,飞轮大模型通过量产车辆日均收集超60万个有价值场景,总计超过7000万多场景、多环境、不同天气和光照条件Event数据,覆盖真实场景Corner case,从而减少未知场景和极端场景风险。案例概述案例概述闭环自动化闭环自动化:一段式端到端大模型中自研了大量闭环自动化工具链,连接产品线和数据线,实现低成本、高效率处理海量数据,驱动算法高效率迭代、高质量交付。当前自动化问题解决率已经超过95%,显著降低人工处理成本,加速解决自动驾驶长尾问题。灵活适配灵活适配:飞轮大模型可支持纯电车、燃油车、混动车型等不同能源类型,根据需求及不同车型软硬件配置,覆盖从高端车型到10-15万大众车型。同时“无图方案”加速实现“全国都能开”至“全球都能开”,进入辅助驾驶“标配时代”。0220252025汽车人工智能应用案例集汽车人工智能应用案例集座舱智能化研发生产智能化驾驶自动化0301地平线基于国产大算力芯片的一段式地平线基于国产大算力芯片的一段式端到端辅助驾驶系统端到端辅助驾驶系统北京地平线机器人技术研发有限公司北京地平线机器人技术研发有限公司地 平 线 全 场 景 辅 助 驾 驶 系 统 Horizon SuperDrive(HSD),搭载高性能的国产智芯片征程6P,采用一段式端到端技术架构,是国内先进的软硬结合全栈开发的辅助驾驶系统,涵盖高速、城区和停车场三大场景。征程6P基于自主知识产权设计研发,在计算单元设计和缓存体系设计等底层做了更适应智驾大模型运行的布局,在与软件强耦合运行时,它的计算效率可发挥到最大。HSD体系中的国产大模型采用“一段式端到端+强化学习”的方案,实现了从“光子输入到轨迹输出”的系统超低时延,大幅提升辅助驾驶的安全、效率、舒适。一段式端到端模型技术创新点技术创新点实施效果与应用落地情况实施效果与应用落地情况地平线HSD在变道博弈成功率、复杂路口通行效率等核心指标上与人类驾驶水平相当,正走向“超越人”。实际路测数据显示,较传统方案,HSD的类人性提升50%、路口通行效率提升67%、场景覆盖率达100%。2025年,奇瑞集团官宣成为地平线征程6P及HSD辅助驾驶产品的首发量产合作车企,星途品牌车型搭载HSD全球首发量产。地平线与大众汽车集团在高阶领域展开进一步合作,合作的车辆也将于2026年正式落地。截至2025年12月,地平线HSD已获得国内外10余家车企品牌,20多款车型的定点合作。技术方案技术方案地平线城区辅助驾驶系统(HSD)是国内先进的软硬结合全栈开发的L2城区辅助驾驶系统。硬 件 芯 片 上硬 件 芯 片 上,征 程征 程 6 6P P 高 效 支 撑 大 参 数高 效 支 撑 大 参 数TransformerTransformer、大规模交互式博弈算法大规模交互式博弈算法。征程6P可支持先进算法的丰富算子库,能加速端到端和交互博弈算法的应用普及。具体参数上,征程6P搭载4核BPU纳什,AI算力达560 TOPS;采用LPDDR5存储接口设计,带宽高达205 GB/s。与业内其他主流芯片产品相比,征程6P对Transformer类算法的支持效率FPS提升最高40倍。软件算法上软件算法上,HSDHSD采用真正的一段式端到端架采用真正的一段式端到端架构构,将感知、预测、规划全链路融合进统一模型,实现从光子输入到轨迹输出的系统超低时延,同时具备环境理解、多模态轨迹生成与个性化决策能力,大幅提升辅助驾驶安全、效率、舒适。新范式下的HSD具备四大特征:系统超低时延、更强的防御驾驶能力,横纵向耦合、以及持续的自我进化。“一段式端到端一段式端到端+强化学习强化学习”的策略的策略,为地平线HSD带来了更好的表现面对复杂的城区道路,系统从“传感器画面+导航数据”直接输出动作指案例概述案例概述征程6P基于自主知识产权设计研发,在计算单元设计和缓存体系设计等底层做了更适应智驾大模型运行的布局,在与软件强耦合运行时计算效率可发挥到最优。HSD体系中的国产智驾大模型采用“一段式端到端+强化学习”的方案。基于一段式端到端架构,HSD实现从光子输入到轨迹输出的系统超低时延,大幅提升辅助驾驶的安全、效率、舒适。模型在设计之初就考虑到了征程6P的数据精度支持能力,搭配AI模型工具链实现低精度损失部署上车,软件性能得到最大程度发挥。在能力上,HSD 在响应延时、防御性驾驶、横纵向控车方面性能提升显著,驾乘体验更好。加之强化学习的介入,HSD通过自我探索最大化激发模型潜力。03令,包括变道、左右转和绕行动作,整体行为更连贯。一段式的端到端模型消除了场景切换的拼接感。20252025汽车人工智能应用案例集汽车人工智能应用案例集座舱智能化研发生产智能化驾驶自动化0401小马智行第七代自动驾驶乘用车系统小马智行第七代自动驾驶乘用车系统北京小马易行科技有限公司北京小马易行科技有限公司小马智行成立于2016年,致力于提供安全、先进、可靠的自动驾驶技术和解决方案,实现未来交通变革。小马智行第七代L4自动驾驶软硬件系统方案于2025年4月在上海车展进行全球首发,三款与北汽新能源、丰田汽车、广汽埃安合作的第七代Robotaxi家族车型也集体亮相。通过三家整车厂及上下游芯片、传感器企业的战略合作,小马智行将在2025-2026年实现千台量级的第七代北汽极狐T5 Robotaxi、丰田铂智4X Robotaxi及广汽埃安Robotaxi车型落地,投入国内一线城市,致力于为公众提供安全、舒适、高效的全无人驾驶出行服务。软件方面软件方面,采用了小马智行自动驾驶技术采用了小马智行自动驾驶技术。小马智行通过基于强化学习范式的世界模型(PonyWorld)来打造适用于各类车型及应用场景的虚拟司机(Virtual Driver),已经实现50万小时全场景、全天候、全无人驾驶运营,L4自动驾驶安全性表现比人类驾驶高出10倍。架构平台方面架构平台方面,PonyBrainPonyBrain是小马智行自主研是小马智行自主研发的一套自动驾驶车载系统发的一套自动驾驶车载系统。与大多数自动驾驶公司采用传统机器人操作系统(ROS)不同,PonyBrain性能更优,适应车载计算环境,并且减小了资源占用,支持复杂的深度学习模型与软件快速迭代。技术创新点技术创新点实施效果与应用落地情况实施效果与应用落地情况第七代自动驾驶系统的应用有三大成效,一是可以与车辆实现前装级别的完美适配,为下一代正式前装量产奠定基础;二是可以赋能传统主机厂、运输企业,并带动相关产业链企业、运营服务配套企业发展;三是车辆及ADK成本大幅下降,对无人化Robotaxi运营提供商业闭环的可能性。技术方案技术方案需求分析:需求分析:经过多年的发展,小马智行先后历经配备安全员的技术测试阶段、无人化的技术测试阶段,至2023年9月在北京率先获得全无人+载人+收费的无人Robotaxi运营测试许可,之后又先后获得了广州、深圳、上海同类型测试许可。与此同时,以美国Waymo为代表的无人驾驶科技公司也开始聚焦Robotaxi的商业模式打造。目前,全球无人驾驶头部企业主要集中在中美两国,从技术成熟度和商业价值角度,都在聚焦Robotaxi的应用,未来无人驾驶商业化落地,将是中美无人驾驶技术竞争的关键。技术方案:技术方案:小马智行第七代自动驾驶乘用车系统是基于车规级芯片Orin-X实现L L4 4级全场景无人驾驶能力的级全场景无人驾驶能力的系统方案系统方案。软硬件开发流程、质量管理体系等满足功能安全开发要求。硬件方面硬件方面,搭载了专为无人驾驶设计的搭载了专为无人驾驶设计的6 6大类大类3434个量产传感器方案个量产传感器方案。可实现车周360无盲区、最远650米的高精度、全融合感知覆盖,从容应对各类光照和天气,实现城区、高速、环路场景一体化运营。案例概述案例概述系统具有高度集成和通用性,围绕三款不同车型,设计了可灵活部署的“模块化”方式,提高了系统的通用化适配能力。同时也可支持Robo-truck部署,通用化座舱功能、外观造型、传感器配置、交互体验可快速上车应用。车辆采用小马智行自研的传感器自清洁方案,包括压缩空气喷射、喷水清洗等,以更好地解决因为水滴、雾气、脏污等导致感知精度下降的问题,提供应对大雨、暴雨场景时的关键保障。0420252025汽车人工智能应用案例集汽车人工智能应用案例集座舱智能化研发生产智能化驾驶自动化0501多任务深度学习重卡自动驾驶轨迹规划多任务深度学习重卡自动驾驶轨迹规划鄂尔多斯市卡尔动力科技有限公司鄂尔多斯市卡尔动力科技有限公司针对自动驾驶重卡在复杂交通环境中的模块割裂、规则依赖、时序建模不足及意图安全缺陷等痛点,通过采用多任务深度学习模型、进行统一预测与规划,实现了一体化、低延迟、拟人化且安全冗余的技术突破,满足了行业对高效、精准、安全驾驶系统的需求。应用效果显著,卡车编队车距精确到10厘米,省油15%;路口通行成功率提升至99%,提升物流效率、降低事故风险。目前已落地应用于城市道路、高速公路等场景,未来将扩展到更多领域。技术创新点技术创新点实施效果与应用落地情况实施效果与应用落地情况技术方案技术方案需求分析:需求分析:当前自动驾驶重卡在复杂交通环境中面临四大核心痛点,亟需一体化、低延迟、拟人化且安全冗余的技术突破。一是模块割裂,他车预测与自车规划独立运行,导致信息断层、延迟高、效率低;二是规则依赖,传统规划算法依赖人工调参,CPU消耗大、泛化性差,难以应对复杂交互;三是时序建模不足,现有方法丢失时序细节或延迟过高,且未建模他车与自车的动态交互关联;四是意图与安全缺陷,多模态预测缺乏语义意图,对鬼探头等长尾行为的安全响应不足。随着自动驾驶技术成熟,企业对自动驾驶系统要求更高。传统独立轨迹预测与运动规划模块难以满足复杂交通场景的实时性和高效性。行业需求侧重统一建模框架,减少模块割裂,提高预测与规划系统精度和效率,适应多样化驾驶行为和复杂场景。对高效计算、低延迟和高安全性需求不断增长,推动新型算法和技术探索应用。大模型技术方案:大模型技术方案:案例概述案例概述传统自动驾驶技术采用单目标轨迹预测、传统规划与控制的串行链路,存在模块割裂、响应延迟等问题。本案例创新性地将其替换为“场景场景目标轨迹预测目标轨迹预测+自车轨迹规划自车轨迹规划”的多任务深度学习的多任务深度学习模型模型,构建了一个端到端的统一深度学习网络。该模型首先通过编码器融合高精地图、周边环境、车辆状态及历史轨迹等多模态场景信息;随后在解码器中强化时序交互建模,增强自车在复杂交通场景中的交互与博弈能力,最终并行输出预测与规划结果。该一体化架构从根本上消除了模块间的信息隔阂,减少信息损失与误差传递,降低对人工规则的依赖,提升算法迭代效率、系统安全性与智能化水平;同时通过基于决策意图的多模态规划机制,显著增强系统在多样化场景中的适应能力。主要能力:主要能力:采用端到端低延迟多任务统一模型采用端到端低延迟多任务统一模型,实现预测与规划协同优化,城区场景延迟低于80ms,高速场景延迟低于50ms,GPU利用率低于20%,显存需求下降40%。支持多模态轨迹预测支持多模态轨迹预测,未来5秒内轨迹终点误差控制在3m内,转向意图识别准确率超93%。采用模仿学习与强化学习融合架构采用模仿学习与强化学习融合架构,实现低碰撞概率、高避障成功率,优化驾驶平顺性,提升通行效率。模型泛化性能强,适配新路线、车型及编队模式。提出轨迹预测与运动规划多任务统一建模框架,紧密集成协同优化。融合深度学习、图神经网络等多种先进算法,精准建模复杂环境。通过优化设计,构建高性能、高鲁棒性系统。该大模型通过仿真验证,进入实车测试,已在城市道路、高速公路等场景落地应用。物流编队车间距达10cm级,燃油降低15%;路口通行效率提升30%,误减速降50%,未来将扩展到更多领域。经济效益上,预计降低L4级自动驾驶系统40%维护成本、80%新路线迁移开发成本。社会效益上,减少30%交通事故风险,优化城市交通流量,助力绿色低碳出行。自动驾驶预测规划一体化技术架构0520252025汽车人工智能应用案例集汽车人工智能应用案例集座舱智能化研发生产智能化驾驶自动化0601多模态大模型赋能智能座舱认知智能多模态大模型赋能智能座舱认知智能基于多模态大模型构建智能座舱系统。系统融合DVR摄像头数据与语音文本,从视频流提取关键帧图像识别车型品牌、标志性建筑和交通标识等,结合语音意图进行视觉理解和联网搜索,提供相关内容介绍。同时整合舱内OMS摄像头、语音和传感器数据,脱敏后上传云端,进行多模态识别,分析驾乘人员信息,结合用户习惯推理意图,调用车控、三方服务及语音TTS功能。基于8295平台,接入多种传感器,满足实时数据采集等需求。端侧进行多模态能力接入与预处理,整合视觉能力、语音能力和多维数据三类能力。云端部署多模态大模型,整合多源数据,完成复杂推理与决策。边缘设备的微控制器或小型计算模块接收云端指令,执行具体操作,并将结果反馈至云端形成闭环控制,优化模型性能,提升系统准确性。后训练后训练RLHFRLHF:对齐(RLHF)利用自研奖励模型与反馈算法,提升模型整体性能;Prompt Engineering借助微调LLM优化美学与多样性表现;超分模型提高图像分辨率并修复细微结构错误。技术创新点技术创新点实施效果与应用落地情况实施效果与应用落地情况案例概述案例概述全面感知与深度理解:全面感知与深度理解:多模态大模型能融合多种数据形式,对场景进行更全面、细致的感知和理解。相比单模态模型,能捕捉更多信息,理解更深入,为主动服务提供更准确依据。跨模态关联与推理:跨模态关联与推理:能发现不同模态数据间的关联,并进行跨模态推理。在主动服务场景中,可综合分析多源信息,主动推断用户需求,提供更贴合实际需求的服务。个性化与场景化服务:个性化与场景化服务:通过分析大量多模态数据,模型能深入了解用户偏好、行为模式等,结合场景提供个性化服务,提升用户体验和服务精准性。主动感知与预判需求:主动感知与预判需求:基于对场景的持续理解和学习,多模态大模型能够主动感知环境变化和用户行为线索,提前预判需求,主动提供服务。技术方案技术方案需求分析:需求分析:随着多模态AI大模型的应用,智能座舱将从当前主要的“语音+触摸屏”被动式交互,加速向座舱5.0人机主动式交互时代转变,实现更智能、自然的多模态交互。大模型技术方案:大模型技术方案:采用大规模稀疏采用大规模稀疏MoEMoE架构架构,由一组专家模型和由一组专家模型和一个门控网络构成一个门控网络构成。处理输入数据时,门控网络依据数据特征与需求,动态从众多专家模型中挑选出最适配部分进行激活,从而对数据展开处理。多模态数据处理技术多模态数据处理技术、视觉多模态技术:视觉多模态技术:在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了提升。模型训练与优化:模型训练与优化:从训练和推理效率的角度出发,研究稀疏度Scaling Law,确定性能和效率比较平衡的稀疏比例,并根据MoE Scaling Law确定小参数量激活的模型提升模型的性能。主要能力:主要能力:视觉理解能力:视觉理解能力:视觉理解、分类、信息抽取、解题、视频理解等能力强。深度思考能力:深度思考能力:具备复杂创作能力、更强的数 学 和 专 业 知 识 能 力、更 强 的 指 令 遵 循 和Function Call能力、原生多模态深度推理能力。通过多模态大模型赋能智能座舱,提升用户体验,实现万物识别、时空明信片、主动关怀等功能。2025年8月30日,在东风奕派车型上搭载。06多模态AI助手技术框架东风汽车集团有限公司东风汽车集团有限公司东风汽车集团有限公司研发总院东风汽车集团有限公司研发总院20252025汽车人工智能应用案例集汽车人工智能应用案例集座舱智能化研发生产智能化驾驶自动化0701北汽百模汇创中枢大模型平台创新北汽百模汇创中枢大模型平台创新应用模式应用模式北京汽车研究总院有限公司北京汽车研究总院有限公司北京汽车研究总院有限公司是北京汽车集团有限公司旗下负责自主品牌乘用车研发业务的主要机构,有效支撑极狐和北京(含BEIJING)两大品牌及旗下车型的研发。基于1+N+AI的产品理念,北汽百模汇创大模型平台架构,以“1个面向汽车垂域的中枢大模型”+“N个更垂直的内容和技能的AI大模型”的模式,突破单一模型的能力、参数、模态限制,融合多种大模型能力,形成平台化管理体系,实现多模态应用能力组合,并基于车型项目需求调用所需能力。平台在实现行业首批车端大模型应用落地的同时,单车型项目节省大量开发费用与时间成本,提升企业效益。技术创新点技术创新点实施效果与应用落地情况实施效果与应用落地情况基于百模汇创大模型平台,北汽智能座舱已推出10余项创新AI大模型产品。AI情感闲聊、AI汽车大师等产品让车主与爱车之间的交流更加流畅,大幅提升了驾驶体验;AIGC文生场景、文生图等产品则充分满足了用户对个性化用车体验的追求。2024年2月起产品陆续在极狐考拉、阿尔法T5、S5等车型落地。2025年初,北汽智能座舱实现快速接入Deepseek大模型能力,并支持多个顶尖AI大模型自由切换,打造“千人千面”的智能中枢。技术方案技术方案需求分析:需求分析:现阶段大模型发展与迭代势头迅猛,车企纷纷推进大模型上车,但在实际应用中仍面临诸多挑战。一是大模型技术层面仍处于探索阶段,企业的应用适配速度难以跟上模型的迭代速度,选择投入使用的模型先进性难以保证。二是大模型实际应用开发链路长、投入大,且需承担较高的调整成本。一旦某一模型被接入,其后续的新增或更改变得相对困难,调整成本较高。三是大模型能力相对分散,缺少聚合场景将多种能力效果最大化。单一模型往往针对特定的任务或场景进行优化,距打造适用多样场景的智能助理的终极目标仍有差距。技术方案:技术方案:北汽百模汇创中枢大模型平台以智能座舱中枢北汽百模汇创中枢大模型平台以智能座舱中枢大模型为核心大模型为核心,形成平台化形成平台化、规模化规模化、规范化的规范化的架构架构。创新设计的可插拔式对接结构使各垂域模型解耦,基于统一标准化的适配规范,实现对各垂域模型的灵活调度与自由切换,支持将海量垂域模型能力接入中枢大模型,并体现于车端应用层。架构的设计具备架构稳定、易对接、标准化、案例概述案例概述北汽百模汇创中枢大模型平台以智能座舱中枢大模型为核心,采用平台化、规模化、规范化的技术平台架构。基于架构的可插拔式对接结构,智能座舱创新产品形态与服务的灵活性、可复用性和可维护性大幅提升。北汽在汽车产业创新管理中,形成了大规模模型资源管理体系,突破单一模型限制,融合多种大模型能力,实现平台化管理。可跨域数量多、可调用生态广泛等特点,突破了单一模型能力的局限,具备了丰富的垂域模型选择和能力扩展的可能性。现已实现高效接入电信、火山引擎、Deepseek等大模型,并通过中枢大模型调用适配的细分场景大模型,组合所需的产品能力,有效支撑新产品的落地。百模汇创中枢大模型平台架构支持多种场景百模汇创中枢大模型平台架构支持多种场景下的智能推理下的智能推理、调用调用。针对用户多意图的复杂任务,中枢大模型支持10轮跨域上下文记忆,可准确理解、分类、取用、跨域组合云端15+垂域模型的能力,调度车端基于SOA平台所实现的19类座舱功能域多模态数据和100+原子功能标准服务。0720252025汽车人工智能应用案例集汽车人工智能应用案例集座舱智能化研发生产智能化驾驶自动化08基于大模型基于大模型AgentAgent技术的语音交互技术的语音交互解决方案解决方案岚图汽车科技有限公司岚图汽车科技有限公司为实现岚图智能座舱“最自然的对话智能,最暖心的场景智能”产品目标,岚图座舱大模型研发团队深度构建AI能力,通过对DeepSeek大模型进行知识蒸馏来持续训练提升岚图座舱AI智能体大模型的语义理解能力。同时基于大模型Agent技术,AI核心模块全面自研,来实现语音交互业界领先的唤醒识别率和唤醒响应速度,车控端到端响应速度提升至1s内,免唤醒覆盖量比自研前提升近400倍。语音助手系统从业务结构上可以分为语音助手系统从业务结构上可以分为5 5个层级:个层级:a.设备层:主要是AI助手业务的使用层。该层提供与用户的交互工作,用户可以通过集成在设备上的mic发出语音指令。通过语音系统的指令分析,对应为用户提供不同的服务。b.AI助手层:主要为了便于不同的硬件快速集成AI助手的能力。该层负责联通硬件和云端对话系统服务,且同时提供离线的算法能力,保障用户在网络条件不好的场景切换时,也可以较好地使用语音服务。c.业务层:业务层主要作为语音核心能力的封装和业务调度,同时对接不同的CP/SP资源,为用户提供丰富的数据内容。同时为AI提供平台化的能力,支持AI能力的快速闭环。d.算法层:算法层提供ASR、NLU、大模型等核心算法元能力。e.数据层:提供业务和算法需要的数据支撑。技术创新点技术创新点实施效果与应用落地情况实施效果与应用落地情况本系统从简易交互、快速响应、智能理解多种维度,为多样化用户群体提供全方位立体化的智能语音体验。如语义理解:精准率(功能范围内)99.59%;召回率(功能范围内)99.44%;误召回率0.5%。目前已在岚图汽车多款车型落地,如岚图知音、岚图梦想家,规划全系车型覆盖。技术方案技术方案需求分析:需求分析:汽车行业对于车载座舱AI大模型需求迫切。一方面,希望借助其提升交互体验,实现更自然、便捷的多模态交互,增强用户粘性;另一方面,期望通过大模型优化个性化服务,满足不同用户需求。同时,企业需要大模型助力成本优化,降低开发及运营成本。此外,在数据隐私保护、舱驾融合、智能化生态拓展等方面也有需求,以提升智能座舱竞争力,在市场中占据优势地位。大模型技术方案:大模型技术方案:案例概述案例概述主要能力有文生文能力、文生图能力、行程规划能力、场景规划能力、车书问答能力等。图1 岚图汽车-逍遥座舱大模型系统架构图通过知识蒸馏技术将岚图座舱AI智能体的语义理解能力快速提升至DeepSeek同一水平,通过基于大模型Agent技术的全自研语音交互方案,促使传统语音助手向数字生命体进行觉醒及跃迁。图2 算法原子能力图0820252025汽车人工智能应用案例集汽车人工智能应用案例集座舱智能化研发生产智能化驾驶自动化0901灵语灵语AIAI大模型赋能智能汽车座舱升级大模型赋能智能汽车座舱升级上汽通用五菱汽车股份有限公司上汽通用五菱汽车股份有限公司灵语AI大模型致力于打造个性化、智能化的座舱体验。基于百万级用户数据构建软硬件协同架构,通过超级接口整合,实现深度体验融合。采用“1+N”分布式架构,运用预训练、语义拼接、知识蒸馏等技术,实现传统模型到生成式大模型的自然融合。灵语AI大模型目前已在五菱多款车型落地应用,提供革新性交互体验,有效满足智能座舱升级需求。“N”N”垂直智能体垂直智能体:多个高内聚领域模块,专注高效执行特定任务。高效协同高效协同:简单指令由中枢直达智能体执行,复杂指令由中枢拆解,协调多智能体完成。技术创新点技术创新点实施效果与应用落地情况实施效果与应用落地情况技术方案技术方案需求分析:需求分析:当前,尽管多数车企已部署语音交互等基础功能,但市面主流方案普遍依赖传统模型,存在算力有限、适配能力弱、难以满足复杂行车场景等问题。此外,其在多语言及方言识别精准度、个性化体验深度以及用户交互感受方面,仍有明显不足。结合行业发展趋势及用户需求,企业亟需通过更先进的技术推动智能座舱革新。灵语AI大模型凭借其强大的语言理解、学习与生成能力,可有效解决传统方案的痛点。利用该模型在多模态融合交互、高精度语音识别及个性化服务等方面的优势,打造感知与交互能力更强的智能座舱,以满足消费者对高端化、智能化、个性化出行体验的需求,从而提升产品竞争力并扩大市场份额。大模型技术方案:大模型技术方案:灵语AI大模型以通用智能为核心,采用可靠性优先的“1+N”分布式大模型架构,支持多智能体云端接入,实现高效处理多样任务,大幅降低模型幻觉,结合注意力机制与决策系统,对车内外数据感知、决策及反馈,融合动态思维链及工具调用,提供个性化、场景化的智能用车体验。“1 1”中枢模型中枢模型:智能核心,统一负责意图理解、对话管理、复杂决策与任务调度,接口标准化,可快速接入更多智能体。案例概述案例概述创新解决大模型效率与深度兼顾难题:效能平衡:中枢深度思考,智能体高效执行。资源优化:简单任务不耗中枢算力,降低整体资源需求。系统韧性:模块化提升可维护、可扩展和鲁棒性。赋能价值:实现智能座舱交互飞跃,复杂指令精准理解、迅捷响应、可靠执行。作为核心引擎搭载宝骏享境、五菱星光s等车型,目前已OTA升级至宝骏云海、五菱缤果plus等车型,用户认可其响应速度、语义理解和多任务协同能力。用户体验效益方面,显著提升语音交互满意度、驾驶专注度和座舱科技感,增强产品吸引力。商业与技术效益方面,有效降低长期维护与功能扩展成本,加速新功能落地,有力支持其在智能座舱塑造差异化竞争优势,提升品牌技术形象与市场竞争力。“1+N”灵语AI大模型主要能力:主要能力:深度任务处理:中枢调度智能体执行,流畅处理多步骤、跨域复杂任务。极致响应:简单任务直通智能体,实现近零延迟响应。精准理解与连贯:中枢统一管理上下文,精准解析模糊表达。模块化敏捷:架构易扩展新智能体,独立升级。0920252025汽车人工智能应用案例集汽车人工智能应用案例集座舱智能化研发生产智能化驾驶自动化1010思必驰天琴车载语音助手思必驰天琴车载语音助手思必驰科技股份有限公司思必驰科技股份有限公司思必驰是国内专业的大模型对话式人工智能平台型企业,其为智慧出行场景打造的天琴车载语音助手,以车载场景下的人机对话交互为核心,围绕“语音交互智能+云端互联服务”,不仅具备全双工交互免唤醒、一句话多意图、可见即可说、上下文指代、声纹识别、多音区声源定位等功能,同时还具有超高度定制性、支持大模型端侧部署,满足产品的多样化需求。目前已与梅赛德斯-奔驰、奥迪、保时捷等全球60多家知名汽车品牌合作,推出200多款量产车型,累计“上车”超1500万辆。主要能力:主要能力:思必驰为智慧出行场景打造的天琴车载语音助手服务于汽车前装与后装导航及智能座舱设备,以车载场景下的人机对话交互为核心,围绕“语音交互智能+云端互联服务”,融合智能导航、多媒体娱乐、车身控制、驾驶行为监控、车况监控等智能座舱人机交互需求,不仅具备全双工交互免唤醒、一句话多意图、可见即可说、上下文指代、声纹识别、多音区声源定位等功能,实现了全场景语音交互突破,同时还具有超高度定制性、支持大模型端侧部署,满足产品的多样化需求。通过与思必驰自研通用语言大模型DFM-2相结合,天琴语音助手可实现出行规划、情感关怀交互、复杂任务定制、汽车领域大师等功能;支持多模态、多意图、多音区、全场景多轮连续对话,打造无拘无束的交互体验;通过多Agent
展开阅读全文