1、1报告提供的任何内容(包括但不限于数据、文字、图表、图像等)均系头豹研究院独有的高度机密性文件(在报告中另行标明出处者除外)。未经头豹研究院事先书面许可,任何人不得以任何方式擅自复制、再造、传播、出版、引用、改编、汇编本报告内容,若有违反上述约定的行为发生,头豹研究院保留采取法律措施、追究相关人员责任的权利。头豹研究院开展的所有商业活动均使用“头豹研究院”或“头豹”的商号、商标,头豹研究院无任何前述名称之外的其他分支机构,也未授权或聘用其他任何第三方代表头豹研究院开展商业活动。头豹研究院2024年中国端侧大模型行业研究算力优化与效率革命如何重塑行业生态企业标签:阿里云、商汤科技、面壁智能AI变
2、革行业创新发展China End To Side Large Model Industry中国側大型産業撰写人:王利华头豹研究院咨询/合作网址:电话:15999806788(袁先生)电话:18916233114(李先生)深圳市华润置地大厦E座4105室团队介绍袁栩聪首席分析师oliver.yuanL王利华行业分析师头豹是国内领先的行企研究原创内容平台和创新的数字化研究服务提供商。头豹在中国已布局3大研究院,拥有近百名资深分析师,头豹科创网()拥有20万+注册用户,6,000+行业赛道覆盖及相关研究报告产出。头豹打造了一系列产品及解决方案,包括数据库服务、行企研报服务、微估值及微尽调自动化产品、
3、财务顾问服务、PR及IR服务,研究课程,以及分析师培训等。诚挚欢迎各界精英与头豹交流合作,请即通过邮件或来电咨询。报告作者中国:人工智能系列行业研读|2024/400-072-55883摘要2023年中国端侧大模型市场规模达8亿元,持乐观态度估计,预计2024年中国端侧大模型市场将达到21亿元生成式AI市场的蓬勃兴起,正驱使大模型厂商积极探索端侧应用新蓝海,以此作为增长的新引擎。端侧大模型通过在设备本地运行,有效降低了数据传输延迟,增强了隐私保护,拓宽了AI应用场景的广度与深度。与此同时,下游市场需求的强劲增长,特别是手机与自动驾驶行业的蓬勃发展,正强力拉动端侧大模型市场的扩张,2023年中国
4、端侧大模型市场规模达8亿元,预计2024年中国端侧大模型市场将达到21亿元。依托技术实力和生态建设,头部大模型厂商纷纷投入端侧大模型市场,利用在云端大模型领域的技术优势,商汤商量、阿里通义以及面壁智能率先在端侧大模型领域取得领先突破。端侧大模型定义为运行在设备端的大规模人工智能模型,这些模型通常部署在本地设备上,如智能手机、IoT、PC、机器人等设备。与传统的云端大模型相比,端侧大模型的参数量更小,因此可以在设备端直接使用算力进行运行,无需依赖云端算力。端侧大模型在成本、能耗、可靠性、隐私和个性化方面相比云端推理具有显著优势,并能够以低能耗提供高效且安全的AI处理,减少延迟并保护用户隐私,适合
5、个性化的AI应用。取决于行业对数据安全、隐私保护的需求、行业本身智能设备的普及程度以及AI大模型技术的成熟度,这些因素的相互作用和共同推动,端侧大模型将推动各行业智能化发展的步伐。端侧大模型面临的行业壁垒包括技术、硬件、数据、成本以及市场等方面,要求产业界在技术创新、标准制定、生态建设和市场推广等方面进行深入合作,以克服挑战,实现端侧大模型的广泛应用和落地。400-072-5588 中国端侧大模型行业概述-6定义与分类-7发展历程-8驱动力-9市场规模-10 中国端侧大模型行业产业链分析-11产业链-12模型压缩技术-13成本构成-14厂商类型-15行业场景-16业务场景-17 中国端侧大模型
6、行业分析-19政策分析-20行业壁垒-21竞争格局-22发展趋势-23 中国端侧大模型行业典型厂商分析-24阿里云-25商汤科技-26面壁智能-27 方法论及法律声明-28 业务合作-294研究框架400-072-5588AI大模型:指的是大型人工智能模型,通常由数十亿至数百亿个参数组成,用于各种自然语言处理、计算机视觉等任务。模型压缩技术:是一系列用于减少大型神经网络模型尺寸和计算复杂度的技术,包括剪枝、量化、蒸馏等方法,旨在减少模型大小的同时保持其性能。IoT设备:指的是物联网设备,通常具有较小的计算能力和存储空间,但能够通过互联网进行通信和数据交换。PC设备:个人计算机,如台式机、笔记本
7、电脑等,通常具有较高的计算和存储能力,适合运行复杂的应用程序和任务。数据中心:指的是大规模的服务器集群,用于存储和处理大量数据,支持云计算服务和网络应用。服务器:通常指的是提供网络服务、存储和计算资源的计算机系统,可用于托管网站、应用程序等。BERT:是一种预训练的自然语言处理模型,采用Transformer架构,能够理解文本语境并在各种NLP任务中取得良好性能。DistilBERT:是对BERT模型进行了蒸馏(Distillation)的轻量化版本,通过减少参数和计算复杂度来提高模型的运行效率。TinyBERT:是进一步轻量化的BERT模型,通过更深入的模型压缩和优化来适应资源受限的环境,如
8、移动设备或物联网设备。Jetson AGX Xavier:高性能嵌入式系统,具有GPU和AI计算能力,适用于边缘计算和深度学习应用。TPU:谷歌推出的张量处理单元,是一种专门用于加速人工智能工作负载的定制硬件加速器。PyTorch Mobile:是PyTorch框架的移动端部署版本,支持在移动设备上运行训练好的深度学习模型。TensorFlow Lite:是谷歌推出的用于在移动设备和嵌入式系统上部署深度学习模型的轻量级框架。ONNX:开放神经网络交换,是一种开放的跨平台深度学习模型表示格式,支持模型在不同框架之间的转换和部署。预训练模型:指的是在大规模文本数据上进行预训练的神经网络模型,通常包
9、含通用的语言或视觉理解能力,并可通过微调适应特定任务。中心云:指的是传统的云计算架构,数据和计算资源集中在大型数据中心进行管理和运行。边缘云:是一种分布式的云计算架构,将计算和存储资源放置在接近终端用户的边缘节点上,以提高服务响应速度和降低网络延迟。AI芯片:专门用于加速人工智能计算任务的硬件芯片,能够在高效率和低能耗的条件下进行大规模并行计算。知识蒸馏:是一种通过让一个较大且性能较好的模型(教师模型)指导一个小型模型(学生模型)来提高学生模型性能的技术,通常用于模型压缩和轻量化。名词解释400-072-5588Chapter 1行业概述 定义与分类 发展历程 驱动力 市场规模行业研读|202
10、4/400-072-5588中国:人工智能系列行业研读|2024/5用户端侧大模型定义为运行在设备端的大规模人工智能模型端侧大模型定义为运行在设备端的大规模人工智能模型,与传统的云与传统的云端大模型相比端大模型相比,端侧大模型的参数量更小端侧大模型的参数量更小,因此可以在设备端直接使因此可以在设备端直接使用算力进行运行用算力进行运行,无需依赖云端算力无需依赖云端算力中国端侧大模型市场探析定义与分类端侧大模型的定义来源:企业官网,头豹研究院移动设备IoT设备机器人PC设备网络计算存储安全端侧大模型定义为运行在设备端的大规模人工智能模型,这些模型通常部署在本地设备上,如智能手机、IoT、PC、机器
11、人等设备。与传统的云端大模型相比,端侧大模型的参数量更小,因此可以在设备端直接使用算力进行运行,无需依赖云端算力。AI大模型端侧大模型模型压缩技术AI大模型模型训练方式:数据中心或云端模型推理方式:服务器或云端参数量:多为百亿级别端侧大模型模型训练方式:云端模型推理方式:端侧参数量:多为十亿级别VSAI大模型通常在数据中心或云端进行训练,使用大规模的计算资源和海量数据。相比之下,端侧大模型由于资源限制,往往需要在设计和训练阶段进行模型压缩和优化。在推理方式上,AI大模型通常运行在服务器或云端,通过强大的计算能力处理复杂的任务。然而,这种云端推理方式依赖于网络连接,会带来延迟和隐私问题。端侧大模
12、型则是在本地设备上进行推理。参数量是AI大模型和端侧大模型的一个显著区别。AI大模型通常具有数十亿甚至上百亿的参数,如GPT-3的1,750亿参数。这种巨大的参数量使得大模型能够捕捉复杂的数据模式并在多种任务中表现出色。然而,端侧设备的计算能力和存储资源有限,因此端侧大模型的参数量通常较小。通过模型压缩技术,如知识蒸馏、剪枝和量化,端侧大模型的参数量可以减少到几百万或更少。例如,MobileBERT的参数量仅为BERT的1/4左右,但依然能够在移动设备上高效运行。400-072-5588中国:人工智能系列行业研读|2024/5端侧大模型在成本端侧大模型在成本、能耗能耗、可靠性可靠性、隐私和个性
13、化方面相比云端推理隐私和个性化方面相比云端推理具有显著优势具有显著优势,并能够以低能耗提供高效且安全的并能够以低能耗提供高效且安全的AIAI处理处理,减少延迟减少延迟并保护用户隐私并保护用户隐私,适合个性化的适合个性化的AIAI应用应用中国端侧大模型市场探析驱动力端侧大模型市场驱动力分析来源:中国统计局,CNNIC,头豹研究院中心云边缘云5G端侧为实现规模化扩展,AI处理的重心,正在向边缘转移从成本优势来看,AI推理的规模远高于AI训练。尽管训练单个模型会消耗大量资源,但大型生成式AI模型预计每年仅需训练几次。然而,这些模型的推理成本将随着日活用户数量及其使用频率的增加而增加。在云端进行推理的
14、成本极高,这将导致规模化扩展难以持续。从能耗来看,支持高效AI处理的边缘终端能够提供领先的能效,尤其是与云端相比。边缘终端能够以很低的能耗运行生成式AI模型,尤其是将处理和数据传输相结合时。这一能耗成本差异非常明显。从可靠性、性能和时延来看,终端侧AI处理能够在云服务器和网络连接拥堵时,提供媲美云端甚至更佳的性能。当生成式AI查询对于云的需求达到高峰期时,会产生大量排队等待和高时延,甚至出现拒绝服务的情况。向边缘终端转移计算负载可防止这一现象发生。从隐私和安全来看,端侧大模型从本质上有助于保护用户隐私,因为查询和个人信息完全保留在终端上。对于企业和工作场所等场景中使用的生成式AI,这有助于解决
15、保护公司保密信息的难题。从个性化来看,数字助手将能够在不牺牲隐私的情况下,根据用户的表情、喜好和个性进行定制。所形成的用户画像能够从实际行为、价值观、痛点、需求、顾虑和问题等方面来体现一个用户,并且可以随着时间推移进行学习和演进。0304050102端侧大模型可靠性、性能和时延成本优势个性化能耗隐私和安全400-072-5588中国:人工智能系列行业研读|2024/5下游市场需求的强劲增长下游市场需求的强劲增长,特别是手机与自动驾驶行业的蓬勃发展特别是手机与自动驾驶行业的蓬勃发展,正强力拉动端侧大模型市场的扩张正强力拉动端侧大模型市场的扩张,20232023年中国端侧大模型市场规模年中国端侧大
16、模型市场规模达达8 8亿元亿元,预计预计20242024年中国端侧大模型市场将达到年中国端侧大模型市场将达到2121亿元亿元中国端侧大模型市场探析市场规模中国端侧大模型行业市场规模来源:专家访谈,企业公告,头豹研究院CAGR:58%受实际落地情况的影响,2023年中国端侧大模型市场规模达8亿元,持乐观态度估计,预计2024年中国端侧大模型市场将达到21亿元生成式AI市场的蓬勃兴起,正驱使大模型厂商积极探索端侧应用新蓝海,以此作为增长的新引擎。端侧大模型通过在设备本地运行,有效降低了数据传输延迟,增强了隐私保护,拓宽了AI应用场景的广度与深度。例如,智能手机集成的AI摄影功能,能实时识别场景并优
17、化图像质量;可穿戴设备利用端侧模型监测健康指标,提供即时反馈。与此同时,随着AI芯片等算力市场带动,为端侧大模型打开新的市场空间。高性能、低功耗的AI芯片设计使得复杂模型能够在手机、物联网设备等终端高效运行,无需依赖云服务,显著提升响应速度与用户体验。2021年全球AI芯片市场规模达到200亿美元,预计到2025年将超过700亿美元,其中端侧AI芯片占比快速提升,成为增长的重要动力。下游市场需求的强劲增长,特别是手机与自动驾驶行业的蓬勃发展,正强力拉动端侧大模型市场的扩张手机作为个人智能终端的核心,正集成更先进的AI功能以提供个性化服务与优化用户体验,如荣耀Magic系列利用端侧AI大模型实现
18、偏好理解与多模态交互。同时,自动驾驶领域对实时性与安全性要求极高,推动了BEV+Transformer等技术与端侧大模型的融合,百度Apollo ADFM等L4级自动驾驶大模型的推出,标志着该领域迈向商用新阶段。8213147617920232024E2025E2026E2027E2028E中国端侧大模型市场规模单位:亿元400-072-5588Chapter 2产业链分析 产业链图谱 模型压缩技术 成本构成 厂商类型 行业场景 业务场景行业研读|2024/400-072-5588中国:人工智能系列行业研读|2024/5中国端侧大模型上游主要包括中国端侧大模型上游主要包括AIAI芯片供应商芯片
19、供应商、云计算服务商以及数据云计算服务商以及数据服务商服务商,中游为端侧大模型科技厂商和端侧科技企业中游为端侧大模型科技厂商和端侧科技企业,主要通过设备主要通过设备企业最终应用到汽车企业最终应用到汽车、教育等各行各业教育等各行各业中国端侧大模型市场探析产业链中国端侧大模型行业产业链分析来源:专家访谈,头豹研究院上游下游云计算服务提供商中游端侧大模型科技厂商AI芯片供应商端侧科技企业设备端企业应用场景数据服务商泛娱乐医疗金融汽车其他教育文本场景图像场景音频场景视频场景多模态场景 400-072-5588中国:人工智能系列行业研读|2024/5通过知识蒸馏通过知识蒸馏,端侧大模型能够在保持较高性能
20、的同时端侧大模型能够在保持较高性能的同时,大幅减少模大幅减少模型参数量和计算复杂度型参数量和计算复杂度。这种技术使得复杂的这种技术使得复杂的AIAI模型可在资源受限的模型可在资源受限的端侧设备上高效运行端侧设备上高效运行,实现低能耗实现低能耗、高响应速度和高准确度的高响应速度和高准确度的AIAI推理推理中国端侧大模型市场探析模型压缩技术端侧大模型压缩技术知识蒸馏来源:专家访谈,智慧文旅,头豹研究院inputXLayer1Layer2LayermTeacher modelLayer1Layer2LayernStudent(distilled)modelLoss FnSoftmax(T=t)Sof
21、tmax(T=t)Softmax(T=1)Loss Fnhardlabel y(ground truth)Soft labelsSoft predictionshardpredictionstudent lossdistillation loss知识蒸馏的基本原理首先,在强大的计算资源和海量数据集上训练一个高性能的大模型,称为教师模型。教师模型在输入训练数据时,不仅输出最终的分类结果(硬标签),还输出每个类别的概率分布(软标签),这些软标签包含了更多关于输入数据的细微信息和模式。在训练较小的学生模型时,不仅使用原始数据的硬标签,还使用教师模型生成的软标签。学生模型通过学习这些软标签,能够捕捉到
22、教师模型中包含的丰富知识。知识蒸馏在端侧大模型中的应用知识蒸馏使得学生模型能够在保持较高准确度的同时,显著减少参数量。例如,TinyBERT通过知识蒸馏技术将BERT的参数量减少到原来的1/7左右,但在许多自然语言处理任务中仍能保持较好的性能。这使得学生模型能够适应端侧设备的计算和存储限制。较小的学生模型在推理阶段需要的计算资源更少,推理速度更快。这对于资源受限的端侧设备尤为重要。端侧设备通常对能耗有严格限制。知识蒸馏生成的学生模型由于计算复杂度低,能够以较低的能耗完成推理任务。例如,在物联网设备和移动设备中,学生模型的低能耗运行方式使其能够长时间持续工作,而不会显著消耗电池电量。知识蒸馏生成
23、的学生模型可以针对不同的端侧设备进行优化。例如,针对特定硬件架构进行剪枝和量化,使模型在特定设备上达到最佳性能。此外,学生模型还可以通过在线学习机制,在端侧设备上不断适应和优化,以满足动态变化的应用需求。400-072-5588中国:人工智能系列行业研读|2024/5AIAI芯片作为加速端侧大模型的关键技术芯片作为加速端侧大模型的关键技术,提供高效计算和能耗比提供高效计算和能耗比,使使得大规模模型在端侧设备上高效运行得大规模模型在端侧设备上高效运行,研发人员及显卡成本需兼顾研发人员及显卡成本需兼顾,确保研发经济可持续确保研发经济可持续中国端侧大模型市场探析成本构成端侧大模型成本构成分析来源:专
24、家访谈,智慧文旅,头豹研究院30%60%10%硬件成本研发成本其他成本硬件成本包括端侧大模型部署所必需的硬件设备,如AI芯片。AI芯片专门设计用于加速深度学习任务,相比通用处理器,AI芯片可提供更高的计算效率,降低模型执行的能耗和延迟。研发成本是开发和优化端侧大模型所需的成本,主要为研发人员的人力成本以及设备成本。人力成本涉及到研究人员、工程师和数据科学家等的工资、培训和福利待遇。设备成本包括用于开发和测试的显卡、服务器和云服务等。其他成本包括除了硬件和研发成本之外,还包括各种间接成本,例如管理成本、运营成本和市场推广成本等。AI芯片成为加速端侧大模型应用的关键技术成本AI芯片作为专门设计用于
25、加速深度学习任务的硬件,具有较高的能效比和计算性能,成为了实现端侧大模型高效部署的关键。一方面,AI芯片能够提供更高的计算性能和能效比,从而加速端侧大模型的推理和执行速度。例如,Google的TPU能够在相同的功耗下实现比传统GPU更高的性能,这使得在端侧设备上运行大规模的神经网络模型成为可能。另一方面,AI芯片也能够提供更低的功耗和更小的尺寸,适合嵌入到各种端侧设备中,为端侧大模型的应用提供了更广泛的可能性和更好的用户体验。在端侧大模型的开发过程中,需要综合考虑研发人员的成本和显卡的成本,以确保项目的顺利进行和成功实施深度学习模型的研发需要具有深度学习和机器学习背景的专业人员,他们负责模型的
26、设计、算法优化、超参数调整等工作。美国的机器学习工程师的平均年薪约为12万美元,而深度学习工程师的平均年薪则更高,约为14万美元。因此,合理控制研发人员的成本,并保证其具备高水平的技能和专业知识,对于端侧大模型的研发和应用至关重要。其次,显卡的性能和规模直接影响着模型训练的速度和效率。一台高端显卡如NVIDIA GeForce RTX 3,090的价格约为1,500美元。此外,显卡可以通过云服务提供商租用,这也是许多企业在进行端侧大模型的研发和优化时采取的一种常见方式。但在长期使用过程中,租用成本也会成为企业的一项不小的支出。因此,企业需要综合考虑研发人员的成本、显卡租用成本以及其他相关成本,
27、以确保研发过程的经济性和可持续性。400-072-5588中国:人工智能系列行业研读|2024/5取决于行业对数据安全取决于行业对数据安全、隐私保护的需求隐私保护的需求、行业本身智能设备的普及行业本身智能设备的普及程度以及程度以及AIAI大模型技术的成熟度大模型技术的成熟度,这些因素的相互作用和共同推动这些因素的相互作用和共同推动,端侧大模型将推动各行业智能化发展的步伐端侧大模型将推动各行业智能化发展的步伐中国端侧大模型市场探析行业场景中国端侧大模型行业行业场景分析来源:专家访谈,头豹研究院行业对数据安全和隐私保护的需求将直接影响端侧大模型的应用随着数据泄露和隐私问题的日益突出,各行业对于数据
28、的保护需求愈发迫切。因此,在端侧大模型的应用中,需要采取一系列的技术手段来确保数据的安全性和隐私性,如联合学习、加密计算等。这将促使行业在应用端侧大模型时更加谨慎和审慎,但也为解决数据安全隐患提供了新的解决方案。因此,端侧大模型在金融、医疗、政务等对数据安全要求较高的行业具有较大发展潜力。行业本身智能设备的普及程度也将影响端侧大模型的发展前景随着智能设备的普及程度提高,对于端侧AI应用的需求也将相应增加。这些智能设备不仅提供了丰富的数据来源,也为端侧大模型的运行提供了更多的计算资源和场景。例如,随着智慧教堂的普及率加深,教育成为端侧大模型未来发展的潜力场景之一。此外,在医疗领域,家用健康监测设
29、备能够使数据存储在设备端,更能满足客户的隐私性。AI大模型技术的成熟度是端侧大模型发展的重要因素之一端侧大模型应用依赖于AI大模型的技术基础,随着AI大模型在自然语言处理、计算机视觉、语音识别等领域的发展和成熟,端侧大模型应用也得到推动;各行业对端侧设备上运行的大型AI模型的需求不断增加,促使端侧大模型应用成熟度与AI大模型保持一致;同时,技术转移和跨界应用使得一些在特定行业中成熟的AI大模型技术可以被应用到其他行业的端侧设备中,推动两者的同步发展。技术成熟度市场发展潜力低高高医疗政务泛娱乐电商互联网科技法律教育工业其他传统产业金融汽车 400-072-5588中国:人工智能系列行业研读|20
30、24/5中国端侧大模型市场探析业务场景端侧大模型业务场景分析按不同的设备类型分类来源:专家访谈,头豹研究院端侧大模型能在保障数据隐私的同时端侧大模型能在保障数据隐私的同时,实现低延迟的实时计算实现低延迟的实时计算,并提并提供高度个性化的服务供高度个性化的服务,因此基于对数据隐私因此基于对数据隐私、计算实时以及个性化等计算实时以及个性化等强需求强需求,AIAI手机手机、自动驾驶和机器人成为端侧大模型核心应用场景自动驾驶和机器人成为端侧大模型核心应用场景AI手机:数据隐私性和计算实时性现代智能手机在语音助手、图像识别、自然语言处理等方面广泛应用AI技术,这些功能需要处理大量的用户数据。如果将这些数
31、据传输到云端进行处理,不仅增加了隐私泄露的风险,还会由于网络延迟导致用户体验下降。端侧大模型可以在本地设备上进行数据处理,确保用户的敏感信息不被泄露,同时大幅提升计算的实时性。自动驾驶:实时决策和安全性自动驾驶车辆需要在复杂的道路环境中实时做出决策,如避让行人、识别交通信号和处理突发情况。这些决策需要极低的延迟,因为任何延误都可能带来安全隐患。端侧大模型能够在车辆本地进行高效计算,确保实时响应和高精度决策,从而提升自动驾驶系统的安全性和可靠性。此外,端侧计算减少了对网络连接的依赖,在网络条件不佳的情况下仍能保持车辆的正常运行。机器人:个性化服务和效率提升在机器人应用中,特别是家庭服务机器人和医
32、疗机器人,端侧大模型的优势在于能够提供个性化服务和提高效率。机器人需要根据用户的具体需求和偏好调整其行为和功能,例如在家庭中提供特定的照护服务或在医院中执行特定的医疗任务。通过在本地处理数据,机器人可以更好地理解用户的行为和习惯,从而提供更加个性化的服务。此外,端侧计算能够提升机器人的响应速度和任务执行效率,在面对复杂环境和任务时,机器人可以迅速做出决策和调整,确保任务的准确性和高效性。这种能力不仅提高了用户体验,还拓展了机器人的应用范围和市场潜力。强需求场景其他场景机器人自动驾驶AI手机基于对数据隐私性、计算实时性以及市场个性化需求等因素,AI手机、自动驾驶以及机器人成为推动端侧大模型的三大
33、核心应用场景。400-072-5588中国:人工智能系列行业研读|2024/5随着技术的不断进步和应用场景的拓展随着技术的不断进步和应用场景的拓展,端侧大模型各业务场景中存端侧大模型各业务场景中存在差异在差异,文本生成和图片生成场景相对较成熟文本生成和图片生成场景相对较成熟,音频生成场景逐步发音频生成场景逐步发展展,视频生成和多模态生成场景尚处于起步阶段视频生成和多模态生成场景尚处于起步阶段业务场景(接上页)端侧大模型业务场景分析按不同的技术场景分类来源:专家访谈,头豹研究院文本生成图片生成音频生成视频生成多模态生成0.11101001000模型规模(十亿参数)云端端侧文本生成与图片生成的业务
34、场景文本生成模型如GPT系列在端侧的应用逐渐成熟,尤其是在智能手机等移动设备上的应用。通过模型压缩和优化,现有的文本生成模型已经可以在资源受限的环境下高效运行。图片生成模型的端侧应用也在逐步发展,尤其是一些轻量级的图像生成模型。这些模型可以用于图像风格转换、图像修复、图像增强等应用,为用户提供更丰富的图像处理功能。随着硬件技术的进步和模型算法的改进,图片生成模型在端侧的应用将进一步成熟。音频生成的业务场景音频生成模型在端侧的应用相对较新,但也在不断发展。目前一些语音合成模型已经可以在端侧设备上实现实时的语音合成功能,如智能语音助手、语音提示等。视频生成和多模态生成的业务场景相比于文本和图片生成
35、模型,视频生成模型的端侧应用相对较少,主要原因是视频数据的复杂性和处理量较大。而一些视频压缩和编解码技术的进步以及硬件加速器的应用,为视频生成模型在端侧的应用提供一定的可能性。多模态生成模型是指同时处理多种类型数据的生成模型,其在端侧的应用也在逐步探索和发展,如智能多模态搜索、多模态推荐系统等,但其成熟度相对较低,需要更多的研究和技术突破。400-072-5588Chapter 3行业分析 政策分析 行业壁垒 竞争格局 发展趋势行业研读|2024/400-072-5588中国:人工智能系列行业研读|2024/5中国政府将人工智能产业视为中国国家战略核心中国政府将人工智能产业视为中国国家战略核心
36、,在端侧大模型方面在端侧大模型方面展现出积极的支持立场展现出积极的支持立场。在在AIAI基础设施以及生成式基础设施以及生成式AIAI方面设立规范方面设立规范,整体政策环境对整体政策环境对AIAI产业及端侧大模型的健康发展表现有利产业及端侧大模型的健康发展表现有利中国端侧大模型市场探析政策分析中国端侧大模型相关政策,2020-2024年来源:政府各部门,头豹研究院政策名称颁布日期颁布主体主要内容及影响针对生成式人工智能服务出台针对生成式人工智能服务出台管理办法管理办法2023-04网信部一方面,该办法支持人工智能算法、框架等基础技术的自主创新、推广应用、国际合作,为端侧大模型发展提供了政策支持和
37、技术保障;另一方面,该办法要求端侧大模型在数据来源、算法设计、内容标识等方面遵守法律法规的要求,尊重社会公德、公序良俗,防止生成虚假信息、侵犯他人权益、造成社会不良影响等问题,为端侧大模型发展提供了规范引导和监督约束数字中国建设整体布局规划数字中国建设整体布局规划 2023-02国务院不仅在技术基础、数据资源、应用场景、技术创新和政策环境等多个层面提供了支持和指导,还明确了发展方向和合规要求,为端侧大模型的健康、快速发展铺平了道路。这促使相关企业需不断提升技术创新能力,加强数据安全与隐私保护,深化与实体经济的融合,以适应并推动数字中国建设的总体布局关于加快场景创新以人工智能关于加快场景创新以人
38、工智能高水平应用促进经济高质量发展高水平应用促进经济高质量发展的指导意见的指导意见2022-07科技部一方面,该指导意见鼓励在各行业领域深入挖掘人工智能技术应用场景,为端侧大模型提供了丰富多样的应用场景,如聊天和文本生成、机器翻译、语音识别与合成、自然语言理解与推理等;另一方面,该指导意见强调以需求为牵引谋划人工智能技术应用场景,为端侧大模型提供了需求驱动的动力,促进端侧大模型在解决实际问题中优化升级关于促进新一代人工智能产业关于促进新一代人工智能产业高质量发展的若干措施高质量发展的若干措施2022-01教育部发挥科技支撑和引领作用,支持有条件的地区和高校、科研机构、企业开展语言智能技术研究,
39、着力在自然语言处理、机器写作、机器翻译、机器评测等领域取得实质成果,为端侧大模型奠定技术实力工业和信息化部关于开展信息工业和信息化部关于开展信息通信服务感知提升行动的通知通信服务感知提升行动的通知2021-11工信部从事互联网信息服务的企业应建立客服热线电话,并在网站、APP等显著位置公示客服热线电话号码。鼓励具备条件的企业提供充足的人工客服坐席国家新一代人工智能标准体系国家新一代人工智能标准体系建设指南建设指南2020-07网信办指南规划了新一代人工智能标准体系的总体框架和具体内容,包括标准目录、标准体系结构、标准分类和标准制定程序等。通过建设完备、系统、规范的人工智能标准体系,促进人工智能
40、技术的创新和应用,保障人工智能的安全和可持续发展400-072-5588中国:人工智能系列行业研读|2024/5依托技术实力和生态建设依托技术实力和生态建设,头部大模型厂商纷纷投入端侧大模型市场头部大模型厂商纷纷投入端侧大模型市场,利用在云端大模型领域的技术优势利用在云端大模型领域的技术优势,商汤商量商汤商量、阿里通义以及面壁智阿里通义以及面壁智能率先在端侧大模型领域取得领先突破能率先在端侧大模型领域取得领先突破中国端侧大模型市场探析竞争格局中国端侧大模型行业竞争格局来源:企业官网,头豹研究院技术力强市场力强弱领导者商汤阿里云面壁智能百度智能云华为云腾讯云科大讯飞依托技术实力和生态建设,头部大
41、模型厂商纷纷投入端侧大模型市场头部大模型厂商依托其深厚的技术积累和成熟的生态系统,正加速布局端侧大模型市场。一方面,这些厂商利用在云端大模型领域的技术优势,通过算法优化、模型压缩等先进技术,有效解决了端侧算力限制问题,使得复杂的AI功能能够在移动设备、物联网终端等平台上高效运行,满足用户对即时性、隐私保护及离线使用的需求,如商汤发布1.8B端侧大模型,阿里也发布18亿参数的通义端侧大模型。另一方面,通过构建开放的生态平台,整合上下游资源,赋能开发者与行业伙伴,共同探索端侧AI的多元化应用场景。技术融合与创新驱动将加剧端侧大模型市场竞争随着端侧大模型技术的日益成熟,未来中国端侧大模型行业的竞争格
42、局将呈现出技术深度融合与创新驱动的新态势。一方面,技术融合将成为竞争的核心要素。厂商不再局限于单一技术的优化,而是趋向于跨领域技术的集成,如将自然语言处理、计算机视觉、边缘计算等技术与大模型结合,打造综合型AI解决方案。生态系统构建与合作模式的创新将成为塑造竞争格局的关键在端侧大模型的部署与应用中,单一企业的力量难以覆盖全部产业链环节,因此构建开放合作的生态系统,促进技术、数据、应用和服务的共享,将成为提升竞争力的重要途径。这包括与芯片制造商、硬件供应商、软件开发商、行业应用提供商等多方面的深度合作,形成共生共赢的生态体系。例如端侧大模型推动AI芯片市场发展,2023年全球边缘AI芯片出货预计
43、达22.86亿颗。此外,创新的合作模式,如联合研发、数据共享协议、灵活的IP授权方式等,将促进资源优化配置,加速技术产品的迭代与市场拓展。400-072-5588Chapter 3典型厂商分析 阿里云 商汤科技 面壁智能行业研读|2024/400-072-5588中国:人工智能系列行业研读|2024/5 头豹研究院布局中国市场,深入研究19大行业,持续跟踪532个垂直行业的市场变化,已沉淀超过100万行业研究价值数据元素,完成超过1万个独立的研究咨询项目。研究院依托中国活跃的经济环境,研究内容覆盖整个行业的发展周期,伴随着行业中企业的创立,发展,扩张,到企业走向上市及上市后的成熟期,研究院的各
44、行业研究员探索和评估行业中多变的产业模式,企业的商业模式和运营模式,以专业的视野解读行业的沿革。研究院融合传统与新型的研究方法,采用自主研发的算法,结合行业交叉的大数据,以多元化的调研方法,挖掘定量数据背后的逻辑,分析定性内容背后的观点,客观和真实地阐述行业的现状,前瞻性地预测行业未来的发展趋势,在研究院的每一份研究报告中,完整地呈现行业的过去,现在和未来。研究院密切关注行业发展最新动向,报告内容及数据会随着行业发展、技术革新、竞争格局变化、政策法规颁布、市场调研深入,保持不断更新与优化。研究院秉承匠心研究,砥砺前行的宗旨,从战略的角度分析行业,从执行的层面阅读行业,为每一个行业的报告阅读者提供值得品鉴的研究报告。方法论