2024年中国AI大模型产业发展报告：开启智能新时代.pdf

资源描述

1、前言伴随人工智能技术的加速演进，AI 大模型已成为全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎，发展潜力大、应用前景广。近年来，我国高度重视人工智能的发展，将其上升为国家战略，出台一系列扶持政策和规划，为 AI 大模型产业发展创造了良好的环境。当前，通用大模型、行业大模型、端侧大模型如雨后春笋般涌现，大模型产业的应用落地将进一步提速。作为新一代人工智能产业的核心驱动力，AI 大模型广泛赋能我国经济社会的多个领域，打开迈向通用人工智能的大门，推动新一轮的科技革命与产业变革。在大模型盛行的时代，产业发展到何种阶段，遇到何种挑战，未来将走向何方，这些都是需要面对的问题，亟需社会各界共同努

2、力。在此背景下，人民网财经研究院、至顶科技联合发布开启智能新时代：2024年中国 AI 大模型产业发展报告，报告对于 AI 大模型产业发展背景、产业发展现状、典型案例、挑战及未来趋势等方面进行了系统全面的梳理，为政府部门、行业从业者以及社会公众更好了解 AI 大模型产业提供参考。专家寄语2023 年人工智能大模型全面爆发，给科技创新、生产生活带来重大变革、机遇和挑战。全球大模型竞争日趋激烈，众多国产大模型脱颖而出。大模型与电力、零售、出版等传统行业的成功融合，展现对传统产业改造提升的潜力。大模型赋能金融、医疗等行业提质增效，对推动新质生产力快速发展起到重要作用。大模型持续健康发展，需要政策法

3、规保驾护航，满足隐私保护、数据安全等多方面要求。期待未来大模型持续深耕技术创新并服务于各行各业，为全社会全方位地注入高质量发展的新动能。李君李君传播内容认知全国重点实验室专职副主任AI 大模型的出现，使得利用人工智能技术来生成内容，从“可用”跨越到“好用”。生产内容是所有行业共有的需求，如今大模型已经在电商、影视、传媒等领域被规模应用。大模型的商业化需要供需双方同时发力：供给侧来看，以Transformer 为代表的根技术存在显著成本问题，当前大模型还有进一步压缩成本、提高性价比的空间；需求侧来看，企业高效应用 AI 大模型的必然前提是，投入大量资金、人力、时间以提升企业自身数字化程度。未来

4、，人工智能生成内容从“好用”到“高效”，也许会再经历一次或多次技术范式的颠覆。王蕴韬王蕴韬中国信息通信研究院人工智能研究中心副总工程师2024 年，多重利好因素将推动大模型快速发展，首先是“人工智能+”行动等来自政府层面的有力支持，其次用户提升生活、工作效率的需求激增，再加上科技公司加大对 AI 领域投入资金、人力、技术研发，各环节协同支撑大模型发展。当前大模型产业也面临挑战，包括算力分散不足、Transformer 结构是否为最优的疑问、领域数据稀缺、缺少现象级应用的问题。就产业趋势而言，投入基础模型训练的公司未来可能会大幅减少，转而更多的公司会去寻找应用场景和爆款应用。vivo 结合自研

5、大模型端侧化、矩阵化的技术优势并且会聚焦手机行业的应用经验，利用大模型重构手机各类功能，找到落地场景，普惠更多用户。周围周围 vivo 副总裁、vivo AI 全球研究院院长目录第第一章一章扬帆起航：中国扬帆起航：中国 AIAI 大模型产业发展背景大模型产业发展背景.1 11.1 中国 AI 大模型产业发展政策驱动力.11.2 AI 大模型产业发展技术驱动力.41.3 中国 AI 大模型产业发展市场驱动力.9第二章第二章百舸争流：中国百舸争流：中国 AIAI 大模型产业现状及典型案例大模型产业现状及典型案例.12122.1 AI 大模型主要特征.122.2 AI 大模型主要类型.132.3

6、中国 AI 通用大模型典型案例.152.4 中国 AI 行业大模型典型案例.202.5 中国 AI 端云结合大模型典型案例.27第三章第三章大浪淘沙：中国大浪淘沙：中国 AIAI 大模型产业发展所面临的挑战大模型产业发展所面临的挑战.3 31 13.1 大模型产业遭遇算力瓶颈.313.2 主流大模型架构仍存在诸多局限.313.3 高质量的训练数据集仍需扩展.323.4 大模型爆款应用尚未出现.32第四章第四章天阔云高：中国天阔云高：中国 AIAI 大模型产业趋势展望大模型产业趋势展望.3 34 44.1 AI云侧与端侧大模型满足不同需求，C端用户将成为端侧的主要客群.344.2 AI 大

7、模型趋于通用化与专用化，垂直行业将是大模型的主战场.344.3 AI 大模型将广泛开源，小型开发者可调用大模型能力提升开发效率.354.4 AI 高性能芯片不断升级，AI 大模型产业生态体系将不断完善.36结语结语.37AI 大模型将加快新质生产力发展，助力我国经济社会高质量发展.371/37第一章第一章扬帆起航：中国扬帆起航：中国 AIAI 大模型产业发展背景大模型产业发展背景1.11.1 中国中国 AIAI 大模型产业发展政策驱动力大模型产业发展政策驱动力近年来，我国始终高度重视人工智能发展机遇和顶层设计，发布多项人工智能支持政策，国务院于 2017 年发布新一代人工智能发展规划。科技部

8、等六部门也于 2022 年印发关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见对规划进行落实。2024 年政府工作报告中提出开展“人工智能+”行动。伴随人工智能领域中大模型技术的快速发展，我国各地方政府出台相关支持政策，加快大模型产业的持续发展。当前，北京、深圳、杭州、成都、福建、安徽、上海、广东等地均发布了关于 AI 大模型的相关政策。具体来看，北京着力推动大模型相关技术创新，构建高效协同的大模型技术产业生态；上海强调打造具备国际竞争力的大模型；深圳重点支持打造基于国内外芯片和算法的开源通用大模型，支持重点企业持续研发和迭代商用通用大模型；安徽从资源方面着手吸引大模型企业

9、入驻；成都着力推动大模型相关技术创新，重点研发和迭代 CV 大模型、NLP 大模型、多模态大模型等领域大模型以及医疗、金融、商务、交通等行业大模型；杭州支持头部企业开展多模态通用大模型关键技术攻关、中小企业深耕垂直领域做精专用模型。2 2023023 年以来我国各地出台的大模型产业相关政策年以来我国各地出台的大模型产业相关政策发布发布时间时间发布机构发布机构政策标题政策标题政策政策内容内容2 2023023 年年 5 5 月月北京市北京市人民政府人民政府北京市加快建设北京市加快建设具有全球影响力的具有全球影响力的人工智能创新策源人工智能创新策源地实施方案地实施方案（2023-20252023-

10、2025 年）年）支持创新主体重点突破分布式高效深度学习框架、大模型新型基础架构等基础平台技术。着力推动大模型相关技术创新。构建高效协同的大模型技术产业生态。建设大模型算法及工具开源开放平台，构建完整大模型技术创新体系。组建全栈国产化人工智能创新联合体，搭建基于国产软硬件的人工智能训练和服务基础设施，研发全栈国产化的生成式大模型，逐步形成自主可控的人工智能技术体系和产业生态。2/372 2023023 年年 5 5 月月北京市人民政北京市人民政府办公厅府办公厅北京市促进通用北京市促进通用人工智能创新发展人工智能创新发展的若干措施的若干措施高效推动新增算力基础设施建设高效推动新增算力基础设施建设

11、:加快推动海淀区、朝阳区建设北京人工智能公共算力中心、北京数字经济算力中心，形成规模化先进算力供给能力，支撑千亿级参数量的大型语言模型、大型视觉模型、多模态大模型、科学计算大模型、大规模精细神经网络模拟仿真模型、脑启发神经网络等研发。开展大模型创新算法及关键技术研究开展大模型创新算法及关键技术研究:围绕模型构建、训练、调优对齐、推理部署等环节，积极探索基础模型架构创新，研究大模型高效并行训练技术和认知推理、指令学习、人类意图对齐等调优方法，研发支持百亿参数模型推理的高效压缩和端侧部署技术，形成完整高效的技术体系，鼓励开源技术生态建设。2 2023023 年年 5 5 月月中共深圳市委中共深圳市

12、委办公厅、深圳办公厅、深圳市人民政府办市人民政府办公厅公厅深圳市加快推动深圳市加快推动人工智能高质量发人工智能高质量发展高水平应用行动展高水平应用行动方案（方案（202320232022024 4年）年）重点支持打造基于国内外芯片和算法的开源通用大模型；支持重点企业持续研发和迭代商用通用大模型；鼓励大模型企业联合生态伙伴加强大模型插件及相关软硬件研发，推动大模型与现有的操作系统、软件、智能硬件打通、互嵌。2 2023023 年年 7 7 月月杭州市人民政杭州市人民政府办公厅府办公厅杭州市人民政府杭州市人民政府办公厅关于加快推办公厅关于加快推进人工智能产业创进人工智能产业创新发展的实施

13、意新发展的实施意见见到 2025 年，基本形成“高算力+强算法+大数据”的产业生态，将我市打造成为全国算力成本洼地、模型输出源地、数据共享高地，人工智能创新应用水平全国领先、国际先进。算力设施先进泛在，算力供给普惠高效，全市可开放算力规模在使用半精度输出输入(FP16)下达到 5000 千万亿次浮点指令/秒(PFLOPS)以上，高性能算力占比达到 60%以上。模型创新应用领跑全国，培育性能达到国际先进水平的通用大模型 1 个、具有行业重大影响力的专用模型 10 个。支持头部企业开展多模态通用大模型关键技术攻关、中小企业深耕垂直领域做精专用模型，鼓励相关技术和算法开源开放，形成“1

14、+N+X”的协同创新、双向赋能产业生态。2 2023023 年年 8 8 月月成都市经济和成都市经济和成都市加快大模成都市加快大模支持企业与科研机构开展数据与知识深度联合学习、大规模3/37信息化局、成信息化局、成都市新经济发都市新经济发展委员会展委员会型创新应用推进人型创新应用推进人工智能产业高质量工智能产业高质量发展的若干措施发展的若干措施认知与推理、可控内容生成等关键算法研发，着力推动大模型相关技术创新，重点研发和迭代 CV 大模型、NLP 大模型、多模态大模型等领域大模型，以及医疗、金融、商务、交通等行业大模型。2 2023023 年年 9 9 月月福建省人民政福建省人民政府办公厅府办

15、公厅福建省人民政府福建省人民政府办公厅关于印发福办公厅关于印发福建省促进人工智能建省促进人工智能产业发展十条措施产业发展十条措施的通知的通知以普惠算力降低人工智能企业研发成本，支撑快速增长的算力需求，促进自然语言，多模态认知等超大规模智能模型开发训练。2 2023023 年年 1010 月月安徽省安徽省人民政府人民政府安徽省人民政府安徽省人民政府关于印发打造通用关于印发打造通用人工智能产业创新人工智能产业创新和应用高地若干政和应用高地若干政策的通知策的通知对在皖落户的通用及行业大模型企业、跨领域应用企业、新兴算力企业、安全人工智能企业等，优先匹配算力、数据、场景、基金、场地等要素资源。2 20

16、23023 年年 1010 月月上海市经济和上海市经济和信息化委员信息化委员会、上海市发会、上海市发展和改革委员展和改革委员会等五部门会等五部门上海市推动人工上海市推动人工智能大模型创新发智能大模型创新发展若干措施展若干措施（2023-20252023-2025 年）年）实施大模型创新扶持计划。支持引进高水平创新企业，支持本市创新主体打造具有国际竞争力的大模型，鼓励形成数据飞轮，加速模型迭代，对取得重大成果的予以专项奖励。实施大模型示范应用推进计划。重点支持在智能制造、生物医药、集成电路、智能化教育教学、科技金融、设计创意、自动驾驶、机器人、数字政府等领域构建示范应用场景，打造

17、标杆性大模型产品和服务。2 2023023 年年 1111 月月广东省广东省人民政府人民政府广东省人民政府广东省人民政府关于加快建设通用关于加快建设通用人工智能产业创新人工智能产业创新引领地的实施意引领地的实施意见见围绕基础架构、训练算法、调优对齐、推理部署等环节，研发千亿级参数的人工智能通用大模型，形成自主可控的大模型完整技术体系。聚焦智能经济、智能社会等行业创新场景，研发具有多模态数据、知识深度融合的垂直领域大模型，支撑多任务复杂场景行业应用。制表：报告组根据公开信息整理4/371.21.2 AIAI 大模型产业发展技术驱动力大模型产业发展技术驱动力近年来，AI 大

18、模型得到快速发展，当前大模型热潮主要由语言大模型相关技术引领。语言大模型通过在海量无标注数据上进行大规模预训练，让模型学习大量知识并进行指令微调，从而获得面向多任务的通用求解能力。2017年，Google提出基于自注意力机制的神经网络结构Transformer 架构，奠定了大模型预训练算法架构的基础。2018 年，OpenAI 和 Google 分别发布了 GPT-1 与 BERT 大模型，预训练大模型成为自然语言处理领域的主流。2022 年，OpenAI 推出 ChatGPT，其拥有强大的自然语言交互与生成能力。2023 年，OpenAI 多模态预训练大模型GPT-4 发布，其具备多模态理解

19、与多类型内容生成能力。2024 年，OpenAI 发布视频生成大模型 Sora，提出时空碎片和扩散 Transformer 技术，大模型的多模态生成能力的进一步成熟。本部分将从经典 Transformer 架构出发，通过全面梳理基于人类反馈强化学习、指令微调、提示学习等相关大模型技术，体现技术对于产业发展的带动作用。1.2.11.2.1 TransformerTransformer 架构架构Transformer 架构是目前语言大模型采用的主流架构，于 2017 年由 Google提出，其主要思想是通过自注意力机制获取输入序列的全局信息，并将这些信息通过网络层进行传递，Transformer

20、架构的优势在于特征提取能力和并行计算效率。Transformer 架构主要由输入部分、多层编码器、多层解码器以及输出部分组成。其中，输入部分包括源文本嵌入层、位置编码器；编码器部分由 N 个编码器层堆叠而成；解码器部分由 N 个解码器层堆叠而成；输出部分包括线性层和Softmax 层。5/37TransformerTransformer 架构图架构图制图：报告组根据公开信息整理自注意力机制作为 Transformer 模型的核心组件，其允许模型在处理序列数据时，对每个词位置的输入进行加权求和，得到一个全局的上下文表示。在计算自注意力时，模型首先将输入序列进行线性变换，得到 Q（查询）、K（键）

21、和 V（值）三个向量。然后，通过计算 Q 和 K 的点积，并应用 Softmax 函数，得到每多头自注意力残差连接和层归一化掩码多头自注意力残差连接和层归一化多头自注意力残差连接和层归一化输入嵌入前馈层残差连接和层归一化前馈层残差连接和层归一化输出嵌入线性层Softmax 层NxNx位置编码位置编码输入输出（右位移）输出概率6/37个位置的权重。最后，将权重与 V 向量相乘，得到自注意力的输出。为提高模型的表达能力，Transformer 模型采用了多头自注意力机制，这意味着模型在同一时间关注来自不同表示子空间的注意力信息。多头自注意力的实现方法是将输入序列分成多个组，每个组使用一个独立的权重

22、矩阵进行线性变换，并计算自注意力。最终，自注意力的输出被拼接起来，并通过一个线性层得到最终的输出表示。在计算自注意力和多头自注意力之后，Transformer 模型使用前馈神经网络对输入序列进行变换。前馈神经网络由多个全连接层组成，每个全连接层都使用 ReLU激活函数。前馈神经网络的作用是对输入序列进行非线性变换，以捕捉更复杂的特征。1.2.21.2.2 A AI I 语言大模型关键技术语言大模型关键技术AI 语言大模型关键技术主要涉及基于人类反馈强化学习、指令微调、模型提示等相关技术。（1 1）基于人类反馈强化学习基于人类反馈强化学习基于人类反馈强化学习基于人类反馈强化学习(Reinforc

23、ementReinforcement LearningLearning fromfrom HumanHuman Feedback,Feedback,RLHF)RLHF)，是指将人类标注者引入到大模型的学习过程中，训练与人类偏好对齐的奖励模型，进而有效指导语言大模型的训练，使得模型能够更好地遵循用户意图，生成符合用户偏好的内容。基于人类反馈强化学习具体包括以下几个步骤：1 1）训练监督策略模型：）训练监督策略模型：使用监督学习或无监督学习的方法，对一个预训练的语言模型进行训练，通过给予特定奖励或惩罚引导 AI 模型的行为，使其能够根据给定的输入预测输出或行为。2 2）训练奖励模型：）训练奖励模型

24、：让标记员参与提供有关模型输出结果的反馈，对模型生成的多个输出或行为的质量或正确性进行排名或评分，这些反馈被转换为奖励信号，用于后续的强化学习过程。3 3）采用近端策略优化进行强化学习：）采用近端策略优化进行强化学习：先通过监督学习策略生成近端策略优化（PPO）模型，经过奖励机制反馈最优结果后，再将结果用于优化和迭代 PPO7/37模型参数。具体而言，在 PPO 模型训练过程中，智能系统通过尝试不同的行为，并根据每个行为获得的奖励来评估其质量，智能系统逐步改进行为策略。基于人类反馈强化学习示意图基于人类反馈强化学习示意图制图：报告组根据公开信息整理（2）指令微调指令微调指令微调(Instruc

25、tion(Instruction Tuning)Tuning)，是一种帮助语言大模型实现人类语言指令遵循的能力，在零样本设置中泛化到未知任务上的学习方法。指令微调是让语言大模型理解人类指令并按照指令要求完成任务，即在给定指令提示的情况下给出特定的回应。指令微调可被视为有监督微调（Supervised Fine-Tuning，SFT）的一种特殊形式，但两者目标有所差别。SFT 是一种使用标记数据对预训练模型进行微调的过程，以便模型能够更好地执行特定任务，而指令微调是一种通过在（指令，输出）对的数据集上进一步训练大型语言模型（LLMs）的过程，以增强LLMs 的能力和可控性。指令微调的特殊之处在于

26、其数据集的结构，即由人类指令和期望的输出组成的配对，这种结构使得指令微调专注于让模型理解和遵循人类指令。（3）模型提示8/37通过大规模文本数据预训练之后的语言大模型具备作为通用任务求解器的潜在能力，这些能力在执行特定任务时可能不会显式地展示出来，在大模型输入中设计合适的语言指令提示有助于激发这些能力，称为模型提示技术。典型的模型提示技术包括指令提示和思维链提示。指令提示（指令提示（InstructionInstruction PromptPrompt）。OpenAI 在 GPT-3 中首次提出上下文提示，并发现 GPT-3 在特定领域少样本提示下能够达到人类水平，证明在低资源场景下非常有效。

27、指令提示的核心思想是避免强制语言大模型适应下游任务，而通过提供“提示（Prompt）”来给数据嵌入额外的上下文以重新组织下游任务，使之看起来更像是在语言大模型预训练过程中解决的问题。思维链思维链提示提示（ChainChain ofof ThoughtThought,CoTCoT）。推理的过程通常涉及多个推论步骤，通过多步推理允许产生可验证的输出，可以提高黑盒模型的可解释性。思维链是一种提示技术，已被广泛用于激发语言大模型的多步推理能力，被鼓励语言大模型生成解决问题的中间推理链，类似于人类使用深思熟虑的过程来执行复杂的任务。在思维链提示中，中间自然语言推理步骤的例子取代少样本提示中的输入，输出

28、对，形成输入，思维链，输出三元组结构。思维链被认为是语言大模型的“涌现能力”，通常只有模型参数规模增大到一定程度后才采用思维链能力。激活语言大模型的思维链能力方法，在提示中给出逐步的推理演示作为推理的条件，每个演示都包含一个问题和一个通向最终答案的推理链。9/371.31.3 中国中国 AIAI 大模型产业发展市场驱动力大模型产业发展市场驱动力中国 AI 大模型产业发展源于多领域的广泛需求，例如来自办公、制造、金融、医疗、政务等场景中降本增效、生产自动化、降低风险、提高诊断准确率、提高政务服务效率等诉求。相关领域的创新和发展共同推动着中国 AI 大模型产业的蓬勃发展，预示着未来更广阔的市场前景

29、。1 1.3.1.3.1 办公场景办公场景近年来，随着文字、语音、图像等处理能力跃迁，大模型摇身变为“助理”走入办公室和会议室，结合传统软件使得办公和会议智能化。基于大模型的智能办公产品满足日常办公场景中文案生成、PPT 美化、数据分析等各种需求。仅通过自然语言交互，用户便可将繁琐的文字、演示、数据处理工作交给“助理”，用节约的时间做更有创意的事情。智能文档负责协助用户构建文章大纲、一键生成模板、生成内容、优化表达、处理和理解文档；智能演示承担自动排版美化、生成演讲备注、一键生成幻灯片等任务；智能表格通过对话即可生成公式、数据批量处理、自动生成表格。智能会议方面，大模型可从会议策划、同声传译、

30、会议记录等各环节赋能。会议策划场景大模型根据会议主题等提示词，自动生成会议环节、会议分论坛、会议时间、会议预算等完整策划内容；在大模型能力加持下，同声传译的准确性、及时性和多语言能力得到显著提升；通过大模型处理后，结构清晰、要点明确的会议记录结果使得会后回顾更加高效。1 1.3.2.3.2 制造场景制造场景人工智能崛起引领制造行业的深刻变革，改变研发设计、生产制造、供应链管理等流程。大模型+EDA/CAE/CAD，将传统研发设计软件效率进一步提升。大模型助力数字孪生和机器人，获得强大的感知场景和执行任务能力。大模型融合供应链管理，实现工厂管理的智能化转型。10/37在研发设计阶段，以大模型+E

31、DA 为例，利用云端扩展性实现设计自动化，并确保设计在电气方面准确无误，同时简化系统设计流程，缩短 PCB 设计周转时间。企业借此缩短研发周期、降低研发成本、提升行业竞争力；生产制造中，利用 AIGC 和数字孪生技术，可模拟真实生产环境派出虚拟人代替工人进行危险、故障排查，或是通过仿真设备操作场景，完成沉浸式作业教学。拥有大模型功能的机器人凭借机器视觉技术，可执行路径规划、物体识别等任务；大模型集成于供应链管理系统中，能重构数字化办公流程，通过自然语言指令实现人机交互，推动企业进行更高效的管理决策、更便捷的数据分析与可视化，在需求端及时预测需求达到降本增效的目的，在仓库和物流端实现智能调度、智

32、能跟踪和智能预警。1 1.3.3.3.3 金融场景金融场景金融行业存在前、中和后台的业务划分，在数字经济时代的浪潮中，相关业务已被大模型全局赋能提升效率。以银行为例，对话机器人、虚拟助理已经逐渐出现在个性化服务、电子营销、金融欺诈检测、信贷支持等服务场景中。个性化服务方面，银行大模型以客户数据为依据，为客户提供定制的财务和产品计划；电子营销方面，大模型根据客户行为偏好生成个性化电子邮件；金融欺诈检测方面，大模型赋能专业人员检索大量数据识别欺诈行为；信贷支持方面，大模型通过分析海量生产生活和信用数据，为信贷部门人员生成高质量的信贷方案建议，减少银行贷款收益损失。1 1.3.4.3.4 医疗场景医

33、疗场景得益于近年来医疗大模型的不断迭代，复杂的医疗数据分析任务得以解决。由于患者行为数据的独特性，大模型通过个性化设计，满足患者“千人千面”的医疗服务需求，应用于智慧影像、智慧手术、智慧健康等领域。智慧影像覆盖 CT、MR、DR、US、DSA、钼靶等医疗影像场景，为患者进行早期检测、诊断及健康风险评估；智慧手术功能大幅提高患者病情评价准确度，打牢术前风险评估、术中手术规划、术后预后估计的基础；智慧健康则作为一般患11/37者的贴身健康助手，通过小程序等便捷方式为患者提供高质量导诊服务和个性化健康建议。1 1.3.5.3.5 政务场景政务场景在办公、制造、金融、医疗场景得到助力的同时，政务场景下

34、的效率、信息参考范围、经验共享、规范性等常见痛点也获得大模型能力加持得以解决。为提升效率，大模型利用自动化的政策检索、政策比对解决海量政策参考、人工分析比对的耗时问题；为缩小信息参考范围，政策撰写助手结合政策数据权威白名单，并接入政策全量库，避免不可靠信息来源引发舆论风险；为提高政策管理经验共享，大模型引入政策经验知识库，提升政务业务理解和政策管理能力；为规范政策撰写，政务大模型凭借规范化生成、检查功能维护成果的规范性、权威性。12/37第二章第二章百舸争流：中国百舸争流：中国 AIAI 大模型产业现状及典型案例大模型产业现状及典型案例2.12.1 AIAI 大模型主要特征大模型主要特征AI

35、大模型具有泛化性(知识迁移到新领域)、通用性(不局限于特定领域)以及涌现性(产生预料之外的新能力)特征。以 ChatGPT 为代表的 AI 大模型因其具有巨量参数和深度网络结构,能学习并理解更多的特征和模式,从而在处理复杂任务时展现强大的自然语言理解、意图识别、推理、内容生成等能力,同时具有通用问题求解能力,被视作通往通用人工智能的重要路径。AIAI 大模型的三大特征：泛化性、通用性、涌现性大模型的三大特征：泛化性、通用性、涌现性制图：报告组绘制13/372.22.2 AIAI 大模型主要类型大模型主要类型按照部署方式划分，按照部署方式划分，A AI I 大模型主要分为云侧大模型和端侧大模型

36、两类。大模型主要分为云侧大模型和端侧大模型两类。云侧大模型由于部署在云端，其拥有更大的参数规模、更多的算力资源以及海量的数据存储需求等特点；端侧大模型通常部署在手机、PC 等终端上，具有参数规模小、本地化运行、隐私保护强等特点。具体而言，云侧大模型分为通用大模型和行业大模型云侧大模型分为通用大模型和行业大模型；端侧大模型主要有手端侧大模型主要有手机大模型机大模型、PCPC 大模型大模型。从云侧大模型来看，通用大模型具有适用性广泛的特征，其训练数据涵盖多个领域，能够处理各种类型的任务，普适性较强。行业大模型具有专业性强的特点，针对特定行业（如金融、医疗、政务等）的需求进行模型训练，因而对特定领域

37、具有更深的业务理解和场景应用能力。从端侧大模型来看，手机和 PC 大模型由于直接部署在设备终端，让用户体验到更加个性化和便捷的智能体验。14/37AIAI 大模型主要分为云侧大模型和端侧大模型两类大模型主要分为云侧大模型和端侧大模型两类制图：报告组根据公开信息整理当前，我国 AI 大模型产业呈现蓬勃发展的态势。伴随多家科技厂商推出的AI 大模型落地商用，各类通用、行业以及端侧大模型已在多个领域取得了显著的成果，如在金融、医疗、政务等领域，AI 大模型已成为提升服务质量和效率的重要手段。我国具有代表性的通用 AI 大模型主要包含科大讯飞的讯飞星火认知大模型、百度公司的文心一言大模型、阿里巴巴的通

38、义千问大模型等；行业AI 大模型主要涵盖蜜度的文修大模型、容联云的赤兔大模型、用友的 YonGPT 大模型；同时具有云侧和端侧大模型的端云结合 AI 大模型主要有 vivo 的蓝心大模型；端侧 AI 大模型主要以蔚来的 NOMI GPT 大模型为代表。15/37中国中国 A AI I 大模型分类及典型案例大模型分类及典型案例类别类别A AI I 大模型功能大模型功能A AI I 大模型案例大模型案例A AI I 通用大模型通用大模型文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等科大讯飞讯飞星火认知大模型百度公司文心一言大模型阿里巴巴通义千问大模型A AI I 行业大模

39、型行业大模型1.金融：文档处理、知识问答、内容生成、辅助决策2.医疗：医学影像生成、知识问答、辅助决策3.政务：政策检索、知识问答、辅助决策4.电商：经营分析、商品推广、商品销售5.传媒：录音转写、新闻写作、视频剪辑蜜度文修大模型容联云赤兔大模型用友YonGPT 大模型人民网“写易”智能创作引擎AIAI 端侧大模型端侧大模型物体识别、语言理解蔚来NOMI GPTA AI I 端云结合端云结合大模型大模型语义搜索、知识问答、文本创作、图片生成、智慧交互等vivo蓝心大模型制图：报告组根据公开信息整理2.32.3 中国中国 AIAI 通用大模型典型案例通用大模型典型案例案例一：科大讯飞案例一：科大

40、讯飞讯飞星火认知大模型讯飞星火认知大模型（1 1）大模型简介：）大模型简介：讯飞星火认知大模型讯飞星火认知大模型是科大讯飞推出的新一代认知大模型，可实现基于自然对话方式的用户需求理解与任务执行。讯飞星火从赋能万物互联时代的人机交互、赋能知识学习与内容创作、提升数智化生产力三个方面展现其应用能力。讯飞星讯飞星火火认知认知大模型具备七大核心能力大模型具备七大核心能力：文本生成文本生成、语言理解语言理解、知识问答知识问答、逻辑推理逻辑推理、数学能力、代码能力和多模态能力数学能力、代码能力和多模态能力。（2 2）大模型优势：）大模型优势：2024 年 1 月，讯飞星火认知大模型 V3.5 发布，七大核

41、心能力全面提升。据科大讯飞宣称，数学、语言理解超 GPT-4 Turbo，在代码能力方面已经达到 GPT-416/37Turbo 的 96%。另外，星火大模型在多模态理解方面达到 GPT-4V 的 91%，其中语音的多模态能力已经超过 GPT-4。讯飞星火认知大模型讯飞星火认知大模型 V3.5V3.5 七大能力七大能力图片来源：讯飞星火认知大模型 V3.5 升级发布会讯飞星火认知大模型 V3.5 从三个角度展示了模型能力的提升，赋能万物互联时代人机交互、赋能知识学习与内容创作、提升数智化生产力。人机交互方面人机交互方面，讯飞星火 V3.5 在语义理解、指令跟随和多轮对话中展现优异能力，在情绪感

42、知和拟人合成方面也有出色表现；知识学习与内容创作方面知识学习与内容创作方面，要素抽取、问题生成等底层能力的进步，能够帮助知识学习和内容创作领域，产生更丰富更有用的智能体。讯飞星火大模型能够结合外部知识进行合理拓展，做到“旁征博引”；数数智化生产力方面智化生产力方面，逻辑推理能力和时空推理能力并重，数学则是大模型的基础能力，而代码能力用于生成各种工具链接虚拟和现实世界，最后多模态能力也是机器人、工业、家庭等场景中必备的能力。讯飞星火 V3.5 在这些关键技术领域取得显著进步。（3 3）大模型应用：）大模型应用：讯飞星火七大能力的提升，实现了各类应用场景性能升级。语言理解方面语言理解方面，情感分析

43、可以提取文本情感色彩更好了解内容观点和态度。文本摘要总结简洁准17/37确的摘要，快速理解文章的核心观点；文本生成方面文本生成方面，科大讯飞推出可以一键快速自动生成文档和 PPT 的办公产品讯飞智文，主要功能有文档一键生成、AI撰写助手、多语种文档生成、AI 自动配图、多种模板选择、演讲备注等；知识知识问答方面问答方面，讯飞星火对生活常识问答、医学知识问答、政策问答等任务“信手拈来”；逻辑推理方面逻辑推理方面，思维推理可以通过分析问题的前提条件和假设来推理出答案或解决方案，给出新的想法和见解。科学推理则使用已有的数据和信息进行推断、预测和验证等科学研究中的基本任务；数学能力方面数学能力方面，讯

44、飞星火可以解决方程求解、立体几何、微积分、概率统计等数学问题；代码能力方面代码能力方面，讯飞星火能根据注释、函数名智能生成代码，支持逐行代码注释，还可以精准定位代码语法、逻辑错误，甚至可以智能生成单元测试数据；多模态能力方面多模态能力方面，讯飞星火可根据用户上传图片返回准确的图片描述，或完成针对图片素材的问答，还可以凭借用户描述，生成期望的音频和视频。案例二：百度公司案例二：百度公司文心一言大模型文心一言大模型（1 1）大模型简介：大模型简介：文心一言是百度研发的人工智能大语言模型产品，具备跨模态、跨语言的深度语义理解与生成能力，在文学创作、文案创作、搜索问答、多模态生成、数理逻辑推算等众多领

45、域都能为用户提供高质量服务。文心一言拥有四大基础能力文心一言拥有四大基础能力：理解能力、生成能力、逻辑能力、记忆能力。理解能力、生成能力、逻辑能力、记忆能力。（2 2）大模型优势：大模型优势：2023 年 10 月发布的“文心大模型 4.0”，相比上一代文心大模型，四大能力显著升级，其中逻辑提升幅度是理解的 3 倍，记忆提升幅度是理解的 2 倍。理理解能力解能力方面，文心一言能听懂潜台词、复杂句式、专业术语、前后乱序、模糊意图等复杂提示词，也能胜任代码理解与调试任务；生成能力生成能力方面，文心一言能快速生成风格多样的文本、代码、图片、图表、视频，比如进行文案创作、制定生活计划、编写高质量代码；

46、逻辑能力逻辑能力方面，文心一言能帮用户解决复杂的逻辑难题、困难的数学计算、重要的职业/生活决策、代码纠错、常识推理、逻辑校验、18/37立体几何、辩论灵感等；记忆能力记忆能力方面，经过多轮对话后，文心一言依然能记住对话的重点，轻松胜任复杂问题、沉浸体验角色对话。文心大模型 4.0 的能力提升源自相关举措：（1）在万卡算力上基于飞桨平台，通过集群基础设施和调度系统、飞桨框架的软硬协同优化，支持了大模型的稳定高效训练。（2）通过建设多维数据体系，形成了从数据挖掘、分析、合成、标注到评估闭环，充分提高数据的利用效率，大幅提升模型效果。（3）基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐，保证

47、了模型能够更好地与人类的判断和选择对齐。（4）利用可再生训练技术通过增量式的参数调优，有效节省了训练资源和时间，加快了模型迭代速度。文心大模型文心大模型 4.04.0 典型特征典型特征图片来源：百度世界大会（3 3）大模型应用：大模型应用：文心大模型在文学创作、文案创作、搜索问答、多模态生成、数理逻辑推算等方面已有应用面向用户开放。文学创作方面文学创作方面，文心一言可以清晰地表达观点、传递情感，因此可以应用于小说、散文、诗歌等文学作品的创作中；文案创作方文案创作方面面，在商业领域，文心一言可以撰写商业计划、市场分析报告等商业文案，提供有力的文字支持。文心一言可以激发创意思维，为广告行业提供新的

48、灵感和想法，可以帮助广告人员快速构思出吸引人的广告文案和宣传语；搜索问答方面搜索问答方面，基于文心一言的聊天机器人可以与用户进行自然语言交互，理解用户的意图和需求，并提供相应的回答和建议。这种应用可以广泛应用于生活服务、教育辅导、客服19/37等领域；多模态生成方面多模态生成方面，文心大模型支持图像生成和处理，可以根据用户需求生成图像或者对已有图像进行处理编辑。文心大模型还支持语音合成、语音识别和音频分类。文心大模型还能对视频数据进行处理，或将文本转化为动态图像序列完成视频分类、目标检测等任务；数理逻辑推算方面数理逻辑推算方面，文心大模型可以解决复杂的数学问题，也可以成为代码编写助手，比如百度

49、基于文心大模型研制了智能代码助手 Comate，提供智能推荐、智能生成、智能问答等多种功能，支持多种编程语言和 IDE。案例三：阿里巴巴案例三：阿里巴巴通义千问大模型通义千问大模型（1 1）大模型简介：大模型简介：通义千问是阿里云研发的预训练语言模型，基于先进的自然语言处理技术（NLP）,执行理解、生成和解释人类语言、图片和文档等任务。通义千问能在创意文案、办公助理、学习助手、趣味生活等方面为使用者提供丰富的交互体验。通义千问具备中英文理解、数学推理、代码理解通义千问具备中英文理解、数学推理、代码理解等能力。（2 2）大模型优势：大模型优势：2023 年 10 月，千亿级参数大模型通义千问千亿

50、级参数大模型通义千问 2 2.0.0 发布发布,相比 1.0 版本，其在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。中英文理解能力中英文理解能力是大语言模型理解和表达的基础能力，英语任务中，通义千问 2.0 的 MMLU（伯克利大学、哥伦比亚大学等联合发布）基准得分是 82.5。中文任务中，通义千问 2.0 在模型训练中学习了更多中文语料，在 C-EVAL（上海交大和清华联合研发的中文大语言模型测试集）基准上获得最高分；数学推理数学推理方面，在推理基准测试 GSM8K（OpenAI 发布的小学数学测试集）中，通义千问排名第二，展示了强大的计算和逻辑推理能力；代码理

展开阅读全文