2024年中国人工智能行业产业研究报告.pdf

资源描述

1、部门：企业服务三组2024 iResearch Inc.中国人工智能产业研究报告（VI）山高泽长，AI鼎新自显于时署名：王祺李冬露2前言PREFACE研究背景：在问到如何平衡ChatGPT和大学录取的时候，斯坦福大学终身教授李飞飞老师给到了这样的回答，“录取最会使用ChatGPT的前2000名学生是个很有意思的答案。“能够制造并使用工具成为人类进化史上一道显著的分水岭，而当下如何更好的使用AI工具已然成为人类在产业应用、生产生活与学习工作中的热门议题。随着大模型、生成式AI技术的到来，其强大的数据处理、学习泛化与内容生成能力，高质效加速了各行各业人工智能技术的赋能进程，为AI可赋能的场景领域

2、、扮演角色提供更多创新性与可能性。人工智能应用正加速扩散，渗透到办公、设计、传媒、法律、游戏、教育、汽车等多领域。艾瑞人工智能研究团队延续既往5年对人工智能行业的市场研究，于第六年聚焦人工智能产业发展进程、发展征程、发展旅程的各个发展阶段，集中探讨中国人工智能产业的发展环境、市场动态、产业机会、发展监管等核心要点，为市场提供有公信力、受到广泛认可的数据与观点。研究方法：本报告通过业内资深的专家访谈、桌面研究、案例实证研究、行业对比研究、投融资数据统计输出相应研究成果。nMvNnQtRmMtQtMqRmQtQsN6M9R7NnPpPpNtPlOrRnRlOtRmOaQpOpONZnRwPuOrN

3、nO3摘要ABSTRACT2023年，生成式AI为人工智能领域带来重大突破与新的希望，而围绕生成式AI的政策布局也迅速铺开，从数据资源和算力基础夯实，到快速对生成式AI规范化引导，再到产业扶持，形成一套强有力的组合拳；从资本市场来看，AIGC概念火爆，近40%的投资事件指向2023年新成立的AIGC公司；从技术发展来看，大模型基座催化AI工业化生产，加持各AI细分技术赛道的革新发展。而大模型以泛化推理能力见长，小模型以高成熟度、性价比优势仍存市场，大小模型是当下产业应用的核心落点。未来，多模态模型与MOE架构将共同拓展大模型产业空间；从产业发展来看，中国AI企业正积极抓住应用探索机会，获取新技

4、术浪潮变现的先发优势，生成式AI进一步加速内容产业的渗透进程。国家也从基础设施角度积极开展智算中心建设，推动AI数据标准建立，鼓励开源数据集发展。2023年中国人工智能产业规模已达到2137亿元，预计到2028年，中国人工智能产业规模将达到8110亿元，五年复合增长率达到30.6%。对比原本大模型未出现涌现能力的人工智能产业规模值，艾瑞测算，大模型带来的产业加成比例在2028年或达到32.9%，发展进程发展征程发展旅程1）生成式AI产业洞察：2023年，全球进入AI驱动的生产革命，生成式技术是时代际遇。预训练大模型的技术架构在多模态路径下优化底层模型训推与理解产出，让决策式AI与生成式AI共筑

5、AI产业发展。国内大模型落地声量加大，行业大模型进入爆发期，其中，医疗与金融为典型落地领域。从模型模态来看，生成式AI应用的文本模态达高应用成熟度，代码、语音、图像具备商业化基础；从商业应用来看，国家对大模型上线监管采取“备案制”，已有40+家大模型持“证”上岗。艾瑞认为，B端场景出发需逐步渗透打磨，打通业务逻辑实现更多场景的落地应用闭环，呈延续性曲线融合赋能。C端场景需从供给侧满足硬件设备条件及大模型能力适配，在软硬件生态成熟后涌现阶梯式能量爆发。2）AI产业边缘与端侧洞察：大模型的出现，加速了AI能力由云向边端多智体的演化进程。当前，大模型正在从算力统管和场景优化两个维度在边缘侧进行落地尝

6、试，部分替代和接管原有云端计算中心的算力调度权限与能力，大大减少云端传输所带来的时间损耗，同时大模型能够取代原有边缘侧用于预测、决策、判别、生成等多类任务的小模型，提升场景泛化能力和使用效果，改善ROI，并正在对自动驾驶技术栈进行全方位升级与重构。AI与终端正在进行加速融合，端侧大模型率先落地于手机、智能座舱等场景。从硬件维度来看，AI重塑操作系统是释放大模型潜力的关键。从社会层面来看，值得关注的主要风险在于人工智能技术对用户心智、用户隐私及安全伦理问题的潜在影响。从企业应用来看，AI技术的内生性缺陷对企业应用的影响更为明显，人工智能框架、数据、算法、模型任一环节都能给系统带来脆弱性。基于上述

7、对人工智能发展风险的探讨，未来人工智能产业发展需从技术研究、行业标准规范和法律监管三个层面持续完善和引导。在技术研究方面，提高算法的准确性和透明度，防止偏见和不公平现象出现；在行业标准方面，建立统一的规范和伦理准则，确保人工智能应用符合道德和社会价值；而在法律监管方面，则需制定和修改相关法律法规，保护个人隐私，防止滥用和侵犯权利，由此保证中国人工智能产业稳定实现高质量正向发展。4目录CONTENTS01中国人工智能产业进程：日积月累的AI技术革新山积而高，泽积而长02中国人工智能产业征程：重塑生态的AI产业展望圣人之后，必大而昌03中国人工智能标杆厂商：百练之钢的AI厂商实践日积月累，百炼成

8、钢04中国人工智能产业旅程：回归审慎的AI社会思考由圣与贤，或为霸强5中国人工智能产业进程AI-ing0162024.4 iResearch I2023年人工智能产业活跃动态在人工智能发展历程中，2023年必将被载入史册。相比前代AI具备高可用性、高拟人化的预训练大模型跨越技术奇点，国内外技术公司、高校、研究院的语言、图像、视频、音频大模型在2023年以极快的速度相继推出和迭代，基于预训练大模型的应用在全球范围内产生了爆炸式的影响，从社会群众到AI从业者，对人工智能技术能够带来的生产生活变革，都实现了颠覆性的再认识。艾瑞通过技术本身、应用变体、算力支持、政策监管和国际局势五个维度，对2023年

9、AI世界的发展进行全面梳理和俯瞰。来源：艾瑞咨询研究院自主研究绘制。2023年人工智能产业大事记总览人工智能产业进入高速发展期，创造多个技术、市场、监管里程碑大模型技术进程大模型落地应用进程国家动态监管生成式AI进入监管体系中美关系限制2月25日，Meta AI 在官网公开发布了 LLaMA大型语言模型，包括 7B、13B、33B和65B 4 种参数规模，后续被国内外多款展垂类、端侧大模型作为技术底座。大模型小型化3月15日，OpenAI 发布了多模态预训练大模型 GPT-4，直接开放API。6月20日，国家互联网信息办公室发布关于发布深度合成服务算法备案信息的公告，公开发布境内深度合成服务算

10、法备案信息。7月13日，国家网信办等七部门联合公布的生成式人工智能服务管理暂行办法即将自2023年8月15日起施行。10月17日，美国更新出口管制标准，英伟达针对中国市场的特供版H800、A800两款芯片也面临禁售。合成数据再度引发关注AI芯片出口再禁多模态模型下场垂直行业化2月7日，微软发布ChatGPT版搜索引擎New Bing，上线48小时内获100万账户申请。智算实力加强11月13日英伟达发布了目前世界最强的AI芯片 H200，性能较 H100 提升了60%到90%，还能和H100兼容。英伟达持续扩大领先优势10月25日高通推出新一代移动芯片骁龙8Gen 3，其AI引擎支持多达

11、100亿个参数的生成式 AI 模型。Hexagon NPU的性能提升了98%，持续的AI推理的每瓦性能提高了40%。端侧算力准备3 月 30 日，彭博社发布BloombergGPT论文，该模型专门针对各类金融数据进行训练。现有应用融合Agent崛起11月7日，OpenAI发布了AIAgent初期形态产品GPTs，并推出了相应的制作工具 GPTBuilder。用户仅仅通过跟GPTBuilder聊天，把想要的GPT功能描述一遍，就能生成专属GPT。11月17日，工信部、公安部、住房和城乡建设部、交通运输部共同发布关于开展智能网联汽车准入和上路通行试点工作的通知。L3

12、自动驾驶迎来曙光网络安全对抗升级3月2日，美国拜登政府正式发布新版国家网络安全战略，提出中国是“对美国政府及私营部门网络最广泛、最活跃、最持久的威胁。7月27日，Stability AI正式发布文生图模型SDXL1.0。文生图模型快速进化72024.4 iResearch I顶层设计驶入深水区，生成式AI成焦点规范引导、基础夯实和产业扶持三管齐下，促进AI全方位深化发展来源：中国政府网，艾瑞咨询研究院自主研究及绘制。国家新一代人工智能标准体系建设指南关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见关于支持建设新一代人工智能示范应用场景的通知国家新一代人工智能创新发展试验区建设工

13、作指引算力基础设施高质量发展行动计划原则：坚持发展和安全并重、促进创新和依法治理相结合，采取有效措施鼓励生成式人工智能创新发展，对生成式人工智能服务实行包容审慎和分类分级监管。信号：明确鼓励生成式人工智能技术在各行业、各领域的创新应用，支持专业机构协作；明确要求提供者对AI生成内容进行标识；明确规定生成式AI训练全程使用来源合法的数据。“十四五”数字经济发展规划到2023年，布局建设20个左右试验区，产出一批重大原创科技成果，创新一批切实有效的政策工具，形成一批人工智能与经济社会发展深度融合的典型模式。建体系20192022202020212022提出着力打造人工智能重大场景，提升场景创新能力

14、，推动场景开放，加强场景创新要素供给。建设涵盖基础共性、支撑技术与产品、基础软硬件平台、关键通用技术、关键领域技术、产品与服务、行业应用、安全/伦理八大模块构成的人工智能标准体系。提出要建立数字要素市场体系、提升产业数字化和数字产业化水平、普惠数字化公共服务、完善数字经济治理体系等目标。初试点促产业推落地提出打造形成一批可复制、可推广的标杆型示范应用场景，首批支持智慧农场、智能港口、智能矿山、智能工厂、智慧家居、智能教育、自动驾驶、智能诊疗等十大场景。生成式AI数据算力产业化规范引导生成式人工智能产业与服务发展生成式人工智能服务管理暂行办法产业扶持大力发展生成式AI及元宇宙产业基础夯实数据与算

15、力该方案主要聚焦新兴产业与未来产业标准化工作，形成含生成式人工智能与元宇宙在内的“8+9”的新产业标准化重点领域，其重点任务是通过完善新产业全生命周期管理及各项标准确立，建立新产业标准化工作体系、强化新产业科技创新体系。新产业标准化领航工程实施方案（20232035年）2019-2022年2022-2023年国务院关于构建数据基础制度更好发挥数据要素作用的意见从计算力、运载力、存储力以及应用赋能四个方面提出了到2025年发展量化指标，引导算力基础设施高质量发展。提出要建立数据产权制度、数据要素流通和交易制度、数据要素收益分配制度、建立数据要素治理制度。近年人工智能技术及产业发展相关政策分析自2

16、019年以来，我国人工智能相关政策始终紧随技术和产业发展步伐，历经广泛试点、建设框架、产业化发展、场景化落地四个阶段，切实推动人工智能从一项新兴技术走向规范应用。2023年，生成式AI为人工智能领域带来重大突破与新的希望，而围绕生成式AI的政策布局也迅速铺开，从数据和算力基础夯实，到快速对生成式AI规范化引导，再到产业扶持，形成一套强有力的组合拳。Part4:产业动态Part3:技术演进Part2:资本市场Part1:政策环境82024.4 iResearch I2024.4 iResearch I典型城市：北京市人工智能发展独具特色产业集群：极化与扩散并存来源：中国新一代人工智能发展战略研究

17、院，北京市人民政府，艾瑞咨询研究院绘制。来源：中国新一代人工智能发展战略研究院，艾瑞咨询研究院绘制。AI示范先导区及产业集群初具规模企业实力强劲截至2022年10月，北京拥有人工智能核心企业1048家，占我国人工智能核心企业总量的29%人工智能科技产业区域竞争力评价指数（2023）北京市通用人工智能产业创新伙伴计划聚焦汇聚从算力、数据、模型、应用到投资的产业链上下游合作伙伴，采用用户单位与大模型团队结对方式，构建政产学研用深度融合的协同联动产业体系扩大产业规模加快建设具有全球影响力的人工智能创新策源地实施方案（2023-2025年）提出“核心产业规模达到3000亿元，持续保持10%以上增长，辐

18、射产业规模超过1万亿元”等具体工作目标增强链接能力发展成果未来规划学术能力领先北京人工智能领域核心技术人才超4万人，占全国的60%。人工智能论文发表量居全国第一产业体系完善已经形成了全栈式的人工智能产业链落地场景丰富海淀、朝阳等五区已开始或完成“智慧城市大脑”部署；无人出行从示范运营迈入商业试点；智能工厂加紧建设我国已经初步形成以京津冀、长三角、珠三角为代表的人工智能产业集群，其发展呈现出核心区域持续“极化”，从极点向外逐步“扩散”的整体趋势。从技术合作关系密度来看，北京市、广东省和上海市构成了我国人工智能产业集群价值网络的三个“极点”，这三个区域无论是对内对外，都是技术合作最密集的地区，且仍

19、处于不断扩张的趋势。虽然整体而言极点内部技术合作多于外部合作，但仅看外部合作，三大极点的对外技术赋能要高于从外部获得的技术输入，这说明从极点向外的技术扩散和带动效应十分显著。企业簇群是产业集群的关键构成要素，而人工智能企业簇群价值网络同样呈现极核状，少数核心节点是产业发展的主导。关键节点通过与研究型大学、国外基础软硬件供应商、产业智能化企业与地方政府的技术合作与交流，发挥辐射与带动作用，构成产业集群的灵魂所在。北京广东上海地域关系企业簇群核心节点研究型大学国外基础软硬件供应商产业智能化企业地方政府极点发挥示范引导作用，以点带面形成AI产业集群我国人工智能重点区域与产业集群建设都取得显著成果。从

20、重点区域看，北京、深圳、苏州等地人工智能产业发展迅猛，北京为其中之最，在中国新一代人工智能科技产业区域竞争力评价指数当中综合分位列第一，从企业扶持、技术探索、产业落地等多个方面建设取得显著成果。2023年，北京市显著加大对人工智能产业扶持力度，将重点通过扩大产业规模、提升链接能力，将人工智能产业打造成为北京市经济增长的新引擎。从产业集群看，我国产业集群发展总体呈现极化与扩散并存的特征，在地域关系上以北京、上海、广东为产业核心，通过区域内部和区域之间的紧密合作，打造出新一代人工智能产业网络空间；在企业簇群上以华为、腾讯、京东、阿里及三大运营商为核心节点，并通过与周边关系节点的交流合作，打造我国人

21、工智能产业的复杂生态。Part4:产业动态Part3:技术演进Part2:资本市场Part1:政策环境92024.4 iResearch I一级市场：AI产业投资风向转变AI产业开启新一轮融资周期，新概念下原有赛道稳步跟进注：2023年共497条有效数据；因一家公司可同时具备多项AI技术，图表2不同技术赛道融资事件互有重合。数据来源：IT桔子，艾瑞咨询研究院自主研究撰写从2017-2022年，随着人工智能产业成熟度不断提升，融资逐步向中后期过渡，而在AIGC概念火爆的2023年，种子轮与天使轮融资重返主力位，在这其中，近40%的投资事件指向2023年新成立的AIGC公司，这表明AIGC正在引领

22、AI产业新一轮融资周期。与此同时，原有AI各技术赛道也依然保持活力，机器学习使用最广，存在感最为明显，计算机视觉、NLP依然紧随其后。值得注意的是，AIGC相关融资占2023年AI产业全部融资事件的28%，并且在除机器人外的各个赛道均有渗透，成为年度AI融资的最大关键词。771312942218463597873202220232021-2023年中国人工智能产业投资轮次分布情况种子轮/天使轮pre A轮至B+轮C轮至G轮pre IPO及IPO战略及股权投资种子轮/天使轮融资数显著增加701150以往成立2023年成立（非AIGC）2023年成立（AIGC）2023年新成立2022年及以前成立

23、AIGC相关41322313198715558融资事件数2023年人工智能产业各技术赛道投资分布情况机器学习计算机视觉自然语言处理智能机器人自动驾驶智能语音AI算力AIGC公司融资事件数占比28%Part4:产业动态Part3:技术演进Part2:资本市场Part1:政策环境2023年获种子轮/天使轮融资企业成立时间102024.4 iResearch I一级市场：新的投资逻辑创造资本神话资本抢注“有背景”的AIGC团队，构建新格局时代，企业资源决定成败注：月之暗面于2024年2月估值已达到25亿美元，本报告数据截止2023年12月31日数据来源：IT桔子，艾瑞咨询研究院自主研究绘制AIGC带

24、来AI投资逻辑新变化大模型创业需要大量高端技术人才与算力储备，在如今市场当中属于顶尖稀缺资源，有行业影响力的创业者更具有资源凝聚力。在国内5家AIGC独角兽中，有3家为国内科技圈“大佬”牵头打造。15.4 12.3 12.0 12.0 10.0 3.0 智谱AI光年之外百川智能Minimax零一万物月之暗面2023年AIGC独角兽估值（亿美元）2019年成立或正式运营时间2021年2023年传统AI赛道的典型模式为AI技术+垂直场景+项目制开发，在可持续经营和规模化扩张能力方面稍显不足，而大模型的技术特征和应用效果，让市场对于AI的商业价值产生了全新的认知与期待：价值视角纵观AI赛道，进行价值

25、再认识投资策略落回具体标的，重视公司的资源整合能力在看好AI赛道的前提下，对投资标的选取也呈现出与以往不同的显著特点：18.9%9.7%融资事件统计2023年AI产业及AIGC赛道美元融资事件占比（%）AIGC赛道美元融资事件占比（%）AI产业美元融资事件占比（%）技术落地快可批量化复制适用范围广AIGC技术的上述特性也使得AIGC公司成为更加国际化的投资标的，AIGC赛道美元融资事件占比近20%，大大超出整个AI产业美元融资事件比例，冲刺美股将趋势已显现。资源整合能力AIGC作为新兴赛道，又生长于紧张的国际局势当中，其影响因素诸多且实时变化，资本会以长期动态眼光看待AIGC公司的发展，这也将

26、使得资本对市场动作的反应速度进一步加快。关键词：关键词：动态的投资视角2023年中以前，许多投资人对AIGC持观望态度，但仍有不少资本势力躬身入局。从全年战绩来看，2023年资本缔造了5家中国AIGC独角兽和一家准独角兽，其中4家为2023年新开项目，“AIGC速度”充分证明这一轮AI技术爆发对传统AI赛道投资逻辑的改变。一方面，资本对AI所能提供的商业价值普遍产生新的认识，另一方面，从具体公司来看，资本明显看好名人创业+大模型团队的配置。筑造优秀大模型技术企业需要算力资源、数据资源及生态资源的多方加持，方能从技术研究走向商业生态的长久闭环。未来AIGC应用创业公司将成为未来赛道健康成长的关键

27、支柱。Part4:产业动态Part3:技术演进Part2:资本市场Part1:政策环境112024.4 iResearch I二级市场：AI公司IPO机遇与挑战港股将为AI公司开放更大窗口，长期盈利能力证明是过审关键2023年，共有18家AI公司进入IPO阶段，而其中12家选择港股上市，除了全球化募资的野心外，更大原因在于港股对高新技术企业上市的财务指标要求表现出明显的宽松倾向，预计未来会有更多AI公司选择冲刺港股。与此同时，AI公司上市过程仍旧相对反复曲折，许多公司多次重复交表，而进入问询阶段后，企业面临对长期盈利目标与战略更加严格细致的拷问。2023年AI公司IPO进程分析2023年共有1

28、8家AI公司进入IPO进程，而其中67%的公司选择港股上市港交所上交所纽交所处理中问询失效终止上市12213542023年3月31日，港交所18C条款生效：香港联合交易所在主板上市规则中新加入第18C章，针对特专科技公司特征，对其净利润、营业收入、现金流考察标准均有放宽，甚至在研发费用率和估值符合一定条件下，允许未商业化公司上市融资。而黑芝麻也成为国内第一家采用18C条款进入港股IPO程序的AI公司。如内陆交易所没有更多利政策释放，未来AI公司港股上市优势将进一步扩大。上市路径选择港股成为AI公司首选上市过程卡点交易所对AI公司长期盈利能力判断更加审慎特专科技行业细分领域新一代信息技术云端服务

29、人工智能先进硬件及软件机器人和自动化电动及自动驾驶汽车先进材料元宇宙新能源及节能环保新食品及农业技术云天励飞交易所关注问题排名：1、长期盈利能力对于无账面亏损企业不会问询这一问题，对于账面亏损企业必须提出扭亏为盈的措施与依据2、核心竞争壁垒需证明公司技术先进性公司名称赛道进展问询内容节卡机器人智能机器人已问询首先关注核心技术先进性及技术来源问题；其次关注可持续经营能力（客户交易、收入增长、毛利、费用、现金流可持续性）百奥赛图AI医疗已问询主要围绕公司盈利能力展开全方位提问，首要关注现在亏原因，改善亏损措施，其次关注公司核心竞争壁垒，如技术先进性、团队、收入与客户等。同时关注成本、费用等思必驰智

30、能语音NLP上会被否第一轮：对思必驰的“持续经营能力”提出疑问，要求说明是否具备扭亏为盈的基础条件和经营环境，说明扭亏为盈的测算依据及合理性，审慎论证是否具有客观性和可行性。第二轮：要求思必驰说明预测的未来年度营业收入及复合增长率是否合理、审慎，是否具备实现的基础。第三轮：再次要求思必驰说明相关营收增长预测是否合理、谨慎，扭亏为盈的测算依据及合理性，审慎论证是否具有客观性和可行性。小i机器人第四范式知行汽车优必选赴港IPO的12家AI公司中，5家处于失效状态，有2家曾在失效后重新提交资料；在上交所IPO的5家AI公司中，有两家上会被否，AI公司上市依然面临不小的挑战。2023年AI公司IPO进

31、程总览来源：艾瑞咨询研究院自主研究绘制Part4:产业动态Part3:技术演进Part2:资本市场Part1:政策环境122024.4 iResearch I二级市场：AI上市公司表现接近大盘AIGC概念并非万金油，投资者预期收缩注；本报告定义AI上市公司为以提供AI产品或服务为主营业务的公司，非AI概念股，数据来源：同花顺、艾瑞咨询研究院自主研究绘制。2023年AI上市公司未显现逆势上行，投资者买单AIGC概念2023年，A股大盘指数在跌宕中呈下降态势，国内AI上市公司共计36家（含美股与港股），其中2023年末收盘价相比年初下跌的有24家，总体与A股大盘全年态势基本符吻合。同时，也有部分A

32、I公司及AI概念股出现明显上涨趋势，AI领域如计算机视觉、NLP、智能语音与AI数据领域，基本符合AIGC概念从算力+数据+相关算法全链条对相关公司的利好逻辑，但由于国内大部分AI芯片厂商未上市，二级市场反馈并不明显。AI概念股中，与AIGC相关的云基础设施公司如浪潮云，属于AIGC最直接应用场景的网文、影视公司如掌阅、天娱数科等，也受到投资者青睐。市场对AI“故事”正在脱敏，AI公司需要尽快交出盈利答卷2023年新上市AI公司共5家，分别为第四范式、小i机器人、云天励飞、知行汽车与优必选，涵盖了AI领域大部分赛道，上市后股价均不容乐观，而其中无论是作为为传统机器学习头部厂商如第四范式，还是典

33、型以NLP、智能语音技术提供智能坐席等服务的厂商小i机器人，都有明确拥抱AIGC的动作和规划，但从实际结果而言，资本市场并未买单。AIGC概念股在2023年也普遍经历了一轮猛烈上涨后回落。从交易机构审查到真正进入投资者视野，AI公司讲好故事仅仅是第一步，找到切实可行的盈利方向迫在眉睫。AI上市公司股价变动分析赛道公司名称上市时间上市板块机器学习百融云创2021港股商汤科技2021港股创新奇智2022港股云从科技2022科创板易点天下2022创业板第四范式2023港股计算机视觉海康威视2010中小板中科信息2017创业板虹软科技2019科创板天准科技2019科创板医渡科技2021港股罗普特202

34、1科创板鹰瞳科技2021科创板格灵深瞳2022科创板凌云光2022科创板联影医疗2022科创板NLP拓尔思2011创业板万兴科技2018创业板小i机器人2023美股智能语音科大讯飞2008中小板汉王科技2010中小板AI数据美林数据2014新三板数据堂2014新三板海天瑞声2021科创板AI芯片紫光国微2005中小板北京君正2011创业板中基国威2018新三板瑞芯微2020主板寒武纪2020科创板复旦微电2021科创板安路科技2021科创板云天励飞2023科创板自动驾驶四维图新2010深交所知行汽车2023港股智能机器人科沃斯2018主板优必选2023港股12242023年中国AI上市公司股价

35、变动情况股价总体上涨公司数（个）股价总体下跌公司数（个）AI上市公司一览020406005010015020012345678910 11 12主打AIGC概念的AI上市公司2023年股价走势海天瑞声股价（元）科大讯飞股价（元）Part4:产业动态Part3:技术演进Part2:资本市场Part1:政策环境132024.4 iResearch I多模态生成大模型加持AI技术赛道革新发展大模型基座催化AI工业化生产，Decoder only路径引领生成式AI产业变革来源：MM-LLMs:Recent Advances in MultiModal Large Language Models，艾瑞咨

36、询研究院根据公开资料、专家访谈自主研究绘制。基于模型底座的AI技术迭代图预训练大模型预训练大语言模型自然语言理解图像生成计算机视觉机器学习智能语音知识图谱如基于注意力的编码器-解码器模型Transformer架构、RNN、CNN架构等x0 x1x2zDiffusion Model成为图像生成技术主流+CLIP模型：基于Transformer连接文本和图像的预训练模型，使得模型输出的文字特征值与图像特征值存在明确的对应关系前向扩散反向生成知识图谱技术：描绘实体之间关系的语义网络，自带语义、逻辑含义与规则“实体关系属性”打造CV大模型，如ViT、SAM猫猫鸭子狗图像分类物体检测图像分割物体识别猫鸭

37、子狗以卷积神经网络CNN为主导1）大模型助力知识图谱构建，提取节点、摘要和扩展属性，节约知识图谱的构建时间及成本（零/少样本、开放知识抽取）2）知识图谱在RAG里作为大模型的外部知识库，助力问答及推理任务数据分词词性标注实体识别表示学习文本分类文本生成传统NLP任务实现由机器学习技术到深度神经网络的底座技术跨越，效果提升明显。而后在预训练大语言模型影响下，更多语言任务由此路径取代。EncoderDecoderBERTT5GPT系列Decoder-only+自回归模型+RHLF的生成式预训练大模型出现涌现能力，迎接生成式AI时代ASR 自动语音识别TTS 自动语音合成Automatic Spee

38、ch RecognitionText to Speech基于Transformer或RNN结构等开发语音大模型，打造多语言端到端的语音识别/语音合成大模型，提高识别准确率与语音合成效果。Transformer广义自然语言理解广义计算机视觉数据准备特征工程模型验证算法建模模型运营管理未来模型应用呈现大小模型结合，机器学习平台开发更多大模型组件、工具链、开闭源模型生态及底层算力资源绑定。Transformer结合视觉模型、音频模型等多模态理解多模态编码器大模型主干输入投影多模态大模型输出投影多模态生成器以LLM为基础，让其具备多模态处理与生成能力的多模态大模型是未来重要研究方向。传统计算机视觉偏图

39、像识别、跟踪等领域，随着图像生成技术逐步完善，视觉生成完善加入Part4:产业动态Part3:技术演进Part2:资本市场Part1:政策环境142024.4 iResearch I在自然语言处理能力上不断突破创新突破语言理解能力、文本处理长度、知识增强等技术，缓解LLM幻觉问题来源：艾瑞咨询研究院根据专家访谈、公开资料自主研究绘制。大模型文本能力提升路径0102大模型的上下文本长度不断增加，提升文本处理能力检索生成增强RAG成为大模型外挂知识库的有力帮手理解Token的概念大模型上下文支持更多token数的难度国内外大模型在上下文本长度的突破进展大模型幻觉问题“模型可以理解和生成的最小文本单

40、位”“能够被编码的最小单元”1 token=英文中的4个字符1 token=个单词100 tokens=75个单词且相较于英文，中文语义需要更多token表示Transformer自注意力机制计算复杂度处理Token数量计算复杂性与token数量的平方成正比，增加计算复杂度、消耗资源及响应时间。上下文支持需存储输入和输出token，对内存需求有更高要求。2023.11 GPT-4 Turbo 128K2023.7 GPT-4 8K/32K2023.6 GPT-3.5 Turbo 16K2024.4 GPT-3.5 Turbo 4K2023.12Gemini 32K2023.4Gemini 1.

41、5 Pro 1000K2023.10 Baichuan2-192K2024.3 Yi-34B-Chat-200K2023.10 Kimichat-200K2023.10 Kimichat-2000K20万汉字200万汉字大模型厂商在上下文长度PK火热，然而部分模型测试时发现文本长度增加时，准确率呈现下降的趋势，需回归本心，上下文长度是为了更好的应用。大模型幻觉问题：输出内容看上去合理、有逻辑，甚至可能与真实信息交织在一起，但实际上却存在错误的内容、引用来源或陈述，是影响大模型规模化应用的核心问题。业界提出诸多解决办法，如延长上下文、外挂知识库、微调、提示工程等。1）通过延长上下文长度泛化模型能

42、力，拓宽认知边界，缓解幻觉问题大模型的应用痛点存在幻觉问题信息时效性问题专业知识需微调定制投入检索生成增强RAG技术检索增强生成技术（Retrieval-Augmented Generation，RAG），用从其他地方检索到的附加信息来补充用户输入到大型语言模型(LLM)。向量数据库知识图谱提前完成知识库建设Embedding ModelLLMQuery 通过更新知识库具备时效性结合用户知识、数据实现个性化与扩展性满足专业领域回答，提升回复质效向量数据库因高维向量的检索能力，与大模型的结合简单，效果最好，是RAG 常用的外部数据源2）外挂知识库，结合知识检索完成人机交互，缓解幻觉问题

43、3）微调：基于特定数据集重新训练微调模型，需时间与资源投入，若保证时效性则需定期更新4）提示工程：通过优化Prompt缓解幻觉问题，对提示生成要求较高，且专业化领域可用度低AnswerPart4:产业动态Part3:技术演进Part2:资本市场Part1:政策环境152024.4 iResearch I在计算机视觉赛道优化补全生成能力AI初具对世界的三维理解与创造能力，Sora模型为全球带来更多想象2024年2月，OpenAI发布Sora模型，在全球范围内引起剧烈反响。Sora是一个以视频生成为核心的空间模型。它的出现，标志了DiT（Diffusion Transformer）架构的融合成功，

44、且在视觉领域同样可以出现涌现能力，未来持续迭代有望进一步提升视觉模型的生成效果，可喻为视觉生成领域的“GPT 3”时代。此外，随着模型计算规模逐渐增大，模型在物理世界的关键特征、数字和内容的标注理解下，成功建立相应的物理特征与数字关联，具备模拟现实世界中人类、动物和环境，甚至事件生成的能力。因此未来Sora模型不仅可以在影视、医疗、教育等领域提供生产力角色，还能基于对世界空间的认知理解，服务于空间模拟、视频计算、数字孪生等深层需求，成为一款更具通用能力的世界模型。来源：Open AI官网、Open AI官方文件，艾瑞咨询研究院根据公开资料、专家访谈自主研究绘制。引爆全球的“世界模拟器”Sora

45、Sora的技术原理Sora的技术局限性Sora的技术优势及战略意义编码解码图块加噪后图块加噪后正向扩散过程Forward DiffusionZtZt-1逆向扩散过程Reverse Diffusion（Transformer）视频数据生成视频用户指令LLM GPT-4 文本编辑器将用户的提示词通过GPT进行扩写成更为详细的说明文字，并转换为文本向量，作为条件信息与视觉Patch一并输入潜在空间，准确遵循用户的提示，生成高质量的视频不能准确地模拟许多基本交互的物理过程，如玻璃破碎等。物体交互并不能总是产生正确的物体状态变化，如吃东西等。描绘生成复杂动作或捕捉微妙面部表情方面仍然有待提升由于形状、大

46、小、位置及与其他手指的关系极其复杂多变，手指生成有待提升生成视频没有声音，后续结合应用场景可进一步生成声音配合Sora 功能实现：60s视频长度文本生成图像文本生成视频Sora 技术优势：Sora 战略意义：视觉的“Scaling LAW”视频延长图像生成视频视频连接视频编辑连贯性、一致性、稳定性：人物和背景的连贯性、前后主题的一致性与稳定性及物体恒存性等视频内容生成的灵活性：可生成不同尺寸、像素、画幅的图像视频，并完成图生视频及视频延长、视频连接、视频编辑等功能视频内容对物理规律的理解：没有人为约束下视频内容满足物理学规则，但仍存在局限性视频描述生成器视频提示工程第一个确认展示出涌现能力的视

47、觉模型，是计算机视觉领域的重要里程碑，验证DiT路径大力出奇迹的可行性。影视教育游戏医疗机器人空间理解空间计算空间模拟世界模型雏形Part4:产业动态Part3:技术演进Part2:资本市场Part1:政策环境162024.4 iResearch I“大小模型融合赋能”是当下核心应用落点“ChatGPT爆火后，NLP技术不存在了”，这类说法在2023年讨论的如火如荼。而艾瑞与人工智能产学研厂商深度交流后认为，NLP小模型仍在被广泛应用，为供给侧厂商完成意图识别、检索匹配等任务。NLP技术不存在更多是从前瞻性学术角度来看，而从产业应用角度，大小模型结合仍是人工智能产业的当下核心应用落点。而随着智

48、算规模扩张、大模型能力提升及应用成本降低之后，大模型的确会对小模型的更多应用场景展开替代趋势，尤其是在大模型擅长的归纳推理、内容生成等语言语音应用场景。来源：艾瑞咨询研究院根据专家访谈、桌研资料自主研究绘制。中国人工智能产业应用落地大小模型应用逻辑大模型以泛化推理能力见长，小模型以高成熟度、性价比优势仍存市场大模型具备泛化与深层推理理解力小模型具备高成熟度与性价比大模型剪裁剪支大小模型结合应用：从需求侧角度出发，客户并不会核心目的不是对于大小模型的选择，而是AI产品方案的实现与应用，因此供给侧厂商目前普遍采用大小模型结合的办法达到成本效益的最优化。视觉场景：如安防、人脸识别等场景，CNN、RN

49、N等小模型成熟度高，CV产品应用具有高实时性与高性价比语音场景：人机对话采用的ASR、TTS等小模型已发展成熟，基于性价比、时延等要求，多数简单对话场景仍应用小模型数据分析、语言应用场景：在与行业知识、业务数据紧密结合的时候，当下供需两侧出于性价比、小模型专业度等原因仍会采用小模型或者搭配使用。视觉场景：从图像识别角度来看，CV大模型具备场景泛化与更深层理解推理能力，可应用在工业、自动驾驶、安防园区等复杂场景；从图像生成角度，Diffusion大模型为技术底层架构。语音场景：语音大模型架构，模型层面有效解决小语种、方言等小样本问题，交互层面提升内容理解识别能力与拟人化生成能力，衍生音乐生成、音

50、乐创作等场景数据分析、语言应用场景：大语言模型擅长知识归纳、理解推理、总结生成等语言类任务，在搜索问答、内容创作、知识助手、角色扮演等领域率先得到应用，其归纳推理能力也应用于企业数据中，以对话交互形式优化BI分析呈现。企业实际应用时，会对千亿级大模型进行剪裁优化，缩减至数百亿、数十亿参数的模型，此时艾瑞仍认定为本页大模型讨论范围。Part4:产业动态Part3:技术演进Part2:资本市场Part1:政策环境172024.4 iResearch I2024.4 iResearch I单模态、款模态向多模态：开启大量潜在应用场景单一架构向MOE架构转变：改善大模型落地成本资料来源：NExT-GP

展开阅读全文