ChatGPT浪潮下看中国大语言模型产业发展.pdf

资源描述

2023.4 iResearch Inc.ChatGPT浪潮下，看中国大语言模型产业发展22023.4 iResearch I前言ChatGPT的横空出世拉开了大语言模型产业和生成式AI产业蓬勃发展的序幕。艾瑞将撰写AIGC系列报告，包括此篇ChatGPT浪潮下，看中国大语言模型产业发展、AIGC系列-中国生成式AI基础层行业研究报告、AIGC系列-中国生成式AI应用层行业研究报告等，为市场描绘AIGC产业全景与辨析产业发展价值与空间。此篇专题将着重分析“OpenAI ChatGPT的成功之路”、“中国类ChatGPT产业发展趋势”、“ChatGPT应用场景与生态建设”、“ChatGPT浪潮下的危与机”四个问题。聚焦国内市场，辨析中国自研通用基础大语言模型的重要意义、分析中国大语言模型产业参与角色分化路径及原因、梳理呈现中国大语言模型产业受益链图谱。大模型（以大语言模型为主，包含多模态模型等）产业的蓬勃发展将改变数字产业生态，助力AI工业化进程、变革海量应用交互方式、创造数字产业新的增长空间。ChatGPT及大语言模型丰富价值的背后，也隐藏着社会对其及生成式AI技术（AIGC）与通用人工智能（AGI）的疑虑，可信、数据与隐私安全、滥用风险、伦理等层出不穷的问题需要规范与解决。但“未来已来”，国家、企业到个体都需立足长远，迎接AIGC与AGI时代的到来。艾瑞咨询研究院3OpenAI ChatGPT的成功之路1中国类ChatGPT产业发展趋势2ChatGPT应用场景及生态建设34ChatGPT浪潮下的“危”与“机”42023.4 iResearch IChatGPT生成式AI里程碑生成式AI的重大突破，通用基础大模型的胜利相比之前的生成式对话产品，ChatGPT（Chat Generative Pre-trained Transformer）在大范围连续对话能力、生成内容质量、语言理解能力和逻辑推理能力上都得到大幅提升，超出了大众对于一款聊天机器人的预期，是生成式AI（AIGC）极为关键的发展节点。作为一款生成式预训练大语言模型，“Chat”指向它的功能，“Generative”代表它属于生成式算法。生成式算法在过去数年中受制于RNN的内生缺陷始终发展缓慢，直到2017年“Transformer”架构出现并解决了传统RNN模型的问题，生成式AI才开始在预训练的Transformer架构之上焕发生机，NLP、CV甚至多模态领域通用基础大模型飞速演进。在模型参数量几何级数增长以及多种训练方式的探索之中，ChatGPT横空出世，也标志着通用基础大模型将突破NLP领域以小模型为主导的传统发展范式。来源：艾瑞咨询研究院根据公开资料自主研究绘制。Transformer生成式AI预训练大模型探索判别式AI微调小模型时代2017ChatGPT引领大模型时代Transformer架构在计算上的高效性和良好的迁移能力使预训练的transformer迅速取代RNN成为大语言模型的主流训练框架。生成式AI发展历程与ChatGPT的突出能力202220231：抽样出在概率上与上文相关度最高的单字形成下文以小模型为主导的分析型算法是AI领域主流，生成式模型受制于RNN的顺序计算效率低、长序列处理能力不足等问题，无法得到良好的发展。2：将每个新生成的字与上文所有内容合并成新的上文，再次根据这个上文预测下一个字低生成式算法GPT-4生成式AI原理（以ChatGPT所用自回归算法为例）ChatGPT的突出能力更好的语言理解能力：自注意力机制和多头注意力机制可以有效地学习输入序列中的关系和语义信息，使得模型更好地理解和生成文本。提升计算效率：避免了RNN中的顺序计算，大大提高了模型的计算效率。长序列处理能力：Transformer相比CNN，计算两个位置之间的关联所需的操作次数不随距离增长。Transformer的革命性ChatGPT VS 微调小模型生成质量大大提升ChatGPT VS 其他大模型更接近商用水准通用性强：回答范围不局限在某个行业领域，而是几乎所有的人类知识范围连续多轮对话：能建模对话历史，提供持续交互体验（ChatGPT支持最多20轮次问答交互）生成能力强：生成内容流畅通顺，能够回答从未见过的问题，创作能力甚至超过部分人类的水平回答更“类人”：回答更生动自然有逻辑，符合人类价值观上文请告诉我“举头望明月”的下一句：下文12低52023.4 iResearch I探秘ChatGPT的能力从何而来？RHLF指令精调+能力涌现，让大模型说好“人话”ChatGPT具有的惊人效果，是在超大预训练语言模型GPT-3.5基础上，进一步根据人的需求目标进行模型调优的结果。巨大的参数量和预训练数据量让GPT-3.5成为一颗储备了大量知识，并且具备语言生成能力的混沌“大脑”，再使用人类反馈强化学习（RHLF）的方法进行指令精调，将模型的各项能力激活，并以符合人类的需求、偏好和价值观的方式有效释放，同时大大提升了模型应对从未见过的新指令的能力。此外，ChatGPT在逻辑推理、上下文理解等方面的能力，是模型参数量达到该量级后“涌现”出的，即所谓的“大力出奇迹”，这一现象在其他预训练大模型中也得到了印证。来源：Natural Language Processing with Deep Learning，Jesse Mu，艾瑞咨询研究院根据公开资料自主研究绘制。共128层每层千个节点ChatGPT能力实现解析GPT采用神经网络架构（如上图所示），由128层网络和1750亿参数组成，并使用45TB数据进行训练。此时大模型已经具备了许多能力，但是不懂得如何发挥效果。GPT-3.5模型抽象示意图模型进化过程语言生成基础大模型：说胡话的混沌大脑模型微调：以说人话为目标进行规训人工对大量问题形成回答模板供模型学习学习回答模板人工对GPT生成的数个答案进行排序，建立奖励模型，自动为后续生成结果打分作答评分调整考试提升水平建立评分机制+从“乱说话”到“说人话”指令精调根本目的是希望模型能够生成符合人类需求和偏好，并且具有较高安全性和正确性的回答。在这一阶段大量使用了人工标注的方法，同时通过形成奖励模型，让GPT能够脱离人工指引，自动通过不断地“考试”，进行模型调优。指令精调流程示意图能力激活Chain of Thought 能力随模型规模增大涌现示意图+逻辑推理能力大模型具有的部分能力是在模型参数量达到一定规模后突然出现的，随着模型参数指数级增长，这些能力呈明显的线性增长。上图演示了在提问里给出推理过程范例，模型就能给出具有同样推理逻辑的回答（Chain of Thought）这项能力在LaMDA、GPT和PaLM三个模型上的演变过程。能力涌现：大力出奇迹大量知识储备语言理解对话翻译提炼分类123能力演化创作代码+举一反三已具备所有基础能力，但质量差能够按照人类偏好、习惯和普世价值取向，并保证一定安全性的前提下生成应用度较高的内容应用指数应用指数应用指数+上下文理解能力由于模型参数足够大带来的“彩蛋”，进一步充实了模型能力，更加接近人类水平62023.4 iResearch I成功背后：秉承初心+巨量资源ChatGPT的成功是一场初心+资源加持下的长期主义的胜利，GPT模型正是在密集烧钱策略后出现的，而ChatGPT这一明确指向商业化的产品则显然受到OpenAI从非营利向半营利转型的发展路径影响。来源：艾瑞咨询研究院根据公开资料自主研究绘制。2018.062015.122021.052022.11OpenAI 成立非营利阶段半营利阶段2015-2018.06阶段成就：发布AI工具包和模型训练平台，开始研究DOTA对战和语言模型，为后续研究蓄力。在Sam Altman上任前，Open AI的年均资金投入尚不足DeepMind的1/10，资金短缺造成了高端人才流失，也使得模型研发进展较为缓慢。2019.022020.062023.03GPT-1GPT-2GPT-3基于GPT-3的视觉模型 DALL-E和 CLIP基于 GPT-3的对话模型ChatGPTGPT-4模型研发商业化参数量117M1.5B175B训练数据量4.6G40G45TB在这一阶段，OpenAI调整经营模式，吸纳巨量资金，大模型研发飞速进展并达到一个令人满意的智能程度，随后OpenAI开始通过定向微调模型，依次推出面向图片生成和文本生成的大模型，并直接达到了商用水平。2019.03马斯克退出OpenAI，Sam Altman成为Open AI 首任CEO。OpenAI成立有限合伙公司OpenAI LP，成为半营利模式。资金投入与发展策略为ChatGPT成功带来至关重要的影响资金：数十亿美元算力：一万块A100打底人才：全球顶尖人才OpenAI的几位创始人以造福全人类为宗旨，希望能够研发出能够安全可控，放心使用的高水平AI技术。在这一初心的指引下，OpenAI创始人兼CTO不断用第一性原理的思维定位研发方向，走出技术瓶颈，才让OpenAI 得以成为今天通用AI领域的重要力量。据国盛证券测算，在不考虑算法优化的情况下，需要3万块A100芯片才能支持每日2500万人访问量，在考虑算法优化后保守估计在1万片左右。微软Azure为GPT-3准备的训练研发平台在2020年时共部署英伟达V100超过1万块，置换为A100，则所需GPU算力约为3000-5000块英伟达A100。训练运行ChatGPT成本可分为数据、模型训练、模型运营和人工等部分，从GPT-1 开始算起到ChatGPT诞生，总花费约为数十亿美元。ChatGPT团队共87人，毕业院校以斯坦福、伯克利、麻省理工为主，其中有5 人被评为2023 年度“AI 2000全球人工智能学者”。GPT-3训练数据达45TB，相当于阅读了数千万本文学巨著。数据：45T2019.07接受微软10亿美元注资不仅是多种关键要素的聚合，更突显方向与路径的重要性初心：实现安全的AGIOpenAI ChatGPT成功要素分析72023.4 iResearch I竞品分析：技术能否赶超ChatGPT？存在赶超机会，但中外差距短期难以追平与ChatGPT功能对标的大语言模型(Large Language Models,LLMs)，目前国外主要有Google推出的Gopher、LaMDA以及Meta的Llama等；国内为百度首发的“文心一言”、360发布的大语言模型、阿里发布的“通义千问”、商汤发布的“商量”等。虽从对话和文本生成的直观体验看ChatGPT略胜一筹，但对于Google等国外大厂而言，克隆ChatGPT并不存在太高壁垒，当前暂时落后主要是出于公司战略与技术理念差异，选择了不同技术路线，随着各家探索成果和新技术方法的实践不断推进，仍存在对GPT系列模型赶超的可能。对百度等国内大厂而言，则在数据、算力、工程化能力等关键要素上存在短板，短期内难以对国外领先大模型实现赶超，为跟随者角色，长期更需要国内AI全产业链整体进化。来源：艾瑞咨询研究院根据公开资料自主研究绘制。国内外主要大语言模型研发路径与技术对比模型母公司生成方式参数量技术特点优势能力GPT-3OpenAI自回归175B大量采用RHLF技术，训练模型生成符合人类偏好的内容。内容生成LLamaMeta自回归最大65B大训练数据+小模型参数的组合。常识推理与理解LaMDAGoogle自编码340M基于一段话中词汇间的关系和重要程度不同的思想进行建模；在微调阶段采用合理性、针对性、趣味性和安全性四个标准进行评分。语言理解T5Google序列到序列11B实验了NLP领域多种主流训练技巧并进行了对比，相当于一个大一统NLP框架。能力相对均衡GopherGoogle自编码280B用RMSNorm取代layerNorm，将绝对位置编码改为相对位置编码。知识密集型任务影响大语言模型应用效果的公认可见因素主要是训练数据、模型规模（参数量）以及选用的生成算法和调优技术，但这些因素是如何决定大模型效果，目前尚处于探索阶段，对于何种数据和技术组合能产生怎样的训练效果并无定论。当前这些世界一流水平模型之间并未在技术水平上拉开明显差距。秉承AGI目标，始终基于GPT主路径分化演进GPT-1GPT-2GPT-3Training on codeInstruction tuningGPT-3.5ChatGPTText-davinci-002浓厚学术精神，创新能力强，同时探索多条路径T5LaMDAGopherPaLM提出transformer架构BERTFLAN T5PaLM-EALBERTELECTRAERNIE 1.0（对标BERT）ERNIE 2.0ERNIE 3.0文心一言对话 PLATO搜索信息抽取代码跨语言图网络志不在AGI，重点培养面向应用的全栈模型能力82023.4 iResearch I竞品分析：企业商业化路径服务于各公司战略业务拓展，形成差异化商业路线商业模式上，ChatGPT已经明确指向API、订阅制和战略合作（嵌入微软Bing、Office等软件）三种营收方式，且已在用户数据积累、产品布局和生态建设层面充分领先；Google虽有意追赶，但由于聊天机器人这样的产品形态对于其主营的搜索引擎业务的助益有限，因此在与搜索引擎结合方面较为审慎，更希望借助大模型能力开展“模型即服务”范式，开拓其当前市占率较低的云服务业务的市场空间。作为国内大模型的标杆企业，百度的选择与Google更为类似，“文心千帆”产品剑指B端市场，意图带动云服务营收。来源：艾瑞咨询研究院根据公开资料自主研究绘制。订阅制TO C能力集成API调用Office BingLaMDA拉动B端业务意图明显，多款模型能力形成组合拳存量巩固增量拓展Bard搜索引擎PaLMTO C能力集成Google workspaceMaaSGoogle cloud增量增量BertGPT-3GPT-4MaaS战略布局plugins0.02$/1000token20$/monthC端生态B端生态u 在C端生态上，ChatGPT一方面通过“引进来”的方式，兼收上游插件增强多种应用能力，打造super APP吸纳用户；另一方面“走出去”，通过革新软件交互方式将用户收入囊中，从而实现完整的C端生态布局。u 在B端生态上，Open AI通过合作微软Azure，间接实现“模型即服务”，又通过直接提供大模型API能力调用，服务小B开发者，勾勒B端生态雏形。变现主要依靠C端，在微软加持下形成强有力生态布局主推B端，基于全栈优势构建全链能力ChatGPT基础模型：文心一言框架平台：飞桨行业模型MaaS企业级云服务市场增量拓展垂类厂商fine-tune开发工具独立开发者TO C能力集成界面引入chat功能底层支持检索Super APP成为应用的平台国内外主要大语言模型厂商商业路径对比9OpenAI ChatGPT的成功之路1中国类ChatGPT产业发展趋势2ChatGPT应用场景及生态建设34ChatGPT浪潮下的“危”与“机”102023.4 iResearch I中国自研通用基础LLMs的重要意义大厂的绝对战略优先级，但也是一场重投入的持久战2023年3月中，OpenAI宣布ChatGPT整合GPT4，实现多模态交互、大幅提升复杂长文本理解与生成能力、可控性增强，引起全球科技界震动。在国内科技及投资各领域的高度关注下，百度举办了“文心一言”产品发布会，虽说从产品功能、成熟度、支持用户并发等维度距ChatGPT还有不足，但也是中国在这新一轮“科技军备竞赛”中的勇于尝试与发声，目前百度也已启动API接口开放测试，瞄准B端市场。紧随其后，360、阿里、华为、商汤、京东、科大讯飞、字节跳动等巨头企业也动作频频。从自研通用预训练大语言模型的必要性角度分析：在全球政治经济局势下，自主可控是保障网络安全、信息安全的前提，自研基石模型具有高度战略意义；从自研的可行性角度分析：基于前文讨论的通用基础LLMs研发所需的算力、数据、算法、人才、资金储备等，中国仅有少数头部互联网企业具备研发“入场券”。宣布入局的头部企业基于自身业务生态选择的战略路线也不尽相同。但可以大胆假设，未来若形成大模型能力领先，谁拥有通用基础大模型与生态和流量入口，谁就更有可能拥有从应用层到算力层的营收话语权。注：大语言模型（LLMs）研发正向多模态领域推进。来源：艾瑞咨询研究院根据公开资料自主研究绘制。卡点：高端AI算力、数据、算法、人才、资金储备价值：自主可控的战略意义、大模型的商业价值vs调用国外大模型将涉及数据跨境的合规风险、中国中大型企业与政府部门均存在私有化部署需求、以及受美国科技保护主义影响。种种原因，国内必将且必需产生自主可控的通用基础大模型产品与服务“滚雪球效应”使通用基础大模型的门槛越来越高，但其可以提供“超级大脑”一样的价值。OpenAI与微软的成功路线表明，依托ChatGPT有望打造新的个人与企业应用开发生态以及拉升云厂商业务营收美国芯片禁令下高端AI算力资源不足，算力资金投入上还需支撑智算集群的训练与运营成本互联网中文高质量数据资源小于英文，差距20-30倍，需要高质量数据清洗通用基础大模型开发是一个系统工程，需具备分布式训练、模型蒸馏等各类技术能力与工程化能力如何把know-how数据转化成Q&A的能力，需要大量提示（人与机器进行交互的指令语言）工程师通用基础大语言模型的价值与自研卡点112023.4 iResearch I应用开发厂商：不具备充足算力和资金的厂商，可基于API进行AIGC相关应用产品开发，依托巨头生态打磨产品与拓客中国LLMs产业厂商类型与定位逻辑垂直基础大模型厂商与应用开发厂商需在窗口期加快建立“数据飞轮”壁垒此轮基于ChatGPT的大模型浪潮兴起伊始，结合我国AI产业链与竞争格局现状，一种判断是：基于大模型的通用和泛化性提高，未来手握通用基础大模型的巨头企业会逐渐侵蚀垂直领域厂商业务。这种压力长期来看的确存在，但大模型与产品结合，尤其在非检索或开放域交互等场景中，需要依赖垂直领域数据和行业know-how、应用场景和用户数据反哺、一站式端到端工程化能力等。在此窗口期，垂直领域与应用层厂商应积极将大模型能力整合入自己的技术栈，服务于产品功能优化，建立“数据飞轮”壁垒。在下游丰富的基于大语言模型、AIGC应用开发需求的影响下，还将分化出一类工具型或平台型厂商，主要提供基于各类大模型的开发平台服务，帮助客户实现便捷的AIGC应用开发与落地。来源：艾瑞咨询研究院根据公开资料自主研究绘制。工具层厂商：负责承担大模型调优工作，服务于应用开发或解决方案厂商，可能逐步向平台型发展垂直基础大模型厂商：具备一定算力、资金和技术实力的垂直赛道厂商，可基于多家开源模型和数据，进行垂直基础大模型自研。一般该类型厂商亦会横跨模型层与应用层通用基础大模型在高商业价值的内容输出方面能力较弱且在产出结果的可信程度上不可控，需要垂直领域know-how与数据调优；在数据开放度低的行业领域，如能源、政务、金融、电力、通信等，通用基础大模型缺少高质量数据集支撑；在落地实施层面上，不具备调优与二次开发能力的企业需要端到端的大模型开发及部署服务，以控制部署成本未来可能国内只有1-2家完全跑通，产生类OpenAI企业来自同赛道内部和外部巨头的竞争日益激烈通用基础大模型厂商通过海量数据自研大模型后，一般经过垂直领域数据调优、缩小模型量级首先服务于自身业务，达到降本增效、提高营收等效果。后开放服务，赋能B端或C端客户定位分化原因大模型改变了AI产业的技术流通路径和生产方式。在促进AI工业化进程的同时，优化了应用的产品功能、拓宽了应用层市场大模型是AIGC产业发展的基石参与应用开发中国大语言模型产业参与厂商类型与定位逻辑122023.4 iResearch I中国大语言模型产业价值链产业加速发展中，产业价值链格局初显注释：图谱展示为不完全列举。中国AIGC产业链格局与LLMs产业链基本类似，详情请见艾瑞即将发布的AIGC系列报告。来源：艾瑞咨询研究院根据公开资料自主研究绘制。通用基础大模型算力基础设施垂直基础大模型、工具平台应用产品芯片云服务数据基础设施国外中国通用基础大模型厂商可直接赋能应用层厂商或开发应用产品垂直基础大模型厂商可直接开发应用产品区域智算中心GPT模型文心通义悟道盘古对话式AI消费级硬件产品行业领域工具软件类（办公生产工具、RPA、视频工具、数据分析、CG制作）企业服务应用（ERP、CRM、协同办公软件等）垂直领域产品辅助编程类电商金融政务能源电力教育等各类知识/数据密集型领域各云计算厂商LLaMA模型LaMDA模型应用型公司依托 LLMs 将落地场景中的真实数据发挥更大价值各类开源模型巨头企业、高校或研究机构在参数量级、通用性上存在差异中国大语言模型产业价值链混元数据采标数据库资源通用搜索引擎商量13OpenAI ChatGPT的成功之路1中国类ChatGPT产业发展趋势2ChatGPT应用场景及生态建设34ChatGPT浪潮下的“危”与“机”142023.4 iResearch I大语言模型落地应用对数字产业影响变革交互方式、丰富产品种类、新兴商业模式、构建生态平台1）变革人机交互方式：既有软件将接入对话能力，交互界面发生变革，自然语言成为用户发布操作指令的新模态。这一影响将从搜索引擎等知识信息平台拓展到一切人机交互型应用。友好度和功能性的显著提升将激活软件服务的增量用户市场；2）丰富产品种类：将诞生新一批AI-first的应用，如创意设计、AI营销、AI运营等领域；3）塑造新兴商业模式：AI主导的“模型即服务”商业逻辑将重构应用开发流程，传统企业可享受低成本构建应用模型的便利；4）构建新兴生态平台：超级应用的出现，本质上搭建了用户需求与各类信息服务之间的基于自然语言交互的平台生态，塑造了移动互联网后新的流量入口。来源：艾瑞咨询研究院根据公开资料自主研究绘制。大语言模型将改变数字产业生态ChatGPT类产品助力AI工业化发展进程供给侧需求侧知识调用软硬件功能调用NLP知识图谱变革人机交互方式改变现有数字产业生态交互体验升级交互效率飞跃搜索引擎企业知识库教育办公软件数据分析工具行业专用软件智能机器人云服务:MaaS数据存储模型外围应用开发效率化颠覆产品设计思路增强产品能力社交娱乐软件创造新的产业空间大模型能力直接穿刺到C端催生以大模型为基础的海量应用ChatGPT集成多功能，成为大模型时代的iphone多模态芯片CV提升模型能力降低开发成本152023.4 iResearch IChatGPT引领AI应用热潮与应用革命ChatGPT被称为AI的“iPhone时刻”，以ChatGPT为代表的生成式AI让每个人命令计算机解决问题成为了可能。可对生产工具、对话引擎、个人助理等各类应用，起到协助人、服务人甚至超越人的角色。凭借此革命性突破，ChatGPT在搜索引擎与各类工具软件中率先掀起应用热潮，引起了广大用户对ChatGPT相关技术的关注与学习。海量下游应用也因此捕捉到新的技术与产业机会，希望通过各类大模型与工程化能力，将类ChatGPT产品能力输送到原有的应用中，关于应用革命的序幕就此拉开。注释：已渗透应用领域有公开资料支持佐证应用已接入OpenAI的GPT系列模型，实现ChatGPT相关功能应用；或不使用GPT系列模型，但具备ChatGPT类似功能。来源：艾瑞咨询研究院根据公开资料自主研究绘制。应用革命序幕拉开，应用渗透不断加剧模型：OpenAI GPT-4通用搜索引擎办公生产工具垂直领域应用企业服务应用模型：OpenAI GPT-4&GPT-3.5PAIR模型：OpenAI GPT-4&GPT-2，百度文心一言；包含类ChatGPT应用模型：OpenAI GPT-4；包含类ChatGPT应用对话式AI模型：OpenAI GPT-4&GPT-3.5&GPT-3；包含类ChatGPT应用IntercomDiscord通用基础大模型垂直基础大模型模型工具平台人开发应用借助工具平台开发借助工具平台开发降解与调优开发应用开发应用海量应用池：应用产品功能因LLMs的介入将产生革命性突破。应用价值链已渗透部分应用服务价值生成指令：请根据准备好的用户数据与材料起草一份调研问卷，可以结合数据做分析和总结问卷生成应用触达应用举例：可覆盖应用举例：大语言模型产品应用价值链与已渗透部分应用162023.4 iResearch I通用搜索引擎新布局互动溯源的新搜索方式，各搜索引擎企业对标微软布局加码集成了ChatGPT版搜索引擎的New Bing改变了检索引擎的内容呈现逻辑，用户在短时间内可获取更可靠、更完整、更具备创意的答案，且因接入实时网络数据同时满足对数据实时性要求。凭借全新的搜索体验，New Bing收获了较大的用户流量。与此同时，谷歌与百度虽均发布了与ChatGPT对标产品，但并未直接嵌入搜索引擎中，不过谷歌正在测试几款集成了类ChatGPT对话式功能的新搜索产品；360作为国内搜索引擎追赶玩家，发布大模型产品并整合入搜索产品中，意图抢占用户流量。来源：艾瑞咨询研究院根据公开资料自主研究绘制。应用4:其他生产工具应用3 对话式AI应用2:办公生产工具应用1:通用搜索引擎改变用户搜索习惯：从用户角度看，New Bing对搜索引擎造成两点改变：一是搜索方式从关键词式变成对话式，二是搜索结果从简单的摘要排列式变成篇章阅读式。凭借新功能吸引用户，争夺市场：尽管微软基于GPT-4与Edge浏览器数据升级的New Bing存在数据准确性错误、链接排版错误等不足，但凭借个性化交互、内容生成等优势与用户猎奇心理收获了大量用户流量，争夺搜索引擎市场。接入ChatGPT一个月后，微软公布其进展称，Bing 每日活跃用户已突破1亿，New Bing预览版的数百万活跃用户中，大约三分之一是Bing的新用户。这对于Google来说造成了技术与市场的双重威胁，Google拉响“Red Code”警报，启动Bard项目应战。1）New Bing功能GPT-4Edge浏览器数据为用户提供聊天功能和扩展的搜索栏，提升交互性2）微软布局思考引流广告主追随用户微软获取广告主费用微软广告营收增长提供具备时效性与针对性的内容，附上来源与链接进行内容推荐与提醒，根据需求创作与提供写作模板微软New Bing布局谷歌谷歌Bard与谷歌搜索引擎分开运行，仅支持英语生成答案，访问权限有限。每次提问给出三种版本回答，支持一键返回搜索界面。谷歌没有明确表明要在搜索引擎中集成Bard，但谷歌正在测试几款新搜索产品，将类ChatGPT对话式功能集成在搜索产品中。百度其他搜索引擎企业布局360百度文心一言是国内首个对标ChatGPT的产品，可实现跨模态功能，服务于文学与文案创作、数学计算、多模态生成等场景。目前百度文心一言尚未接入搜索引擎，但这可能只是时间问题。一旦接入，百度搜索引擎有望迎来新用户与商业增长。360基于大语言模型在C端推出新一代智能搜索引擎，并将基于搜索场景推出人工智能个人助理类产品360大模型战略也将在ToC、ToSME、ToG&B方面进行商业化场景落地。搜索引擎与大语言模型结合情况172023.4 iResearch I共生模式下待解决的发展问题存在机器信任风险、运营成本过高、冲击原有广告商业逻辑ChatGPT与搜索引擎不是非黑即白、此消彼长的替代关系，而是相互结合促进的共生关系，ChatGPT会升级与丰富搜索引擎的功能，推动搜索引擎往下一新阶段发展。在共生关系发展过程中，ChatGPT主要面临着三方面待解决的难点：1）ChatGPT回答的可信度存疑，存在机器信任风险。以及为避免数据时效缺陷而频繁引入新数据与知识、进行模型精调会造成原有知识遗忘；2）模型训练与在线推理成本过高，搜索服务的C端收费与否成为两难决策；3）冲击原有广告系统商业逻辑。来源：艾瑞咨询研究院根据专家访谈、公开资料自主研究绘制。ChatGPT产出内容准确性的不可控，会让用户陷入信任与否的两难局面。目前，ChatGPT已经成为很多用户获取信息的手段，但用户如果没有分辨能力，可能会被误导，带来风险隐患。为避免回复的数据时效性问题，若对ChatGPT频繁微调，新数据与知识在模型内的权重过高可能会对原有知识造成遗忘，影响回答准确度。据估算，ChatGPT生成一条信息的成本约为1.3美分，是目前传统搜索引擎的三到四倍。即ChatGPT每一次生成答案的成本超过搜索引擎。ChatGPT的训练成本与在线推理成本过高。如果完全开放，面向搜索引擎的数以亿计的用户请求，假设继续采取免费策略，OpenAI 将无法承受。虽然ChatGPT plus版本以订阅制收费，但目前算力仍然制约其用户数量扩张。ChatGPT在搜索引擎场景中待解决问题采用ChatGPT搜索直接得到对应信息，一定程度上阻止用户点击搜索引擎界面的广告链接，而搜索引擎广告收入长期以来一直是搜索引擎巨头的营收主力。若要保留广告收益，有一种方案设想是在ChatGPT中嵌入广告链接，将广告优先排序在答案序列中，但这明显破坏了ChatGPT直接回应问题的功能性，与基本的问答逻辑不符。除了检索准确度外，这也是Google落后OpenAI进行尝试的原因。回答可信度存疑频繁微调造成原知识遗忘训练与推理成本过高收费与否成为两难决策冲击原有广告系统商业逻辑应用4:其他生产工具应用3 对话式AI应用2:办公生产工具应用1:通用搜索引擎182023.4 iResearch I基础办公软件革新解放基础性办公劳动力，定价与买单情况尚未落实2023年3月17日，微软正式发布 Microsoft 365 Copilot，将GPT-4与ChatGPT能力融入了Office 365全栈生产力工具，并推出汇集了Office 365数据的Business Chat功能，较大提升了数字化办公的智能化水平，可有效解放重复性的基础办公劳动力。目前能与微软Microsoft 365 Copilot对标的成型产品为谷歌的Workspace，国内的金山办公正在围绕AIGC与LLMs领域进行类似产品功能的研发。来源：艾瑞咨询研究院根据公开资料自主研究绘制。微软365 Copilot与谷歌Workspace金山办公微软接入GPT-4与ChatGPTWordPPTExcelOutlookTeams根据指令写文章和摘要；实现Excel、PPT的内容格式转换；根据需求修改文风与排版，实现个性化撰写基于Word、Onenote等草稿直接生成幻灯片；通过自然语言交互自动修改幻灯片内容与风格，实现特效增减根据已有数据进行自动化数据分析并给出关键信息总结；根据需求清洗、分析、预测数据，进行数据可视化展示根据用户需求自动总结邮件核心要点，生成格式化邮件初稿，灵活切换邮件语气与风格根据需求自动总结会议要点，自动生成会议纪要和任务模板，自动生成回顾邮件并为用户答疑解惑相应地，谷歌推出的 Workspace 加入了生成式AI办公软件套餐（Docs，Slides，Sheets，Gmail，Meet，Chat）。尽管没有明确加入类ChatGPT产品，但在生成式AI功能上基本上可以实现与微软365 Copilot的对标BusinessChat基于Office所有应用数据，实现全局信息视角下的交互式问答，自动创建业务流程，提供解决方案与措施建议谷歌收费模式采用增值收费，但价格尚未确定：基于办公基础软件包之上增加增值包，微软与谷歌还处于内测阶段，尚未确定价格。算力、人力等资源投入高昂，如何将费用合理平摊到每个用户，并保证收益是个复杂的问题。应用落地思考产品对标：WPS Office全套应用买单意愿产品错误仍旧存在，用户是否会持续买单存疑：以Copilot为例。Copilot目前无法避免错误，微软在发布会上也强调Copilot会和其他AI内容生成器一样出现事实错误，需要用户查看、审核与调整生成结果。如果因为产品错误与成本问题影响用户的消费意愿，用户未来是否会在“尝鲜”消费之后继续购买Copilot仍旧存疑。ChatGPT应用于基础办公软件研发展望：根据2022年金山办公财报显示，金山办公围绕AIGC与LLMs领域进行研发投入，优化文档数据搜索功能，并在智能辅助写作与排版、表格数据智能分析、PPT一键生成与美化等场景进行融合应用4:其他生产工具应用3 对话式AI应用2:办公生产工具应用1:通用搜索引擎192023.4 iResearch I对话式AI接入“高知、高情商大脑”对话系统升级以避免对话交互的知识与情感障碍在ChatGPT出现以前，文本机器人、语音机器人、多模态数字人等对话式AI产品普遍存在知识结构不完善、只能做简单问题回答、语义与情感理解不到位等问题，较大程度上拉低了用户的交互体验感。将对话式AI与大语言模型产品结合，相当于给对话系统安装了一个更富有人类知识、智慧、情感的大脑，可改善以往对话式AI的产品痛点，完善产品功能，添加产品新卖点。注释：对话式AI与垂直领域工具存在交叉。来源：艾瑞咨询研究院根据公开资料自主研究绘制。应用4:其他生产工具应用3 对话式AI应用2:办公生产工具应用1:通用搜索引擎应用举例例1：智能客服功能，客户服务软件公司Intercom基于GPT-4和Intercom自研的AI chatbot，开发出类ChatGPT机器人Fin。Fin可进行多对话轮次的查询，提供回答的出处。例2：内容创造场景，Snap.Inc推出了My AI聊天机器人服务，可要求机器人帮忙编写生日祝福，或编辑图片配套的文案，服务网络社交分享场景。例3：智能助手场景，Discord推出的Clyde机器人通过调用ChatGPT，帮助用户回答琐事问题、安排会议、推荐播放列表等。金融互联网医疗政务教育智能客服营销推荐知识问答通用功能功能共性问题知识库不够完善，与用户个性化或专业化问题的匹配程度低语义与情感理解不到位，回复僵硬，缺乏亲和力结合价值点以大模型为基础，丰富底层通用知识库，同时可结合行业知识做调整模型语义理解力增强，可响应个性化问题，做到精准推荐智能家居车载语音助手语音智能客服智能音箱智能机器人共性问题问答停留在一问一答、命令式的交互状态，产品仅能针对个别问题和指令做简单回答，交互体验感达不到预期，被用户称为“人工智障”结合价值点弥补传统交互方式体验不足的痛点，提升语音机器人的反馈丰富度与准确性，进行更高效、更拟人化的交流，为用户带来从“智能”到“智慧”的感知+认知双重体验，带来市场新增长机会应用举例高级开发人员通过ChatGPT，结合Siri Shortcuts做出更智能的语音助手；开发者将ChatGPT人形机器人Ameca接入GPT3与GPT-4，交互顺畅度提升内容创造智能助手皮囊灵魂虚拟形象ChatGPT注入结合价值点已接入ChatGPT的数字人企业将外表与人类接近的数字人与思维接近人类的ChatGPT结合，将诞生更接近人类的数字智能体，实现亲切自然、专业的互动风语筑深圳光子晶体岭南股份天娱数科捷成股份大语言模型与对话式AI结合文本机器人语音机器人多模态数字人202023.4 iResearch I应用4:其他生产工具企业服务与垂直领域应用B端海量应用需求待满足，G端尚处于尝试及观望期来源：艾瑞咨询研究院根据公开资料自主研究绘制。应用3 对话式AI应用2:办公生产工具应用1:通用搜索引擎企业服务应用微软 Dynamics 365 Copilot Salesforce Einstein GPT服务受众购买方为企业客户，使用者为企业内部的销售、客服、市场营销、供应链相关工作者实现功能自动编写回复邮件，生成邮件总结，从CRM系统中提取产品与报价细节，减少销售伏案工作时间销售客服市场营销供应链基于企业内部知识库与过往案例，为客服提供查询服务，快速响应客户问题自动进行客户分类，定位特定客户群体；编写推广计划的建议；梳理与创建产品列表，生成产品简介根据天气、财务、地理环境等信息，发出供应链流程事件警告；预测筛选受影响订单；生成预警邮件与微软 Dynamics 365 Co

展开阅读全文