收藏 分销(赏)

全球生成式AI应用全景图:AI应用进入大爆发时代.pdf

上传人:Stan****Shan 文档编号:1291701 上传时间:2024-04-22 格式:PDF 页数:94 大小:5.11MB
下载 相关 举报
全球生成式AI应用全景图:AI应用进入大爆发时代.pdf_第1页
第1页 / 共94页
全球生成式AI应用全景图:AI应用进入大爆发时代.pdf_第2页
第2页 / 共94页
全球生成式AI应用全景图:AI应用进入大爆发时代.pdf_第3页
第3页 / 共94页
全球生成式AI应用全景图:AI应用进入大爆发时代.pdf_第4页
第4页 / 共94页
全球生成式AI应用全景图:AI应用进入大爆发时代.pdf_第5页
第5页 / 共94页
点击查看更多>>
资源描述

1、http:/ 年 09 月 06 日行业研究证券研究报告全球生成式全球生成式 AI 应用全景图应用全景图行业深度分析行业深度分析AI 应用进入大爆发时代应用进入大爆发时代投资要点投资要点模型、算力、生态推动模型、算力、生态推动 AI 应用进入大爆发时代:应用进入大爆发时代:1)算法及模型的快速进步算法及模型的快速进步:2017 年 Transformer 模型及 2022 年 ChatGPT 的发布标志着生成式 AI 在文本领域的重大飞跃,并在多项能力上超越了人类基准,未来随着更强大的语言大模型(如 GPT-5),以及多模态生态和视觉大模型的技术持续突破,将推动 AI 应用的持续进化。2)算力

2、基础设施将更快算力基础设施将更快、更便宜更便宜:虽然短期内大模型训练需求的激增推高了算力成本,但随着英伟达 GPU 性能的持续升级,以及微软、亚马逊、谷歌和Facebook 等巨头正在加大对 AI 算力云服务的资本开支,并积极布局自研 AI芯片,未来 AI 算力将更快、更便宜,以更好的支撑应用层的快速发展。3)AI 生态的逐渐成熟生态的逐渐成熟:AI 组件层(AI Stack)的完善和产业分工细化,为 AI应用在模型训练、数据整合、应用开发、应用部署等环节提供全生命周期的支撑。全球科技股复盘全球科技股复盘:算力基础设施层公司率先受益于本轮算力基础设施层公司率先受益于本轮 AI 产业浪潮产业浪潮

3、,应用层公应用层公司同样有所演绎,从兑现节奏上晚于基础设施层。司同样有所演绎,从兑现节奏上晚于基础设施层。在基础设施层中,英伟达是AI“掘金买铲”逻辑的核心受益者,其次为微软、Google、AWS、Oracle 等头部云服务厂商和大模型厂商。在应用层中,美股年初至今涨幅靠前的 AI 应用公司 有:Palantir(136%)、Duolingo(109%)、Shopify(92%)、Palo AltoNetworks(74%)、Salesforce(67%)、adobe(67%)、ServiceNow(52%)。相较于 AI 基础设施厂商已经能够从模型训练所产生的巨大需求,订单和业绩也得到了持续

4、验证,B 端应用还处于早期,大多数 AI 应用厂商还尚未进入到商业化阶段,从兑现时间来看预计要晚于基础设施层 2-3 个季度。全球生成式全球生成式 AI 项目及投融资现状:项目及投融资现状:1)AI 项目数量激增:项目数量激增:GitHub 上 AI 开源项目截止 8 月底数量达到了 91 万,相较于去年全年的增幅达到 264%。根据 Replit 的数据,23 年二季度 AI 项目环比增速达 80%,相较于去年同期同比增长了 34 倍;2)OpenAI 在大模型上依然具备统治级地位:在大模型上依然具备统治级地位:95%以上的应用项目均是基于OpenAI 的模型来构建,同时开源项目数量也开始大

5、幅增长;3)2023 年是生成式年是生成式 AI 投融资创纪录的年份投融资创纪录的年份:根据 CB Insights 的数据,截至2023 年第二季度,生成式 AI 的投融资相较于去年全年的 25 亿美元,增长了 4.6倍;4)生成式)生成式 AI 应用层融资金融仅占三成:应用层融资金融仅占三成:目前约七成资金投向了包括大模型开发在内 AI 基础设施层。而从应用层的融资中,AI 数字代理获得融资最多,其次投资评级领先大市-A维持首选股票首选股票评级评级688111.SH金山办公买入-A002230.SZ科大讯飞买入-A002410.SZ广联达增持-A300496.SZ中科创达买入-A68802

6、3.SH安恒信息买入-A一年行业表现一年行业表现资料来源:聚源升幅%1M3M12M相对收益-2.67-11.0724.31绝对收益-7.86-11.9119.24分析师方闻千SAC 执业证书编号:S相关报告相关报告金山办公:订阅业务快速增长,看好 AI+办公的深度融合-金山办公业绩快报 2023.8.24四维图新:看好公司智驾、智芯的长期驱动力-四维图新业绩快报 2023.8.24计算机:数据资源并表发布,加速数据要素商业化-计算机行业快报-数据资源暂行规定发布,加速数据要素商业化 2023.8.23广联达:收入端稳定增长,看好 AI+建筑的产业布局-广联达业绩快报 2023.8.23中科创达

7、:智能汽车保持高增,大模型+边缘计算彰显长期价值-中科创达业绩快报 2023.8.20天融信:收入端稳定增长,新业务开始发力-天融信业绩快报 2023.8.20科大讯飞:二季度经营全面改善,AI 布局国内领先-科大讯飞业绩快报 2023.8.19 行业深度分析http:/ AI 应用按应用领域可以分为工具型应用应用按应用领域可以分为工具型应用、通用软件通用软件、行业软件行业软件、智能硬智能硬件四大类,从产品形态上将沿着件四大类,从产品形态上将沿着 AIGC(内容生成)、(内容生成)、Copilot(智能助手)、(智能助手)、Insight(知识洞察)、(知识洞察)、Agent(数字代理)四个重

8、要的方向演进。(数字代理)四个重要的方向演进。1)工具型应用工具型应用:包括聊天机器人、搜索引擎、文本工具、AI 作画以及代码工具等,主要集中在 C 端,产品的同质化程度较高,对于大多数文本、图像、视频、代码、3D 模型等 AIGC 工具,模型/算法的能力决定了产品的受欢迎程度,对底层模型特别是 GPT-4 存在高度依赖。目前行业进入第一轮洗牌期,竞争优势的构建来自于差异化的产品定位以及持续训练更强大的底层模型和算法。2)通用软件通用软件:包括办公软件、企业服务、IT 运维、软件开发、网络安全、数据智能等领域,各领域头部厂商均已出现标杆产品,最常见的产品形态主要是 AI智能助理(Coplilo

9、t),代表有 Office 365 Copilot、Salesforce Einstein GPT 及Adobe Firefly。目前各个赛道竞争格局变化不大,各个赛道的龙头厂商依然率先受益于生成式 AI 所创造的新的产品功能,未来的竞争关键在于 AI 与场景/工作流的深度融合,目前通用软件头部厂商预计将在四季度进入商业化落地的关键阶段;3)行业软件行业软件:涉及金融、医疗、教育、工业、游戏、法律等多个行业,生成式AI 在游戏、法律、教育、电商等 C 端场景有较多的结合,而在医疗、金融、工业等 B 端场景下生成式 AI 产品的成熟度仍然偏低。AI 助手(Copilot)同样得到了广泛应用,而未

10、来在金融、医疗、工业等领域,最具前景的应用来自于数据分析和知识洞察(Insight)工具。同时,目前各行业头部厂商也在开始自建垂类大模型,包括彭博社的金融大模型 Bloomberg,以及 Meta 蛋白质大模型ESMFold,当前垂类大模型在其专业领域的性能普遍超过通用大模型。4)智能硬件:)智能硬件:包括智能汽车、机器人、智能终端等,目前生产式 AI 与智能硬件的结合主要分为两个方面:一是语音助手,应用场景包括智能座舱、智能音箱、家用机器人等各类智能终端,相较于过去的语音交互模式,大模型和生成式 AI 技术提升了感知和生成能力,进而带来了用户体验的提升,但是总体而言产品门槛相对较低,另一类则

11、为数字代理 AI Agent,主要应用包括自动驾驶、智能机器人等,具备更加广阔的应用空间。目前 AI Agent 在感知与决策能力上仍存在瓶颈,未来应用空间打开的关键在计算机视觉、具身智能等底层技术的突破。生成式生成式 AI 产品目前的商业模式主要包括功能订阅产品目前的商业模式主要包括功能订阅、按量付费按量付费、产品销售等产品销售等,其其中中 C 端应用以功能订阅和按量付费为主端应用以功能订阅和按量付费为主,商业化已经趋于成熟商业化已经趋于成熟,而而 B 端应用则端应用则主要为功能订阅、解决方案和产品销售,即将进入全面商业化阶段。主要为功能订阅、解决方案和产品销售,即将进入全面商业化阶段。目前

12、第一批生成式 AI 应用包括 Jasper AI、Notion AI、MidJourney 等均已经成功实现商业化。其中 Office 365 Copilot 的定价为每个用户 30 美元/月。相较于 Office 主线产品 15-30 美元/月的定价,最高提升了 2 倍以上。Salesforce 的生成式 AI模块服务 GPT 和销售 GPT 分别单用户每月付费为 50 美元。此外,Palantir、Palo Alto Networks 的 AI 产品已经在实际场景中得到应用且已经带来了明显的收入贡献,四季度 AI 应用将正式进入商业化落地阶段。投资逻辑投资逻辑:生成式 AI 相关标的涉及模

13、型、算法、应用、算力四大类型厂商,重点看好具备明确商业化前景,能够基于行业纵深,场景卡位,数据资源的来构建竞争壁垒的应用厂商公司。同时,看好 AI Infra 中应用上游工具链头部厂商,行业深度分析http:/ AI 应用进入大爆发时代应用进入大爆发时代.71)驱动因素:大模型、算力与生态的共振.72)产业现状:一二级视角看 AI 应用的演进.163)应用框架:应用的四大赛道与产业逻辑.24二、生成式二、生成式 AI 应用细分赛道梳理应用细分赛道梳理.371)AI+办公软件.372)AI+创意工具.433)AI+企业服务.474)AI+网络安全.525)AI+IT 运维.566)AI+软件开发

14、.607)AI+数据智能.648)AI+数字代理.679)AI+金融.7010)AI+医疗.7511)AI+教育.7912)AI+工业.8313)AI+汽车.8614)AI+机器人.90三、投资策略三、投资策略.93四、风险提示四、风险提示.93图表目录图表目录图 1:人工智能产业发展浪潮.8图 2:模型、算力、生态推动为 AI 应用进入大爆发时代.9图 3:GPT 模型的迭代过程.10图 4:GPT-4 是目前最强大的大模型.10图 5:大模型家族的不断丰富和技术演进路演.11图 6:生成式 AI 应用与多模态模型.13图 7:当前视觉大模型相当于 20 年前后的语言大模型.14图 8:算力

15、芯片万倍增长.15图 9:云服务解决方案数量对比.15图 10:AI 产业生态的逐渐成熟.16图 11:生成式 AI 应用的发展阶段.18图 12:海外科技股价复盘:基础设施层公司率先受益 AI 产业浪潮.19图 13:海外科技股价复盘:应用层公司股价同样有所演绎.20图 14:Github 过去十年 AI 项目数量.21图 15:Replit 的 AI 项目数量激增.21图 16:约 95%的项目是 OpenAI 的模型构建(Replit).21图 17:Replit 开源模型项目数量快速增长(Replit).21图 18:2023 年生成式 AI 投融资金额涨幅高达 464%.22 行业深

16、度分析http:/ 19:已有 15 家生成式 AI 独角兽达到 10 亿美元+估值.22图 20:生成式 AI 项目大部分处于早期.23图 21:生成式 AI 投融资金额分布.23图 22:生成式 AI 应用层融资分布(22Q3-23Q2).24图 23:生成式 AI 应用产业地图.25图 24:AI 应用的基础能力与演进方向.26图 25:通用软件标杆产品与发展路径.27图 26:通用软件市场应用进展.30图 27:行业应用:C 端场景成熟,B 端处于起步阶段.33图 28:AI+生产力工具变革主要体现在三个层面.40图 29:AI+办公应用的标杆:微软 365 Copilot.41图 3

17、0:微软 Office 办公套件产品的竞争者.42图 31:AIGC 依赖于生成算法、大模型与多模态三大底层技术的进步.45图 32:Adobe firefly 的主要功能.47图 33:赛富时 AI 产品组合.49图 34:销售 GPT 的主要功能:销售电子邮件将为每次客户互动自动生成个性化且包含数据的电子邮件.50图 35:服务 GPT 的主要功能:自动化回复.51图 36:Dynamics 365 Finance 充分利用 ERP 数据来加速洞察.52图 37:AI+安全的最大机会来自于提升安全运营的自动化程度.54图 38:Security Copilot AI 提升安全运营自动化.5

18、5图 39:XSIAM 是集成了 AI 的基于云交付的集成 SOC 平台.56图 40:Servicenow 将生成式 AI 集成到 NOW 平台.58图 41:Datadog 推出了针对 OpenAI 的性能监控产品.59图 42:Datadog 可监控和跟踪 GPT 及其他大模型的 token 消耗.59图 43:Github copilot X 是目前最强大的 AI 编程开发工具之一.62图 44:Microsoft Power Apps 的 AI 能力进化路线.63图 45:OutSystems 低代码平台.64图 46:AIP 产品的三大基础模块.66图 47:AIP for Def

19、ense:分析战场中敌方军队的详细情报.67图 48:AIP for Defense:给出作战行动计划的相关建议.67图 49:AIP for Business:查询飓风对配送中心的影响.67图 50:AIP for Business:查询运输线路的最优化路径.67图 51:AI Agent 的组成模块与实现原理.69图 52:AutoGPT 的工作流程.70图 53:Finchat 基本面分析功能.73图 54:Finchat 股票筛选功能.73图 55:Finchat 财报摘要生成功能.74图 56:AI+金融公司分类.75图 57:AbSci 通过生成式 AI 构建抗体.76图 58:A

20、I+医疗公司分类.79图 59:Duolingo Max 两大全新功能“解释我的答案”、“角色扮演”.81图 60:Khanmigo 具备辅导教学、教案生成、写作训练、编程练习四大功能.82图 61:达索四大 AI 设计助手:选择助手、匹配助手、草图助手、智能配接.84图 62:智能座舱词汇激活系统.87图 63:生成式 AI 赋能自动驾驶框架.88 行业深度分析http:/ 64:特斯拉自动标注原理.89图 65:特斯拉 Occupancy Network 模型结构图.89图 66:1Xtechnologies 旗下 EVE 实体机器人.91图 67:Richtech Robotics 旗下

21、餐饮机器人 Adam.91表 1:生成式 AI 访问量统计排行.28表 2:工具型应用各赛道主要产品.29表 3:通用软件各赛道主要产品.32表 4:行业软件各赛道主要产品.34表 5:智能硬件各赛道主要产品.35表 6:C 端 AI 应用工具的商业化情况.36表 7:B 端 AI 应用工具的商业化情况.37表 8:AI+办公软件标杆产品.39表 9:AI+金融产品目录.41表 10:AI+创意工具标杆产品.44表 11:三类文生图工具的商业模式.46表 12:AI+企业服务标杆产品.48表 13:AI+网络安全标杆产品.53表 14:AI+IT 运维标杆产品.57表 15:AI+软件开发标杆

22、产品.61表 16:AI+数据智能标杆产品.65表 17:AI+数字代理标杆产品.68表 18:AI+金融标杆产品.72表 19:FinChat 收费标准.74表 20:AI+医疗标杆产品.78表 21:AI+教育标杆产品.80表 22:AI+教育产品商业化案例.82表 23:AI+工业标杆产品.86表 24:AI+汽车标杆产品.90表 25:AI+机器人标杆产品.92 行业深度分析http:/ AI 应用进入大爆发时代1)驱动因素:大模型、算力与生态的共振生成式人工智能是自个人生成式人工智能是自个人 PC 出现和互联网诞生以来最具颠覆性的技术创新出现和互联网诞生以来最具颠覆性的技术创新,随着

23、大模型以随着大模型以及及 ChatGPT 等一系列等一系列“杀手级杀手级”应用的诞生应用的诞生,生成式生成式 AI 在在文本文本、图像图像、代码代码、音频音频、视频和视频和 3D模型模型等领域展现出了强大的能力等领域展现出了强大的能力。当前当前生成式生成式 AI 的发展的发展仍处于起步阶段仍处于起步阶段,未来有望为未来有望为全球经济全球经济创造创造数万亿美元的价值数万亿美元的价值,并对各行各业的工作方式产生重大影响并对各行各业的工作方式产生重大影响。在生成式在生成式 AI 产业突变的背后产业突变的背后是人工智能技术数十年的积累和酝酿,其演进历程具体可分为四个阶段:是人工智能技术数十年的积累和酝

24、酿,其演进历程具体可分为四个阶段:1)专家系统:)专家系统:上世纪 50 年代前后,人工智能开始萌芽,基于规则的专家系统占据主导,这一时期,使用复杂的逻辑规则,能够处理包括字符匹配、词频统计等一些简单的任务,机器翻译以及语言对话的初级产品,1966 年 MIT 发布的世界上第一台聊天机器人 Eliza 可以看作生成式 AI 最早期的产品之一。Eliza 能够根据接收到的文本,遵循简单的语法规则来模拟与人类用户的对话。与此同时,专家系统存在词汇量有限、缺乏上下文和过度依赖规则等缺点,生成创造性内容的能力非常有限;2)机器学习与神经网络机器学习与神经网络:1980 年美国的卡内基梅隆大学召开了第一

25、届机器学习国际研讨会,标志着机器学习在全世界兴起,20 世纪 90 年代以后,神经网络作为一种新的生成人工智能方法出现了。神经网络受到人脑的启发,能够以基于规则的系统所不能的方式从数据中学习,带来了AI 技术的突破,AI 可以开始基于神经网络创建逼真和有创意的内容;3)深度学习:)深度学习:2012 年后,深度学习在人工智能领域中的应用将生成式 AI 带入了一个新的高度。深度学习作为一种基于神经网络的机器学习方法,通过大规模的数据特征学习,对不同场景具备很强的自适应性,同时可以通过增加层数和节点数,实现对更复杂的问题的解决,提升了模型的准确性和真实性,并且基于分布式计算和 GPU 加速等技术,

26、能够训练更大规模的数据和更大尺寸的模型。直到现在,生成式 AI 依然建立在深度学习的基石之上;4)大模型:)大模型:2017 年,Google 发布著名论文Attention is All You Need,提出了基于一种新的神经网络Attention 注意力机制所构建的模型 Transformer,2018 年 OpenAI 和谷歌分别推出了 GPT 模型以及 BERT 模型,均是在 Transformer 的基础上构建,Transformer 及 GPT模型标志着生成式 AI 在文本领域的重大飞跃。与此同时,伴随着 VAEs、扩散模型、神经辐射场、CLIP 等一系列生成算法和多模态模型的不

27、断成熟,生成式 AI 的时代正式开启。行业深度分析http:/ 1:人工智能产业发展浪潮资料来源:真格基金、华金证券研究所模型、算力、生态推动为模型、算力、生态推动为 AI 应用进入大爆发时代:应用进入大爆发时代:1)算法及模型的快速进步:)算法及模型的快速进步:2017 年 Transformer 模型及 2022 年 ChatGPT 的发布标志着GenAI 在文本领域的重大飞跃,并在多项能力上超越了人类基准,随着未来更强大的语言大模型(如 GPT-5),以及多模态大模型和视觉大模型的技术突破,将带动 AI 应用的持续进化。2)算力基础设施将更快、更便宜:)算力基础设施将更快、更便宜:虽然短

28、期内大模型训练需求的激增导致了算力成本的持续上涨,但是随着英伟达算力芯片的不断更新迭代,微软、亚马逊、谷歌等在 AI 云服务资本开支的不断加大,AI 应用的发展将得到更加强有力的支撑。3)AI 生态的逐渐成熟:生态的逐渐成熟:AI 组件层(AI Stack)的完善和产业分工细化,为 AI 应用在模型训练、数据整合、应用开发、应用部署等环节提供全生命周期的支撑。行业深度分析http:/ 2:模型、算力、生态推动为 AI 应用进入大爆发时代资料来源:华金证券研究所绘制本轮生成式本轮生成式 AI 的技术的最大突破来自于底层大模型的技术的最大突破来自于底层大模型,GPT 作为当前全球最强大的语言大模作

29、为当前全球最强大的语言大模型,从型,从 2018 年年 5 月月 GPT 初代版本,到初代版本,到 2023 年年 3 月的月的 GPT-4,仅,仅 5 年时间模型的性能就产生年时间模型的性能就产生了质的飞跃了质的飞跃。在 GPT 模型快速进化的背后,一方面是对训练方法的持续迭代,从 GPT-1 的半监督式学习,到 GPT-2 舍弃了微调阶段,再到 GPT-3 的 In-context 学习和海量参数,以及引入了基于人工反馈的强化学习之后的 ChatGPT;另一方面,在模型参数规模扩大背后,是 OpenAI对研发和算力的持续高投入,通过“大力出奇迹”的方式,支撑了模型参数和训练数据的快速膨胀。

30、GPT-4 相较于之前版本的 GPT 模型,在推理能力、文本生成能力、对话能力等方面有了大幅提升之外,在许多能力上已经超越了人类基准。同时大模型作为能够在海量、广泛、非结构化数据集(例如文本和图像)上进行训练的大规模深度学习模型,它的强大之处不仅在于文本生成,大模型可以适应各类不同的任务,不仅可以用于聊天机器人,同时也可以用来创建新的蛋白质序列,并且当前已经成为了图像、代码、音频、音乐、视频和 3D 模型等各种模态应用的底层框架。行业深度分析http:/ 3:GPT 模型的迭代过程资料来源:Wikipedia、CSDN、华金证券研究所图 4:GPT-4 是目前最强大的大模型资料来源:GPT-4

31、 Technical Report、华金证券研究所随着大模型家族的不断丰富,出现了单向随着大模型家族的不断丰富,出现了单向/双向、开源双向、开源/闭源等不同的技术路线。闭源等不同的技术路线。1)单向单向/双向:双向:在 Transformer 模型 2017 年诞生之后,2018 年 OpenAI 和 Google 发布的GPT-1 和 BERT 采用了 Transformer 不同的框架,6 月 OpenAI 发布的 GPT-1 仅使用了Transformer 的 Decoder 框架(单向架构),10 月,Google 发布的 BERT 模型采用 Transformer的 Encoder

32、框架(双向架构),作为一个拥有 3 倍 GPT 参数量的更大体量的语言模型,BERT 行业深度分析http:/ GPT 的初代版本。2020 年,随着 GPT-3的惊艳表现,单向模型在语言生成方面的优势开始展现(特别在大参数情况下),Decoder 路线逐渐占据主导,当前主流大模型大多采用 Decoder 框架或大 Decoder 小 Encoder 框架。2)开源开源/闭源:闭源:大模型的开源/闭源,与 iPhone/Android、Windows/Linux 有类似之处。包括 GPT-4,以及谷歌的 Bard、Claude 等大模型均是闭源模型,优势在于性能强大和易于上手,目前依然是绝大多

33、数海外主流生成式 AI 应用的首选;而 LLaMA2、Stable Diffusion,Eleuther,GLM130B,OPT,BLOOM 引领的开源模型优势在于灵活性和低成本,特别 llama2 的发布,宣布支持商业化,让应用层的公司可以以非常低成本来使用大模型,可以基于开源模型进行私有化部署并实现差异化功能的开发。在过去的一年里,开源阵营模型的能力和数量有了显着的提高,开源框架目前也正在成为越来越多应用的选择。图 5:大模型家族的不断丰富和技术演进路演资料来源:Harnessing the Power of LLMs in Practice:A Survey on ChatGPT and

34、 Beyond、华金证券研究所 行业深度分析http:/ NLP 领域,包括领域,包括图片、语音、视频、代码等多种模态的应图片、语音、视频、代码等多种模态的应用开始涌现用开始涌现,而大模型而大模型、生成算法与多模态等底层技术的突破成为了生成算法与多模态等底层技术的突破成为了 AIGC 的质变的关键的质变的关键。一方面,目前大模型可以广泛适用于各类下游任务,当前已经成为了 AIGC 的底层框架。许多跨领域的 AI 应用均是构建于大模型之上,能够解决多任务、多场景、多功能需求,支撑各种模态的生成;另一方面,包括生成对抗网络(GAN)、变分自编码器(VAE)、扩散模型(Diffusion Model

35、)、神经辐射场(Nerf)等快速涌现的生成算法,以大模型为基础,能够创造出文字、图片、语音、视频、代码等各种模态的内容,而基于此之上的多模态应用开始涌现。1)文本生成:)文本生成:目前技术最成熟的领域,随着新一代大模型的发布,未来将看到更高质量的输出、更长形式的内容和更好的垂直特性;2)图像生成图像生成:过去一年技术进化速度最快的领域,2014 年出现生成对抗网络 GAN 是图片生成的主流算法,但一直存在对输出结果控制力弱,难以生成新图像等缺点。随后扩散模型、CLIP 模型等技术的成熟,文生图的能力大幅增强,包括 DALL-E2、Stable Diffusion 等主流文生图应用均是基于扩散模

36、型所构建;3)视频生成视频生成:目前尚未有非常成熟的视频生成算法,许多应用还是依赖于图像生成的算法;4)3D 模型生成:模型生成:3D 模型生成还处于早期,其中这一领域关键算法神经辐射场(NeRF)于 2020 年于 ECCV 会议上提出,目前已经成为 3D 模型构建的主流算法,并广泛应用于游戏、数字人、虚拟现实、增强现实、电子商务等领域,未来具备广阔的应用空间;5)代码生成代码生成:GPT-4 等大模型具备很强的代码能力,未来将会对软件开发人员生产力产生重大影响,同时能够使非专业开发人员更容易生成代码;6)音频生成:)音频生成:音频合成在技术和商业化上已经非常成熟,近年来大模型和优化算法的成

37、熟能够基于大量音乐数据集训练和优化算法来创建 AI 虚拟歌手,更加趋近于真人发声效果,典型应用如:AI 孙燕姿;7)其他:)其他:从生物蛋白质分子模型到其他垂直领域,许多行业都在进行垂类模型的研发。行业深度分析http:/ 6:生成式 AI 应用与多模态模型资料来源:Generative AI:A Creative New World、华金证券研究所在语言大模型和多模态多模态大模型快速取得质变的同时,视觉领域的基础大模型在语言大模型和多模态多模态大模型快速取得质变的同时,视觉领域的基础大模型 VisionTransformer(VIT)在)在 2020 年诞生后,近三年语义分割、目标检测、图像

38、分类、实例分割等年诞生后,近三年语义分割、目标检测、图像分类、实例分割等主要视觉任务上的能力均有明显提升。主要视觉任务上的能力均有明显提升。Vision Transformer(VIT)于 2020 年由 Google 提出,可以看成是 Transformer 的图形版本,在尽可能少的改造下将标准的 Transformer 模型直接迁移至图像领域变成 Vision Transformer 模型。Vision Transformer 最初用于处于图像分类任务,2020年很多后续的视觉模型都是基于 VIT 建立。为了将 Transformer 模型适用于图像,VIT 将图像切分成很多子块并将这些子

39、块组成线性嵌入序列,然后将这些线性嵌入序列作为 Transformer 的输入以模拟在 NLP 领域中词组序列输入。当前视觉大模型相当于当前视觉大模型相当于 20 年前后的语言大模型:年前后的语言大模型:1)Transformer 于于 2017 年由年由 Google 提出,提出,Vision Transformer 于于 2020 年提出;年提出;2)当前最大的语言模型已经超过万亿参数量级当前最大的语言模型已经超过万亿参数量级,当前最大的视觉模型刚刚达到百亿参数量当前最大的视觉模型刚刚达到百亿参数量级;级;3)从从 GPT-2(2019)开始开始,语言模型开始具备通用能力语言模型开始具备通

40、用能力,而当前视觉模型基本仍只能处理而当前视觉模型基本仍只能处理特定视觉任务。特定视觉任务。行业深度分析http:/ 7:当前视觉大模型相当于 20 年前后的语言大模型资料来源:GPT-4核心技术分析报告、华金证券研究所巨头持续加码算力基础设施巨头持续加码算力基础设施,未来未来 AI 算力将更快算力将更快、更便宜更便宜,并更好的支撑应用层的快速发并更好的支撑应用层的快速发展展。多年来,英伟达 GPU 性能的突破的基本遵循摩尔定律,GPU 的晶体管数量每两年增加一倍。近年来,随着芯片架构的进步以及张量核心和 Transfomer 引擎等功能的引入进一步提高了英伟达 GPU 的吞吐量和效率,GPU

41、 进化的速度超越了摩尔定律。同时除了硬件之外,英伟达围绕CUDA 构建的软件生态系统,为开发人员提供端到端的解决方案,简化了人工智能应用的开发、部署和管理,已经成为了各行业人工智能的操作系统层。除英伟达外,全球科技巨头均在加速算力侧的布局,其中软件厂商开始自研芯片,而硬件厂商则在搭建算力平台,包括微软、亚马逊、谷歌、甲骨文和 Facebook 等软件及云服务巨头正在加大对 AI 算力云服务的资本开支,并提供更丰富的 AI 云服务模块、涉及 NLP、机器学习、计算机视觉等各个领域;另一方面,微软、亚马逊、谷歌等均在加大自研 AI 芯片的投入。因此虽然短期来看,大模型训练的需求的急剧增加推高了算力

42、成本,但随着未来芯片性能的快速进步以及 AI 算力供需的逐渐平衡,应用层的发展将得到更好的支撑。行业深度分析http:/ 8:算力芯片万倍增长图 9:云服务解决方案数量对比资料来源:英伟达投资者PPT、华金证券研究所资料来源:Khaveen Investments、华金证券研究所AI 组件层组件层(AI Stack)是是 AI 生态的重要组成部分生态的重要组成部分,为模型训练为模型训练、数据整合数据整合、应用开发应用开发、应应用部署等提供支撑用部署等提供支撑,AI 组件层的完善和产业分工细化组件层的完善和产业分工细化,代表代表 AI 生态的逐渐成熟生态的逐渐成熟。AI 组件层具体包括了模型训练

43、、数据整合、应用开发、应用部署等几个关键环节,各环节均已经初步跑出了一系列组件工具,可预见随着各个头部工具厂商不断拓展自身的产品线,AI 组件层的一体化和平台化程度会越来越高。除了新兴厂商之外,IBM、埃森哲、德勤等 IT 咨询公司也推出了 AI 解决方案,来支撑 AI 应用的开发与部署,具体来看:1)应用框架:)应用框架:通过提供了一套组件和接口,将开源模型、API 和数据库等不同的外部组件链接在一起,能够帮助应用开发快速构建基于大模型的 AI 应用,来简化应用的开发和创建过程,代表厂商包括 LangChain,Dust.tt,Fixie.ai,GPT Index 和 Cognosis。2)

44、数据整合:)数据整合:由于基础模型仅限于对训练它们所依据的事实进行推理,而应用和垂类模型需要使用时效性强以及垂直领域和私有数据来推出面向专业领域的应用,特别是在金融、医疗等专业性强以及天气、体育、新闻等实效性强的领域,应用程序开发人员需要模型调用外部数据源,通过外挂等方式来实现数据整合,而非再次训练底层大模型。涉及工具包括了向量数据库Pinecore、Chroma、Redis 等、上 下 文 窗 口 LangChain、LlamaIndex 等、数 据 加 载器 Unstructured.io、Databricks 等。3)模型训练模型训练:应用开发对底层模型有多种选择,可以选择由 Open

45、AI、Anthropic 或 Cohere等供应商创建的闭源模型,或者使用开源模型,以及可以选择训练自己的模型,而且模型尺寸、模态、输出质量、上下文窗口大小、成本和延迟各不相同,最佳设计通常需要开发人员在使用多个模型的组合。涉及到的 AI 组件包括:模型库 Hugging Face、Replicate 等、深度学习框架TensorFlow、PyTorch、DeepSpeed 等、训练工具 Mosaic、TOgether、Cerebras 等,托管服务 OctoML、Vertex AI 等。行业深度分析http:/ Statsig、Comet、Mlflow 等;另一方面,在应用部署后,应用厂商需

46、要跟踪底层大模型的性能、成本、延迟和行为随时间的变化,了解模型输出的质量,防止恶意使用以及控制大模型的成本,相关工具包括 WhyLabs、datadog 等。5)应用部署应用部署:将 AI 应用部署到实际应用环境中,可以采用 Fixie、Gradio 等框架,或者采取第三方厂商的服务来完成应用的部署实施。图 10:AI 产业生态的逐渐成熟资料来源:Menlo Ventures、华金证券研究所2)产业现状:一二级视角看 AI 应用的演进随着随着 GPT 以及扩散模型等底层模型和算力能力的突破,生成式以及扩散模型等底层模型和算力能力的突破,生成式 AI 应用在近应用在近 3 年来取得了年来取得了跨

47、越式的发展。当前时点,跨越式的发展。当前时点,B 端应用场景逐渐成熟,端应用场景逐渐成熟,AI 应用即将进入全面商业化阶段。应用即将进入全面商业化阶段。1)2021:GPT-3 催生出第一批生成式催生出第一批生成式 AI 应用。应用。2021 年第一批生成式 AI 应用诞生得益于2020 年 5 月 GPT-3 的发布,相较于 GPT-2 及其他语言模型,GPT-3 在机器翻译、聊天问答和 行业深度分析http:/ NLP 任务,比如生成新闻报道和撰写文章。因此从 2021 年开始,包括 Jasper AI 在内第一批基于大模型生成式人工智能应用诞生,大多是基于 GPT-3 的能力,并以类 S

48、aaS 服务的形式进行收费。Jasper Ai在成立当年就收获 7 万名用户、营收额达到 4500 万美元,2022 年翻倍达到 8000 万美元,仅用18 个月时间速成为一家估值 15 亿美元的 AIGC 独角兽。2)2022:AI 作画的爆发与作画的爆发与 ChatGPT 的发布,的发布,22 年是生成式人工智能的元年。年是生成式人工智能的元年。22 年随着扩散模型等生成算法的突破,一系列 AI 作画应用相继诞生,其中包括了 MidJourney、Dall-E2、Imagen 等在线文生图应用,以及 Stability AI 的开源模型 Stable Diffusion,AI 图像生成的效

49、率与精度提升到了前所未有的量级。22 年底,生成式 AI 的“杀手级应用”ChatGPT 正式发布,基于对超大规模数据的深度学习,ChatGPT 在文本生成领域的能力得到了空前提高。除此之外,各种视频生成(Make-a-Video、Imagen Video),以及 3D 模型生成(DreamFusion、Magic3D和 Get3D),包括代码生成工具 GitHub Copilot 开始受到广泛关注。3)2023:C 端应用面临洗牌端应用面临洗牌,B 端应用即将进入全面商业化端应用即将进入全面商业化。23 年生成式年生成式 AI 在在基础模型实现了持续的突破,GPT-4 发布的大语言模型在多项

50、任务上进一步提升,而开源模型 Llama 为初创企业和其他企业提供了一个强大的免费选择,和 OpenAI 的闭源模型阵营形成竞争。在模型能力快速进化的同时,一方面是各类生成式 AI 的项目数量开始激增,另一方面,B 端应用在处在商业化的前夜,自 3 月微软发布了基于 GPT-4 的 AI 办公助手 office Copilot,此后包括企业服务、营销、低代码、安全、教育、医疗、金融等领域的 AI 应用开始陆续发布。7 月份,Microsoft365 Copilot 公布定价,为每个用户 30 美元/月,同时全球 CRM 龙头 Salesforce 宣布正式向所有用户开放 AI 产品,并给出了单

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服