资源描述
2AI+办公与内容生成是此次AIGC浪潮中的核心受益方向1)AI+办公方面,随着ChatGPT火爆全球,基于对图像、视频、音频等进行处理的多模态大模型的应用也得到快速推广。微软已推出Microsoft 365 Copilot为用户办公模式带了个革命式的变化,国产厂商也奋起直追,其中金山办公是国内办公软件厂商探索AI技术应用的先行者之一,接入多个大模型供应商,可更精准满足用户AI创作需求。2)AI全方位赋能,掀起内容创新浪潮。在游戏行业中,AI能够帮助用户体验再升级,并助力大众创作降本增效;在教育行业,智能教育迈向因材施教阶段,AI服务在学生、教师两端均有落地;在影视行业,AI可以助力特效内容生成;在电商行业,从产品上架到售后服务,AIGC将多方位赋能品牌商家;在营销行业,创意文案能够通过AI迅速生成,实现千人千面个性化推荐。AI+智能驾驶与工业:大模型实现对智能驾驶的全面赋能,亦有助于工业场景效率提升在智能驾驶领域,AI大模型可以大幅提升场景生成效率,丰富人与车辆的交互方式,提升驾乘体验;在工业领域,AIGC将降低设计软件使用门槛,提升生成式设计能力,实现降本增效;AIGC的生成和推理能力将进一步优化执行和管理流程。金融、网络安全等行业也是AI技术落地的重要场景未来,AI技术在金融行业的落地方向贯穿了金融机构业务开展的主要方向,如风险管理、投资管理、客户服务、交易监管、金融创新等;对于网安行业而言,AI大模型的出现既有机遇也有挑战。一方面,人工智能技术可以帮助组织降低入侵风险,并改善其整体安全状况,赋能网安行业;另一方面,AI大模型本身的安全保证也十分重要。AI大模型加持下,办公、内容创作、智能驾驶、金融、设计与工业软件、网络安全等领域均将受益AI+办公推荐金山办公,受益福昕软件、万兴科技;AI+智能驾驶推荐中科创达、德赛西威、虹软科技、经纬恒润;AI+金融推荐恒生电子、同花顺(非银组覆盖)、凌志软件;设计与工业软件推荐广联达、中控技术、中望软件;AI+网络安全推荐奇安信、深信服、天融信、绿盟科技、安恒信息、启明星辰。01020304风险提示AI技术落地不及预期、AI大模型受到政策强监管043/3/CONTENTS0102030405064/4/CONTENTS0708091011125/56诚信 责任 亲和 专业 创新AI+办公是AIGC浪潮的核心,海外巨头引领潮流01 AI+办公是此次AIGC浪潮中的核心受益方向AIGC即生成式人工智能,是一种面向文字、音视频、图像等内容自主创作场景的AI技术;基于自然语言处理大模型技术的文字创作工具ChatGPT快速成长为火爆全球的现象级应用,引爆了本轮AIGC浪潮。随后,基于对图像、视频、音频等进行处理的多模态大模型的应用也快速推广起来;AIGC可以直接提升现有各类型办公软件的产品力,从而推动办公软件的迭代升级。AIGC视频视频画质增强视频内容创作视频风格迁移文本文本创作代码生成对话问答图像图片编辑图片生成3D图像生成音频文本合成语音语音克隆音乐生成跨模态文字合成图片文字合成视频图1:AIGC应用功能涉及视频、音频、图像、文本等多个维度资料来源:各公司官网,中国通信研究院,国泰君安证券研究7诚信 责任 亲和 专业 创新微软发布Microsoft 365 Copilot,AIGC技术重塑办公体验01 微软推出Microsoft 365 Copilot订阅服务,用AIGC技术重塑办公体验2023年3月16日,微软正式发布Microsoft 365 Copilot订阅服务,其背后技术支撑是Copilot引擎,使用了Microsoft 365 Apps、MicrosoftGraph和Large Language Model三大核心基础技术Microsoft 365 Apps是Word、Excel、PowerPoint、Outlook、Teams等一系列常见的微软办公软件;Microsoft Graph是一个可以帮助访问在Microsoft 365 Apps上积累的用户业务数据的安全智能网关,这些数据来自于用户的文档、电子邮件、会议、聊天、日历等环节;大语言模型(LLM)是一个创造性的引擎,能够解析并产生人类可以阅读的文字,其使用了OpenAI的ChatGPT及最新发布的GPT4模型。资料来源:StartSe官网,国泰君安证券研究用户在Microsoft 365 Apps里使用自然语言输入提示词后,提示词会通过Copilot系统进行基础训练,提高提示词的质量,使提示词变得可以被执行。将改善后的提示词发送给LLM,前述过程叫做预处理。LLM对提示词进行响应并进行后处理,这个过程会再次通过Microsoft Graph调用用户数据进行训练后,在通过安全性、合规性和隐私审查之后,生成反馈答复最后通过Copilot系统向用户输出反馈答复并驱动APP执行相关的命令通过这样一套完整的处理流程,用户可以在Word等办公软件里通过自然语言下达指令,此后办公软件便自动呈现出一个具有明显个人信息特征的反馈初稿,极大提高了用户的办公效率。图2:Microsoft 365 Copilot的使用流程8诚信 责任 亲和 专业 创新微软发布Microsoft 365 Copilot,AIGC技术重塑办公体验01 Microsoft 365 Copilot为用户办公模式带了个革命式的变化,有助于提高办公创作效率Microsoft 365 Copilot一方面会嵌入到用户高频使用的各类办公软件之中,包括了Word、Excel、PowerPoint、Outlook、Teams等,从而帮助用户从繁琐的事务性工作中解放出来,让用户更专注于创造性工作,从而提高办公效率;Microsoft 365 Copilot还引入了全新的商务聊天(Business Chat)应用场景,可以基于用户过往积累各项业务数据,按照用户需求生成全新的内容,提高创作效率。图3:Microsoft 365 Copilot全面重塑Office套件功能,有助于提高办公创作效率WordCopilot可以根据用户的命题,并引用用户历史文档中的数据,直接草拟一篇不同文风(简洁、详尽、活泼、严谨等)的文档初稿以及摘要,还可以根据用户历史文档惯用的文档格式进行自动排版ExcelCopilot可以根据用户数据直接生成可视化图表以及文字性的分析内容,例如根据公司财务报表数据自动分析公司业务发展趋势TeamsCopilot可以根据聊天对华的上下文提供实时摘要,对视频会议生成实时字幕、会议纪要及要点摘要,便于未参会的用户直接浏览要点,提高效率PowerPointCopilot可以将用户的Word文档直接生成具有设计感的PPT,且自动生成演示者备注,可以根据用户需求调整PPT风格OutlookCopilot可以自动将用户收到的邮件梳理出关键要点,且根据用户的行文习惯自动草拟答复初稿资料来源:微软官网,StartSe官网,国泰君安证券研究9诚信 责任 亲和 专业 创新微软发布Microsoft 365 Copilot,AIGC技术重塑办公体验01 Microsoft 365 Copilot使用自然语言作为人机交互的渠道,降低了Office办公软件的使用门槛根据微软发布会披露,有90%以上的PowerPoint、Excel功能是不被用户使用的;这一现象并不是因为这些功能无用,而是过往通过菜单按钮或者函数公式的方式进行交互的门槛较高,多数用户未经过系统学习就无法直接调用相关功能;引入Copilot之后,所有的办公软件在右侧都会形成一个聊天框,用户将自己想要实现的效果(如进行某种排班、添加某种动画效果或者进行某种特殊运算)以自然语言聊天的方式输入后,软件会直接实现相关的功能,从而使得丰富的软件功能都得到应用,极大降低了用户的使用门槛,有助于进一步提高用户规模和粘性,从而提高付费月活用户数量。图4:在PowerPoint中使用Copilot对话框以自然语言输入希望实现的效果,降低了软件使用门槛数据来源:微软官网10诚信 责任 亲和 专业 创新微软发布Microsoft 365 Copilot,AIGC技术重塑办公体验01 Microsoft 365 Copilot的推出将为微软带来新的收入来源,提高付费用户ARPU目前Microsoft 365 Copilot仍处于内部测试阶段,根据科技媒体TheInformation报道,微软正在向包括美国银行、沃尔玛、福特和埃森哲等在内的600多家大型机构客户测试具备AI能力的Microsoft365 Copilot订阅服务;在已经付费订阅Microsoft 365年费会员的基础上,每1000名员工使用Copilot服务需要支付的额外年费为10万美元,对应额外的ARPU为100美元,目前试点客户的付费意愿超出微软早先预期;根据微软财报数据测算,2022年Microsoft 365机构订阅的ARPU约为103美元,此次Copilot服务的试点价格有望推动ARPU实现接近翻倍增长。图5:Microsoft 365商业版ARPU约为103美元88.0090.0092.0094.0096.0098.00100.00102.00104.00106.002019202020212022微软Office 365商业版ARPU(美元)数据来源:Wind,国泰君安证券研究11诚信 责任 亲和 专业 创新Adobe推出生成式AI模型集Firefly01 Adobe推出生成式AI模型集Firefly,展示出强大的设计创作能力2023年3月21日,Adobe正式推出生成式AI模型集Firefly,随后在Photoshop应用中进行了测试上线。Firefly的推出有望极大提高设计创作效率,降低设计创作用户门槛,改变目前的创意设计行业格局。图7:在Photoshop中使用Firefly可以将一张原始图像自动扩容为一张内容更丰富的大图数据来源:Adobe官网文字效果:将特定纹理显示到艺术字体中等。后续Firefly还将探索视频自动处理、文字生成3D/矢量文件、草图变全彩图像等一系列AI功能文字转图像,Firefly可以根据用户的提示词自动生成所需图像,如输入“天空增加极光”指令之后,可以自动为图像中的天空部分增添极光生成填充能力,可以根据原始图像中内容,自动拓展、填充、扩容成为一个内容更加丰富的图像文字转图像Firefly文字效果生成填充图6:Adobe推出AIGC模型集Firefly,展示出强大的设计创作能力12诚信 责任 亲和 专业 创新国内办公软件厂商奋起直追,AIGC功能实现快速迭代01 金山办公是国内办公软件厂商探索AI技术应用的先行者之一在AI团队成立的前两年,团队主要强调积累AI研发能力,包括算法能力、工程能力、数据采集和分析能力等;后两年公司开始更加注重AI技术的产品化,在公司产品中增加了一系列AI功能,推出了包含智能美化、智能校对、智能辅助写作、全文翻译、图像识别等一系列的AI辅助办公功能,来帮助提高用户的办公效率。图9:预处理过程可以改善用户指令的质量数据来源:金山办公官网,国泰君安证券研究AI在金山办公内部被首次上升到战略层面,由姚冬组建了数百人的AI团队,主要负责AI算法改进和工程产品的落地2 0 1 7金山办公正式对外提出了“多屏、内容、云、AI”的发展战略,AI战略公开亮相2 0 1 8截止2021年7月,WPS的智能美化月活用户超过百万,智能校对的月校对字数超过了70亿,智能生成的内容占据了云端整体内容资源的33.6%,AI战略对公司产品力和用户粘性的提升已经体现出明显的帮助2 0 2 1未来,公司发展战略的重心已经成为加速AI产品的产业化,强化对公司营收增长的积极作用,从而实现长期的可持续发展未来图8:金山办公是国内办公软件厂商探索AI技术应用的先行者之一13诚信 责任 亲和 专业 创新金山办公推动AIGC功能快速迭代01 金山办公接入多个大模型供应商,可以更精准的满足用户AI创作需求目前市面上可供选择的大模型正在持续增加,各家大模型表现各有所长,并没有哪一家有绝对领先的产品力表现;目前金山办公的产品已经接入了MiniMax、百度文心、CopyDone等多家大模型,未来还有望接入新的大模型;同时接入多家大模型,按照不同的用户需求去匹配调用不同的大模型进行内容创作,能够更好的满足用户的创作需求。图11:CopyDone大模型擅长文案营销场景数据来源:CopyDone官网,国泰君安证券研究CopyDoneCpoyDone是一个专门面向场景营销打造的大模型,可以生成丰富商品类型、海量内容平台风格的文案、图片、视频内容,在文案营销场景WPS可以优先对接CopyDone大模型MiniMaxMiniMax是一个多模态大模型,在对华聊天等场景更有优势百度文心百度文心则凭借其丰富的语料库在文学创作等领域可以更好的满足用户需求WPS作为大模型的调度匹配中心,统筹各家大模型发挥出“1+12”的效果图10:金山办公接入多个大模型供应商,可以更精准的满足用户AI创作需求14诚信 责任 亲和 专业 创新01 基于AI大模型的WPS轻文档率先进入内测阶段,展示出较强的文字创作能力2023年4月18日,金山办公发布了WPS AI的Demo演示视频,官宣WPS AI将嵌入金山办公全线产品;率先进入内测阶段的是具备AI能力的WPS轻文档,这是一款对标Notion AI等轻办公产品的在线内容协作编辑工具。图13:WPS AI轻文档可以提供丰富的创作辅助功能数据来源:金山办公官网,国泰君安证券研究CLICK ADD TITLE借助大模型自动生成新闻稿、工作周报、运营策划案等实现多轮对话,持续就某个主题进行讨论;也可以对现有文档进行改写、扩写、缩短、润色等对指定文档生成主旨摘要、文章大纲等功能图12:WPS AI显示出较强的文字创作能力,有望提升用户创作效率WPS AI金山办公推动AIGC功能快速迭代15诚信 责任 亲和 专业 创新01 金山办公类Copilot的客户端产品仍在持续打磨之中,有望成为提升用户付费率的重量级手段类比微软Copilot,语义理解是大模型为办公软件带来的核心能力,使WPS可以在用户需求理解、内容创作、内容分析等方面获得提升,有利于提高创作效率,提升付费率;人机交互方式的创新则是大模型为办公软件带来的创新能力,用户只需关注最终要实现的创作目的,用自然语言下达指令,WPS可以自动完成相关运算并输出最终结果,从而大幅度降低使用壁垒,扩大用户群,进一步打开公司的长期成长空间。图14:WPS的类Copilot功能丰富数据来源:国泰君安证券研究WPS表格WPS表格将具备智能数据理解与分析能力WPS演示WPS文字和演示将具备内容生成、文字润色能力,能根据用户命题自动进行文档创作WPS PDFWPS PDF可进行内容要点概括、文档大纲生成、文档内容问答等功能金山办公:推动AIGC功能快速迭代16诚信 责任 亲和 专业 创新01 福昕软件在海外版PDF Editor Cloud中集成ChatGPT,向用户提供AIGC功能 福昕软件是PDF板式办公软件龙头企业,其推出的Foxit PDF Editor Cloud是一款在线PDF编辑器,用户可通过该工具在线阅读及编辑PDF文件;2023年4月25日,海外版的Foxit PDF Editor Cloud成功集成ChatGPT,付费用户目前主要可以使用多项AIGC功能。数据来源:福昕软件官网,国泰君安证券研究文档摘要文档改写文档翻译文档内容回答根据文档内容快速生成简洁、准确的摘要文档摘要在不改变文档原意的情况下进行重写,优化文档的表述方式,提高可读性文档改写将选定内容或者摘要翻译成指定语言文档翻译可以在对话框中就感兴趣的内容进行提问,其将根据文档内容生成答案,并定位到相应段落文档内容回答福昕软件:在PDF Editor Cloud中集成ChatGPT图15:福昕软件在海外版PDF Editor Cloud中集成ChatGPT,向用户提供AIGC功能17诚信 责任 亲和 专业 创新福昕软件:在PDF Editor Cloud中集成ChatGPT01 AIGC功能有望提升福昕软件ARPU 由于Foxit PDF Editor Cloud提供的AI功能基于ChatGPT,因而对用户均有次数/字数限制,文档改写每用户每月上限为100页;文档翻译每用户每日上限为50个指令,每个指令最多2000字;文档内容问答每用户每日上限为50个指令或问题;一旦超过相应限制,用户需要进行额外付费,从而有助于提高用户ARPU。图16:PDF Editor Cloud借助ChatGPT的能力可以提供文档摘要、文档重写、文档翻译、文档问答等功能数据来源:福昕软件官网,国泰君安证券研究18诚信 责任 亲和 专业 创新万兴科技:加码AI技术研发投入01 万兴科技拥有完善的创意办公软件产品线,是国内创意办公软件的领跑者 公司产品涵盖视频创意、绘图创意、文档创意和实用工具四大类别,形成了万幸喵影、万兴播爆、亿图脑图、万兴爱画、万兴PDF等具有广泛影响力和庞大用户群的核心创意办公软件产品。图17:万兴科技拥有完善的创意办公软件产品线数据来源:万兴科技官网,国泰君安证券研究绘图创意实用工具视频创意文档创意19诚信 责任 亲和 专业 创新万兴科技:加码AI技术研发投入01 万兴科技长期加码AI技术研发投入,AI产品逐渐进入落地期图19:万兴播爆、万兴爱画新品上线数据来源:万兴科技官网,国泰君安证券研究2022年下半年以来公司视频创意、文档创意、绘图创意等主要产品线均陆续发布了带有AI功能的新版本,并推出融入多项AI技术的新产品。在视频创意产品线2022年公司完成了万兴喵影大版本更新,上线了AI分割、AI抠像、AI降噪、AI音频重组、AI文案生成等AI功能套件,并在2022年底发布了基于AIGC技术的数字人营销视频创作工具万兴播爆,可以实现文生视频、虚拟人直播等AI功能2022年11月公司上线全新的AIGC图像生成工具-万兴爱画,支持AI文字绘画、AI以图绘图、AI简笔画三种创作模式,用户输入一段文字描述即可获得多种艺术风格的AI绘画作品,或者输入图片后将其转化为绘画作品公司从2020年就开始洞察到AI技术的发展前景,并快速组建了一支上百人的高素质技术研发团队,近两年在视频生成算法、图像生成算法、GAN生成算法、音频生成算法等AI前沿算法等领域均取得多项技术研发成果图18:万兴科技AI产品逐渐落地20诚信 责任 亲和 专业 创新万兴科技:加码AI技术研发投入01 万兴科技积极拥抱大模型技术,推动AI产品力实现快速提升图21:万兴播爆可以大幅降低营销视频生产成本,并提高生产效率数据来源:万兴科技官网,国泰君安证券研究公司宣布其在海外运营的视频创意软件Wondershare Filmora已经全面接入了ChatGPT母公司OpneAI的商用服务开通了GPT-4模型的商用账号权限与微软签订云服务框架协议,双方将在云服务及AI技术领域全面深化合作,未来优先使用微软新品,目前正在持续推动多个海外产品接入GPT大模型2023年3月31日,公司发布基于AIGC大模型的“真人”出海营销短视频工具-万兴播爆推出桌面版产品,万兴播爆基于AIGC大模型可以提供120多种语言的文案脚本快速生成能力以及60多种国籍的数字人播报能力,还可以进行数字人的定制服务,相较传统视频生产模式,万兴播爆可以使成本投入降低至原先的1/5,并大幅提升用户的生产效率。2023年2月2023年4月2023年6月2023年3月31日2023年3月图20:万兴播爆发展迅猛21诚信 责任 亲和 专业 创新万兴科技:加码AI技术研发投入01 AIGC新品为万兴科技带来新的盈利点,有望提升用户ARPU公司传统的万兴喵影个人年费会员定价为269元,5年期会员的年费进一步降低至120元;万兴喵影企业年费会员定价为3299元,可支持5台设备同步使用,相当于单设备年费价格为660元;公司推出的AIGC新品中,万兴播爆的年费会员定价为1688元,相较传统软件产品的定价有显著提升;万兴爱画则按照创作次数进行付费,10次图片创作合计5元,最便宜的100次图片创作合计费用为20元,按次收费的方式在客户需求侧有更高的成长上限。总体来看,AIGC新品的定价要高于传统创意软件,有望为万兴科技带来新的盈利点,提升用户ARPU。图22:AIGC新品万兴播爆、万兴爱画为公司带来新的赢利点,提升用户ARPU数据来源:万兴科技官网,国泰君安证券研究22/2223诚信 责任 亲和 专业 创新自动驾驶:AI大模型有助于我们提升覆盖小概率路况的效率02 对小概率路况的覆盖是自动驾驶落地的核心问题公司由于一旦发生事故造成的后果极为严重,自动驾驶是一个对小概率情况非常敏感的场景。由于交通事故将会产生非常严重的后果,对于主机厂而言,在责任明晰之前,即使是99.99%的可靠性也是不能接受的,因为这可能意味着每卖出10000台车可能就会产生一起事故。行业特点决定了要实现自动驾驶就必须先对长尾场景进行有效覆盖。测试里程的积累是有效覆盖小概率路况的前提。根据广汽的预测,要实现L4级自动驾驶所需要的长尾场景覆盖程度,至少需要完成10亿个测试场景,最小测试里程也需要10亿公里,这两个数据分别是实现L2级自动驾驶的10万倍、1万倍。最小车辆数最小车辆数最小里程数据最小里程数据测试场景数测试场景数/评价维度评价维度2000+*10910亿+/100+200+*1081000万+/5010+10610万/10+610*1051万+/103-51041千/52-3103100/5L4智能驾驶智能驾驶L3智能驾驶智能驾驶L2智能驾驶智能驾驶011030100100010000KPD 公里公里/无接管无接管图23:达到L3及以上级别自动驾驶需要大量测试数据来源:广汽,国泰君安证券研究24诚信 责任 亲和 专业 创新 此前,测试里程的积累主要有两种方式。一种是通过自动驾驶车队来进行数据采集,以Waymo为代表;一种是通过私家车进行数据采集,以特斯拉为代表。测试里程的积累主要有两种方式02通过自动驾驶车队进行路测来覆盖小概率路况的方法效率比较低。Waymo是自动驾驶领域的霸主,但是在过去很多年里,感知问题、行人问题、软件问题等方面,Waymo的接管频率并没有收敛。毫无疑问,Waymo的自动驾驶能力是逐年增强的。那么,Waymo在软件问题、行人问题等方面的表观“退步”就只能用它在覆盖更多的小概率路况来解释。众包方式能在一定程度上提升对小概率路况的覆盖效率。特斯拉采用影子模式取代测试车队。影子模式本质上是通过众包的方式来解决场景的快速积累问题。在这一模式下,即使在人进行驾驶的时候特斯拉自动驾驶系统同样也在进行计算自己会怎么做,然后和人的选择进行对比。如果自动驾驶系统和人的选择不一致,就对这类数据进行汇集,然后交由工程师判断自动驾驶系统的选择是否合理。VS数据来源:国泰君安证券研究图24:测试里程积累有两种主要方式25诚信 责任 亲和 专业 创新大模型对于覆盖小概率路况意义重大02 大模型可以大幅提升场景生成的效率随着AI大模型的出现,我们覆盖自动驾驶小概率路况的效率有望大幅提升,利用AI大模型进行场景生成是覆盖小概率路况的新思路。相对于单纯的路测,直接进行场景生成,并将仿真结果与路测相结合对于快速实现路况覆盖大有裨益。毫末智行已发布DriveGPT雪湖 海若,可以实现三项能力:按照概率生成很多个场景序列,每个场景序列都是未来可能会出现的一种实际路况;在所有场景序列都产生的情况下,能对场景中最关注的自车行为轨迹进行量化。可以实现在生成场景的同时就产生自车未来的行车轨迹;基于所生成的轨迹,实现决策逻辑链的输出。值得注意的是,毫末的雪湖 海若引入了类似于GPT系列模型中的人类反馈强化学习机制。即把系统和驾驶员的判断和决策进行对比,若对比结果一致,系统会被打高分,反之则会被打低分。这与特斯拉FSD的模式有异曲同工之妙。图25:毫末智行利用大模型进行驾驶场景的生成图19:毫末基于海量接管数据对模型进行训练,从而选出最优策略数据来源:毫末智行26诚信 责任 亲和 专业 创新大模型对于覆盖小概率路况意义重大02 除场景生成外,AI大模型在自动标注方面同样能够发挥重要作用。基于大模型可以实现自动标注,从而大幅度降低成本,提升效率。在AI的1.0时代,数据标注主要依赖于人工,导致数据的标注时间很长,且成本比较高。尤其在自动驾驶领域,由于路况复杂,存在大量的标注需求。如毫末智行的雪狐海若将场景识别能力对外开放。此前采用普通的标注方案标注一张图片需要约5元,而DriveGPT雪湖 海若只需要0.5元,大幅节约了成本。数据来源:毫末智行图26:毫末智行将海若场景识别能力对外开放27诚信 责任 亲和 专业 创新 特斯拉通过道路重建作为车道线感知真值进行4D标注,其本质上是一个基于Tesla强大视觉感知能力的众包建图。特斯拉利用AI技术实现自动标注和自动驾驶模拟仿真022018年之前采用纯人工进行2维图像标注,效率较低。2019年人工进行3D 固定框的图像标注,当时的拓扑只是基于单趟轨迹,重投影精度3pixel,整个标注还比较依赖人工,需要3.5小时进行一个clip标注。2020年采用 BEV空间进行标注,这里可以看到此时的建图已经是基于BEV感知进行的建图,重投影精度7pixel,人工标注耗时小于0.1小时,已经基本可以实现自动标注。2021年以后首先对场景进行重建后在 4D 空间(关于2021年开始采用的4D标注,早在19年Autonomous Day上Karpathy就做过了介绍,当时Tesla使用的是SfM的方式进行周围场景重建,然后再在重建的点云上进行4D标注)中进行标注,使用3D特征进行多趟采集轨迹的聚合重建,重投影精度从(7pixel)优化到(3pixel),人工标注耗时与2020相当,但计算时间从2hrs降低到0.5和hrs,可扩展性也变得非常强,可以取代 500 万小时的人工作业量,人工仅需要检查补漏。2021-2022年特斯拉自动标注技术逐渐成熟,且受全球疫情影响,特斯拉宣布裁员计划,将裁掉自动驾驶部门200位负责数据标注的员工视觉图像的仿真一直是计算机视觉的热门方向,特斯拉目前的ai化方案仅需五分钟就能够设计一个负责的路口,而利用传统建模渲染的方案则需要一个设计师两周的时间自动标注自动标注模拟仿真模拟仿真图27:特斯拉利用AI技术实现自动标注和自动驾驶模拟仿真数据来源:特斯拉,国泰君安证券研究2021-2022年特斯拉自动标注技术逐渐成熟,且受全球疫情影响,特斯拉宣布裁员计划,将裁掉自动驾驶部门200位负责数据标注的员工视觉图像的仿真一直是计算机视觉的热门方向,特斯拉目前的ai化方案仅需五分钟就能够设计一个负责的路口,而利用传统建模渲染的方案则需要一个设计师两周的时间自动标注自动标注模拟仿真模拟仿真28诚信 责任 亲和 专业 创新大模型依然无法帮助我们100%解决小概率路况带来的问题02 大模型没有摆脱深度学习框架,这就意味着现阶段的AI背后依然是统计学,无法彻底解决残差问题。从本质上来说,利用AI大模型进行路况生成虽然能大幅提升效率,但依然类似穷举。而通过穷举法实现对小概率路况的全覆盖从理论上不太可能实现,本质的原因在于“路况本身是一个无限场景”。试想一下,如果我们要打开一个密码箱,我们只需要从“000”到“999”全部尝试一遍,箱子就必然已经被打开了;同样的道理,在棋类运动中,每一步可以“落子”的情况都是有限的集合,换句话说,所有可能性是也是可以被遍历的,所以这两个场景都是“有限场景”,而公开道路自动驾驶场景则是一个“无限场景”。但我们不能因大模型难以100%解决问题而低估其对自动驾驶行业的帮助。无法单纯从技术上解决问题并不意味着大模型对于自动驾驶的落地没有意义。我们认为,技术的突破和法律、伦理的放缩将“相向而行”,从而最终在一个可以接受的安全性范围内实现平衡。大模型核心解决的是成本和效率问题。小模型APP工厂大模型APP工厂开发模式复用性效能/效率较低,场景模型强绑定,难以复用和积累随业务线增多,人员效率降低,效能降低当前AI商业化痛点高,“大模型+微调”流水线可有效复用大模型为核心,效率/效能不受业务增多影响开发团队APPs核心数据处理 1-n 模型设计 1-n参数调优 1-n模型 1-n数据处理 1-n 模型设计 1-n参数调优 1-n其他定制开发极大降低开发成本开发团队维护APPs其他定制开发解耦合工程库池核心大模型模型 1-n微调人力释放数据来源:北京智源人工智能研究院,国泰君安证券研究图28:大模型核心解决的是成本和效率问题29诚信 责任 亲和 专业 创新AI助力智能座舱交互体验提升02 智能座舱交互属性毫无疑问会不断上升。从必要性角度:汽车行业正从卖方市场转向买方市场,行业演进的核心驱动因素由技术与产品转变为消费者需求。传统汽车工业已走过百年,随着行业的高度成熟,这一市场正逐渐由卖方市场转变为买方市场,行业向前发展的关键因素也从技术的突破和产品的打磨转向消费者的需求变化。从可行性角度:随着EE架构的集中化,以及主控芯片算力的提升,将可以支撑越来越多新的功能点。AI大模型可以丰富和革新人与车辆的交互方式。在座舱内,驾驶员会与汽车通过语音、视觉等多种方式产生交互,毫无疑问,AI大模型有助于交互体验的提升。如驾驶员将可以通过自然语言的方式和系统进行沟通,比如选择一条更快的路或是收费更少的路;或者系统会对驾驶员的各种习惯进行学习,比如什么时间在什么地方喜欢买咖啡,从而对驾驶员进行建议;再或是基于天气提示驾驶员带雨伞等等。图29:国内消费者购车决策中座舱智能科技因素占比达26.7%图30:国内市场智能座舱渗透率提升速度有望快于全球市场数据来源:IHS Markit,国泰君安证券研究30诚信 责任 亲和 专业 创新AI带动车辆研发设计效率提升02 随着项目周期的压缩,汽车研发效率正变得越来越重要。汽车产业更短的开发周期和更多的定制化需求对Tier1的智能制造能力提出了更高的要求。汽车的开发周期正逐渐缩短,这使得供应商的项目周期被大幅压缩,此前项目可能是2-3年,而现在可能是1年多甚至不到1年,同时主机厂的定制化需求却越来越多,自动驾驶功能模块逐渐增加,需要测试的里程数快速增加,这些都对汽车研发效率带来了新的挑战。没有完全足够的时间进行路测,同时由于涉及到安全,测试环节本身不能简化,所以设计、测试的效率在一定程度上正逐渐成为制约项目能否快速及时交付的重要因素。06个月12个月30个月24个月18个月概念界定&业务案例开发装配场地准备/营销计划制定产品工程制造工程战略开发阶段项目执行阶段场地选择产品/性质转换图31:汽车的开发周期正逐渐缩短数据来源:Center for Automotive Research,国泰君安证券研究31诚信 责任 亲和 专业 创新 中科创达Genius Canvas将语言能力、视觉渲染以及特效制作能力结合在一起,多方面帮助设计师完成创作过程,从而优化工作流程,并提高设计师的工作效率。AI带动车辆研发设计效率提升02Genius Canvas能够把3-4周的工作周期缩短到1周,节省70%的时间。概念创作Genius Canvas能够把46周的工作周期缩短到3天,节省85%的时间。3D元素设计Genius Canvas能够节省90%的时间。特效及场景制作数据来源:中科创达图32:Genius Canvas大幅提升设计师效率32诚信 责任 亲和 专业 创新中科创达:推出Genius Canvas,提升HMI交互体验02中科创达重视AI技术,利用kanzi推动智能驾驶舱的发展。在2022年,中科创达公布与地平线成立合资公司,聚焦智能驾驶赛道。kanzi是一个具有强大实时3D渲染能力的工具。中科创达推出的智能驾驶舱3.0使用了Kanzi for Android这种新技术,使得Android系统和Kanzi完美对接,实现了3D唱片、可定制实景导航、实时界面个性化定制、跨屏幕跨系统应用等功能。中科创达Genius Canvas赋能汽车产业发展,打造全新HMI交互体验。Genius Canvas的一个工具是大模型引擎。它能够把想法和理念转化为文案,并进一步转化为创意和作品,最终通过技术手段转化为应用程序。Genius Canvas的第二个工具来源于KANZI产品。Kanzi与大模型结合后,能够利用大模型的知识库及创新能力,快速创作丰富多彩的Kanzi HMI概念效果及特效,构建多样的3D模型及形象库,并且在车机系统中能够实现实时预览功能。目前,全球已有超过百款车型选用了Kanzi,每年有数千万辆搭载Kanzi 技术的量产车型落地。图33:中科创达推出Genius Canvas数据来源:中科创达33诚信 责任 亲和 专业 创新德赛西威:联合高校推进大模型本地化,赋能自动驾驶02德赛西威联合高校推进大模型本地化部署。德赛西威已和中山大学、南洋理工大学等高校合作,通过尝试和布局基于大模型的数字虚拟助手、图像数据自动标注、自动场景创建、自动编程等,构建技术支撑,相关方案已经在上海车展上亮相。在AI大模型本地化过程中,德赛西威能够为客户提供差异化、全方位的技术支持和解决方案。AI大模型技术可以和德赛西威现有技术形成完美融合。比如,AI大模型可以在感知融合、感知预测和规划上实现更为精准的数据补充和预测,从而在行为预测方面给予自动驾驶更多地帮助,并给出更多的控制选择。图34:AI大模型技术可以和德赛西威现有技术形成完美融合数据来源:德赛西威34诚信 责任 亲和 专业 创新虹软科技:非常稀缺的能够将AIGC技术进行产品化落地的公司02在目前阶段,投资者非常关注哪些公司能在AIGC方面形成真正的产品,并产生商业价值。虹软作为安卓系手机拍摄算法的全球霸主和汽车视觉算法的领先者,在图像处理方面拥有超过20年的技术积累,是非常稀缺的能够在现阶段将AIGC技术进行产品化落地的公司。商业AIGC商业模式分为会员服务费和生产流量费两部分。会员服务费部分,公司会根据不同的会员等级开放不同的功能,比如不同的场景库和模型库;此外,公司可以针对一些增值的API做差异化的定制开发。在生成流量费部分,公司将按照生成内容的实际算力消耗直接定价。降低成本商业拍摄市场空间超500亿元,虹软方案能大幅降低对模特的依赖,降低商品展示成本,实现对于原方案的替代。推出新产品公司计划在2023年推出静态商品展示图解决方案,包括商品加背景静态图像的生成,以及商品加数字模特图像生成,后续计划推出动态视频以及3D内容。提高还原度目前市场上的方案在很多细节处存在畸变和失真,虹软的方案能使得商品展示“所见即所得”。图35:公司已发布AIGC产品,助力小B客户大幅降低商品展示成本数据来源:虹软科技,国泰君安证券研究35诚信 责任 亲和 专业 创新经纬恒润:自主开发驾驶仿真测试软件,推出智能座舱AI单品02自动驾驶仿真方面AI大模型经纬恒润自主开发仿真软件,助力驾驶测试。经纬恒润自主研发了综合驾驶测试仿真软件ModelBase,这一软件可以被用于乘用车、商用车的整车电控系统、ADAS系统的设计、测试和验证。涉及电控系统的全开发周期,包括早期的算法仿真测试,控制器的硬件在环测试,半实物台架测试,以及车辆在环测试。目前这一软件已经被已应用于一汽、东风、蔚来等50余个项目中。智能座舱交互方面在智能座舱交互方面,经纬恒润基于AI技术开发了音乐律动氛围灯等一系列产品。经纬恒润音乐律动氛围灯具有实时歌曲特征识别和离线歌曲特征识别两种模式。其中离线歌曲特征识别模式的相关功能就是基于AI音乐风格分类算法和AI音乐段落划分算法进行实现。通过音乐特征识别,为氛围灯音乐律动提供丰富的效果组合,提升用户体验。图36:经纬恒润依托大模型助力产业升级数据来源:经纬恒润,国泰君安证券研究36/3637诚信 责任 亲和 专业 创新金融行业敢于尝试新技术,是AI落地核心场景之一03 相比于其他行业,金融行业在新技术应用上有三个特点金融机构对于系统稳定性和数据安全有极高要求重视新技术发展,敢于尝试金融行业IT预算
展开阅读全文