收藏 分销(赏)

生成式AI手机产业白皮书2024.pdf

上传人:宇*** 文档编号:2752375 上传时间:2024-06-05 格式:PDF 页数:27 大小:1.59MB
下载 相关 举报
生成式AI手机产业白皮书2024.pdf_第1页
第1页 / 共27页
生成式AI手机产业白皮书2024.pdf_第2页
第2页 / 共27页
生成式AI手机产业白皮书2024.pdf_第3页
第3页 / 共27页
生成式AI手机产业白皮书2024.pdf_第4页
第4页 / 共27页
生成式AI手机产业白皮书2024.pdf_第5页
第5页 / 共27页
点击查看更多>>
资源描述

1、1 Counterpoint Technology Market Research 2024 Copyright Counterpoint Research.All rights reserved.May 2024 生成式生成式 AIAI 手机产业手机产业 白皮书白皮书 2 Counterpoint Technology Market Research 2024 本白皮书由 Counterpoint 与联发科技共同发布,其他联合发布者包括阿里云通义千问、百川大模型、虎牙、酷狗、零一万物、OPPO、Soul、腾讯 AI Lab、腾讯混元、vivo(按公司名拼音首字母顺序排列)目目录录 前言.3

2、第一章:智能手机开启生成式 AI 手机时代.4 手机的智能化演进.4 Counterpoint 对生成式 AI 手机的定义.5 端云结合将是生成式 AI 部署的主流模式.7 多模态是实现 AI 智能体愿景的关键.7 端侧部署 AI 大模型的优势.8 第二章:生成式 AI 手机生态系统.10 LLM 现状以及预测.10 阿里云通义大模型.10 百川大模型.11 零一万物 Yi 模型.11 腾讯混元.11 未来两年端侧大模型参数规模将继续增长.12 APP 为基础的用户界面与 AI 智能体将会在未来几年内共存.13 芯片设计公司的生成式 AI 战略.14 手机 OEM 厂商的生成式 AI 战略.1

3、4 OPPO 生成式 AI 战略.15 vivo 生成式 AI 战略.15 开发者生成式 AI 战略.16 虎牙.17 酷狗.17 Soul.18 腾讯 AI Lab.18 第三章:生成式 AI 手机的软硬件科技全景.19 端侧部署 AI 大模型的硬件要求.19 软件生态的需求.21 目前可支持端侧 AI 大模型手机的 SoC 平台.22 第四章:生成式 AI 手机预测.24 结论.26 3 Counterpoint Technology Market Research 2024 前言前言 2022 年 11 月 30 日,ChatGPT 上线,并迅速获得追捧。这场最初由 ChatGPT 引发

4、的生成式 AI 浪潮,让全球消费者惊讶于大语言模型(LLM)所带来的全新人机交互体验的同时,也让产业界充分认识到生成式AI 技术在消费者(C 端)市场的巨大应用潜力。而智能手机,作为当下最重要的个人智能终端,在全球范围内拥有超过 40 亿用户规模,无疑是生成式 AI 技术在 C 端应用成功与否的重中之重。另一方面,智能手机产业在进入 5G 时代后,也需要一场真正意义上的颠覆性革新,为消费者带来更加智能、个性化,同时也更加安全的使用体验,将手机打造成全天候的私人智慧助手和移动生产力工具,从而为智能手机下个十年的发展打下坚实的基础。生成式 AI 技术与智能手机的融合刚好契合这一需求,它将全方位赋能

5、智能手机产业,革新包括硬件、软件,以及相关的移动互联网内容生态的方方面面。生成式 AI 与智能手机的融合既是产业各方的需要,也是 AI 普惠的必由之路,以智能手机为媒介,全球手机用户能够更便捷、更高效地享受生成式 AI 技术发展所带来的福祉。本白皮书提出了生成式 AI 手机的概念,讨论了生成式 AI 手机生态中各个玩家,包括芯片厂商、手机厂商、大模型厂商、开发者的相关 AI 战略,以及围绕生成式 AI 手机的软硬件科技全景,最后是Counterpoint 对生成式 AI 手机发展的预测。4 Counterpoint Technology Market Research 2024 第一章第一章:

6、智能手机智能手机开启开启生成式生成式 AIAI 手机手机时代时代 从 2023 年底至 2024 年一季度,新一代旗舰智能手机陆续发布,越来越多的基于生成式 AI 能力的功能开始出现在这些产品中。无论是手机厂商还是其生态伙伴,在主动拥抱生成式 AI 趋势的同时,也在积极探索各种可能性,着力打造对用户有价值的高频使用场景,而这一探索将贯穿整个2024年。Counterpoint认为 2024 年会是生成式 AI 手机的元年。手机手机的的智能化智能化演演进进 大约在二十多年前,以诺基亚塞班为代表的操作系统,第一次允许用户自行下载 APP,并将其作为入口,访问服务和数字内容,这种模式一直持续到今天。

7、也正是这种变化,使得全球的开发者可以加入到智能手机产业中来,为手机用户提供丰富多样的应用选择,促成了之后移动互联网生态的蓬勃发展,手机也逐渐发展为人们休闲娱乐、通信社交、健康和出行服务、消费购物,以及移动办公的重要载体,早已不可或缺。2007 年,iPhone 的问世颠覆了传统的手机设计理念,物理键盘逐渐被淘汰,触控屏幕成为人机交互的核心。然而随着时间的推移,在一些场景下,触控输入的方式变得越来越低效,常常需要多次的用户干预,才能到达最终的服务界面。在此背景下,出现了包括智能语音助手,手势、眼球追踪在内的新的交互方式,致力于打造更流畅、高效,更加用户友好的交互体验。通过 AI 技术赋能智能手机

8、的尝试最早可以追溯至 2017 年,彼时苹果刚刚发布了首款后置双摄手机iPhone 7 Plus,而安卓阵营也开始在其 SoC 平台中加入独立的 AI 计算单元,用于运行和影像增强相关的深度学习模型。在这之后,AI 技术逐渐被手机厂商用于更多方面,如强化安全、优化续航、提升网络性能等,但计算摄影一直是其最主要的应用领域,直到 LLM 被装进智能手机,手机 AI 应用从中小模型时代跨越至大模型时代。得益于 AI 大模型的赋能,智能手机将迎来新一轮的革新。首先在人机交互层面,有了 LLM 的加持,新的多模态交互将取代传统的、单一的触控屏交互,逐渐实现从图形用户界面 GUI 到语音用户界面 VUI

9、的跨越式转变,用户可以以更直观、更自然的方式与手机沟通。其次,多模态输入和输出能力相结合,可以极大强化智能手机的生产力工具属性:既可以基于多种形式的输入信息,生成用户需要的图表、文本、音乐、图片甚至是视频,也可以对输入的图片、视频进行编辑。最后,随着融合的深入,生成式 AI 技术将在智能手机上孕育出一个甚至多个智能生命体(AI Agent)。智能生命体以用户为中心,不断学习用户的行为习惯,能够智能识别用户意图,适时向用户推荐个性化的内容和服务。Counterpoint 认为智能体将会成为专属于每个用户的应用入口,但预计在很长一段时间里,智能体仍将会和 APP 共存。5 Counterpoint

10、 Technology Market Research 2024 图表图表 1 1:手机智能化演进路线图手机智能化演进路线图 来源:Counterpoint Research CounterpointCounterpoint 对对生成式生成式 AIAI 手机的定手机的定义义 Counterpoint 认为生成式 AI 与智能手机的融合无疑将引发一场深刻的变革。参照过往每一次技术革新,在初期探索阶段,新的功能和特性将首先被赋予算力资源更加充裕的旗舰和次旗舰产品,并迅速成为重要的差异化卖点。而随着时间的推移,生成式 AI 能力将加速下沉,从而能够在全球范围内,惠及更广大的消费者群体。基于上述判断,

11、Counterpoint 提出了生成式 AI 手机的概念,并结合现阶段生成式 AI 应用的现状,以及对生成式 A I 手机未来发展与演进的预判,给出了如下定义:6 Counterpoint Technology Market Research 2024 生成式 AI 手机是利用大规模、预训练的生成式 AI 模型,实现多模态内容生成、情境感知,并具备不断增强的类人能力。生成式 AI 手机开启了智能手机发展的新周期,长远看,智能手机会发展为移动智能体。Counterpoint 认为,生成式 AI 手机需要具备如下必要特征:支持大模型的本地部署,或是通过云端协同的方式执行复杂的生成式 AI 任务。生

12、成式 AI 手机本身具备强大的 AI 算力,无须完全依赖云端服务器。具备多模态能力,即可以处理文本、图像、语音等多种形式的内容输入,以生成各种形式的输出,典型用例如翻译、图像生成和视频生成等。确保流畅、无缝的用户体验,设备能够以自然而直观的交互方式,快速响应用户的请求。拥有实现上述特征的硬件规格,包括但不限于基于领先工艺和先进架构设计的移动计算平台,拥有集成或者独立的神经网络运算单元(如 APU/NPU/TPU),大容量和高带宽的内存,以及稳定和高速的连接,硬件级和系统级的安全防御。图表图表 2 2:Counterpoint Counterpoint 生成式生成式 AIAI 手机定义手机定义

13、来源:Counterpoint Research 2024 年是生成式 AI 手机爆发的元年,在产业链的配合下,头部安卓厂商已经成功实现了 70 亿参数大模型的本地部署。在此基础上,一些基础能力被开放给开发者,其中比较有代表性是:基于 Diffusion 大模型的图片和视频生成(本地用例多为低分辨率,如 480p);基于 LLM 的自然语言处理,包括语音转文本,文本转语音,任务型对话,实时翻译和信息问答等,以及基于 sLLM 模型(轻量型语言模型)的文字校对和文本生成、改写和总结。7 Counterpoint Technology Market Research 2024 端云端云结合将是结合

14、将是生成式生成式 AIAI 部署部署的的主流主流模式模式 相对于手机端有限的计算和存储资源,云端无疑拥有更充足的算力,从而能够支持更大规模的 AI 模型部署和训练,当前一些复杂的生成式 AI 任务主要是通过云侧大模型来实现的。从长远看,Counterpoint认为端云结合会是生成式 AI 在手机端侧部署的主流模式。一方面,在未来几年,本地大模型无论是规模还是效率都将保持增长,这意味着用户可以从本地获得多数基于生成式 AI 的服务,本地大模型还将为需要云端介入的任务提供数据脱敏、压缩等预处理,以保护用户隐私。另一方面,云侧 AI 大模型可以为用户带来更有价值的服务,比如提供更高品质的内容输出,如

15、影视、动画制作等,或是专为云办公场景打造智能协同平台,可以打破物理空间的边界,允许海量人群参与到同一个项目中。总之,要用发展的眼光看待生成式 AI 手机这一新现象,目前展示的生成式 AI 用例只是冰山一角。无论发展到哪个阶段,端云协同在满足产业各方需求的同时,也能最大化利用分布在端云两侧的算力资源。在端侧,移动计算平台的每一次迭代和升级,都意味着手机 AI 算力的大幅突破,相应的,消费者可以期待更加流畅、也更加丰富的生成式 AI 体验。同时,生成式 AI 手机的端侧多模态能力也将获得进一步的强化,Counterpoint 认为,多模态能力,包括多模态输入和输出,是生成式 AI 手机愿景得以实现

16、的关键之一,也是实现多元化交互的基础。多模态是多模态是实现实现 AIAI 智能体智能体愿景的关键愿景的关键 上文中,我们提到多模态能力是实现生成式 AI 手机愿景的关键。在 Counterpoint 的预测里,随着生成式 AI 手机的发展,将带来如下几个维度的革新:首先是交互方式的多元化、直觉化,一方面这要求大模型可以识别、理解不同形式的输入内容,用户可以通过文字输入,也可以是一段语音,一张表格,一张图片,一段视频。另一方面,具备多模态输出能力的大模型将以用户为中心,选择最佳的、最适合当前情境的输出方式。可以说,多模态交互是开启全新交互体验的钥匙。长期以来,语音助手被认为缺乏实用性,但有了多模

17、态 LLM 的加持,语音助手将变得更加智能,它能够更加准确地识别、理解人类的自然语言,不但能够快速理解和响应用户指令,还解锁了语音文本互转、多轮对话等能力,在越来越多的场景下,更自然的语音交互将会成为智能手机输入输出的首选方式。其次,今年年初 Sora 横空出世,其展现出的文生视频能力备受行业关注,成为多模态应用创新的“新高地”。对于智能手机用户来说,短视频无疑是当下最受欢迎的移动互联网应用之一,将会是未来数字内容传播最主要的媒介,对优质、个性化、多样化短视频内容的需求也将会持续增长。因此,短视频制作是生成式 AI 最重要的应用领域之一,具备视频理解能力的生成式 AI 手机可以提供智能视频剪辑

18、、风格转换、文案自动生成、以及生成配音等辅助功能,成为视频创作者的得力助手。受益于手机 AI 算力的不断增长,8 Counterpoint Technology Market Research 2024 在不久的将来,语言视觉模型(LVM)也将实现本地部署。届时,通过文字和语音提示生成、编辑短视频将成为可能,这将大幅提升视频制作效率,进一步促进短视频生态的繁荣。最后是 AI 智能体的成长。多模态大模型可以同时感知不同类型的数据,包括图像、文本和语言,从而为智能体的成长提供更多维度和更加丰富的训练语料。这意味 AI 智慧体可以像人类一样从不同的媒介获取知识,不断提升对复杂现实世界的理解能力。在这

19、个过程中,AI 智能体将习得“听说读写”这些类人的本领。此外,伴随着认知能力的发展,AI 智能体将拥有更加全面的能力。联发科技认为未来的智能体还将具备自主决策能力,包括“计划”、“记忆”和“行动”的能力。计划 具备任务分解和自我反思能力;记忆 短期和长期记忆能力;行动 直接执行或利用工具完成特定任务。在联发科技的设想里,智能体可以学习、记忆手机用户的使用习惯,以及兴趣和偏好,在此基础上协助人处理日常生活(食、衣、住、行)以及工作(计划、执行、报告)事項,使得人可以专注在设定目标和进行决策。以旅行场景为例,智能体可以为在出发前为用户量身订制出行方案,在旅行过程中,可以根据天气、交通和景区信息,以

20、及一些突发情况,动态调整计划,让旅行变得更轻松、更加个性化。端端侧部署侧部署 AIAI 大模型的大模型的优势优势 如前所述,Counterpoint 认为端云结合、优势互补会是生成式 AI 技术与智能手机融合的主流模式。同时,Counterpoint 认可端侧部署 AI 大模型具有如下优势:低延时:在许多生成式AI任务场景下,网络传输时延是用户无法获得流畅体验的主因,而本地大模型可以更快地响应用户需求,将时延控制在秒级甚至是毫秒级别。安全和隐私:AI 大模型本地部署可以确保用户个人数据不离开手机,结合芯片公司提供的基于底层硬件的防护机制,可以最大程度保护用户的数据和隐私安全。减少对网络的依赖:

21、AI 大模型本地部署可以极大降低对网络的依赖,即便是在弱信号,甚至没有网络的情况下,手机仍然可以提供必要的生成式 AI 能力,为用户提供不间断的服务。个性化:具有自学习能力的本地大模型可以成长为每个用户专属的智能体,从而有能力为用户提供个性化的服务和推荐。9 Counterpoint Technology Market Research 2024 减轻基础设施负载:考虑到全球范围内超过 40 亿的智能手机用户,随着生成式 AI 应用在手机上的普及,对AI算力的需求将呈现爆发式增长。通过部署本地大模型,可以在本地完成尽量多的生成式AI任务,一方面降低了对网络带宽占用,另一方面将极大减少手机用户对

22、云计算资源的访问和占用。10 Counterpoint Technology Market Research 2024 第二章:第二章:生成式生成式 AIAI 手机生手机生态系统态系统 LLMLLM 现状以及预测现状以及预测 全球范围内已经掀起了生成式 AI 创新的浪潮,Google 和 Meta 在海外是 LLM 的重要创新者和参与者,其各自 LLM 的战略覆盖了从云侧到边缘,再到端侧的全域场景。2017 年,Google 首次提出了 Transformer 架构,并将其应用于自然语言处理,使其成为最早投入 LLM模型开发的头部互联网企业之一。2022 年 4 月,Google 推出了 LL

23、M PaLM(Pathways Language Model),参数规模达到了 5400 亿。一年后,Google 发布升级版 PaLM2,通过采用 Compute-Optimal Large Model 技术,优化了模型的规模,并强化了多语言、推理和编程能力,从而使 PaLM2 在真实世界中的表现更加优异。2023 年底,随着全新多模态模型 Gemini 的发布,Google 加快了 LLM 的商用化步伐。Counterpoint 判断Google会优先将Gemini用于强化自身业务,如搜索、Chrome浏览器、YouTube等,并尝试赋能安卓生态。Gemini 目前有三个重要版本,分别是面

24、向端侧应用场景的 Gemini Nano(包括 1.8B 的 Nano-1 和 3.25B 的Nano-2),以及面向云侧应用场景的 Gemini Pro 和 Gemini Ultra。2023 年 2 月,Meta 发布自研的基础 LLM LLaMA,包含 70 亿、130 亿、330 亿和 650 亿等四个不同参数规模的版本。同年 7 月,Meta 宣布开源其最新版本 LLaMA2,Meta 还和微软达成协议,后者将在 Azure 和Windows 上支持 LLaMA2。这两项举措帮助 LLaMA2 赢得了众多产业伙伴的支持,开发者可以选择以 LLaMA2为基础,围绕自身业务场景定制开发大

25、模型,极大推动 LLaMA2 的产品化进程。在手机领域,部分手机厂商已经将 Meta 和 Google 作为海外部署生成式 AI 的重要合作伙伴。在 LLaMA2 取得显著成就之后,Meta 于2024 年推出了最新版本 LLaMA3。LLaMA3 在先前版本的基础上进行了多项优化和改进,包括模型参数(7B 到8B)和上下文长度的扩展(4K 到 8K)、算法效率的提升以及更加精细的模型训练。LLaMA3 进一步提升了自然语言处理的准确性和生成能力,将帮助 Meta 巩固其在生成式 AI 模型领域的领导地位,为开发者和产业伙伴提供了更加强大和灵活的工具,以支持他们在各自的业务场景中创造更多的可能

26、性。在中国,近两年也涌现出一大批的国产 LLM,其中不乏一些佼佼者,综合性能持续对标国际先进水平,中文能力上的表现更是做到了行业领先。阿里云通义阿里云通义大模型大模型 通义千问是阿里云通义实验室自主研发的 LLM,2023 年 4 月上线并邀请用户测试体验,9 月首批通过备案并正式向公众开放。2023 年 10 月,通义大模型发布 2.0 版本,模型参数达到千亿级,模型在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等方面的能力都有明显跃升,位居行业前列。通义大模型先后推出了 PC 和 APP 应用,能为用户提供生活、工作、学习、娱乐等多种支持。通义还是业界最具影响力的开源大模型之一,先

27、后开源了 0.5B、1.8B、4B、7B、14B、32B 和 72B 等 7 个不同尺寸的大语言模型,包括 Base 和 Chat 版本,以及视觉理解大模型 Qwen-VL 和音频理解大模型 Qwen-Audio,在业界率先实现全尺寸、全模态开源,通义千问开源系列模型下载量已经突破 300 万。11 Counterpoint Technology Market Research 2024 百川百川大模型大模型 百川大模型最早发布于 2023 年 6 月,初代产品为 Baichuan-7B,拥有 70 亿参数,主要由中文拼音、汉字和词语,以及英文单词构成,用于中英文的自然语言处理、机器翻译和问答

28、。仅仅三个月后,百川智能宣布开源第二代基础模型 Baichuan 2,包括 70 亿的 Baichuan2-7B,以及 130 亿的 Baichuan2-13B,两者的训练语料均达到了 2.6TB,最高支持 4K 的上下文输入,在文档生成、多轮对话等场景下有着出色的表现。而随着 Baichuan 3 的发布,百川大模型的参数规模已经超过千亿,基础通用能力全面提升,逻辑推理和语义理解能力显著增强。零一万物零一万物 YiYi 模型模型 零一万物是一家致力打造 AI 2.0 时代的前沿大模型技术及软件应用的全球化公司。平台业务核心首重建构行业领先的大模型,如开源的Yi-34B、Yi-6B和多模态模型

29、Yi-VL,以及微调模型Yi-34B-Chat(0205)、长文本的 Yi-34B-Chat-200K 和 Yi-VL-Plus,其 Yi 系列模型支持中英文等多语种对话和图像识别对话能力,千亿模型 Yi-Plus 将于近期正式亮相。零一万物在模型小型化技术方面有着深厚的积累,剪枝、蒸馏、量化等模型小型化技术一直是零一万物研发的重点之一,此外,零一万物将逐步发布完善的开放平台中间件和开发者工具,助力基于 Yi 系列的“端测模型+远端大模型”组合开发消费级和商务级应用。消费级应用业务着重在研发新型态个人效率工作软件“万知”及社交方向;商务级应用层面,零一万物也积极与企业客户合作探索商务级 To

30、B 应用层面的落地场景。腾讯腾讯混元混元 腾讯混元大模型技术架构已升级为混合专家模型(Mixture of Expert,MoE)架构,参数规模达万亿,更擅长处理复杂场景和多任务场景,中文整体表现上处于业界领先水平,尤其在数学、代码、逻辑推理和多轮对话中性能表现卓越。同时,腾讯混元还提供不同尺寸的模型,适应更多的需要低成本和高推理性能的应用场景。作为腾讯全链路自研的大模型,腾讯混元通过持续的迭代和实践,积累了行业领先的技术能力,受到多方认可,中国电子学会 2023 科学技术奖评选,腾讯面向大规模数据的 Angel 机器学习平台关键技术及应用获科技进步一等奖。基于扎实的基础能力积累,腾讯混元大模

31、型积极推进相关应用落地,让大模型创造更多价值。目前腾讯内部超过 400 个业务及场景已接入测试,企业微信、腾讯会议及腾讯文档部署了生成式 AI 功能,腾讯广告基于混元大模型推出 AI 广告创意平台妙思,有效提高广告主生产及投放效率。不仅如此,腾讯还联合生态伙伴,将大模型技术与 20 多个行业结合,提供超 50 个行业大模型解决方案,也将与手机行业伙伴一起探索应用生成式 AI 技术为消费者带来全新服务与体验的各种可能性。受益于众多的开源基础大模型,开发者可以结合自身业务需要定制专属的应用模型,从而加速了 LLM在端侧、云侧的应用部署。同时,开源更有利于芯片设计企业、手机 OEM 厂商对上述端侧

32、LLM 进行深度适配和优化。以联发科技为例,在天玑 9300 和 8300 平台,已经完成了针对 Google Gemini Nano,Meta LLaMA2、LLaMA3,百川大模型和通义千问等模型的底层调优。12 Counterpoint Technology Market Research 2024 未未来来两两年年端端侧侧大模型大模型参数规模将继续增长参数规模将继续增长 当前,包括 vivo X100 系列,OPPO Find X7 系列,以及荣耀 Magic 6 系列在内的一众安卓旗舰产品已经成功实现了 70 亿 LLM 的本地部署,预计 AI 算力会是未来两代旗舰 SoC 升级的重

33、中之重,从而使端侧部署更大规模的 LLM 成为可能。Counterpoint 预测,本地大模型参数的上限将在 2024 年增长至 130 亿和在2025 年增长至 170 亿。图表图表 3 3:本地大模型参数预计逐年增本地大模型参数预计逐年增长长,20232023 H H2 2-2025(F)2025(F)单位单位:亿亿 来源:Counterpoint Research 大模型参数规模的增长将进一步拓展生成式 AI 手机的能力,比如更强大的音频、视频的处理能力,以及对多语言的支持,一些原本面向 AI PC 开发的办公和创作辅助功能也将被迁移至手机端。而另一方面,更大的模型通常意味着更高的硬件成

34、本,同时还会影响到手机的续航能力。考虑到算力、内存、发热的限制,端侧需要采取与云端不同的发展策略,并非一味追求更大的参数规模。有鉴于此,芯片设计企业如联发科技,正在探索新的技术手段,解决单一模型的限制,如采用 MoE 架构,将多个专家模型融合在一起,既可以针对不同的任务需求动态选择不同的专家模型,又可以对每个独立的专家模型进行微调,从而显著提升整体性能。有了 MoE 的加持,就有可能突破单一模型的天花板,在端侧实现数百亿甚至千亿模型方能达到的准确度。13 Counterpoint Technology Market Research 2024 而云端大模型的发展将继续遵循规模理论(Scalin

35、g Law),模型参数越大,模型的通用性和精度越高。未来两年,将有越来越多的云端大模型达到万亿参数规模。APPAPP 为基础的用户界面与为基础的用户界面与 AIAI 智能体智能体将会在未来几年内共存将会在未来几年内共存 在生成式 AI 手机时代,仍然需要产业生态中的各方群策群力,在各自擅长的领域推动产品和服务的革新。预计移动互联网厂商和广大应用开发者将继续主导移动内容生态的发展,在此背景下,APP 仍将会是构成手机交互的界面的重要元素。随着越来越多的手机厂商开始贯彻以用户为中心的操作系统设计理念,智能手机可以根据用户的使用场景自动生成个性化的界面设计,包括自动调整图标布局、颜色主题和字体大小等

36、。另一方面,基于 AI 智能体多元的、自然的交互体验将受到手机用户的青睐。随着生成式 AI 手机的进化,以及生成式 AI 应用生态的繁荣,越来越多的功能和服务将被接入 AI 智能体。在此基础上,AI 智能体将革新智能手机的交互体验,即从传统的 GUI 发展为 VUI,最终升级为全新的 Agent(app-less)UI,这意味着更多的交互将发生在 AI 智能体和用户之间,从而弱化了 APP 的存在感。图表图表 4 4:AIAI 智能体将发展为未来生成式智能体将发展为未来生成式 AIAI 手机交互的中心手机交互的中心 来源:联发科技;Counterpoint Research AI 智能体会逐渐

37、成为连接数字生态的入口,用户只需输入想要获得的服务(通过语音、文字等形式),AI 智能体会直接跳转到服务页面,同时 AI 智能体基于对用户习惯的了解以及当前使用情景,以更加安全14 Counterpoint Technology Market Research 2024 和个性化的方式为用户提供服务,或是由 AI 智能体直接完成用户所需要的服务,这是传统 APP 访问模式所不能做到的。然而上述演进不会一蹴而就,在很长一段时间里,Counterpoint 判断 AI 智能体与 APP 会同时活跃在生成式 AI 手机里。此外,头部互联网厂商有可能围绕自己的业务生态打造专用的 AI 智能体,这将使得

38、未来的生成式 AI 手机中可能有多个 AI 智能体共存,并能够相互沟通,携手为用户提供智能体验。芯片芯片设计设计公司公司的的生成式生成式 AIAI 战略战略 早在 2017 年,芯片设计公司已经开始在其商用的 SoC 中加入独立神经网络运算单元。时至今日,手机系统中的 AI 算力增长了近 20 倍,而本地部署多模态大模型对 SoC AI 算力提出了更高的要求。在未来几年,受益于半导体代工厂量产更先进的工艺(2nm 和 1nm),以及芯片设计公司和 IP 企业开发出更适合生成式 AI 大模型运行的新型计算架构,SoC 的 AI 算力还将保持两位数的年增长率。头部芯片设计公司,如联发科技、高通已经

39、率先投入到生成式 AI 手机的浪潮中,发布了多款支持多模态大模型端侧部署的移动计算平台,其中包括 2023 年四季度发布的天玑 9300、天玑 8300、高通骁龙 8 Gen3,三星猎户座 Exynos2400,以及 2024 年第二季度发布的骁龙 8s Gen3 和天玑 9300+,为 2024 年生成式 AI 手机的大规模商用铺平了道路。此外,联发科技、高通两家公司基于多年来在 AI 手机应用方面积累的丰富经验,为 OEM 和开发者提供了一整套开发平台,分别是联发科技的天玑 AI 开发套件 NeuroPilot 和高通 AI Stack、AI Hub。在这里,开发者可以获得大量训练好的 A

40、I 模型,并有配套工具可以帮助快速将模型嵌入到应用中。联发科技的生成式 AI 战略主要体现在硬件、软件和生态三个方面。硬件上,全新的 APU 引擎深度适配主流的 Transformer 架构,并支持包括 INT4、INT8、INT16 和 FP16 在内的各种整数和浮点格式,具有行业领先的高能效。软件方面,为在天玑平台部署大模型和开发 AI 应用提供了完整的开发工具链以及集成开发环境。而在生态合作方面,联发科技不断拓展与手机厂商、大模型厂商以及应用开发者的合作,携手共建生成式 AI 手机应用生态。综上,头部芯片设计公司将在生成式 AI 手机时代发挥更重要的作用,将帮助构建从芯片设计到大模型,再

41、到工具链的全局解决方案。手机手机 OEMOEM 厂商的生成式厂商的生成式 AIAI 战略战略 手机 OEM 厂商也是生成式 AI 手机浪潮的重要推动者,一方面,OEM 希望通过生成式 AI 技术来全面提升现有产品,打造差异化的硬件产品,继续推动智能手机功能的革新。另一方面,借助智能手机向智能生命体演化的机遇,OEM 可以进一步提升品牌科技内涵和用户粘性,与用户建立起长期而紧密的联系。截至目前,多数头部 OEM 已经发布自研 AI 大模型,如 vivo 的蓝心大模型 BlueLM,包括从最小的 10 亿参数到最高 1750 亿参数云端大模型,目前落地了 10 亿、70 亿端侧大模型,端侧跑通 1

42、30 亿参数模型;15 Counterpoint Technology Market Research 2024 OPPO 的安第斯大模型 AndesGPT,Tiny 版本为目前端侧主流采用的 70 亿参数规模,Titan 版本包含 1800 亿参数;小米发布了面向端侧部署的 AI 大模型 Xiaomi MiLM,拥有 130 亿参数,三星和荣耀也分别发布 100亿和 70 亿参数的多模态大模型。OPPOOPPO 生成式生成式 AIAI 战略战略 OPPO 从很早以前就开始布局 AI 赛道,截至 2023 年底,其在 AI 领域的全球专利申请超过 3160 件,主要分布在计算机视觉、语音技术、

43、自然语音处理、机器学习等方面。在此基础上,OPPO 已经成功落地了100 多种 AI 功能,包括视觉模型支撑的 AI 消除功能(日均使用次数达到了 15 次),以及 LLM 支撑的全新的小布助手。为了更好地迎接生成式 AI 手机时代的到来,OPPO 在深圳大湾区建设了滨海湾数据中心,部署了千卡规模的训练算力,并在 2024 年 1 月成立了 AI 中心,预示着 OPPO 将继续加码 AI 布局。2024 年 3月,OPPO Find X7 系列顺利通过泰尔实验室 AI 手机测试,使得 OPPO 成为首批获得上述认证的手机厂商。在 LLM 自研方面,OPPO 早在 2020 年就发布了基于 BE

44、RT 架构的预训练语言模型,并于 2023 年发布了自主训练的安第斯大模型(AndesGPT),在 SuperCLUE 给出的十大基础能力排行中,AndesGPT 获得了“知识与百科”能力国内大模型第一。OPPO 同时开发了面向端侧和云侧的 AI 大模型,打造了端云协同框架。OPPO 的端侧模型目前聚焦在 130 亿以下规模,云侧训练了包括 130 亿、340 亿和 700 亿及以上多个规模的版本,可以灵活适配不同业务场景。在端侧,OPPO 不断在小布助手中加入新技能,包括演讲稿生成、头脑风暴、文档助手、AI 作画等,用于提升生产效率。同时,OPPO 还将重点打造面向影像创作、通话摘要、实时翻

45、译等高频场景的 AI 功能。在云侧,OPPO 希望通过与第三方平台的合作,实现全局知识搜索和广域知识问答,并帮助用户缩短知识和服务获取的路径,OPPO 已经发布包括小布英语老师、小布面试官、小布问答在内的一系列相关功能。OPPO 秉持用户价值驱动,开放协作共赢的理念,通过采用 MoE 架构,OPPO 与芯片厂商、国内外头部大模型技术方案及生态伙伴密切合作,其自研的 70 亿 LLM 在联发科技的天玑 9300 平台上实现了极快的推理速度,10 亿视觉模型可以做到秒级文生图(512x512 分辨率)。vivovivo 生成式生成式 AIAI 战略战略 vivo 是较早设立人工智能团队的手机厂商之

46、一,于 2017 年组建 AI 团队,2018 年成立 AI 全球研究院(一直保持千人规模的专家团队),并在 2023 年 11 月率先发布自研 AI 蓝心大模型,并成为行业首批在手机端落地大模型并实现端云协同的厂商。vivo AI 蓝心大模型的优势:海量数据:自 2018 年成立图谱团队,vivo 已积累了 18,000T 的多种模态数据以及 6,750T 高质量中文文本数据,其中训练数据超过 30T,相当于 5 个国家图书馆的藏书量;16 Counterpoint Technology Market Research 2024 全面的模型矩阵:针对不同的应用场景、计算能力以及成本需求,vi

47、vo 提供矩阵式的解决方案,覆盖十亿、百亿、千亿的参数级别,通过提供从小到大的选择来保证更好的产品体验。在2024年,vivo 图像大模型将迎来重大升级,vivo 还将发布音频大模型和多模态大模型;强大的算力:截止目前,vivo 已拥有充沛的训练算力规模,以强大的算力和工程能力支撑自研大模型;高效的算法:vivo 已在 AI 顶级学术会议(AAAI、ICLR、ECCV、CVPR、InterSpeech 等)发表 70多篇论文,申请了 800 多项发明专利;丰富的场景:vivo 在 AI+影像,办公、视频、音乐、游戏、无障碍、生活、健康、出行、安全等多领域,拥有丰富的应用场景。凭借算法、工程、数

48、据、系统、应用层面的持续积累,vivo 蓝心大模型在中文整体表现上处于业界领先水平。在中国信通院组织的可信AI大模型标准符合性验证测评中,蓝心大模型在大语言模型能力评级中,获得最高等级的 4 星+认证。基于蓝心大模型的人工智能助手蓝心小 V/蓝心千询,能够提供高效、智能、贴心的语言交互服务,可以在学习、工作、生活上为用户提供便捷高效的贴心服务,包括但不限于任意问题答疑解惑、文本创作、美图生成、文档处理、情感聊天等,从而为用户带来更加便捷和愉悦的智能生活体验。在与生态伙伴的合作方面,vivo 已经自主研发了成熟的大型模型端侧业务能力,将来会向生态伙伴开放使用。同时,vivo 已经开源了 7B 模

49、型,并将开放基于 7B 模型的 1+N 架构,以支持互联网生态伙伴基于大型模型的业务开发。为了更好地服务全球消费者,在大模型的采用,以及生成式 AI 应用生态发展上,OEM 厂商秉持开放、合作、共赢的理念,正积极与第三方大模型平台以及云服务商展开合作,并为开发者从事生成式 AI 应用研发提供必要的技术和资金支持。Counterpoint 判断领先的 OEM 厂商会通过自建云计算中心,或是租用第三方云计算资源,不断优化自有 AI 大模型。此外,能否与产业生态伙伴构建深层次的、面向 AI 大模型和生成式 AI 应用的战略伙伴关系,也将影响到各 OEM 厂商在生成式 AI 时代的表现。开发开发者生成

50、式者生成式 AIAI 战战略略 毫无疑问,广大开发者将是生成式 AI 应用生态的重要贡献方。智能手机已经渗透到人们生活和工作的方方面面,庞大的 APP 生态满足了消费者社交、娱乐、出行、移动支付、线上购物以及移动办公的需要。17 Counterpoint Technology Market Research 2024 生成式 AI 技术将会赋能开发者社区,帮助 APP 开发者革新现有应用,并创造出惊艳的基于 LLM 的新应用,从而围绕生成式 AI 手机形成新的应用生态。届时,生成式 AI 手机将成为连接消费者和数据世界的纽带。虎牙虎牙 虎牙直播是以游戏直播为主的互动直播平台,正在积极探索生成式

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服