收藏 分销(赏)

人工智能行业研究框架:奔赴人工智能的星辰大海.pdf

上传人:Stan****Shan 文档编号:1431222 上传时间:2024-04-26 格式:PDF 页数:68 大小:3.09MB
下载 相关 举报
人工智能行业研究框架:奔赴人工智能的星辰大海.pdf_第1页
第1页 / 共68页
人工智能行业研究框架:奔赴人工智能的星辰大海.pdf_第2页
第2页 / 共68页
人工智能行业研究框架:奔赴人工智能的星辰大海.pdf_第3页
第3页 / 共68页
人工智能行业研究框架:奔赴人工智能的星辰大海.pdf_第4页
第4页 / 共68页
人工智能行业研究框架:奔赴人工智能的星辰大海.pdf_第5页
第5页 / 共68页
点击查看更多>>
资源描述

1、奔赴人工智能的星辰大海人工智能研究框架2023年08月16日行业专题研究3诚信 责任 亲和 专业 创新人工智能研究框架培训请参阅附注免责声明01人工智能旨在利用计算机模拟和执行各领域的智能任务诚信 责任 亲和 专业 创新4人工智能研究框架培训请参阅附注免责声明从日常生活中可以随处瞥见人工智能的影子01人工智能在生活中的常见应用:人脸识别考勤系统+APP智能推送人脸识别打卡人脸识别打卡是一种快速、高效的考勤方式,相比传统的打卡方式,具有以下优势:1.准确率高:人脸识别技术可以在不同光线、角度、表情等情况下,准确地识别员工的面部信息,避免了手工打卡时出现的误差和作弊行为。2.安全性强:人脸识别技术

2、通过人脸特征识别,确保只有正式员工才能进行考勤,防止了非法人员的进入和作弊行为。3.便捷性高:人脸识别打卡无需员工携带打卡卡片或密码,只需要站在识别设备前进行识别即可,方便快捷。APP智能推送智能推送是一种机器学习方法,可以识别和预测各种用户的兴趣或偏好,从而有针对性地、及时地向用户主动推送所需信息,以满足不同用户的个性化需求。诚信 责任 亲和 专业 创新5人工智能研究框架培训请参阅附注免责声明人工智能旨在利用计算机能够模拟和执行各领域的智能任务01人工智能(Artificial Intelligence,简称AI)是一门研究如何使计算机能够模拟和执行人类智能任务的科学和技术领域。通俗来说就是

3、,先让计算机进行学习,然后让计算机预测未知。传统计算机程序人工智能 根据人类经验制定规则,让计算机学习并预测未知 优势:计算能力和存储容量远超人类脑力水平,可以处理海量数据 弊端:现实生活中很多经由人类经验解决的问题难以制定规则,也就无法转换成机器语言让其学习 通过输入大量资料数据,让计算机学习算法,总结出模型,之后再输入相似样本时,就可以识别结果 优势:模仿人类经验学习的过程,无需人为制定规则数据来源:国泰君安证券研究现如今计算机的计算能力已非常强大,信息管理也越来越数据化,积累的资料越来越多,使我们有足够多的数据可以喂给计算机进行学习。正是这两个因素的成熟,才使得当下是人工智能爆发的时代。

4、机器学习算法图1:机器学习等算法和自我迭代是AI区别于传统计算机能力的主要因素数据来源:国泰君安证券研究自我迭代诚信 责任 亲和 专业 创新6人工智能研究框架培训请参阅附注免责声明人工智能涵盖四大主要的功能维度01 人工智能的功能维度从“计算感知认知创造”层层递进 计算智能指对数据的基础逻辑计算和统计分析;感知智能指基于视觉、听觉的信号,对目标进行模式识别与分类;认知智能指实现对信息的认知、理解、推理和决策,并实现人、物、企业等智慧实体的认知与协同;智能创造指利用人工智能技术进行文学、艺术等方面的创造性创作以及工业领域的智能制造。它的出现不仅改变了传统的创作方式、思维方式和工业模式,也为拓宽人

5、类的能力边界增添了新的可能性。计算智能感知智能认知智能智能创造图2:人工智能经历了四个能力维度的进阶数据来源:国泰君安证券研究诚信 责任 亲和 专业 创新7人工智能研究框架培训请参阅附注免责声明计算智能是人工智能的基础性功能,赋能产业领域较广01 人工智能在计算智能领域的实际应用能带来巨大产业价值 计算智能,通常指基于清晰规则的数值运算,比如数值加减、微积分、矩阵分解等。计算智能得益于计算机存储与硬件的快速发展,已给互联网、金融和工业等多个领域带来产业价值。计算智能也面临显著困境。以金融场景为例,计算智能受限于指定的数据逻辑规则,虽计算智能可以高性能地计算股票的统计特征,但无法运用专家知识,也

6、难以进行深度、动态和启发式的推理,对投资、博弈等业务贡献的价值有限。计算智能所需的高性能硬件和网络支持等,也给企业带来了巨大的成本压力。图3:AI在计算智能领域的应用可以赋能各大产业数据来源:国泰君安证券研究诚信 责任 亲和 专业 创新8人工智能研究框架培训请参阅附注免责声明感知智能开始让AI具备了模拟人类的感知能力01 人工智能在感知智能领域的实际应用开始涉及到与人类的交互 感知智能,其核心在于模拟人的视觉、听觉和触觉等感知能力。感知智能目前用于完成人可以简单完成的重复度较高的工作,比如人脸识别、语音识别等。感知智能的核心业务目标是提高效率且降低成本。智能交通通过感知交通状况和行车习惯,智能

7、交通系统可以提高交通效率和安全性智能家居通过感知用户的行为和需求,智能家居可以自动调整室温、照明等设备,提高生活的舒适度智能医疗AI感知设计可以帮助医疗设备更好地理解患者的病情,从而提高医疗效率和安全性图4:AI的感知智能能够针对人类交互相关的产业领域产生巨大变革数据来源:百度,国泰君安证券研究诚信 责任 亲和 专业 创新9人工智能研究框架培训请参阅附注免责声明认知智能在前两者基础上,提升了对各类信息的处理能力01 人工智能在认知智能领域的实际应用进一步拓宽 认知智能需要具有对采集的信息进行处理、存储和转化的能力,在这一阶段需要运用计算智能、感知智能的数据清洗、图像识别能力。认知智能需要拥有对

8、业务需求的理解及对分散数据、知识的治理能力。认知智能需要能够针对业务场景进行策略构建和决策,提升人与机器、人与人、人与业务的协同、共享和博弈等能力。通过语音或文字的方式与用户交互并提供帮助智能客服根据用户的需求,从海量数据中精准获取相关信息智能搜索将一种自然语言翻译成另一种自然语言智能翻译对肿瘤、病变等医学图像进行分析和判断智能影像利用视觉技术和传感器管理车辆行驶智能驾驶图5:认知智能的主要应用场景如下所示数据来源:国泰君安证券研究 诚信 责任 亲和 专业 创新10人工智能研究框架培训请参阅附注免责声明智能创造开始让AI具备了自主“生成式”(AIGC)的能力01 人工智能的智能创造本质上是一种

9、“生成式”能力 人工智能创造是指利用计算机程序和算法等技术,让计算机自动地生成具有一定艺术性、创造性的作品,包括音乐、诗歌、绘画、小说等;AI创作的基础是数据分析和模型训练。首先需要收集和整理有关主题、情感、语言等信息的数据,通过机器学习、深度学习等算法进行训练,使得机器能够自动完成创作任务。这种方式不仅提高了创作效率,而且还能够创造出更加精准、深刻、个性化的作品。人工智能可以模仿人类的创作过程,产生类似于人类创作的作品。这在文学、音乐、电影等领域都有广泛的应用。数据来源:国泰君安证券研究图6:AI“生成式”下的创作场景部分如下所示诚信 责任 亲和 专业 创新11人工智能研究框架培训请参阅附注

10、免责声明AIGC取长补短,有望成为主流内容生产模式01 AIGC所属内容生产生态的发展经历了专家生产内容(PGC)、用户生成内容(UGC)、AI辅助生产内容、AI生产内容(AIGC)四个阶段,目前处于一、二阶段为主,第三阶段为辅的境况 AIGC克服PGC与UGC存在的质量、产量无法兼具的缺点,其有望成为未来主流的内容生产模式资料来源:foresightnews.pro,中国信通院,国泰君安证券研究PGCUGCAIGC辅助 由专业团队生产,内容质量高 内容生产门槛高,垄断严重 生产周期长,难以满足大规模生产需求电视,电影,游戏等 创作工具下放,用户可自行生产内容,创作门槛、成本降低 内容生产参与

11、者众多,创作生态繁荣,个性化程度高 创作者参差不齐,内容质量不高短视频,社交媒体文章,播客等 AI技术学习的专业知识辅助内容生产环节,提高内容质量 AI技术实现自动化内容生产,减少创作耗时,提高内容生产规模天花板 人在关键环节依然需要输入指令,没有做到完全自主性AI辅助文字创作,图片创作等AIGC 实现完全自主性AI自主文字创作,图片创作等图7:AIGC生态内容生产模式理论上会经历四个发展阶段诚信 责任 亲和 专业 创新12人工智能研究框架培训请参阅附注免责声明AIGC兴起背后是大模型的重大进步,大模型是深度学习的重要成果01大模型生成式人工智能(AIGC)模型模型的本质是对现实世界中数据和规

12、律的一种抽象和描述。模型的目的是为了从数据中找出一些规律和模式,并用这些规律和模式来预测未来的结果。大模型是指具有非常大的参数数量的深度学习模型,通常具有数亿到数万亿参数。这些模型通常需要在大规模数据集上进行训练,并且需要使用大量的计算资源进行优化和调整。生成式人工智能指基于人工智能通过已有数据寻找规律,并自动生成内容的生产方式。在大模型技术推动下,AIGC有了飞速发展,我们熟知的ChatGPT就是基于大模型的AIGC。大模型本质上也是一种深度学习领域的算法,基于一个庞大复杂的神经网络,需要通过存储更多的参数来增加模型的深度和宽度,从而提高模型的表现能力,参数从百亿起步,对大量数据进行训练并产

13、生高质量的预测结果。数据来源:国泰君安证券研究图8:大模型推动AIGC的发展诚信 责任 亲和 专业 创新13人工智能研究框架培训请参阅附注免责声明01人工智能三要素算法,算力,数据人工智能算法算法(Algorithms):是指人工智能的实现方式,包括机器学习、深度学习、自然语言处理等。算法是人工智能的灵魂,能够决定AI能力的效率和准确性。算力算力(Hardware):指的是计算机硬件资源,包括处理器、内存、存储等。算力是人工智能的基础设施,能够支持算法的运行和处理数据。数据数据(Data)是指训练算法和实现算法所需的信息。数据可以是事实、图像、声音、文本等,能够支持算法的训练和优化。数据是人工

14、智能的发展前提,是推动人工智能发展的“原料”。实现AI 大模型能力的基础是AI“三要素”:算力、算法、数据 诚信 责任 亲和 专业 创新14人工智能研究框架培训请参阅附注免责声明算法是人工智能的灵魂所在01强化学习强化学习深度学习深度学习传统机器传统机器学习学习.人工智能(本质上就是能帮人工智能(本质上就是能帮助人类解决问题的方法)助人类解决问题的方法)机器学习(实现机器学习(实现AI功能的主功能的主流算法之一)流算法之一)人工智能算法本质上是帮助人类解决相应问题的方式方法,它可以体现为数学方程、程序、工程架构等等众所周知,计算机最擅长处理的是数字,所以我们可以将现实问题抽象为数学问题,再让计

15、算机帮我们解决。那么,其中的关键就是找到能够准确翻译该问题的数据公式,一般是某个函数关系f(x)。这个函数就叫做“算法/模型”。既然我们知道算法本质就是函数,那么影响算法准确程度的因素是什么?答案就是函数的参数。而机器学习的本质就是它是一种可以通过反复带入数据从而自主调整参数的人工智能算法之一。机器学习不是某种具体的算法,而是很多算法的统称。机器学习下的算法纷繁复杂,从学习方法上来分,机器学习又可以分为传统机器学习(监督学习、无监督学习、半监督学习)、深度学习和强化学习等等。图9:人工智能的算法是其解决问题的核心思路和手段数据来源:国泰君安证券研究诚信 责任 亲和 专业 创新15人工智能研究框

16、架培训请参阅附注免责声明强化学习和深度学习渐成主流01深度学习强化学习深度强化学习 强化学习是一种通过与环境的交互学习最优行为策略的算法。通俗地说,强化学习类似于婴儿学习和发现世界,如果有奖励(正强化),婴儿可能会执行一个行动,如果有惩罚(负强化),婴儿就不太可能执行这个行动。强化学习在游戏、机器人控制和自动驾驶等领域有广泛应用,比如熟知的AlphaGo。深度学习就是基于多层神经网络模型来学习数据表示和特征提取;所谓神经网络,就是让计算模仿大脑神经元来感知信息的一种方法。深度学习可以应用于各种领域,例如计算机视觉、自然语言处理和语音识别等。深度强化学习将深度学习的感知能力和强化学习的决策能力相

17、结合,可以直接根据输入的图像进行控制,是一种更接近人类思维方式的人工智能算法。主流的深度强化学习算法DQN就是在现成的强化学习算法上,通过添加深度神经网络来实现一套新的深度强化学习算法。强化学习和深度学习都是目前机器学习算法的主流分支,而深度强化学习则是博采众长的融合产物。数据来源:国泰君安证券研究图10:强化学习与深度学习的解释如下所示诚信 责任 亲和 专业 创新16人工智能研究框架培训请参阅附注免责声明算力是人工智能的基础设施01算力在人工智能领域扮演着至关重要的角色。算力在人工智能领域的作用是提供强大的计算资源,支持人工智能算法的训练、推理和预测,处理大规模的数据集,优化和调参模型,从而

18、推动人工智能技术的发展和应用。训练深度学习模型 训练深度神经网络需要大量的计算资源来处理大规模的数据集和复杂的模型结构。高算力可以加快训练速度,从而提高模型的准确性和性能。推理和预测 在部署人工智能系统时,需要进行推理和预测。这需要对训练好的模型进行实际应用,并在实时或近实时的情况下对新数据进行处理和响应。高算力可以加快推理速度,使得人工智能系统能够快速做出准确的决策和预测。大规模数据处理 人工智能应用通常需要处理大规模的数据集,包括图像、文本、语音等。算力可以加速数据的处理和分析,提取有用的特征和模式,从而支持更高级别的人工智能任务,如图像识别、自然语言处理和语音识别等。模型优化和调参 在人

19、工智能领域,模型的优化和调参是提高性能和准确度的关键步骤。算力可以支持对模型的超参数进行优化搜索,以找到最佳的配置。此外,算力还可以用于模型架构搜索和自动化的机器学习流程,以提高模型的效果和效率。数据来源:国泰君安证券研究图11:算力在人工智能全生命周期中,都扮演着重要的支撑性角色诚信 责任 亲和 专业 创新17人工智能研究框架培训请参阅附注免责声明数据是人工智能发展的土壤01 数据是指训练算法和实现算法所需的信息,它是训练模型推动AI算法的土壤。数据是人工智能成长的能源。人工智能的自我调整与学习的过程,本质上是对大量数据进行分析并找出规律,如无人车需要大量的试车数据不断地测试算法,并在业务场

20、景上形成自我改进的反馈系统。可见如果没有数据的场景不可能实现人工智能,数据就是人工智能的引爆点。数据是人工智能结果准确的可靠性保证。对于人工智能结果的可靠性,数据要素的丰富性和准确性是关键,只有数据要素充分、准确,才能提高人工智能结果的准确性。数据是人工智能应用的创新基础。在数据要素基础上,人工智能应用可以进行跨学科的整合,辅助解决大量的实际问题,如金融预测、物流运输、医疗诊断等,从而推动了各个领域的创新发展。人工智能创新的基础数据数据来源:国泰君安证券研究图12:数据相当于人工智能领域的“石油资源”诚信 责任 亲和 专业 创新18人工智能研究框架培训请参阅附注免责声明01资料来源:国泰君安证

21、券研究 NLP、CV等是AI技术的重要子领域。这些细分领域的技术专长,又会进一步赋能产业应用计算机视觉(CV)让计算机和系统能够从图像、视频和其他视觉输入中获取有意义的信息,并根据该信息采取行动或提供建议自然语言处理(NLP)在机器语言和人类语言之间沟通的桥梁,以实现人机交流的目的智能推荐(RES)深度智能挖掘用户和物品的关联关系,将对应场景的推荐结果推送给用户,提升用户体验和运营效率自动驾驶自动驾驶有四大核心支柱。感知、定位、规划、控制。随着神经网络的发展,深度学习在这四大领域中发挥了重要作用随着各类算法的演绎和迭代,人工智能的子领域明朗化情感分析机器翻译信息抽取电子商务搜索引擎位置服务图像

22、分类目标检测目标分割实例分割感知定位规划控制新闻推荐诚信 责任 亲和 专业 创新19人工智能研究框架培训请参阅附注免责声明AI 子领域计算机视觉01计算机视觉(Computer vision,缩写作CV)是人工智能(AI)的一个重要应用领域,是指让计算机和系统能够从图像、视频和其他视觉输入中获取有意义的信息,并根据该信息采取行动或提供建议。目前主要有以下几大基础任务:数据来源:国泰君安证券研究01020304图像分类图像分类任务主要的目的是判断一张图片的主要类别。图像分类可以是说计算机视觉中最基础的任务之一。目标检测目标检测任务是给定一张图像或是一个视频帧,让计算机定位出这个目标的的位置并且知

23、道目标物是什么,即输出目标的Bounding Box(边框)以及标签。目标分割目标分割是检测到图像中的所有目标,解决“每一个像素属于哪个目标物或场景”的问题,属于像素级的,需要给出属于每一类的所有像素点,而不是矩形框。实例分割实例分割其实就是目标检测和目标分割的结合。相对目标检测的边界框,实例分割可精确到物体的边缘。相对目标分割,实例分割需要标注出图上同一物体的不同个体。数据来源:国泰君安证券研究图13:CV的应用场景如下所示诚信 责任 亲和 专业 创新20人工智能研究框架培训请参阅附注免责声明01自然语言处理(英语:Natural Language Processing,缩写作NLP)是人工

24、智能和语言学领域的分支学科,是指让计算机和系统能够从文本和语音信号输入中获取有意义的信息,理解人类语言,并作出决策。目前主要有以下几大基础任务:AI 子领域自然语言处理情感分析情感分析信息抽取信息抽取机器翻译,是指通过特定的计算机程序将一种书写形式或声音形式的自然语言,翻译成另一种书写形式或声音形式的自然语言。目前,计算机主要能够实现语音翻译、图像翻译、VR翻译等。情感分析,即指通过计算技术对文本的主客观性、观点、情绪、极性的挖掘和分析,对文本的情感倾向做出分类判断。情感分析在评论机制的App中应用较为广泛。在互联网舆情分析中,尤其是在选举预测、股票预测等领域,情感分析起着举足轻重的作用。信息

25、抽取,指从文本中抽取出特定的事实信息。被抽取出来的信息通常以结构化的形式直接存入数据库,可以供用户查询及进一步分析使用,为之后构建知识库、智能问答等提供数据支撑。机器翻译机器翻译数据来源:国泰君安证券研究图14:NLP的应用场景如下所示21诚信 责任 亲和 专业 创新人工智能研究框架培训请参阅附注免责声明02人工智能发展已历经三次浪潮诚信 责任 亲和 专业 创新22人工智能研究框架培训请参阅附注免责声明“AI生成内容”(AIGC)是AI发展到一定阶段的必然产物02数据来源:国泰君安证券研究图15:全球人工智能产业关键事件时间轴如下图所示从人工智能关键历史事件可以看出,以大模型为基础支撑的“AI

26、生成内容”(AIGC)功能是AI相关理论和技术发展到一定阶段的必然产物诚信 责任 亲和 专业 创新23人工智能研究框架培训请参阅附注免责声明AIGC 是从早期的“决策型”AI发展演化而来02 AIGC(生成式AI)起源于“决策型”AI,决策型AI 发展过程中的技术积累为生成式AI的产生奠定基础 决策型AI其学习的知识局限于数据本身;生成式AI在总结归纳数据知识的基础上可生成数据中不存在的样本 最新生成式AI技术如GAN,Diffusion等,催生多款AIGC产品如:OpenAI系列、DALLE2(Diffusion),StarryA.I.(基于GAN)等资料来源:OpenAI官网,Starry

27、A.I.官网,国泰君安证券研究决策型AI利用机器学习技术学习数据分布,进行如分类,预测等任务。发展过程中诞生了卷积神经网络,残差深度网络,Transformer网络结构等 推荐系统:挖掘用户与物品的关联关系 人脸识别:根据输入人脸信息进行身份判别 文字识别:根据文字图片输出文本 生成式AI(AIGC)在学习归纳数据分布的基础上,学习数据产生的模式,并创造数据中不存在的新样本。在分析式AI技术基础上诞生大型Transformer网络,Diffusion等新模型 文字创作:通过提示文本生成完整文案 图像生成:根据关键信息生成风格多样图片,如博客配图,海报图片等 代码生成:根据上下文生成完整代码 数

28、据学习数据学习+新数据生成图16:AIGC是在决策型AI的基础上,学习数据产生模式,实现新样本内容的创造诚信 责任 亲和 专业 创新24人工智能研究框架培训请参阅附注免责声明OpenAI 的ChatGPT也是“AI 生成内容”(AIGC)浪潮的一部分02资料来源:中国信息通信研究院,国泰君安证券研究AIGC发展特点人工智能总体阶段早期萌芽阶段(20世纪50年代-90年代中期)沉淀积累阶段(20世纪90年代-21世纪10年代中期)快速发展阶段(21世纪10年代中期-至今)受限于技术水平,AIGC仅限于小范围实验AIGC从实验性向实用性转变,受限于算法瓶颈,无法直接进行内容生成深度学习算法不断迭代

29、,人工智能生成内容百花齐放AIGC典型事件1950年,艾伦图灵提出著名的“图灵测试”,给出判断机器是否具有“智能”的方法1966年,世界第一款可人机对话机器人“Eliza”问世80年代中期,IBM创造语音控制打字机“Tangora”2012年,微软展示语全自动同声传译系统,可将英文语音自动翻译成中文语音2007年,世界上第一部完全由人工智能创作的小说1 The Road问世2014年,Lan J.Goodfellow提出生成式对抗网络GAN2018年,英伟达发布StyleGAN模型用于自动生成高质量图片2019年,DeepMind发布DVD-GAN模型用于生成连续性视频2022年,OpenAI

30、发布ChatGPT模型用于生成自然能语言文本图17:随着算法的不断迭代,人工智能主动生成内容(AIGC)技术不断发展诚信 责任 亲和 专业 创新25人工智能研究框架培训请参阅附注免责声明以ChatGPT为例,其也是基于NLP模型逐步进化而来02GPT模型是一种自然语言处理(NLP)模型,使用多层变换器(Transformer)来预测下一个单词的概率分布,通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本从 GPT-1 到 GPT-3 智能化程度不断提升,ChatGPT 的到来也是GPT-4 正式推出之前的序章资料来源:CSDN,国泰君安证券研究GPT-1(1.17亿参数)GPT-1

31、有一定的泛化能力,能够用于和监督任务无关的 NLP 任务中2018201920202022.01GPT-2(15亿参数)除了理解能力外,GPT-2 在生成方面表现出了强大的天赋:阅读摘要、聊天、续写、编故事,甚至可以生成假新闻、钓鱼邮件或在线进行角色扮演GPT-3(1750亿参数)GPT-3 作为一个自监督模型,可以完成自然语言处理的绝大部分任务:将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的哲学家预测生命的真谛InstructGPTInstructGPT是一个经过微调的新版 GPT-3,可以将有害的、不真实的和有偏差的输出最小化ChatGPTChatGPT

32、 是 InstructGPT 的衍生产品,它将人类的反馈纳入训练过程,更好地使模型输出与用户意图保持一致2022.12图18:ChatGPT由GPT-1到InstructGPT模型的不断成熟而逐步形成诚信 责任 亲和 专业 创新26人工智能研究框架培训请参阅附注免责声明2022年总结来看,人工智能的历史沿革本质上是技术的进化演绎02资料来源:真格基金,国泰君安证券研究近期兴起的以ChatGPT为代表的大模型,是来自于机器学习、神经网络以及Transformer模型的多种技术的积累GPT-1GPT-2GPT-3Instruc-tGPTChatGPTT5BARTM2m-100BigBirdBERT

33、RoBERTaXLMALBERTELECTRATransfo-rmerCNNRNN神经网络Machine Learning基于规则的少量数据处理1950年开始1980年开始1990年开始;2006年获得突破2017年2018年2019年2020年基于模板和规则的前深度学习阶段根据一定范围的数据进行参数分类开始模仿人脑进行大量数据的标记和训练对人脑学习过程进行重点关注进行海量数据学习训练,人类的反馈信息成为模型学习的内容图19:ChatGPT经过多类技术积累,最终形成针对人类反馈信息学习的大规模预训练语言模型GANGPT-42023年27诚信 责任 亲和 专业 创新人工智能研究框架培训请参阅附注

34、免责声明03算力是人工智能的基础设施,算法是人工智能的灵魂诚信 责任 亲和 专业 创新28人工智能研究框架培训请参阅附注免责声明算力是AI产业发展的根基03算力是承载人工智能应用发展的基础,是人工智能最核心的要素 数据的快速增长对算力发展提出更高要求。随着信息化、数字化的持续推进,全球新产生的数据量正在快速增长,根据IDC数据显示,2021年全球新增数据总量达到84.5 ZB,预计到2026年全球新增数据总量将达到221.2 ZB,2021年至2026年间的年复合增速达到21.22%新应用场景的出现对数据实时性要求更高,从而使得边缘计算能力变得愈发重要,人工智能应用也越来越依赖边缘算力支撑。算

35、法模型的复杂化和巨量化需要更强算力的支撑。近些年,算法模型的参数量和复杂程度都在呈现指数级增长态势,尤其是自然语言处理等新兴认知智能领域对算力的要求远超图像识别和语音识别等传统AI领域数据算法 算力、算法和数据是人工智能产业发展的三个核心要素,在三大要素中,算力才是最核心的要素 数据的生产不再是问题,如何处理、分析和使用数据才是问题。算法经历了数十年的发展,在深度学习和加速计算出现之后,得到了迅速的发展和优化 算力是承载和推动人工智能走向实际应用的决定性力量算力图20:算力是AI产业发展的根基数据来源:国泰君安证券研究诚信 责任 亲和 专业 创新29人工智能研究框架培训请参阅附注免责声明算力提

36、升有极强的经济效益03算力的经济效益使其成为各国政策支持的重点根据清华大学全球产业院与浪潮信息联合发布的2021-2022全球计算力指数评估报告,通过对全球15个重点国家的计算力指数与数字经济及GDP的回归分析,得到15个重点国家的计算力指数平均每提高1点,国家的数字经济和GDP将分别增长3.5和1.8进一步研究发现,当一个国家计算力指数分别达到40分及60分以上时,计算力指数每提升1点,其对GDP增长的推动力将分别增加到1.5倍及3倍。智能算力提升具备重大经济效益,对算力基础设施发展的支持性政策成为各国政策的重点。数据来源:2021-2022全球计算力指数评估报告,国泰君安证券研究图21:算

37、力提升具有极强的经济效益诚信 责任 亲和 专业 创新30人工智能研究框架培训请参阅附注免责声明AI 数据中心需求激增,AI 服务器快速放量03AI 数据中心是专门用于支持人工智能计算和数据处理任务的设施或物理空间AI 数据中心通常拥有大量高性能的服务器、GPU 加速器和专门的存储系统,以提供强大的计算能力并加速深度学习AI 数据中心配备了高速的网络设备和优化的软件框架,以支持高效的数据传输和算法训练通过这些专门的配置和优化,AI 数据中心能够为各种规模和复杂度的 AI 工作负载提供可靠稳定的计算环境,并满足大规模数据存储、备份和分析的需求AI 数据中心在推动人工智能技术的发展和应用方面起到关键

38、作用,为各行各业的 AI 应用和服务提供了强大的支持软件支持网络宽带储存需求计算能力用于大规模并行计算,处理复杂机器学习和深度学习算法的高性能计算设备(如GPU和特定的AI芯片)用于快速数据传输和通信的高网络带宽、低延迟网络,以满足对数据传输速度的敏感需求用于存储大规模数据集的大容量、高速存储针对机器学习和深度学习任务的软件支持,包括专门的AI框架、库和工具,以及优化的软件栈和分布式计算平台,以提高计算效率和性能数据来源:国泰君安证券研究图22:AI数据中心比普通数据中心需要更好的计算能力、存储需求、网络带宽和软件支持诚信 责任 亲和 专业 创新31人工智能研究框架培训请参阅附注免责声明AI

39、数据中心需求激增,AI 服务器快速放量03大模型的出现和技术创新对AI数据中心的发展起到推动作用大模型的出现带来了算力的增量需求根据 OpenAI 发布的有关 GPT-3模型的文档,它包含 1750 亿个参数,需要进行数千万次的计算操作来完成一次推理任务ChatGPT 的总算力消耗约为 3640PF-days,需要78 个投资规模 30 亿、单体算力 500P 的数据中心才能支撑运行,这样的规模和复杂性需要高性能的计算设备和大规模的并行计算能力,带动了 AI 数据中心需求的增长新的处理器架构、高速网络、存储技术以及更高效的冷却和能源管理系统的出现,提升了数据中心的性能和效率,为 AI 数据中心

40、的发展提供了技术支持图23:大模型时代使算力需求翻倍提升数据来源:IJCNN诚信 责任 亲和 专业 创新32人工智能研究框架培训请参阅附注免责声明AI 服务器中,GPU 价值量最大03AI 服务器是AI 数据中心重要的组成部分AI 服务器是专门为人工智能应用而设计和配置的服务器,具备强大的计算能力和高效的数据处理能力,是执行 AI 任务和处理大规模数据的关键组件,为数据中心提供计算资源和算力,用于执行复杂的 AI 算法和模型。AI 服务器有两种主要架构:混合架构和基于云平台的架构。可以将数据存储在本地,利用本地的计算资源进行AI模型的训练和推理保证数据的安全性和隐私性可能受限于本地的存储和计算

41、能力混合架构基于云平台的架构使用远程存储技术和混合云存储(一种联合本地存储和云存储的技术)进行数据存储,利用云端的计算资源进行AI模型的训练和推理提供弹性的存储和计算能力可能存在数据的安全性和隐私性问题描述优点缺点图24:AI服务器主要使用混合架构和云平台架构数据来源:国泰君安证券研究诚信 责任 亲和 专业 创新33人工智能研究框架培训请参阅附注免责声明AI 服务器中,GPU 价值量最大03AI 服务器中的主要元器件包括CPU、GPU 板组、内存、存储、网络接口卡、机箱、主板、散热系统和电源主板是AI服务器的核心电路板,连接各个部件并提供电源和数据传输的接口,承载着CPU、内存插槽、扩展插槽和

42、其他重要组件电源提供服务器所需的电能,确保各个组件正常运行机箱是AI服务器的外部框架,提供支撑和保护内部组件的结构背板提供连接各个部件的接口,而布线则用于传输电力和数据信号散热系统用于控制服务器的温度并保持其在安全范围内运行。散热片吸收和分散热量,而风扇则提供气流来冷却服务器内部。内存(RAM)用于临时存储数据和程序代码,提供快速的数据访问和处理能力。AI服务器通常配备大容量的内存,以支持大规模的数据集和模型CPU负责执行计算任务和处理数据,是服务器的主要计算引擎,可以进行复杂的算法和模型运算加速卡(如GPU、TPU)提供高性能的并行计算能力,用于加速机器学习和深度学习任务,可以加快模型训练和

43、推理的速度图25:AI服务器拆箱图如下所示数据来源:英伟达官网,国泰君安证券研究诚信 责任 亲和 专业 创新34人工智能研究框架培训请参阅附注免责声明AI 服务器中,GPU 价值量最大03数据来源:国泰君安证券研究图26:整个 AI 硬件产业链中的各个环节紧密合作,共同构建了支持 AI 应用和服务的完整生态系统 GPU 是AI 服务器中价值量最高的部件,承担了大部分的计算任务和深度学习模型的训练与推理AI服务器服务器GPU电源网络设备存储CPU冷却系统在整个AI服务器的投入比例中,GPU通常占据较大的比例,大约在整体投入的30%至60%之间。GPU提供了强大的并行计算能力和高效的深度学习加速,

44、是实现高性能AI计算的关键。CPU作为服务器的核心计算单元发挥着重要作用,而存储、网络设备、冷却系统和电源等则在支持和维护服务器功能上起到关键作用。其他部件在整体投入中比例相对较小,但它们同样是确保服务器正常运行和数据中心高效运作的必要组成部分诚信 责任 亲和 专业 创新35人工智能研究框架培训请参阅附注免责声明AIGC拉动AI算力需求,AI芯片将成为未来科技石油03基于APU架构的MI300预计于年底开始应用于超级计算机 随着AI 进入“大模型”时代,训练数据不断增长、算法复杂度不断提高,国内人工智能厂商对算力的需求陡升。AI芯片作为大模型及AI应用落地的算力基础,重要性日益凸显。广义的AI

45、芯片指专门用于处理人工智能应用中大量计算任务的模块,即面向人工智能领域的芯片均被称为AI芯片。狭义的AI芯片即针对人工智能算法做了特殊加速设计的芯片。狭义的AI芯片与传统芯片(如CPU)相比,性能优势主要体现在专用性的侧重上。数据来源:国泰君安证券研究图27:AI芯片产业链较为复杂IP授权授权设计设计晶圆代工晶圆代工AI芯片芯片云端云端/边缘端边缘端终端终端训练训练推理推理智能汽车智能汽车智能手机智能手机AIoT机器人机器人诚信 责任 亲和 专业 创新36人工智能研究框架培训请参阅附注免责声明AIGC拉动AI算力需求,AI芯片将成为未来科技石油03AI 芯片主要分为三种类型:通用型(GPU)、

46、半定制型(FPGA)、定制型(ASIC)三类芯片代表分别有英伟达(NVIDIA)的GPU、赛灵思的FPGA和Google的TPU。GPU的计算能力最强,但是成本高、功耗高;FPGA可编程,最灵活,但是计算能力不强;ASIC体积小、功耗低,适合量产,但是研发时间长,且不可编辑,前期投入成本高,带来一定的技术风险。数据来源:国泰君安证券研究表1:AI芯片分为GPU、FPGA、ASIC三种类型GPUFPGAASIC定制化程度定制化程度通用型半定制化定制化灵活性灵活性好好不好成本成本高较高低编程语言编程语言/架构架构CUDA,OpenCL等Verilog/VHDL等硬件描述语言,OpenCL、HLS/

47、功耗功耗大较大小主要优点主要优点峰值计算能力强,产品成熟平均性能较高,功耗较低,灵活性强平均性能很强,功耗很低,体积小主要缺点主要缺点效率不高,不可编辑,功耗高量产单价高,峰值计算能力较低,编程语言难度大前期投入成本高,不可编辑,研发时间长,技术风险大主要应用场景主要应用场景云端训练,云端推理云端推理,终端推理云端训练,云端推理,终端推理诚信 责任 亲和 专业 创新37人工智能研究框架培训请参阅附注免责声明AIGC拉动AI算力需求,AI芯片将成为未来科技石油03针对不同技术路径,国内厂商均已有所布局 GPU:国内GPU厂商已有部分产品落地,国产GPU迎来黄金发展期数据来源:国泰君安证券研究图2

48、8:国内GPU企业迎来较快发展景嘉微自主研发了一系列GPU芯片,包括JM54系列、JM72系列、JM92系列三代GPU产品公司于 2014 年成功研发出国内首颗国产高性能、低功耗 GPU 芯片JM5400,打破了国外产品长期垄断我国 GPU 市场的局面,并不断研发更为先进的JM7200 和JM9系列2022 年5 月,公司 M9 系列第二款图形处理芯片成功研发,可以满足地理信息系统、媒体处理、CAD 辅助设计、游戏、虚拟化等高性能显示需求和人工智能计算需求,可广泛应用于各种设备海光 DCU 系列产品以基于通用的GPGPU架构,采用7nm工艺,兼容“类CUDA”环境以及国际主流商业计算软件和人工

49、智能软件,软硬件生态丰富海光DCU系列产品深算一号已经实现商业化应用,于2021年实现规模化出货,未来将广泛应用于大数据处理、人工智能、商业计算等领域其产品性能达到了国际上同类型主流高端处理器的水平,具有较强的并行计算能力和较高的能效比,在国内处于领先地位数据来源:国泰君安证券研究诚信 责任 亲和 专业 创新38人工智能研究框架培训请参阅附注免责声明AIGC拉动AI算力需求,AI芯片将成为未来科技石油03针对不同技术路径,国内厂商均已有所布局数据来源:国泰君安证券研究表2:ASIC:国内ASIC厂商实力雄厚,积极追赶国外芯片巨头此前被全球最大FPGA厂商赛灵思收购的深鉴科技也基于FPGA来设计

50、深度学习的加速器架构图29:CPU+FPGA:国内巨头纷纷布局CPU+FPGA的混合异构加速AI计算全球科技巨头纷纷布局云端FPGA生态,国内包括腾讯云、阿里云均在2017年推出了基于FPGA的服务,百度大脑也使用了FPGA芯片数据来源:国泰君安证券研究诚信 责任 亲和 专业 创新39人工智能研究框架培训请参阅附注免责声明AIGC拉动AI算力需求,AI芯片将成为未来科技石油03实现专用算法“硬件优化”,ASIC路线在AI领域的长期成长性值得期待数据来源:头豹研究院,国泰君安证券研究FPGA方案及ASIC方案成本曲线存在差异ASIC无法重新编程前期投入成本较高ASIC具备性能更强、体积更小、功耗

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服