收藏 分销(赏)

中国互联网行业:“人工智能+”引爆新质生产力革命.pdf

上传人:宇*** 文档编号:4006742 上传时间:2024-07-25 格式:PDF 页数:161 大小:7.25MB 下载积分:20 金币
下载 相关 举报
中国互联网行业:“人工智能+”引爆新质生产力革命.pdf_第1页
第1页 / 共161页
中国互联网行业:“人工智能+”引爆新质生产力革命.pdf_第2页
第2页 / 共161页


点击查看更多>>
资源描述
观点聚焦 Investment Focus 本研究报告由海通国际分销,海通国际是由海通国际研究有限公司,海通证券印度私人有限公司,海通国际株式会社和海通国际证券集团其他各成员单位的证券研究团队所组成的全球品牌,海通国际证券集团各成员分别在其许可的司法管辖区内从事证券活动。关于海通国际的分析师证明,重要披露声明和免责声明,请参阅附录。(Please see appendix for English translation of the disclaimer)研究报告 Research Report 12 Jun 2024 中国互联网中国互联网 China Internet“人工智能+”引爆新质生产力革命“Artificial Intelligence+”Triggers a New Productivity Revolution 股票名称 评级 股票名称 评级 腾讯控股 Outperform 英伟达 Outperform 拼多多 Outperform 苹果 Outperform 阿里巴巴 Outperform Dell Technologies Outperform 美团 Outperform 联想集团 Outperform 网易公司 Outperform 科大讯飞 Outperform 京东 Outperform 金山办公 Outperform 百度 Outperform 浪潮信息 Outperform 腾讯音乐 Outperform 海康威视 Outperform Boss 直聘 Outperform 哔哩哔哩 Outperform 爱奇艺 Outperform 阅文集团 Outperform 微博 Outperform 资料来源:Factset,HTI Related Reports Presentation:AI 革命:机遇与风险(AI Revolution:Opportunities and Risks)(16 May 2024)(Please see APPENDIX 1 for English summary)纵观人类历史,生产力和生产效率的革命是人类发展的核心动力纵观人类历史,生产力和生产效率的革命是人类发展的核心动力和主要目标。和主要目标。从 18 世纪的第一次工业革命开始,以蒸汽机为基础的机械化革命便开始将人类从繁重的体力劳动和低效的畜力生产效率中解脱开来。此后历次的工业革命,都诞生了新的技术来提高生产力和生产效率,同时也推动着人类社会组织架构的变革。技术进步驱动的技术进步驱动的全要素全要素生产率生产率提升是经济增长的关键。提升是经济增长的关键。根据索洛增长模型(Solow Growth Model),经济增长由劳动力、资本和全要素生产率的增速共同决定。全要素生产率的提升决定了经济发展放缓时能否出现新的增长点,而科技发展是决定全要素生产率增长的主要因素。因此在经济进入长期稳定停滞状态时,唯有技术突破才能提供新的增长飞跃,生成式 AI 正是本次工业革命的核心突破。生成式生成式 AI 将成为新的劳动主体,大幅提高将成为新的劳动主体,大幅提高全要素生产率全要素生产率。人工智能系统能通过分析数据来学习、处理知识,理解并使用自然语言,甚至展现出创造性思维。人工智能技术的出现和广泛应用是工业社会发展中又一次科技飞跃,将再次引领社会的生产变革。AI 技术已发展至人类能力的高水位,技术已发展至人类能力的高水位,AI4S 有望冲击科学研究的高有望冲击科学研究的高峰,为现有的生产方式带来进一步的颠覆。峰,为现有的生产方式带来进一步的颠覆。AI for Science(AI4S)将为人类提供新的科学研究工具,填补现有范式难以解决的鸿沟。目前的科学研究严重受到“维度灾难”的制约,尤其在海量数据处理和复杂物理系统中,现有算力条件都因代价过高难以建立高精度的模型。而以机器学习为代表的 AI 技术为系统性解决此类难题打开了窗口,有望引领人类跨越新的高峰。本报告第一章简述 AI 技术的进步性与局限性,并展望向通用式人工智能(AGI)发展的路径;第二章提供全景式的 AI 产业链图谱和中美 AI 能力对比;第三章阐述了生成式 AI 的核心技术及发展趋势;第四章聚焦 AI 对行业的影响和赋能,结合互联网、传媒、计算机、电子、能源、自动驾驶、人形机器人等行业探讨生成式 AI带来的投资机会;第五章从测评、监管和安全的角度来探讨可靠AI生态的建立;第六章展望 AI 商业化路径和产业竞争格局演变,并提出可能的投资机会。风险风险 人工智能发展不及预期。Table_Author 姚书桥姚书桥 Barney Yao 毛云聪毛云聪 Yuncong Mao 杨林杨林 Lin Yang 赵赵玥炜炜 Yuewei Zhao Table_Author 杨斌杨斌 Bin Yang 王晴王晴 Rachel Wang 李加惠李加惠 Jiahui Li 白玉白玉 Jasmine Bai 郑创凯郑创凯 Evan Zheng 杨昊翎杨昊翎 Harry Yang 7085100115130Jun-23Sep-23Dec-23Mar-24Jun-24HAI China InternetMSCI China 12 Jun 2024 2 中国互联网中国互联网 1.人工智能将带来第四次工业革命人工智能将带来第四次工业革命 纵观人类历史,生产力和生产效率的革命是人类发展的核心动力和主要目标。纵观人类历史,生产力和生产效率的革命是人类发展的核心动力和主要目标。从 18世纪的第一次工业革命开始,以蒸汽机为基础的机械化革命将人类从繁重的体力劳动和低效的畜力生产效率中解脱开来,珍妮纺织机、蒸汽轮机、火车等机械设备都给人类的生活带来天翻地覆的变化。而以电气能源为基础的批量生产革命,将生产效率不断提升,电气化代替机械化成为推动生产效率的新的火车头。四次工业革命四次工业革命示意图示意图 Source:HTI 每次技术革命主要产品每次技术革命主要产品技术及受益行业技术及受益行业 Source:HTI 历次工业革命都涌现了一批核心产品,推动了特定行业的高速发展和人类社会的组织变革:12 Jun 2024 3 中国互联网中国互联网 第一次工业革命(第一次工业革命(1760s-1840s)是是以蒸汽机为基础的机械化革命以蒸汽机为基础的机械化革命。“珍妮纺纱机”、改良蒸汽机、火车等发明的出现引起了手工劳动向动力机器生产转变的重大飞跃,随着蒸汽动力的广泛应用、纺织业机械化和铁路网络的扩张显著提高劳动生产率,轻工行业加速发展,人类社会开始从农业社会向工业社会发生转变,资本主义经济体系逐渐确立;第二次工业革命(第二次工业革命(1870s-1940s)是是以电气能源为基础的批量生产革命以电气能源为基础的批量生产革命。以电灯的发明为标志,以内燃机、电话、电报、汽车等一系列核心发明为代表,人类从蒸汽时代迈进电气时代。基础科学与工业经济的突破推动了大规模生产和制造业的兴起,继而带来工业生产的效率和规模大幅提升,促进了全球化贸易的兴起,使得部分国家如美国、德国等取得世界领导地位,同时也导致激烈的资源争夺和战争;第三次工业革命(第三次工业革命(20 世纪中叶至世纪中叶至 21 世纪初)世纪初)是是以电脑和网络为基础的知识信息革以电脑和网络为基础的知识信息革命命。计算机技术、生物技术、原子能技术的应用发展加速开启了信息时代,随着知识经济的兴起与全球信息共享的加速,半导体、计算机和互联网行业蓬勃发展;航天技术也得到重大发展,这时期苏联和美国首次发射了人造地球卫星;第四次工业革命(第四次工业革命(21世纪初至今)世纪初至今)是是以大数据、人工智能、物联网等信息技术为基础以大数据、人工智能、物联网等信息技术为基础的超连接革命的超连接革命。21世纪正在进行的第四次工业革命指以人工智能、物联网、区块链、新能源、新材料、虚拟现实等等一系列创新技术引领的范式变革,推动着数字化转型和工作方式和生活方式的变革。相比前三次工业革命,它的发展速度更快、影响范围更广、程度更深。1.1 历史上的工业革命历史上的工业革命 全球全球 GDP历史增长历史增长 Source:World Bank(2023),Bolt and van Zanden-Maddison Project Database 2023,Maddison Database 2010,HTI 随着人类生产力的不断增长和生产效率的大幅提高,全球GDP已从18世纪的7,510亿美元增长到 2022 年的 139.4 万亿美元。在这一过程中,以 1920 年-1940 年,1960 年-1980 年,1990-2008 年的增速最为显著,分别为 CAGR 2.8%、4.5%、3.3%,对应同一时期的电力、核能、互联网等技术的诞生和大规模投入到生产当中。技术的变革是颠覆性和难以抵抗的技术的变革是颠覆性和难以抵抗的。每一次工业革命都是以前一代的技术被替代、组织架构变更、产业劳动者被淘汰为结果。如第一次工业革命的工业化以圈地运动为前提,失去土地的农民投入工商业成为工业生产的劳动力来源,随之而来的是工人阶级的壮大,同时传统的家庭手工业也因无法与工厂生产的效率竞争而被逐渐淘汰;第二次工业革命中电力和内燃机的普及取代了蒸汽机的工作,新技术催生了技术人员如电力工程师、化学工程师等岗位的涌现,同时大规模机械化生产促进企业迅速增长,新生的中产阶级不断扩大,带来新一波的社会结构和经济模式转型。12 Jun 2024 4 中国互联网中国互联网 1.2 科技的发展和生产率的提升科技的发展和生产率的提升 生产率(生产率(productivity)是原材料变成产品的过程中每单位投入的产出。)是原材料变成产品的过程中每单位投入的产出。以单一要素投入量测定生产率,可将生产率分类为劳动生产率、原材料生产率、能源生产率等;考虑全部资源投入所计算的生产率,即多种生产率的总和,称为全要素生产率(Total Factor Productivity/TFP)。人力与机械功率对比人力与机械功率对比 Source:腾讯新闻,懂车帝,EV database,Petrotech,“The New Siemens Gas Turbine SGT5-8000H for More Customer Benefit”,HTI 工业社会的科技发展让生产率从多要素维度得到提升,进而提升工业社会的科技发展让生产率从多要素维度得到提升,进而提升 TFP。例如,从劳动力的维度,如果以人为单位,一个成年人的最高功率约为 750 瓦,而蒸汽机的功率可达 300kW,蒸汽轮机的功率可超过1,000MW,机械的力为人力的指数级,广泛的机械使用大幅降低了人力消耗;能源转换效率的维度,1954年晶硅太阳能光伏电池的开发让光电转换效率从 1%提高至 6%,至今已接近 30%大关,接近其理论转换效率极限;再例如信息生产和传递效率维度,信息从初始依靠纸张和人力的数日传递,到使用有线通讯如传真、无线通讯如移动电话、数字通讯如互联网,显著缩减了信息传递的时间和损耗。索洛增长模型索洛增长模型 Source:Robert Solow,HTI 技术进步驱动的技术进步驱动的 TFP 提升是经济增长的关键。提升是经济增长的关键。根据索洛增长模型(Solow Growth Model),经济增长速度(以人均产出衡量)由劳动力、资本和全要素生产率(TFP)的增速共同决定。据索洛模型测算,劳动力和资本投入驱动下的有效人均资本波动将在长期达到稳态,即这两项要素驱动的经济增长最终会减缓并达到均衡状态;在此状态 12 Jun 2024 5 中国互联网中国互联网 下,仅有 TFP 的增速能提供有效人均资本稳态水平的增长。简言之,TFP 的提升与否决定了在经济发展放缓时能否出现新的增长点。而如前所述,科技发展是决定 TFP 增长的主要因素,因此在上一次技术变革带来的动能消退、劳动力与资本难以驱动经济的情况下,新的技术突破将是新一轮增长的关键。1.3 人工智能是什么,它将改变什么?人工智能是什么,它将改变什么?人工智能(人工智能(Artificial Intelligence,简称,简称 AI)是用人制造的机器呈现人类智能的科技。)是用人制造的机器呈现人类智能的科技。人工智能系统能通过分析数据来学习、处理知识,理解并使用自然语言,甚至展现出创造性思维。人工智能技术的出现和广泛应用是工业社会发展中又一次科技飞跃,将为经济提供新的增长动能,再次引领社会的生产变革。生成式生成式 AI 将将成为新的劳动主体成为新的劳动主体,大幅提高,大幅提高 TFP。在 1980 年以前,AI 的定义是创造能够执行需要人类智能任务的机器和程序,以按照指令执行为主,依托于大型机,数据储存单位仅千字节;1980 至 2010 年,机器学习的概念出现,强调在没有明确编程的情况下机器通过数据和算法自动改进其性能和学习的能力,硬件迭代为小型机,数据存储能力扩张至兆字节;2010 至 2020 年,AI 的定义在机器学习的基础上延伸至深度学习,即基于深度神经网络,模拟人脑处理信息的方式,从错误反馈中学习处理复杂的数据模式如图像、声音、文本。深度学习涉及大量的并行计算,存储数据量可达十亿字节的GPU 成为其首选硬件;2020年至今,AI 形式迭代至大语言模型(LLM),即预训练的大规模机器学习模型,专门用于处理和生成自然语言。这些模型由多层深度神经网络构成,基于支持大量的矩阵运算和并行处理的GPU集群开发训练,能够通过“自己学”的方式理解并执行多种自然语言任务,生成连贯文本,具有广泛的应用潜力。发展后的AI 有望成为新的劳动主体。AI 迭代历程迭代历程 Source:云知声,HTI 历史上历史上只有人类是唯一的劳动主体,生成式只有人类是唯一的劳动主体,生成式 AI 的诞生会带来和人类现有组织形态的的诞生会带来和人类现有组织形态的本质性冲突。本质性冲突。AI 最擅长的领域是依规行事,其冲突对象将是人类现处工业社会的两大成就,1)以业务流程化和组织科层化为核心的工业企业;2)专业人士。专业人士的价值取决于业务流程环节边界的定义,及工业社会对操作流程的标准化规则,其专业知识更多由社会需求决定,此特征与 AI 的强势领域重合,AI 将在专业领域与人类劳动产生强烈的对抗。另一方面,AI 不擅长处理不断变化的未知事物与创造性,意味着AI 和人类具有完全互补的关系,AI 在人类的优势领域也将无法应用。12 Jun 2024 6 中国互联网中国互联网 工业企业工业企业特征特征 专业人士专业人士特征特征 Source:智识神工,HTI Source:智识神工,HTI 1.4 AI 的三大谬误和五大悖论的三大谬误和五大悖论 AI 作为快速发展的新兴科技,其本质仍未完全为社会所认知。作为快速发展的新兴科技,其本质仍未完全为社会所认知。目前对 AI 的认识仍普遍存在三大谬误,现出对AI 技术不同程度的过度轻视或放大威胁。此类谬误背后对AI技术特征和发展路径的误解,将严重阻碍 AI 技术在社会和企业层面的广泛与正确应用。谬误谬误 1:AI是一种更强的工具,像超级计算机一样可被购买。是一种更强的工具,像超级计算机一样可被购买。将 AI 定义为工具是对 AI 技术本质缺乏认识,仅停留在其工具性层面,而忽视 AI 是一种全新的生产方式,将带来与之匹配的全方位组织形式变革。对 AI 技术革命性的轻视、思维上的墨守成规,可能导致企业和政府错过技术和组织转型的关键入场点,或对 AI 的使用浮于表面,无法及时利用 AI 模型改善运营和决策全流程,此后的追赶将困难重重。谬误谬误 2:AI无所不能,人类是执行器,无所不能,人类是执行器,AI将取代人类。将取代人类。此谬误忽视AI 存在的固有缺陷,AI 仍没有取代人类的能力,例如,AI 在创造性方面无法替代人类,也不能像人类那样感知情景。AI 并非被设计来完全取代人类的,相反,AI 旨在增强人类的能力,提高效率,人类与 AI 的关系将会是互补而非替代。在 AI 技术开始突破临界点的当下,放大 AI 威胁论只会在社会舆论中制造恐慌,对 AI 技术和人类工作的有效融合无益。谬误谬误 3:AI将和人类具备平等的地位。将和人类具备平等的地位。这种认知不是科学也不是社会治理理念,忽视了AI 工具性的本质。AI 是计算机程序构建的模型,其目的是更好地根据数据做出预测,本身不具备主观感觉能力。人类固然能从 AI 身上得到启发,但 AI 并不会具有和人类相同的地位,AI 的发展最终落脚点是为人类所用。跳出舆论对跳出舆论对 AI 技术的过度吹捧与贬低,技术的过度吹捧与贬低,AI 本身并不应被本身并不应被“神化神化”。在 AI 发展中产生了五大悖论,揭示了AI 作为技术的局限性和未来可能应用方向的限制。悖论悖论 1:莫拉维克悖论(:莫拉维克悖论(Moravecs Paradox)莫拉维克悖论认为,实现类似人类的高阶的认知任务(如推理和解决问题)需要很少的计算能力,但在模拟人类的基本感知和运动技能时却需要大量算力。这意味着虽然AI 能够轻易完成计算、推理甚至围棋、编程等“高级任务”,它在人类轻而易举可以达到的运动、手眼协调等“低智能”领域却寸步难行。悖论悖论 2:脑科学悖论:脑科学悖论 尽管 AI 在模拟人类智能方面实现了巨大的进步,但 AI 和人类大脑的工作原理在本质上是不同的。AI 的原理是基于算法和数学模型实现智能行为,其学习机制和决策能力都和人类大脑不同。人类智能是脑科学和心理学的结合,AI 难以完全复制人类大脑的复杂性,实现通用人工智能仍需要进一步模拟大脑智能的机制。12 Jun 2024 7 中国互联网中国互联网 悖论悖论 3:可解释性与自主性悖论:可解释性与自主性悖论 随着 AI 系统自主性的增加,其决策过程可能变得更加复杂,涉及大量的数据、算法和模型,导致决策过程难以追溯和解释,从而降低了可解释性;而人类使用者需要可解释性来理解决策背后的原因,以便进行监管和纠正错误。未来的AI 系统需要在保持高度自主性的同时,也能够提供足够的透明度和可解释性,以满足社会的需求。悖论悖论 4:知识图谱悖论:知识图谱悖论 尽管 AI 和机器学习技术能够从大量数据中发现模式和知识,但它们只能执行预设的算法和处理已有的信息,而不会产生真正意义上的新知识。因此,AI 在创造性方面远逊于人类。悖论悖论 5:生成:生成AI悖论悖论 生成 AI 在生成内容的质量和逻辑性难以评估,因为 AI 可能并不完全理解其自身创作的内容;同时,这种内容往往基于大量现有数据的学习和模仿,可能导致其原创性受到质疑。在在提高AI 技术能力的同时,也应有相应的监管政策到位,确保其符合伦理标准和社会价值观。即使存在以上的悖论与局限,AI 依然是一种意义重大的技术,它将显著提高生产和工作效率,并有希望在更复杂的领域为人类做出巨大贡献。1.5 第五范式第五范式与与 AI4S 科学研究共发展出了四种主要范式,科学研究共发展出了四种主要范式,AI技术则提供第五范式的可能。技术则提供第五范式的可能。四种现存的范式分别为:从几千几百年前起通过观察和实验来描述自然现象的经验范式;使用模型或归纳法进行科学研究的理论范式;随着电子计算机发展而产生的采用计算机进行仿真模拟的计算范式;进入大数据时代后,对大规模实验科学数据进行建模和分析的数据驱动范式。AI 技术的发展揭示了第五种科学研究范式,即通过机器猜想的方式应用于科学智能,通过不同的算法思维和应用场景的对撞,得到不同领域专业知识,从而推导位置结论的范式。第一到第五范式第一到第五范式 Source:澎湃新闻,HTI AI for Science(AI4S)将为人类提供新的科学研究工具,填补现有范式难以解决的鸿将为人类提供新的科学研究工具,填补现有范式难以解决的鸿沟。沟。目前的科学研究围绕数据驱动的开普勒范式和基于第一性原理的牛顿范式开展,严重受到“维度灾难”的制约,即随着维数的增加计算代价呈指数增长,尤其在海量数据处理和复杂物理系统中,现有算力条件都因代价过高难以建立高精度的模型。以机器学习为代表的AI 技术为系统性解决此类难题打开了窗口,使得原理驱动和数据驱动的两种范式得以统一。在数据充足的学科问题中,AI4S 可以在大数据的基础上利用深度学习+高性能计算提效;而数据缺乏、原理明确的问题中,AI4S 能利用生成式模型生产高质量数据,并高效利用小数据实现突破。12 Jun 2024 8 中国互联网中国互联网 AI4S Source:DP Technology,北京科学智能研究院,深势科技,高瓴创投,HTI AI4S 已在多个科学领域实现了初步成果。已在多个科学领域实现了初步成果。2016 年,机器学习等 AI 工具已被尝试用于解决科学问题。2020 年后,Alphafold(DeepMind 开发的蛋白质结构预测程式)、Modulus(Nvidia 开发的基于物理的机器学习平台)等优秀 AI4S 工具相继诞生,AI 领域的工具与方法已初步成熟。至 2023 年,AI4S 工具的发展和运用已在材料科学、气候变化、计算机科学、医学等领域产生了深远影响。尽管 AI4S概念在科学领域的导入已基本完成,但目前 AI4S工具的使用仍以学术界为主导,没有产生系统性的工程化需求。未来5年中,AI4S仍需走过关键的基础设施建设时期,进入成熟应用阶段。现有现有 AI4S工具与成果工具与成果 Source:Human-Center Aritificial Intelligence(HAI),北京科学智能研究院,深势科技,高瓴创投,HTI AI 技术已发展至人类能力的高水位,技术已发展至人类能力的高水位,AI4S 有望冲击科学研究的高峰。有望冲击科学研究的高峰。汉斯莫拉维克(Hans Moravec)认为,人类的潜能类似地形分布,低地为算术、背诵等技能,山麓则是下棋、定理证明、科学研究等能力。计算机潜能的提升正在过去的数年内逐渐淹没人类能力的领地。2016年AlphaGo战胜人类棋手,淹没了围棋的丘陵;AI 代码审查工具 DeepCode、AI 编程助手 GitHub Copilot 等技术已进入编程领域;OpenAI 在 2024年推出的视频生成模型 Sora 开始了对影视领域的冲击;多种文生图、文生 UI 工具抵达 AI 设计的临界点,此后 AI 能力的边界有望加速扩张,冲击科研的顶点,为现有的生产方式带来进一步的颠覆。产业产业AIAI4 4S S工具工具现有成果现有成果物理仿真物理仿真Modulus(Nvidia)“基于物理的人工智能引擎”Modulus,同精度级别的计算速度比传统仿真快1,000100,000倍,基于其显著的速度优势,伯克利劳伦斯国家实验室与加州理工团队实现对复杂气象的实时仿真(0.25s计算出7日预测数据)材料科学材料科学GNoME(DeepMind)GNoME发现了220万种新晶体预测(相当于人类科学家近800年的知识积累),其中有38万个稳定的晶体结构,有望通过实验合成,部分材料或许会引发技术变革,如下一代电池、超导体等分子结构分子结构AlphaFold(DeepMind)DeepMid团队用特殊的网络结构设计,充分利用数据使得蛋白质结构预测达到前所未有的精度医学研究医学研究EVEscape(Harvard/Oxford)通用模块化框架EVEscape能够在不依赖于大流行期间的测序数据或抗体结构信息的情况下,预测病毒的逃逸潜力。这一早期预警系统为公共卫生决策和准备工作提供了指导,有助于最大限度地减少大流行对人类健康和社会经济的负面影响 12 Jun 2024 9 中国互联网中国互联网 人类能力地形图人类能力地形图 Source:Hans Moravec,HTI 1.6 通往通往 AGI 之路之路 人工通用智能(人工通用智能(Artificial General Intelligence,简称简称 AGI)是具备与人类同等智能、或超)是具备与人类同等智能、或超越人类的人工智能,能表现正常人类所具有的所有智能行为。越人类的人工智能,能表现正常人类所具有的所有智能行为。它是一种具有广泛认知能力的人工智能系统,能够实现无需标注的自监督学习,像人类一样在多种不同领域和环境中灵活地思考、学习、推理和解决问题。目前的大语言模型仍然不符合目前的大语言模型仍然不符合AGI的要求。的要求。目前的AI 在几个基准上已经超过了人类的表现,包括图像分类、视觉推理和英语理解等。然而,它在数学竞赛、视觉常识推理和规划等更复杂的任务上仍然落后于人类,也不具备自主能力,需要人类具体定义每个任务。此外,1.0 时代的 AI 需要花费巨大的成本为单一领域收集和标注数据,缺少规模化能力,亦难以实现商业上的成功。从从 AI1.0到到 AI2.0 Source:李开复,HTI AI 2.0 时代将突破时代将突破 1.0 时代单领域、多模型的限制,进一步向时代单领域、多模型的限制,进一步向 AGI冲刺。冲刺。2.0时代用无需人工标注的海量数据训练出的具有跨领域知识的基础大模型可以通过微调适配和执行多样任务,实现平台化效应和商业化机会。AI 2.0 的发展范式是迭代式的,从“辅助人类”到“全程自动”将会出现三个阶段:第一阶段人机协同,生产力工具将会首先实现 12 Jun 2024 10 中国互联网中国互联网 升级,所有使用者界面将被重新设计,用户可以通过描述告诉AI 期望的产出。在这一阶段,人类仍与 AI 保持协作,筛选和纠正 AI 创作的内容;第二阶段局部自动,容错度高的应用和行业将率先实现AI 自动化,例如广告投放、电子商务、搜索引擎等;第三阶段全程自动,AI 将在不容出错的领域实现自动化,AI 医生、AI 教师等应用成为可能。12 Jun 2024 11 中国互联网中国互联网 2.HTI 全球人工智能图谱全球人工智能图谱 2024(HTI Global AI Landscape 2024)HTI 全球人工智能图谱全球人工智能图谱 Source:信通院,中商产业研究院,HTI 12 Jun 2024 12 中国互联网中国互联网 中美中美 AI实力对比实力对比 Source:HAI-AI Index Report 2024,Synergy Research Group,HTI 12 Jun 2024 13 中国互联网中国互联网 3.Gen AI 核心技术解析及发展趋势核心技术解析及发展趋势 传统意义上的AI模型,主要分为判别式模型(判别式模型(Discriminative Models)和生成式模型生成式模型(Generative Models)。)。判别式模型(判别式模型(Discriminative Models):):用于解决回归或分类任务,重点在于区分不同类别的数据。与生成模型不同,判别模型不生成新数据,而是专注于学习输入特征与输出标签之间的关系,以便准确地进行分类或预测。判别式模型在各种应用中广泛使用,特别是在需要分类或回归任务的场景中,例如:BERT(用于各种NLP任务)、金融风险评估的信用评分系统(如FICO)、癌症检测系统等等。生成式与判别式模型生成式与判别式模型 Source:Learnopencv,HTI 而生成式模型(而生成式模型(Generative Models):是生成式AI背后的技术,是一类能学习和模仿数据分布的模型,它们能够创建看起来与训练数据相当相似的新数据样本。举个例子,如果我们有一个人脸生成模型,它可以生成看起来像真人脸的图片,而这些图片与模型用来训练的真实人脸图片很相似,甚至很难区分哪个是生成的,哪个是真实的。生成式模型已被广泛应用于各种领域,特别是在需要生成新数据样本的任务中,例如:GPT、DALL-E(图像生成)、DeepArt和Prisma(图像风格转换)等等。大模型是大模型是“大算力大算力+强算法强算法”结合的产物。结合的产物。大模型通常是在大规模无标注数据上进行训练,学习出一种特征和规则。基于大模型进行应用开发时,将大模型进行微调,如在下游特定任务上的小规模有标注数据进行二次训练,或者不进行微调,就可以完成多个应用场景的任务。从参数规模上看,AI大模型先后经历了预训练模型、大规模预训练模型、超大规模预训练模型三个阶段,参数量实现了从亿级到百万亿级的突破。从模态支持上看,AI大模型从支持图片、图像、文本、语音单一模态下的单一任务,逐渐发展为支持多种模态下的多种任务 生成式生成式AI是利用生成式模型从大量数据中学习并生成新内容的技术,它能够创作与训是利用生成式模型从大量数据中学习并生成新内容的技术,它能够创作与训练数据相似的文本、图像、音频等练数据相似的文本、图像、音频等。如GPT-4,通过理解数据的结构和模式,生成自然流畅的文本、逼真的图像和音视频。目前,生成式AI已广泛应用于内容创作和艺术设计等领域,在交互娱乐等方面也有着广阔的应用前景。以GPT-3.5为例,其训练的过程主要有三个阶段。第一步是训练监督策略,第一步是训练监督策略,人类标注员对随机抽取的提示提供预期结果,用监督学习的形式微调 GPT-3.5,生成 Supervised Fine-Tuning(SFT)模型,使 GPT-3.5 初步理解指令,这一步与先前的 GPT-3 模型训练方式相同,类似于老师为学生提供标答的过程。第二步是奖励模型,第二步是奖励模型,在 SFT 模型中随机抽取提示并生成数个结果,由人类标注员对结果的匹配程度进行排序,再将问题与结果配对成数据对输入奖励模型进行打分训练,这个步骤类似于学生模拟标答写出自己的答案,老师再对每个答案进行评分。12 Jun 2024 14 中国互联网中国互联网 第三步是近段策略优化第三步是近段策略优化(Proximal Policy Optimization,PPO),也是 ChatGPT 最突出的升级。模型通过第二步的打分机制,对 SFT 模型内数据进行训练,自动优化迭代,提高 ChatGPT 输出结果的质量,即是学生根据老师反馈的评分,对自己的作答进行修改,使答案更接近高分标准。GPT-3.5 训练过程训练过程 Source:OpenAI,HTI 人工智能领域中的一些重要基础技术概念如下:(1)神经网络技术(神经网络技术(Neural Network Technology):是一种模仿生物神经系统结构和功能的计算方法。神经网络的结构通常分为输入层、隐藏层和输出层。输入层接受原始数据,隐藏层负责数据的特征提取和处理,输出层生成预测结果。神经网络技术可以处理复杂数据和任务,已在人工智能和机器学习领域中广泛应用。深度神经网络深度神经网络 Source:IBM,HTI 12 Jun 2024 15 中国互联网中国互联网 (2)神经符号推理(神经符号推理(Neuro-Symbolic Reasoning)结合了神经网络和符号推理的混合方法,利用两种技术的优势来解决复杂的推理和学习任务。这种方法在人工智能领域具有广泛的应用前景,因为它能够处理复杂的数据和关系,同时保留符号逻辑的可解释性和规则性。神经符号推理神经符号推理 Source:Semanticscholar,HTI (3)尺度定律()尺度定律(Scaling Law)是指在训练模型时,模型性能随模型规模(如参数数量)、训练数据量和计算资源的增加而变化的规律。这些定律帮助研究人员和工程师更好地理解和预测扩展模型时的效果和需求。在GPT-3的开发过程中,OpenAI遵循了尺度定律,通过大幅增加模型参数数量(达到1750亿),显著提高了模型的自然语言处理能力。而摩尔定律(Moores Law)应用于半导体和计算机硬件领域,具体说的是当价格不变时,集成电路上可容纳的晶体管数目,每隔18个月便会增加一倍,意味着性能也将提升一倍。两个定律应用领域不同,但都体现了技术进步在各自领域内的驱动力。尺度定律(随着时间推移,机器学习的计算资源显著增加)尺度定律(随着时间推移,机器学习的计算资源显著增加)Source:Epoch,HTI (4)自然语言处理技术()自然语言处理技术(Natural Language Processing,NLP):包括词法分析、句法分析、语义理解等。这些技术帮助模型更好地理解和生成自然语言文本,使得生成的文本更加准确和语义丰富。12 Jun 2024 16 中国互联网中国互联网 自然语言处理技术自然语言处理技术 Source:Deloitte,HTI (5)大规模数据集()大规模数据集(Dataset):海量的高质量数据是训练生成式 AI 模型的关键。这些数据集包含丰富的语言知识和模式,能够帮助模型学习到更好的表示和生成能力。大规模数据集大规模数据集 Source:CSDN,HTI (6)无监督学习算法()无监督学习算法(Unsupervised Learning):能够从数据中自动发现模式和特征,无需人工标记的监督信息。这对于生成式 AI 模型的训练至关重要,可以使模型从大量未标记的数据中学习到有用的知识。12 Jun 2024 17 中国互联网中国互联网 监督与无监督学习算法监督与无监督学习算法 Source:BigQuant,HTI (7)强化学习()强化学习(Reinforcement Learning,RL)是一种机器学习方法,用于训练模型做出决策,以实现最佳结果。通过反复试错和奖惩制度,与环境交互来学习最优策略,有助于实现目标的软件操作会得到加强,而偏离目标的操作将被忽略,从而在不同状态下选择最佳处理路径以获得最大化预期回报。强化学习广泛应用于机器人控制、游戏AI、推荐系统等领域。例如,著名的AlphaGo在训练过程中结合了强化学习策略,以寻找最佳落子策略。强化学习强化学习 Source:Techvidvan,HTI (8)强化学习与人类反馈()强化学习与人类反馈(Reinforcement Learning with Human Feedback,RLHF)结合强化学习的自动学习能力和人类的反馈,通过人类反馈指导学习的过程,显著加速学习速度,提高性能及安全性。强化学习与AI反馈(Reinforcement Learning with AI Feedback,RLAIF)是结合了强化学习的自动学习能力和AI模型的智能反馈。其智能体不仅从环境中获得奖励,还从另一个AI系统中获得反馈。这种方法利用AI反馈来指导和改进智能体的学习过程,从而加速策略优化,提高整体性能。12 Jun 2024 18 中国互联网中国互联网 强化学习与人类反馈强化学习与人类反馈 Source:CSDN,HTI (9)迁移学习()迁移学习(Transfer Learning)是一种机器学习方法,其中一个模型在某个任务上学到的知识被应用到另一个相关的任务中。通过这种方法,迁移学习能够利用已有的经验,提高新任务的学习效率和性能。尤其是在数据有限的情况下,迁移学习能够显著提升模型性能。迁移学习迁移学习 Source:CSDN,HTI (10)联邦学习()联邦学习(Federated Learning)是一种分布式机器学习方法,允许模型在多个设备或节点上训练。这种方式能够在保护数据隐私的前提下,利用分散的数据进行模型训练,可以在全局模型的基础上,进一步调整和优化个性化模型,满足不同用户的需求。12 Jun 2024 19 中国互联网中国互联网 联邦学习联邦学习 Source:Geeksforgeeks,HTI (11)生成对抗网络()生成对抗网络(Generative Adversarial Networks,GAN):):GAN包括两个部分:生成器和判别器。生成器尝试生成与真实数据相似的假数据,而判别器尝试区分真假数据。通过不断的对抗训练,生成器最终能够生成较为逼真的数据。生成对抗网络生成对抗网络 Source:Javatpoint,HTI (12)自回归模型()自回归模型(Autoregressive Model):通过前一个时刻的输出来预测下一个时刻的输出,广泛应用于文本生成和音频生成等领域。12 Jun 2024 20 中国互联网中国互联网 自回归模型自回归模型 Source:Otexts,HTI (13)变分自编码器()
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服