收藏 分销(赏)

作为GPT的GPT——新一代人工智能的机遇与挑战.pdf

上传人:自信****多点 文档编号:609039 上传时间:2024-01-13 格式:PDF 页数:18 大小:1.04MB
下载 相关 举报
作为GPT的GPT——新一代人工智能的机遇与挑战.pdf_第1页
第1页 / 共18页
作为GPT的GPT——新一代人工智能的机遇与挑战.pdf_第2页
第2页 / 共18页
作为GPT的GPT——新一代人工智能的机遇与挑战.pdf_第3页
第3页 / 共18页
亲,该文档总共18页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、412023年第6期(总第475期)产业经济作为GPT的GPT新一代人工智能的机遇与挑战陈永伟(比较杂志社 研究部,北京100871)摘要:在经济发展过程中,通用目的技术(GPT)的作用是至关重要的。作为一种新出现的技术,生成式AI具有GPT所要求的普遍适用性、进步性和创新孕育性等特征,因而很可能会成为全新的GPT。生成式AI领域最具代表性的模型就是OpenAI的GPT系列等,这里的GPT全称是“生成式预测训练”(Generative PreTraining)模型。无论是出于高质量发展的需要,还是出于加强我国国际竞争力的考量,发展生成式AI都是当务之急。从目前看,我国在发展生成式AI方面还存在

2、着很多障碍,这就要求政府用好产业政策,为其发展扫清障碍。与此同时,作为GPT,生成式AI的发展一定会伴随着“创造性毁灭”过程,由此带来技术性失业、收入分配恶化,以及垄断和不正当竞争等问题。对于这些问题,应当用好相关政策加以应对,尽可能趋利避害,让生成式AI更好地为经济发展服务。关键词:生成式AI;GPT;ChatGPT中图分类号:F49文献标识码:A文章编号:1000176X(2023)06004118最近,由美国人工智能研究公司OpenAI开发的大型语言模型ChatGPT引发了各界热议。相比于过去的AI产品,ChatGPT不仅可以更为顺畅地与用户交流,而且可以十分高效地按照要求完成包括文本写

3、作、资料整理,甚至程序编写等在内的多种任务,因而广受用户青睐。自2022年11月30日正式上线以来,ChatGPT的用户数量就保持了高速增长。仅仅5天时间,其用户量就突破了100万;不到两个月,用户量就超过了1亿。2023年3月14日,OpenAI又发布了多模态的AI应用GPT-4。这一新模型不仅可以和ChatGPT一样识别文本,还可以进行图像识别,而且其问题解答、人机交互能力都有了质的提升。从分类上看,ChatGPT和GPT-4都属于“生成式AI”(Generative AI)的范畴。随着ChatGPT的爆火,这种类型的 AI 逐步被人们关注。过去市场上的 AI 产品主要是所谓的“分析式 A

4、I”(Analytical AI),这类AI的主要功能是对数据进行学习和分析,以此来预测、辅助用户进行判断。与这类AI不同,生成式AI的主要功能是通过学习来生成与训练数据不同的新数据。例如,ChatGPT会生成不同于其学习材料的文本,DallE2、Stable Diffusion等图片生成AI则会生成不同于其学习材料的图形。得益于这种创造能力,生成式AI可以比分析式AI应用于更多不同的场景、收稿日期:20230320作者简介:陈永伟(1982-),男,浙江杭州人,研究员,博士,主要从事产业经济学、互联网经济学和法律经济学研究。Email:chenyongwei1982 陈永伟作为GPT的GPT

5、陈永伟作为GPT的GPT42完成更为多样化的任务,因而生成式 AI 正在成为一种“通用人工智能”(Artificial GeneralIntelligence)1。既然生成式AI的表现已经如此之好,那么一个直接的问题就是,它是否可能成为经济学意义上的“通用目的技术”(General Purpose Technology,GPT)?如果这个答案是肯定的,那么这种技术将会对经济发展产生怎样的影响?又应该用怎样的政策去促进这种技术的发展?本文将对以上所有问题展开讨论。一、GPT及其影响(一)GPT的定义和特征“通用目的技术”是现代经济增长理论中经常被提及的一个概念。与仅用于某些具体用途的专用目的技术

6、(Specific Purpose Technology,SPT)不同,GPT的应用范围通常十分广泛,对经济的影响是整体性的。例如,蒸汽机、电气化等技术就是最常被提及的GPT。在文献当中,这些技术通常被称为“经济增长的引擎”。Bresnahan和Trajtenberg2最早对GPT进行了研究。根据他们的定义,GPT应该具有如下三个基本特征:普遍适用性(Pervasiveness)。GPT可以作为投入品,被广泛地应用到各个部门。例如,作为GPT的新能源在不同的行业都能够使用,而作为GPT的计算机也可以为各个行业赋能。进步性(Improvement)。通过持续的创新和学习,GPT的表现会随着时间的

7、推移而不断改进。这种改进是多维度的:可能表现为与GPT相关产品、系统及组件的成本降低,也可能表现为质量改善。随着GPT表现的优化,使用它们将会变得越来越有利可图,而这也会有助于它们的进一步扩散。创新孕育性(Innovation Spawning)。GPT的创新会促进相关应用技术的创新,进而提高应用部门的研发生产率,而应用部门的技术进步又会反过来促进GPT自身的进步。显然,创新孕育性的存在会让GPT创新和应用部门创新的回报率同时得到提升。后来的经济学家对Bresnahan和Trajtenberg2的上述标准提出了一些修正。例如,Carlaw和Lipsey3认为,GPT的特征应该包括:最初只用于一

8、些特殊用途;随着在经济中的扩散,它会演化成更为复杂的形式,其效率会不断提升;它会被用于帮助众多领域的生产;它会产生更多新产品,演化出新的生产流程。后来,Bekar等4进一步总结出GPT的六个特征:与定义和支撑它的一组技术互补;与由它赋能的技术具有互补性;与一系列在社会、政治和经济上具有变革性的技术具有互补性;没有相近的替代方案;具有广泛的应用;开始时比较粗糙,但会演化得越来越复杂。不过,尽管有了这些论述,Bresnahan和Trajtenberg2的标准依然被认为是判断GPT的最重要标准。按照上述标准衡量,尽管人类历史上技术发明众多,但能称之为GPT的却很少。Lipsey等5曾对历史上的GPT

9、进行过专门研究。在他们看来,从公元前9 000年至今,只有24种技术可以称为GPT。按照出现的顺序,它们分别为:植物驯化、动物驯养、矿石冶炼、轮子、写作、青铜、钢铁、水车、三桅帆船、印刷术、蒸汽机、工厂体系、铁路、铁轮船、内燃机、电力、汽车、飞机、大规模生产、计算机、精益生产、互联网、生物技术、纳米技术。按照不同的标准,可以对GPT进行不同的分类。例如,在Lipsey等5就给出了两种分类方法:一种是按照技术呈现的形态进行分类,可以将GPT分为产品型技术、流程型技术和组织型技术;另一种则是根据技术的最终用途进行分类,可以将GPT分为材料技术、能源技术、交通技术、组织技术、信息和通讯技术。在本文中

10、,GPT除了指通用目的技术外,还可能指生成式预训练模型。由于在多数情况下这两个意思很容易区别,因而在下文中,除极易混淆之处外,不再对该词的含义进行注释。432023年第6期(总第475期)(二)GPT与生产率的关系与SPT不同,GPT的发明并不能立即带来生产率的显著变化。具体来说,GPT作用的发挥在很大程度上依赖于基础设施,以及与其相关的具体应用的数量和普及程度。一般来说,在一项GPT被发明出来后会经历两个阶段:在第一阶段,与GPT相关的各项基础设施没有普及,各项相关应用也没有被开发出来。此时GPT并不会马上对生产率产生提升效果。甚至由于在这个阶段需要对基础设施和应用发明进行大量的投资,产生大

11、量的成本,因而从总体上看整个经济的生产率甚至会是下降的。在第二阶段,随着基础设施的建成、具体应用的开发,GPT对生产率的作用就会逐渐体现出来。在Helpman和Trajtenberg6的研究中,以上两个阶段分别被称为“播种阶段”(Time to Sow)“收获阶段”(Time to Reap)。以美国经济为例,在电气化技术被发明出来之初,其对经济的影响微乎其微,但到了19世纪90年代,以尼亚加拉水电站为代表的一批重要电力设施建立起来后,电气化对美国经济的提升作用就开始体现。1915年之后,电力网络在美国逐步普及,独立辅助发电器开始广泛应用,电气化对生产率的影响才随之变得明显。同样,在IT技术发

12、展的早期,其对生产率的影响也并不显著,由此还诞生了著名的“索洛悖论”。但是,随着计算机普及,互联网、云计算等基础设施的建立,IT技术在提升生产率方面的作用终于得到体现。欧洲央行在一份报告中指出,“从历史视角来看,索洛悖论并不是什么悖论”,其原因正在于此7。需要指出的是,GPT对生产率的影响在很大程度上取决于其扩散的程度。例如,Jovanovic和Rousseau8曾经对电气化和IT技术这两种GPT对生产率的影响进行过比较。结果发现,截至其研究发表时,IT技术对生产率的影响要远小于电气化的影响。Jovanovic和Rousseau8认为,这是由于电气化技术可以更为平稳地与更多资本存量结合,从而迅

13、速融入更多部门当中,相比之下,IT技术在其发展初期只能应用于较少部门,其传播和扩散速度较为缓慢。不过,他们也发现,与电气化相比,IT技术的动态性更强,与其相关的技术发明速度和专利申请量都要胜过电气化,同时其相关产品的成本下降趋势也更为明显。因此,他们预期IT技术对生产率的影响将会在未来逐步显露出来。(三)GPT的社会影响GPT的扩散通常表现为一个“创造性毁灭”(Creative Destruction)的过程。它可能在促进生产力提升的同时,颠覆既有的经济秩序。在这个过程中,可能会造成一系列复杂的经济、社会和组织影响。限于篇幅,本文集中讨论其中的三种影响。1.GPT对竞争的影响从理论上讲,GPT

14、的扩散可能会重新配置企业之间的竞争优势,从而可能让固守旧技术的在位大企业没落,而率先采用新技术的中小企业则可能趁势兴起,但现实却并非如此9。一些实证研究证实了这一点,如Jovanovic和Rousseau8曾考察过19882001年间不同规模的资本回报状况。他们发现,从长期看,小企业的年资本增值率要比大企业高出7.5%。但是,在电气化和IT技术这两种GPT的主要扩散时期,大小企业在资本增值率方面的相对差异并没有明显变化。也就是说,“创造性毁灭”的作用效果并不明显。对于这种现象有很多解释。其中的一个解释来自 Schumpeter10。他认为,当技术引发的“创造性毁灭”到来时,在位企业不愿意就此退

15、出市场,因而会采用各种不正当的竞争手段来阻碍新兴企业超越自己。另一种解释则来自Aghion等11。他们认为,大企业也可能率先成为新技术的推动者。在这种情况下,它们相对小企业的竞争优势将会进一步凸显,而这可能会反过来打有不少理论认为,规模相对较小的企业会更容易从技术革新中受益。其中最具代表性的理论是“创新者的窘境”理论。该理论认为,作为既有技术的受益者,大企业在新技术出现时很难将更多的资源放在发展新技术上。相比之下,小企业则更加有激励采用更新的、具有颠覆性的技术,因而更有可能成为新技术的受益者。陈永伟作为GPT的GPT44击小企业的创新动力,甚至让它们放弃竞争。无论根据上面哪种解释,都意味着在G

16、PT迅速扩散的同时,也可能会发生比较严重的垄断和不正当竞争问题。事实上,历史也在一定程度上印证了这一理论。以美国为例,电气化扩散的同时,也恰好是美国大型托拉斯兴起的时期;在IT技术扩散的同时,一大批平台巨头也迅速崛起,并由此引发了平台垄断问题。2.GPT的就业效应从历史上看,很多GPT的发明和扩散都会对既有的工作方式产生重大冲击,并带来明显的就业影响。一方面,新技术的扩散会让很多采用旧技术的人失去工作,从而产生“技术性失业效应”;另一方面,新技术的扩散又会催生很多新的就业,从而产生“补偿效应”12。例如,蒸汽机和工厂体系的出现抢走了很多手工业者饭碗的同时,却创造出工人这个新职业;汽车的出现抢走

17、了马车夫生意的同时,却创造出司机这个新就业岗位。尽管从长期看,后一种效应通常会胜过前一种效应,从而使新增的就业数量超过消失的就业数量,但从短期看,前一种效应通常会更占优势,因而技术性失业就成为了新技术,尤其是GPT扩散过程中经常出现的一种现象。3.GPT对收入分配的影响GPT的扩散会从多个机制对收入分配产生影响。技术的影响是有偏向性的,如果某种技术是资本偏向性的,就可能减少对劳动力的需求,这会让劳动力的工资下降,从而导致劳动力收入在总收入中所占的份额也随之减少13。例如,经济史学家Allen14曾经对18世纪早期至20世纪初的工资状况进行过研究,结果发现在这个曾出现众多GPT的时间段内,企业的

18、利润率出现了大幅增长,但与此同时,真实工资水平却一直维持不变。在经济史上,这一现象被称为“恩格斯停滞”(Engels Pause)。从技术偏向性的角度看,“恩格斯停滞”产生的主要原因是这个时期主要GPT几乎都是替代劳动力的。例如,蒸汽机、火车、汽车等的出现,都大幅降低了市场对劳动力的需求,这就导致了工资的停滞不前。此外,GPT的扩散可能还有助于“巨星”企业的发展,使其在行业内的份额变得更高。由于这类企业通常都有高资本密集度的特点,因而“巨星”企业的发展就会加剧劳动力份额在总收入中占比减少的趋势15。二、生成式AI:原理和发展(一)生成式AI的技术原理简介生成式 AI 和分析式 AI 的根本区别

19、是:后者采用的是“判别式建模”(DiscriminativeModelling),其目的是通过训练样本数据来提升模型的判断能力,从而能够帮助人们实现对训练外样本性质的判断;而生成式AI采用的则是“生成式建模”(Generative Modelling),它学习的目的是创造出和训练样本中数据类似的新数据(如图1所示)。举例来说,一个分析式AI通过学习大量梵高的作品,就可以在遇到一幅新作品时判断出它是否为梵高所画;而一个生成式AI在进行了类似的学习后,就可以创造出类似梵高风格的新作品。训练数据训练数据判别式模型生成式模型随机噪声生成样本预测值预测抽样训练训练分析式AI:生成式AI:图1分析式AI与

20、生成式AI的原理比较这个名词是由Allen创造的,但以恩格斯命名的原因是恩格斯在英国工人阶级状况等著作中首先指出了在技术迅速进步、社会生产率大幅度提高、企业利润率大幅增长的同时,工资增长停滞的现实。452023年第6期(总第475期)1.重要的生成模型虽然从表面上看生成式AI非常神奇,但从本质上看,生成式AI就是一个概率模型。通过对样本数据的学习,生成式AI可以形成一个关于数据的分布模型,所谓“生成”新数据的过程就是从这个分布模型中进行重新抽样的过程。目前,人们已经提出了很多不同的生成模型,它们之间在分布模型的构建,以及样本的抽取上都存在着很大差别,各方面表现也不尽相同。在这些分布模型中,最有

21、代表性的有五类:自回归模型、生成式对抗网络模型(GAN模型)、变分自编码模型(VAE模型)、流模型和扩散模型。第一,自回归模型16。自回归模型是文本生成模型中经常用到的一种模型,ChatGPT在训练中就采用了这一模型。这种模型的原理非常直观,即根据之前出现的语句来对后续可能出现语句的概率分布进行建模,并挑选概率最高的那个语句作为生成内容。例如,当AI学习了大量文本后发现,如果在一段文字中出现了“生成式”这三个字,后面出现“AI”的可能性是最高的,那么它在遇到“生成式”之后就会生成“AI”。第二,生成式对抗网络模型17。GAN模型的基本思想来自博弈论中的零和博弈。具体来说,它构造两个相互对抗的网

22、络,分别作为生成器和判别器。其中,生成器通过训练样本进行学习,并根据学习结果生成数据,其目的是让判别器相信所生成的数据是真实的;而判别器则根据训练样本的学习结果对训练外的数据进行判别,其目标是正确判断这些数据是否是生成的。通过这种对抗,生成器和判别器的性能就可以同时得到提升,由该模型生成的数据也就越来越接近真实。不过,GAN模型的缺陷也很明显。由于它不直接对训练样本进行建模,因而其可解释性非常差,并且也难以保证生成数据和训练数据来自同一分布。第三,变分自编码模型18。和GAN模型不同,VAE模型会直接对训练样本进行概率建模。包含两个部分:编码器和解码器。其中,编码器负责对训练样本中各潜变量(L

23、atent Variable)的均值和方差信息进行建模,解码器则利用这些信息生成新的数据。VAE模型会不断将生成的数据和训练数据进行对比,以此对潜变量的均值和方差信息进行重复校正。这样,生成内容的信息质量就能得到持续改进。由于VAE模型对训练样本直接进行概率建模,因而具有很强的可解释性,并且可以有效保证生成数据和训练数据来自同一分布。第四,流模型19。流模型会直接计算决定数据表征的潜变量的分布和数据表征分布之间的转移函数,并由此直接反推出潜变量的分布状况,完整地还原出训练数据的概率模型。显然,流模型具有很强的可解释性,并且可以保证生成数据和训练数据来自相同分布。不过,其对计算的要求很高,因而需

24、要较强的算力支持。第五,扩散模型20。扩散模型由前向扩散过程和反向生成过程构成。在前向扩散过程中,模型会根据事先学习的一些参数,通过一个马尔可夫过程对原数据逐步加入噪声,直到将数据变为近似纯噪声的水平为止。在反向生成过程中,模型则对之前处理的数据进行逐步减噪,由此生成新的数据。通过不断将新生成数据与原数据进行对比,就可以不断校正参数,让模型的质量更高。2.重要训练架构除了训练方法之外,训练架构也是生成式AI的重要支柱。在对神经网络进行训练时,人们开发了很多训练架构模型,如卷积神经网络(Convolutional Neural Networks,CNN)模型、循环神经网络(Recurrent N

25、eural Network,RNN)模型等。这些模型在生成式AI的训练中依然被广泛使用。但是,与这些经典模型相比,对生成式AI发展推动更大的模型则是Transformer模型。Transformer模型最早的应用场景是自然语言处理(Natural Language Processing,NLP)。在处理这类问题时,模型需要对之前处理过的信息有所记忆,但CNN、RNN等经典模型要么难以处理记忆问题,要么不能处理并行计算,运作效率很低。Transformer通过创造性地引入了一种被称为“自注意”(SelfAttention)机制成功地解决了这些问题21。这种机制可以根据某个词语所处陈永伟作为GPT

26、的GPT46的位置来确定与这个位置关联最大的词语的概率分布,从而不仅可以处理记忆问题,还可以支持并行计算。借助Transformer模型,NLP的处理效率得到了突飞猛进的发展,ChatGPT等明星级产品最终得以出现。当然,目前Transformer模型的应用已经不再局限于NLP,而是被广泛应用到了图形、语音处理等各个领域,从而成为了生成式AI,是整个深度学习的一种通用训练架构。正是在上述这些训练模型和训练架构的支撑之下,生成式AI才在当前实现了高速发展。(二)生成式AI发展简史生成式AI的历史原型可以追溯到20世纪60年代的聊天机器人Eliza,但直到2014年GAN模型被提出,它才开始了实质

27、性发展。最早引起人们关注的生成式 AI 用例是“深度伪造”(Deepfake)。所谓“深度伪造”是指借助GAN模型,将人的形象、表情、声音进行拼接,并合成音频和视频的技术。2018年,互联网上出现了很多利用“深度伪造”合成的虚假视频,并引发了争议,但客观上,它也首次让人们认识到生成式AI的力量。此后,随着VAE、扩散模型等新训练方法的提出和应用,生成式 AI迎来了高速发展。尤其是在 2022年,诸如 DallE2、StableDiffusion、MidJourney、Flamingo等产品相继面世,生成式AI市场开始进入繁荣时期。当然,生成式AI领域最大的突破还是来自“大型语言模型”(Larg

28、e Language Models,LLM)。2017年,Transformer模型架构被提出,NLP模型的发展取得了突破。从此,很多企业都开始构建自己的LLM。其中,最有代表性的模型就是OpenAI的GPT系列和谷歌的BERT系列。GPT的全称是“生成式预训练”(Generative PreTraining)模型,其采用的训练方法是自回归算法,通过前面出现过的文字来推断下文。人们现在所熟知的 ChatGPT、GPT-4 等都是这个系列的产物。BERT 模型(Bidirectional Encoder Representations from Transformers,BERT)则采用了自编码

29、技术,根据前后文来生成内容,其逻辑类似于完形填空。尽管现在BERT模型的知名度并不如GPT系列产品,但它在很多方面的性能甚至比GPT系列更优。谷歌正在研发中的很多大模型就是基于BERT模型开发的。最近一段时间,生成式AI迎来了大爆发。在ChatGPT的爆火引发了人们对生成式AI的关注后,国内外各大企业都将生成式AI作为重点发展方向,大量的生成式AI在短期内纷纷涌现。与此同时,生成式AI的普及也十分迅速,目前已经有很多企业将生成式AI应用于自己的业务,并构造出了对应的商业模式。从各方面看,生成式AI已经从孕育期转入了爆发期。三、生成式AI的GPT属性关于AI是否是一项GPT,已经有不少文献进行过

30、讨论。一些观点认为,AI已经被广泛应用于多个领域,并且发展十分迅速,因而具有了GPT属性;另一些观点则认为,虽然广义上的AI被应用于很多领域,但AI本身的含义过宽,在不同领域应用的AI模型在原理上存在着很大的差别,并不能被称为是一类技术。例如,知识图谱和机器学习虽然都归于AI的范畴,但其实是两种差异化的技术。从这个角度看,它们不应该被认为是GPT。本文不对广义上的AI模型是否应该属于GPT进行讨论,本文关注的焦点是生成式AI。如前所述,生成式AI模型从本质上都属于深度学习模型的分支,在训练方法、模型架构上也都有很强的共性,因而大致上可以属于一种单独的技术类别。那么,这种技术是否可以被归入GPT

31、的范畴呢?为了回答这个问题,需要检验它是否具有普遍适用性、进步性和创新孕育性。(一)关于普遍适用性的检验检验一种技术是否属于GPT的首要标准是它是否可以普遍使用。具体到生成式AI,需要检验它是否可以在垂直领域内得到大规模的应用。这个问题的答案是肯定的。无论是在消费端,还是在产业端,生成式AI都有广泛的应用前景。在很多领域,使用者只需要用提示词(Prompt)对预训练模型进行引导就可以得到符合专业需要的版本。相比于过去的分析式AI,生成式AI在472023年第6期(总第475期)各用途之间的转换成本非常低。1.消费端的应用在消费端,生成式AI可以为互联网生态提供大量的内容产品,从而丰富互联网的多

32、样性,提升用户的使用体验。众所周知,在Web1.0时代,互联网的内容产品主要来自“专业生产内容”(Professional Generated Content,PGC),其内容数量很小,难以满足用户需要;在 Web2.0 和Web3.0时代,“用户生产内容”(User Generated Content,UGC)开始大幅增加,这在很大程度上丰富了互联网的生态22。不过,受创作者水平、激励措施等因素的制约,UGC产品的质量良莠不齐,其供给量也很难满足用户需求23。随着生成式AI的面世,一种全新的内容生产方式“AI生产内容”(AI Generated Content,AIGC)随之诞生。相比于PG

33、C和UGC,AIGC在内容制作成本和内容数量、质量的稳定性等方面都更有保证。这些特点决定了它可以被应用到相当多的领域。目前,生成式AI在消费端的很多领域得到了应用。限于篇幅,这里只对其中的五个领域进行介绍:第一,日常办公。生成式AI可以在用户的指导下生成对应的内容,因而日常办公中相对重复、创造性较低的任务都可以由生成式AI辅助完成。最近,不少企业已经将生成式AI植入到办公软件当中。例如,2023年3月16日,微软发布了Office 365 Copilot,这款新的应用不仅可以根据用户的提示直接生成Word、PPT和Excel等,还可以帮助用户完成整理会议摘要、处理邮件等多种任务。也就是说,人们

34、日常办公中的大部分任务都可以由Office 365 Copilot辅助完成。第二,搜索。在搜索领域,目前微软已经将GPT-4模型应用到搜索引擎中,形成了“新必应”(New Bing)。新必应可以根据用户的需要实时从网上获取相关信息,并将信息整理成文本进行输出。和之前的ChatGPT不同,新必应在对用户的要求作答时,会给出确切的参考信息来源,这样就可以在很大程度上保证输出信息的可靠性。很多评论都认为,这种“AI+搜索”模式可以大幅提升人们从海量信息中检索出自己所需要信息的效率,因而可能会成为新一代的搜索方式。第三,教育。生成式AI可以帮助用户创造独特的学习环境和学习内容,并根据其学习的反馈自动进

35、行调整。通过这种方式,用户的学习体验和学习质量就可以得到十分有效的提升。目前,已经有不少平台将生成式AI应用于教育的实践。例如,著名的在线语言学习平台Duolingo就将GPT-3应用于语法修改,这一举措显著提升了学习者的外语写作能力。又如,一项来自教育机构Knewton的研究表明,通过引入GPT-3为高校学生提供个性化教学,可以有效提升教学质量;另一项来自教学机构Querium的研究则显示,GPT-3可以很好地帮助数学和自然科学的教学,让学生更为直观地理解教学内容。第四,金融服务。生成式AI在经过进一步训练之后,可以充当个人的金融顾问,为个人提供投资理财、风险管理等各方面的建议。例如,在一项

36、研究中,人们对ChatGPT的金融知识进行了测试。结果显示,其得分已经达到了充当金融顾问的水平。并且,由于相比于人类顾问,ChatGPT作为顾问会被人们认为更加客观,因而在实践中更加容易被人们所接受24。第五,医疗。以ChatGPT为代表的生成式AI不仅可以辅助用户诊断病情,针对病情给出特定的就医和用药建议,还可以根据患者的描述和医生的诊断自动生成病例记录,从而大幅提升患者就诊和医生诊断的效率。需要指出的是,GPT-4目前已经可以支持图形识别,这为计算机根据图形诊断病情提供了基础,从而可以大幅提升诊断的准确率。2.产业端的应用在产业端,生成式AI的应用同样非常广阔。根据著名咨询机构Gartne

37、r的研究,其中最有代表性的应用场景包括工业设计、药物研发和材料科学。第一,工业设计。当前的工业设计通常采用线性化的流程,不仅步骤繁多,耗费巨大,而且在每一步都可能产生错误,导致设计原型报废,从而产生严重浪费。如果采用生成式AI辅助设陈永伟作为GPT的GPT48计,上述问题就可以得到较好的解决。AI不仅可以根据设计人员的思路迅速提出多套方案,还可以直接对各套方案进行比较评估,供设计人员选择,这样就可以有效节省设计成本、缩短设计时间,还可以有效减少浪费25。以芯片设计为例,在设计过程中,设计人员需要在微小的晶片上尝试各种组件的排列方案。实践中,可供选择的排列方案非常多,甚至可能达到数十亿种。如果依

38、靠人力对这些方案一一尝试,就会产生巨大的成本,研发周期也会非常久。针对以上问题,很多企业已经开始将生成式AI应用到芯片的设计当中。例如,谷歌正在利用生成式AI辅助设计TPU芯片,英伟达也在其GPU芯片的设计当中使用了生成式AI。第二,药物研发。在药物研发的过程中,研究人员需要在海量的化合物当中不断试错,探索可供入药的成分。这使得药物的研发成为了一项周期长、成本高的工作。研究数据显示,美国研究一款新药的平均时间为12年,平均成本则高达26亿美元26。如果引入生成式AI来辅助研究人员识别化合物的分子结构,并根据需要对分子结构进行重构和修改,那么研发时间就可以大幅度缩短,研发成本也可以大幅度降低27

39、。以DeepMind的AlphaFold对蛋白质结构的预测为例:在AlphaFold投入应用之前,人们用实验方法了解的蛋白质折叠结构大约为几万种。而AlphaFold则用很短时间就破解了现在已知的一百多万个物种的2.14亿种蛋白质结构28。在被破解的结构中,35%已经达到了和实验方法破解相当的精度,80%的结果有很高的可靠性,可以被用于后续的分析研究。此外,生成式 AI在直接的药物研发上也已经有了不少的应用。例如,英矽智能(InsilicoMedicine)曾利用生成式AI开发治疗纤维化的新型DDR1激酶抑制剂,整个开发过程仅仅用了21天29。这个速度要远远高于传统的开发方式。第三,材料科学。

40、生成式AI既可以帮助研究人员更好地了解各种材料的结构及化学性质,还可以根据需要对材料进行“反演设计”(Inverse Design),因而在材料科学领域大有用武之地30。几年前人们已经开始将GAN、VAE等生成技术应用于新材料的研发。例如,德国马克斯普朗克科学促进会下属的钢铁研究所不久前提出了一种基于机器学习的高熵合金设计方案,从而大幅提升了设计效率。应用这个方法,该研究团队已经成功设计出了多种高熵因瓦合金31。又如,沙特阿卜杜拉国王大学的研究团队也借助生成式AI对光学纳米材料进行反演设计,其设计效果也得到了很大的改进32。综合以上分析不难看到:生成式AI在各个领域都有巨大的应用潜力。事实上,

41、在以ChatGPT为代表的生成式AI爆火之后,已有大量的企业和个人开始使用ChatGPT。例如,不久前美国的财富杂志进行了一次调查,结果显示在被访的一千多家企业中,有50%的企业已经开始使用ChatGPT,另有30%的企业计划使用33。由此可见,生成式 AI确实具有 GPT所要求的普遍适用性。(二)关于进步性的检验作为一种技术,生成式AI的进步是十分迅速的,主要表现为如下四个方面:1.模型规模的膨胀以GPT系列的发展为例:2018年6月,GPT-1面世时,其参数仅为1.1亿,预训练数据量也仅有5GB;到2019年2月GPT-2推出时,参数达到了15亿,预训练数据量也增加到了40GB;而到202

42、0年5月GPT-3推出时,参数已经猛增到1 750亿,预训练数据量也猛涨到45TB。此后,OpenAI又在GPT-3的基础上增加了参数量和训练数据量,将其升级为GPT-3.5,并用GPT-3.5训练ChatGPT。尽管ChatGPT并没有对外公布其确切的参数量和预训练数据量,显然这些数字都要高于GPT-3。在GPT-4推出之前,曾有传闻说,其参数量将达到100万亿,与人类大脑神经元数TPU是“张量处理单元”(Tensor Processing Unit)的简称,是谷歌进行机器学习的特殊芯片。492023年第6期(总第475期)量相当。尽管该消息最终被确认为不实消息,但可以肯定的是,GPT-4模

43、型的体量应该比GPT-3.5有很大的增加。2.模型性能的提升由于AI模型的性能很大程度上取决于其参数和训练数据的量,因而随着这两者的飞速增长,生成式AI模型的表现也出现了突飞猛进的发展。仍以GPT系列为例,在GPT-3之前,由于模型的参数量和训练数据量都很少,其表现并不突出,而GPT-3和ChatGPT在大幅增加参数量和训练数据量之后,无论是语义识别能力、逻辑推理能力,还是问题解决能力都有了质的飞跃。到了GPT-4,这种提升就更加明显。根据OpenAI官方公布的技术报告,如果让ChatGPT参加总分400分的美国律师资格考试,其得分为213分,大约只能胜过10%的人类考生;而如果让GPT-4参

44、加这一考试,则可以得到298分,可以胜过90%的人类考生34。3.模型使用成本的下降以ChatGPT的使用成本为例:在OpenAI开放ChatGPT的API接口之前,对外开放的一直是instructGPT版本。这个模型的性能比ChatGPT稍差,其收费大约为每千个令牌(Token)0.02美元。按此计算,进行一轮对话的成本大约与目前推送一次搜索广告的成本相当。2023年3月1日,OpenAI开放了ChatGPT的API,其收费下降到了每千个令牌0.002美元,仅为原来的1/10。这样一来,ChatGPT相对搜索广告的成本优势就十分明显了,这为其未来的商业应用创造了无限的想象空间。4.从单模态到

45、多模态的跨越在生成式AI发展的早期,模型大多是单模态的。例如,从GPT-1到GPT-3,以及ChatGPT都是文本输入、文本输出,而最近,多模态模型成为更为流行的选择,Dall-E2、Midjourney等模型都可以根据输入的文字信息输出图形,GPT-4可以从图形中读取信息并生成文字,也能根据文字生成图形,而微软的Kosmos-1模型则可以同时处理文字、图形、音频和视频。总而言之,生成式AI的进步十分迅速。不久前,OpenAI的创始人Altman在自己的社交媒体上提出了一个“智能摩尔定律”:“宇宙中的智能数量每18个月翻一番。”尽管有不少评论人士批评该“定律”语焉不详,甚至有炒作之嫌,但在某种

46、程度上,它其实是对过去一段时间内生成式AI发展的很好概括。由此可见,对于GPT所要求的进步性,生成式AI也可以很好的满足。(三)关于创新孕育性的检验生成式AI对创新的孕育表现在如下三个层面:1.对人工智能创新的推进近十多年来,人工智能的发展主要来自机器学习领域,而这个领域的发展对数据有非常高的依赖性。在具体的实践当中,数据的搜集和整理不仅成本高、质量难控制,还可能衍生出侵犯个人隐私、威胁数据安全等问题,这些都制约机器学习的发展。为了应对这些问题,一些学者建议可以使用合成数据作为真实数据的补充,供机器学习使用。与真实数据相比,合成数据至少具有以下三点优势:第一,从训练效果上看,用合成数据进行训练

47、的效果并不比真实数据差,在一些场合,它们的表现甚至更优异。在真实数据的形成过程中,可能混入很多不必要的噪声信息,这就可能对其质量造成影响,而合成数据则没有这样的问题。麻省理工学院、波士顿大学和IBM曾联合做过一项研究,用真实数据和合成数据分别训练模型识别人类行为,结果是采用合成数据进行训练的模型表现要比采用真实数据进行训练的模型更优35。第二,从成本上看,合成数据要远远低于真实数据。例如,合成数据服务提供商AI.Reverie曾提供过一组数据:用人工方式标注一张图片,平均成本需要6美元,而如果用AI合成一张图片则只需要6美分,其成本仅为前者的1%36。由于在机器学习过程中用到的数据通常是海量的

48、,陈永伟作为GPT的GPT50因而用合成数据代替真实数据将会产生巨大的成本节约。第三,从法律上看,合成数据可以规避很多风险。合成数据都是由AI生成的,而非向个人采集的,因而就可以避免漏露隐私、数据安全等众多问题。对于企业而言,用这样的数据来训练模型就更加没有后顾之忧。综合以上原因,用生成式AI合成数据将有助于突破阻碍机器学习发展的数据瓶颈,这对于促进机器学习的进步将会起到十分重要的作用。2.对其他科研领域创新的促进著名哲学家怀特海在回顾科技进步的历史时曾经说过:“19世纪最大的发明是找到了发明的方法。”由此可见,找到新的“发明方法”或“发现方法”对于推进创新是十分关键的。从某种意义上讲,生成式

49、AI的出现其实就是发现了一种新的发明或发现的方法。从本质上讲,发明创新是一种对各种要素的组合。传统上,人们基于既有知识对要素的组合进行探索,因而具有很强的路径依赖性。正是因为这个原因,在早期的内生增长文献中,都习惯于将创新(也就是知识的增长)视为既有知识的函数。在应用了生成式AI这个新工具后,人们可以以更低廉的成本去探索更多组合的可能,这就让创新可以在更大程度上突破既有知识的藩篱,有了更大的可能性。正如前文中已经指出的,生成式AI已经在生物、化学、制药等需要大量试错的领域得到了广泛应用,并对这些领域的知识和要素重组起到了很大的促进作用。显然,这种“组合式创新”将会大幅提升这些领域的技术进步速度

50、37。3.技术进步的回振作用生成式AI在促进各垂直领域技术进步的同时,这些垂直领域的技术进步也会反过来促进生成式AI本身的进步。一个典型的例子就是生成式AI和机器人学的互动。不久前,谷歌的机器人团队和谷歌创新团队联合研发了一款生成式语言模型PaLME38。这款模型可以根据不同类型的数据,如图像、声音、文本等对机器人进行控制,让它们完成各种任务。应用PaLME,研究者可以更容易地完成对机器人性能的各种测试,从而促进机器人技术的进步。反过来,机器人技术的进步也要求更好的控制技术,从而对PaLM-E的性能提出更多要求,促进其进步。通过这种互动关系,生成式AI和机器人学就可以同时获得进步。综合以上分析

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服