生成式人工智能与哲学社会科学新范式的涌现.pdf

资源描述

1、生成式人工智能与哲学社会科学新范式的涌现政光景吕鹏摘要:生成式人工智能(GAI)对哲学社会科学的学术体系、学科体系和话语体系的影响虽刚刚开始,但已引发了诸多的关注和讨论,未来将更加热烈。从对学术体系的影响来看,在理论上,GAI 推动了机器心理学、行为学和伦理学发展,推动智能社会科学进入新阶段;在方法上,GAI 成为重要的数据分析工具;在数据上,GAI 不仅能进行数据采集,其生成内容也能成为研究数据。从对学科体系的影响来看,在学术评价上,研究数据可得性更高,开展验证性研究更具可能;在人才培养上,研究者更为技术均等化、知识普及化和学习自主化,也要求其更具创新精神、智能思维。从对话语体系的影响

2、来看,在公众话语上,学术权威部分被消解;在国家话语上,哲学社会科学不断推进知识创新、理论创新、方法创新的使命更加重大;在国际话语上,哲学社会科学引领全球的机遇显现。关键词:生成式人工智能哲学社会科学研究范式新文科受新一轮技术革命的影响,近年来哲学社会科学呈现许多新的发展方向与热点,如计算社会科学、智能社会科学、数字人文等。这些研究密切关注科技革命和时代变革的最新趋势,正在成为新的学术增长点和创新点。生成式人工智能(Generative Artificial Intelligence,GAI)是当前人工智能技术发展的热点,是通用人工智能(Artifi-cial General Intel

3、ligence,AGI)的初期版本,也是AI 奇点临近的标志性技术。OpenAI 发布的最新版本的大型语言模型(Large Language Model,LLM)生成式预训练模型4.0(Generative Pre-trained Transformer-4,GPT-4)就是典型的生成式人工智能,其具有多模态数据处理能力,在总结、抽象、推理等多种能力上达到或超过人类水平。大语言模型的更新换代发展速度被总结为人工智能发展的“新摩尔定律”,越来越多的人开始将人工智能生成的内容(Artificial Intelligence GeneratedContent,AIGC)运用于社会生产生

4、活各个领域,对各行各业产生了不可忽视的直接或间接冲击。科学研究领域也不例外。受生成式人工智能技术迅猛发展的影响,科学技术部与国家自然科学基金委员会已于 2023 年 3 月 27 日启动“人工智能驱动的科学研究”专项部署;其既推动了自然科学的发展,也推动了社会科学的变革,甚至231本文系中国社会科学院学科建设“登峰战略”资助计划新兴学科与交叉学科“科技与数字社会”的阶段性成果。高翔:按照习近平总书记和党中央要求办好中国社会科学院,党建2023 年第 5 期。Sbastien Bubeck,et al.,“Sparks of Artificial General Intelligence:Ear

5、ly Experiments with GPT-4”,arXiv preprint arXiv:2303.12712,2023.OpenAI,“GPT-4 Technical Report”,arXiv preprint arXiv:2303.08774,2023.Wang,Hanchen,et al.,“Scientific Discovery in the Age of Artificial Intelligence”,Nature,Vol.620,No.7972,2023,pp.47-60;Gross-mann,Igor,et al.,“AI and the Transformation

6、 of Social Science Research”,Science,Vol.380,No.6650,2023,pp.1108-1109.有人声称 AI 驱动的科学研究将成为科学研究的第五范式。生成式人工智能的发展也必然给哲学社会科学带来新的机遇和挑战。这主要体现在学术体系、学科体系和话语体系三个方面。总的来看,学术体系受到的影响最为直接,尤其是基础理论、研究方法、研究数据三个方面都已经受到了直接的冲击;而后两者受到的影响虽然也开始显现,但相对间接,更具冲击力的效应是否和如何产生,还需要更多的时间积累。虽然目前的很多影响和冲击还是单点的,甚至看似细微,但这些影响和冲击在相互作用之后,不排除

7、产生具有极大意义的现象,即在哲学社会科学领域“涌现”(emergence)出一种新范式的可能。基础理论的新问题和新方向生成式人工智能的发展,首先使得人工智能技术本身成为重要的社会科学研究对象。由于生成式人工智能对社会的影响越来越大,研究和评估其行为和伦理也变得越来越重要,这就是“机器心理学”“机器行为学”和“机器伦理学”,其旨在通过将人工智能作为社会科学研究的对象来识别其能力、行为、决策和推理机制以及伦理道德。这一方向的研究思路是“技术建构论”的,强调生成式人工智能特征应该符合人类社会的基本伦理和价值。其次,生成式人工智能对社会产生了重要影响,使得社会科学研究面对新的社会形态,从而助推了“智能

8、社会科学”的产生。这一方向的研究思路是“技术决定论”的,强调生成式人工智能作为技术基础,会对各种社会现象产生影响。(一)生成式人工智能的机器心理学、行为学与伦理学研究生成式人工智能的发展是弱人工智能走向强人工智能的重要节点,至此人工智能开始有了接近和超越人类的能力,主要表现为其具备推理能力、自我改进与创造能力以及个性、智力、社交属性等能力和特征。(1)在关于生成式人工智能的推理能力的研究上,Wu 等人认为 ChatGPT 具有良好的推理能力,尤其是在回答科学问题、知识相关问题和复杂逻辑问题方面。(2)在自我改进与创造能力的研究上,Huang 等人证明了 LLM 也能够仅使用未标记的数据集进行自

9、我改进,并且根据人类反馈进行微调能使语言模型与人类意图保持一致。(3)在个性的研究上,若干研究评估了大型语言模型的个性。Ayers 等人认为,AI 聊天机器人在回答问题的专业性和人性化两个方面,都完胜临床医生,其具备更高的同理心。(4)在智力研究方面,多项研究验证了大型语言模型的心智能力。(5)在社交属性的研究方面,大型语言模型驱动的聊天机器人能够表现出社交属性。生成式人工智能还具有价值与道德,其可能存在各类伦理问题。(1)生成式人工智能存在各类价值偏差。LLM 可能会延续社会中现有的偏见,并通过快速和低成本的应用加剧这些偏见。Luo 等人发现,ChatGPT 具有语言偏见,它主要基于英语数据

10、训练,将英美视角作为规范性观点;331生成式人工智能与哲学社会科学新范式的涌现王飞跃、缪青海:人工智能驱动的科学研究新范式:从 AI4S 到智能科学,中国科学院院刊 2023 年第 4 期。Rahwan,I.,et al.,“Machine Behaviour”,Nature,Vol.568,No.7753,2019,pp.477-486.T.Y.Wu,et al.,“A Brief Overview of ChatGPT:The History,Status Quo and Potential Future Development”,IEEE/CAA Journal of Auto-mati

11、ca Sinica,Vol.10,No.5,2023,pp.1122-1136.Huang J.,et al.,“Large Language Models Can Self-improve”,arXiv preprint arXiv:2210.11610,2022.Ayers J.W.,et al.,“Comparing Physician and Artificial Intelligence Chatbot Responses to Patient Questions Posted to a Public Social MediaForum”,JAMA Intern Med,Vol.18

12、3,No.6,2023,pp.589-596.Ullman,T.,“Large Language Models Fail on Trivial Alterations to Theory-of-Mind Tasks”,arXiv preprint arXiv:2302.08399,2023.Q.Vera Liao,et al.,“All Work and No Play?Conversations with a Question-and-Answer Chatbot in the Wild”,in Proceedings of the 2018CHI Conference on Human F

13、actors in Computing Systems,2018,pp.1-13.Queenie Luo,Michael J.Puett,Michael D.Smith,“A Perspectival Mirror of the Elephant:Investigating Language Bias on Google,ChatGPT,Wikipedia,and YouTube”,arXiv preprint arXiv:2303.16281,2023.ChatGPT 也被发现有宗教偏见、政治偏见和意识形态偏见。(2)生成式人工智能可能导致隐私泄露。它能从 LLM 中提取个人身份信息和其他敏

14、感信息,这增加了在模型中使用大量数据集可能导致隐私信息泄露的可能性;用户使用ChatGPT 时,可能会在无意中泄露自己的信息,如个人喜好、聊天记录等。(3)生成式人工智能会导致公平性问题。一是计算复杂性会限制某些LLM 的可扩展性,使资源有限的研究人员无法访问它们,并加剧社会不平等。二是 ChatGPT 收费将加剧国际学术领域的不平等,因为低收入和中等收入国家的教育机构可能负担不起费用,从而扩大知识传播和学术出版方面的差距。此外,生成式人工智能还存在复杂性和不确定性、不透明和“随机鹦鹉”现象、事实错误、认知错误、恶意使用、环境成本等问题。(二)智能社会科学研究近几十年来,人类社会先后经历了网络

15、社会、数字社会、算法社会、智能社会等阶段。从趋势上看,机器人世已经出现,一些人认为走向强人工智能时代成为必然。生成式人工智能技术模糊了虚实世界的位格关系,将导致符号世界、心理世界、物理世界从三界同构走向三界异构。生成式人工智能未来将不断与其他机器人技术集成,彻底改变人类与技术的互动方式。在智能社会,个体和社会的存在形式与运作逻辑都发生了重大变迁。从个体层次看,个体既具有真实世界的个体,也具有虚拟世界的个体,即“数据主体”(data sub-ject)或者“算法身份”(algorithmic identity)。数字化的人类也将包括智能辅助人、生理增强人以及非整数维度的数字人。人与机器将走上双向

16、影响、边界消融、互为尺度的未来。个体的社会行动发生显著变化,表现为信息行动或数字行动,即社会行动以信息流的形式展开。从社会层次看,智能社会的基本形态与运行模式发生了深刻变化。社会区分为实在社会与虚拟社会两种基本形态;算法成为智能社会的重要运作规则;社会组织结构加速转型为扁平化、原子化、多样化和网络化的社会结构;物理世界、人类社会和虚拟社会高度集成,人与人、人与物、物与物以及社会事件与社会行动紧密链接;社会关系包括人与人工智能、普通人与掌握运用人工智能的人、人工智能与人工智能等构成的多元社会关系。由此,实在时空与虚拟时空中的人、人工智能和社会综合构成一个新型“生态体系”。从对智能社会的反思来看,

17、算法权力、数字资本主义、数字全景敞视主义、人的单体化等议题将成为社会科学家们反思的重点。4312023.4Jochen Hartmann,Jasper Schwenzow,Maximilian Witte,“The Political Ideology of Conversational AI:Converging Evidence on ChatGPTsPro-environmental,Left-libertarian Orientation”,arXiv preprint arXiv:2301.01768,2023.Carlini,N.,et al.,“Extracting Traini

18、ng Data from Large Language Models”,in 30th USENIX Security Symposium(USENIX Security 21),2021,pp.2633-2650.Queenie Luo,Michael J.Puett,Michael D.Smith,“A Perspectival Mirror of the Elephant:Investigating Language Bias on Google,ChatGPT,Wikipedia,and YouTube”,arXiv preprint arXiv:2303.16281,2023.Mic

19、hael Liebrenz,et al.,“Generating Scholarly Content with ChatGPT:Ethical Challenges for Medical Publishing”,The Lancet DigitalHealth,Vol.5,No.3,2023,pp.105-106.桑基韬、于剑:从 ChatGPT 看 AI 未来趋势和挑战,计算机研究与发展2023 年第 6 期。Aljanabi Mohammad,“ChatGPT:Future Directions and Open Possibilities”,Mesopotamian Journal o

20、f Cybersecurity,Vol.2023,2023,pp.16-17.Cheney-Lippold,John,“A New Algorithmic Identity:Soft Biopolitics and the Modulation of Control”,Theory,Culture&Society,Vol.28,No.6,2011,pp.164-181.姜泽玮:功能局限、关系嬗变与本体反思:人机传播视域下 ChatGPT 的应用探讨,新疆社会科学2023 年第 4 期。陈氚:信息行动理论数字社会时代的社会行动理论探讨,社会学评论2021 年第 5 期。梁玉成、政光景:算法社会

21、模型探析,社会发展研究2021 年第 3 期。杨述明:人类社会的前进方向:智能社会,江汉论坛2020 年第 6 期。刘嘉琪、杨斌艳:我国人工智能与社会科学耦合发展的热点与趋势研究基于 CiteSpace 的文献计量分析,数据与计算发展前沿2022 年第 6 期。研究方法的新功能与新助手在当今生成式人工智能迅速发展的背景下,文本、声音、图像、视频等多模态大数据被迅速生产出来,成为哲学社会科学研究的重要素材。除此之外,生成式人工智能还能作为哲学社会科学重要的研究工具,推动哲学社会科学研究加速进入智能科研时代。一方面,其能作为强有力的数据分析工具,对多模态数据进行数据处理、信息提取与建模分析等;另

22、一方面,其还能在具体的研究全过程扮演得力的科研助手角色。(一)多模态数据分析功能在数据分析上,大型语言模型已被应用于分析社交媒体发帖、调查数据和新闻文章上,促进了社会学、经济学、政治学、新闻传播学、人文学科等研究领域的数据驱动研究。大型语言模型能与外部信息源、工具、感官数据、图像、物理对象等进行交互,这使得其具有强大的多模态数据分析能力。在数据处理上,生成式人工智能能进行数据标注任务,并且其性能超过了训练有素的标注者;Elmas 等使用 ChatGPT 对代表选举前的投票意图和动机进行大规模注释,其能够以 97%的准确率预测首选候选人;ChatGPT 可以解码 Fed-speak(美联储在货币

23、政策决策中使用的语言);ChatGPT 有助于跨资产类别进行选择;ChatGPT能对可信的新闻媒体进行确认。在信息提取上,大型语言模型能进行意见提取,如 ChatGPT 能从一个大型互联网文本数据集中学习其语言模式和风格,使其能够提取社区中的常见意见、想法和语言模式。其还能进行关系提取、文本摘要、命名实体识别、事件提取等信息提取任务。Wei 等利用 ChatGPT 进行关系提取、命名实体和事件提取,其在两种语言、六个数据集的经验研究上实现了极佳效果。在建模分析上,大型语言模型展示了强大的对经验进行观察并据此进行推理的能力。首先,其能进行高性能分类任务。在对推特内容的政治属性进行分类的文本分析任

24、务中,GPT-4 的准确性、可靠性比人类更高。其次,其能作为情感分析的工具。Lopez-Lira 和 Tang 利用 ChatGPT 和其他大型语言模型根据新闻标题进行情绪分析,进而据此预测股市收益。最后,其还能进行多模态数据推理和因果判断任务。Zhang 等人提出Multimodal-CoT(多模态-思维链),其推理准确率达到了 91.68%,性能超过了人类水平。Jin 等人提出了一种道德思想链(MORELOT)提示策略,能准确预测人类的道德判断。大语言模型531生成式人工智能与哲学社会科学新范式的涌现Gilardi,F.,Alizadeh,M.,Kubli,M.,“ChatGPT Outp

25、erforms Crowd-Workers for Text-Annotation Tasks”,arXiv preprint arXiv:2303.15056,2023.Tugrulcan Elmas,Ilker Gl,“Opinion Mining from YouTube Captions Using ChatGPT:A Case Study of Street Interviews Polling the 2023Turkish Elections”,arXiv preprint arXiv:2304.03434,2023.Anne Lundgaard Hansen,Sophia Ka

26、zinnik,“Can ChatGPT Decipher Fedspeak?”,Available at SSRN 4399406,2023.Hyungjin Ko,Jaewook Lee,“Can Chatgpt Improve Investment Decision?From a Portfolio Management Perspective”,Available at SSRN4390529,2023.Kai-Cheng Yang,Filippo Menczer,“Large Language Models Can Rate News Outlet Credibility”,arXiv

27、 preprint arXiv:2304.00228,2023.Nuno Crokidakis,Marcio Argollo de Menezes,Daniel O.Cajueiro,“Questions of Science:Chatting with ChatGPT about Complex Systems”,arXiv preprint arXiv:2303.16870,2023.Xiang Wei,et al.,“Zero-Shot Information Extraction via Chatting with ChatGPT”,arXiv preprint arXiv:2302.

28、10205,2023.Petter Trnberg,“ChatGPT-4 Outperforms Experts and Crowd Workers in Annotating Political Twitter Messages with Zero-Shot Learning”,arXiv preprint arXiv:2304.06588,2023.Alejandro Lopez-Lira,Yuehua Tang,“Can ChatGPT Forecast Stock Price Movements?Return Predictability and Large Language Mode

29、ls”,arXiv preprint arXiv:2304.07619,2023.Zhuosheng Zhang,et al.,“Multimodal Chain-of-Thought Reasoning in Language Models”,arXiv preprint arXiv:2302.00923,2023.Zhijing Jin,et al.,“When to Make Exceptions:Exploring Language Models as Accounts of Human Moral Judgment”,Advances in Neural In-formation P

30、rocessing Systems,35,2022,pp.28458-28473.还能进行各种图形数据推理任务。基于 GPT-4的算法在成对因果发现任务(准确率 97%)、反事实推理任务(准确率 92%)和实际因果关系(准确率 86%)方面表现优异。(二)科研助手的功能生成式人工智能不仅可以直接作为哲学社会科学研究的数据分析方法与工具,还能在哲学社会科学研究的全过程发挥科研助手功能。ChatGPT 已在学术研究与写作领域产生了重大影响,许多现有的研究已经测试了 ChatGPT 如何应用于科学研究和写作,包括头脑风暴、文献综述、代码生成、内容生成、语法检查以及学术评

31、述等功能。ChatGPT 在头脑风暴中可以发挥多种作用,包括激发创造力、产生新想法和扩展现有想法。ChatGPT 具有多角度“思考”的能力,可以帮助用户进行发散性思维和创造性思维,打破思维僵局。Liu 等人的研究结果表明,ChatGPT 与人类思维不同,其具有不同于人类的独特视角,其建议是高度可理解和相关的,具有重要的科学研究价值。ChatGPT 能完成数据分析和可视化等任务。Macdonald 利用 ChatGPT 完成了对10 万个样本的模拟数据集的数据分析任务,大大加快了研究进程。通过 GPT-4 代码解释器,用户可以直接通过自然语言对数据集进行数据分析和可视化,并直接给出相应的编程代码

32、。在文献综述、辅助阅读、内容生成、语法纠正和评述上,ChatGPT 均可以发挥重要作用。当前许多研究已经尝试使用 ChatGPT 生成内容。ChatGPT 还被用于生成特定领域的综述文章。ChatGPT 可以作为一个人工智能驱动的研究性阅读工具,帮助科研人员进行文献梳理和搜集工作。在辅助阅读方面,利用 ChatGPT 对相关研究文章进行解读具有很好的效果。ChatGPT 还能对语法和拼写进行纠正,提高写作质量。此外,其还可以辅助进行观点评述与讨论。数据采集和来源的转变生成式人工智能的发展将使得哲学社会科学研究的数据来源发生革命性转变。一方面,生成式人工智能可以扮演研究者的角色

33、,发挥数据采集功能。在这种情况下,生成式人工智能是在研究者干预和控制下的数据收集主体,向不同研究对象(可以是人或人工智能)采集数据。另一方面,人工智能生成内容(AIGC)本身也可以作为哲学社会科学研究的重要数据来源。在这种情况下,研究者是数据收集主体,生成式人工智能本身构成数据来源。这两种基于生成式人工智能的数据采集方式都将使得哲学社会科学传统的定性和定量的数据采集方式发生重大转变,具体包括传统的质性访谈、问卷调查、实验数据采集、大数据采集等。(一)生成式 AI 作为数据采集工具因当前生成式人工智能已经具备很强的逻辑与共情能力,因此,其能在研究者一系列的引导和提示下,轻松自如地扮演人类研究者的

34、角色,与被研究对象自然地交谈,以获取研究所需数据。大量的研究探索了使用聊天机器人来代替传统的基于问卷的调查进行数据收集。Xiao 等人构6312023.4Jiawei Zhang,“Graph-ToolFormer:To Empower LLMs with Graph Reasoning Ability via Prompt Augmented by ChatGPT”,arXiv preprintarXiv:2304.11116,2023.Emre Kcman,et al.,“Causal Reasoning and Large Language Models:Opening a New Fr

35、ontier for Causality”,arXiv preprint arXiv:2305.00050,2023.Siru Liu,et al.,“Assessing the Value of ChatGPT for Clinical Decision Support Optimization”,MedRxiv,2023.Calum Macdonald,et al.,“Can ChatGPT Draft a Research Article?An Example of Population-level Vaccine Effectiveness Analysis”,Jour-nal of

36、Global Health,13,2023.mer Aydn,Enis Karaarslan,“OpenAI ChatGPT Generated Literature Review:Digital Twin in Healthcare”,Available at SSRN 4308687,2022.骆飞、马雨璇:人工智能生成内容对学术生态的影响与应对基于 ChatGPT 的讨论与分析,现代教育技术2023 年第 6 期。mer Aydn,Enis Karaarslan,“OpenAI ChatGPT Generated Literature Review:Digital Twin in He

37、althcare”,Available at SSRN 4308687,2022.Wei J.,et al.,“Leveraging Large Language Models to Power Chatbots for Collecting User Self-Reported Data”,arXiv preprint arXiv:2301.05843,2023.建了一个聊天机器人,以开放式问题进行访谈,并得到了比人类访问员更高质量的回答。另外,在聊天机器人中注入更多人性化的特征,如较为随意的谈话风格、自我介绍等,这不仅可以提高被访者的参与度和满意度,还会使他们更多地自我披露。Bemmann

38、等人将聊天机器人与抽样方法相结合,发现个性化的聊天机器人具有收集敏感或隐私数据的潜力。除了利用生成式人工智能对人类特征、行为、情感数据进行收集外,还能利用其对 AI 间的互动数据进行采集。Li 等人构建了一个用于角色扮演的新型沟通行动者框架,以促进 AI 之间的自主合作,并深入了解他们的“认知”过程。这个研究展示了如何使用 AI 来进行角色扮演以生成会话数据,以便基于此来研究 AI 的行为和能力。(二)AI 生成内容作为研究数据来源正因为生成式人工智能是一个能够适应不同社会角色的模型,其能对各类哲学社会科学研究数据进行生成或模拟,人工智能生成内容因此将成为哲学社会科学重要的研究数据来源。首先

39、,其生成的多模态大数据能被应用于各类社会场景中,其直接或间接地成为重要的大数据来源。其次,其还能模拟调查数据,在经过校正后成为有代表性的数据集。再次,其还能模仿人类个体,成为各类哲学社会科学的实验对象,因此能成为重要的实验数据来源。最后,通过模仿特定情境下具有特定特质的个体(如稀有人群、历史人物、文学人物、哲学家等),研究者能与其对话,开展质性访谈,使其成为重要的质性研究数据来源。从生成式人工智能作为哲学社会科学研究的大数据来源看,其主要在两种场景、两个方法、两类空间上体现其研究价值。从场景看,第一种研究场景是指生成式人工智能直接作为数据来源,构成研究的对象。如 Bubeck 等人通过一系列预

40、设好的提示使 ChatGPT 生成相应的内容,并根据相应内容研究其内含的偏见。第二种研究场景是指 AIGC 在不同的社会生产生活应用场景中成为研究对象。在这种情况下,AIGC 实际反映的是人类的行为与意图,因为 AIGC 都是根据使用者的提示来生成各类多模态数据。在研究方法层面,第一种情况是指 AIGC 能成为量化研究的数据来源。大规模的多模态数据能构成计算社会科学研究的数据来源,如大量的 AI 生成文本就能成为文本分析的数据来源。第二种情况是指 AIGC能成为质性研究的数据来源。如在网络和虚拟空间中,大量的 AIGC 内容能成为网络民族志和虚拟民族志的重要研究数据。在存在空间上,随着AIGC

41、不断与机器人或传感设备技术融合发展,AIGC 过往主要产生于虚拟空间的情况将发生改变,其也将同时在实体空间中大量存在(如顾客与服务机器人在各类消费场景下的互动数据)。这也将使得 AIGC 大数据具有更丰富的社会情境,为哲学社会科学研究提供更为多样化的大数据来源。生成式人工智能能够通过扩展样本和替代样本两种方式形成对问卷调查数据的补充和替换。通过传统问卷调查进行数据收集的各方面成本较高,时间跨度较长,而生成式人工智能在数据采集成本、效率、议题扩展性等方面的优势将远远超越传统的问卷调查数据采集方式。从扩展样本的方式上看,在复杂、低资源和稀有类的调查中,通过生成式人工智能可以有效扩充稀有类数据集,

42、弥731生成式人工智能与哲学社会科学新范式的涌现Ziang Xiao,et al.,“Tell Me about Yourself:Using an AI-powered Chatbot to Conduct Conversational Surveys with Open-ended Questions”,ACM Transactions on Computer-Human Interaction,Vol.27,No.3,2020,pp.1-37.Florian Bemmann,et al.,“Chatbots for Experience Sampling-Initial Opportun

43、ities and Challenges”,CEUR Workshop Proceedings,Vol.2903,2021.Guohao Li,et al.,“CAMEL:Communicative Agents for Mind Exploration of Large Scale Language Model Society”,arXiv preprint arXiv:2303.17760,2023.Argyle,Lisa P.,et al.,“Out of One,Many:Using Language Models to Simulate Human Samples”,Politica

44、l Analysis,Vol.31,No.3,2023,pp.337-351.Bubeck,S.,et al.,“Sparks of Artificial General Intelligence:Early experiments with GPT-4”,arXiv preprint arXiv:2303.12712,2023.T.Y.Wu,et al.,“A Brief Overview of ChatGPT:The History,Status Quo and Potential Future Development”,IEEE/CAA Journal of Auto-matica Si

45、nica,Vol.10,No.5,2023,pp.1122-1136.补调查数据中特殊类属的稀缺性。Mller 等人的样本扩展实验发现,GPT-4 和 GPT-3.5 在所有任务中都有很强的零样本性能,用扩展样本增强的数据具有较好的数据质量。从替代样本的方式看,其能对调查数据进行取代。Argyle 等人探索了语言模型可以作为社会科学研究中特定样本有效替代的可能性,其根据数千个真实的人类的社会人口背景变量来调整模型,从而创建了一个替代性的“硅样本”(Silicon Sample),并比较了其与人类样本的差异,证明了通过具有高算法保真度(Algorithmic Fidelity)的大型语言模型,并

46、通过硅采样(Silicon Sampling)的方式,可以有效模拟人类社会的调查样本。从人工智能生成内容作为实验数据来源看,当前已有一些研究通过不同的大型语言模型再现了经典的经济学、心理语言学和社会心理学实验。长期以来,对人类的研究是通过基于语言的工具“访问”人类心理,由此产生了大量的方法,而现在通过基于大型语言模型的方法不仅可以用来研究人类,还可以用来研究人工智能。通过对大型语言模型注入特定的禀赋、特征、偏好等,可以使其模拟各种不同的人类行动者,以进行各种类型的实验研究。Horton 的研究以 GPT-3人工智能为实验对象,可以定性地再现基于人类实验的结果。相比于招聘人类进行实验,它的成本非

47、常低,因此可以尝试多种不同的措辞、提示、回答顺序,并且样本可以任意大,还能不受实验伦理的限制。人工智能生成内容作为定性研究数据有其独特优势。在许多人文性较强的人文社会学科中,细致精确地把握行动者和社会的心理、情感、价值与意义等无法有效量化的因素占据着方法论的核心位置。虽然当前生成式人工智能仍处在初级阶段,但已经具备了一定的个性、心智与情感能力。因此,将 AIGC 作为质性研究材料已经具备了可行性。此外,从文学、历史、哲学等人文学科来看,过往通过文学作品、原著、史料等较为零乱、分散的资料来进行研究往往失去了“远读”的宏大视野,而通过生成式人工智能模拟文学家、文学人物、历史人物、哲学家等,能够较为

48、全面且细致地反映出其观点与特征。在对当代社会稀有人群、稀有事件的质性研究中,生成式人工智能也能进行较低成本的模拟访谈,以对特殊稀有人群、现象进行探索性研究。学科体系的评价与人才成长生成式人工智能已经给哲学社会科学学术生态带来了一定的冲击,也必将在未来持续带来更大的影响。这一影响主要体现在对哲学社会科学学科体系中的评价体系和人才培养制度的改变上,这一改变既有机遇也有挑战。当前,哲学社会科学学科组织制度整体上还表现为传统模式,但未来为了适应生成式人工智能等通用人工智能的发展,其必将发生变革。当前在自然科学领域,受生成式人工智能的影响,针对产品开发的 DAO(分布式开放自主组织)和针对基础研究的 D

49、eSci(分布式开放科学运动)正蓬勃兴起。这也是哲学社会科学可以借鉴的学科组织方式。8312023.4Anders Giovanni Mller,et al.,“Is a Prompt and a Few Samples All You Need?Using GPT-4 for Data Augmentation in Low-resource Clas-sification Tasks”,arXiv preprint arXiv:2304.13861,2023.Argyle,Lisa P.,et al.,“Out of One,Many:Using Language Models to Si

50、mulate Human Samples”,Political Analysis,Vol.31,No.3,2023,pp.337-351.Aher G.,Arriaga R.I.,Kalai A.T.,“Using Large Language Models to Simulate Multiple Humans”,arXiv preprint arXiv:2208.10264,2022.Aher G.,Arriaga R.I.,Kalai A.T.,“Using Large Language Models to Simulate Multiple Humans”,arXiv preprint

展开阅读全文