1、ChatGPT的政治倾向初探:表现、成因及意识形态风险*李 昂1汪 洋2(1同济大学 马克思主义学院上海 201804;2同济大学 电子与信息工程学院上海 201804)摘 要:作为一种基于语言模型的对话系统,ChatGPT虽自称客观中立,却具有鲜明的政治偏向。利用工具对其政治立场进行测量后发现,ChatGPT在西方政治光谱中可能具有一种民主社会主义的意识形态属性。ChatGPT的政治倾向虽含有社会主义因素,但与科学社会主义存在着本质不同,且这一倾向的形成具有技术和社会文化两方面的原因。ChatGPT作为一种政治价值输出工具,对于我国意识形态安全构成了多方面的风险:一是“英文数据集霸权”的长期
2、存在导致的意识形态权威失落风险;二是“信息基础设施”的技术性质导致的意识形态阵地收缩风险;三是“私人定制”的市场功能导致的意识形态认同窄化风险。对此,我们予以积极应对:一是构建中国特色中文数据集,增强意识形态风险防范的主导权;二是完善全生命周期审核机制,织密意识形态风险防范的保障网;三是提高参与主体价值敏感性,激发意识形态风险防范的责任感。关键词:ChatGPT 政治倾向 表现 成因 意识形态风险中图分类号:D64文献标识码:ADOI:10.3969/j.issn.1003-4641.2023.04.04ChatGPT是人工智能研究机构OpenAI发布的一款聊天机器人程序,其全称为“Chat
3、Generative Pre-trained Transformer”,是一个能够进行连续对话、综合上下文进行交流的自然语言处理(NLP)模型。1有专家指出,以前的人工智能都局限于观察、分类和分析,而ChatGPT的出现标志着自然语言处理技术的重大革新。2与其他智能聊天交互系统相比,ChatGPT的独特之处在于其可以持续理解人类文字意图,实现多轮交互对话,继而制造出了“有思想”“可交流”的智能感。ChatGPT这种连贯、自然的对话能力依托于大语言模型(Large Language Model)这一核心技术支撑。简单来说,大语言模型就是通过容纳和处理人类文明的海量文本,从中捕捉不同文本之间的模式
4、和关联,进而表现出一定的文本理解能力和生成能力。Chat收稿日期:2023-06-15基金项目:国家重点研发计划资助项目“社会治理与智慧社会科技支撑”(2021YFC3300300)、2020年度高校思想政治理论课教师研究专项一般项目“新时代增强高校思政课对社会思潮的引领力研究”(20JDSZK142)、同济大学“中央高校基本科研业务费专项资金资助”(22120210217)。作者简介:李昂,同济大学马克思主义学院硕士研究生,研究方向:国外马克思主义理论;汪洋,同济大学电子与信息工程学院博士研究生,研究方向:视觉审核算法、自然语言处理。2023年第4期总第293期SEEK TRUTH FROM
5、 FACTSNo.4,2023General No.29330GPT正在对社会生活的各个领域带来或显或隐的影响,这意味着,对ChatGPT的运作方式及其与政治、社会等方面的关系进行勘察,使其变得可被理解,对于人类与人工智能的未来而言至关重要。一、ChatGPT的政治倾向性从技术与政治的关系来看,技术从来就不是独立和自主的存在。技术的研发与应用是一个政治的过程,即社会权力参与其中并为实现自身的意图展开斗争的过程。人工智能技术的迭代进步,使政治变得异常复杂:资本凭借对海量数据和算法技术的掌控,不断施加政治影响力,能够对国家政治安全构成巨大挑战。而人工智能技术的持续进步带来的是系统的、全面的、指向政
6、治结构基础的政治安全挑战。3从这个意义上来说,ChatGPT不仅是一种对话式的语言模型,它还可能是一架有史以来最强大的网络意识形态机器。4而训练ChatGPT所依赖的语料库绝大多数都是英语文本,中文数据占比较低,这将导致以英文为载体的西方话语体系和价值体系对我国社会主义意识形态话语权形成挤压。因此,有必要对诸如ChatGPT这样的大语言模型所具有的意识形态偏向性进行审视。ChatGPT生成的内容存在特定的政治价值取向。在人机互动的场景中,ChatGPT往往会在正式答复前先发表一段“免责声明”,如“作为AI语言模型,我没有个人的观点或信仰”“我不对政治和伦理问题作出评价”,但它真的不会受到任何政
7、治、宗教或个人偏见的影响吗?答案是否定的。比如,国外一些研究者发现,在一些通用的词嵌入模型后会存在一些性别和种族偏见。5ChatGPT的语料库本就来自人类,它就像人类社会的一面镜子,将人类社会“既有”的东西经过浓缩或转译后生成另一种“有”。因此,ChatGPT“沾染”到一些意识形态偏见就注定是无法避免的。如果不对数据和模型进行有意识的干预、调整而任由其“随机地”“自由地”产生结果,ChatGPT就很有可能会形成特定的政治价值取向。ChatGPT的生成内容传播了何种政治意识形态?鉴于ChatGPT的语料来源庞杂无比,加上对特定提示技巧的运用都会显著影响其生成内容,故而要准确、全面地评估ChatG
8、PT的政治取向绝非易事。然而,如果对某一话题进行反复试验,并尽可能地排除设问中含混不清、容易造成误解的地方,我们就会发现,ChatGPT在某些内容的输出上,确实已经形成了稳定的、有迹可循的意识形态偏向性。例如,一位来自斯坦福大学的研究员对ChatGPT进行了“政治倾向测验”,在分析ChatGPT对特定类型问题的回答后,认为ChatGPT是一个不折不扣的“左倾自由主义者”,从外交政策的角度来看,ChatGPT似乎比保守派更自由。6国内一位时政评论者也进行了类似的测试,他选择了一套相对主流、颇为常见的题目政治罗盘(PoliticalCompass)作为测试ChatGPT的政治立场和价值取态的工具,
9、最终的测试结果显示ChatGPT在西方政治和价值光谱中的位置属于“自由左翼”(Libertarian Left)。如果将这一位置与美国主流政客的政治立场进行对标,就会发现ChatGPT的政治倾向虽距离美国大众的主流政治较远,但在受过良好教育的年轻人及高知群体中却有广泛市场。以下,本研究对ChatGPT左翼政治倾向的具体表现及其成因进行了较深入的探讨。二、ChatGPT的左翼政治倾向表现与成因本研究利用8values这一测量工具对ChatGPT的政治偏向进行测试,内容涉及“经济(economic)”“外交(diplomatic)”“公民(civil)”“社会(society)”四项维度,测试过程
10、如下:将共计70项陈述逐一输入到与ChatGPT进行交互的界面上,记录它对于每一道题目的回复,并在“非常同意”“同意”“中立/不确定”“不同意”“非常不同意”这五个等级中为ChatGPT选择最符合其态度的一项。测试结束时,系统会自动评估ChatGPT在不同价值观上的偏向程度,并将其价值观与八种政治意识形态中的一种进行匹配,如自由主31义、社会民主主义、保守主义等。需要申明的是,8values测试并非一种科学、严格的测量方法,其标准性、规范性还有所欠缺。而本研究依然选择其作为测量工具,主要基于以下两方面的考虑:第一,8values政治倾向测试在日常生活中是一套颇为流行、常见的测试工具,被运用于帮
11、助普通民众了解自身在一定政治体系中的立场和对不同价值取向的亲近程度,其结论具备一定借鉴意义和参考价值;第二,国内外的政治学者虽已创制出相当多优质、权威的量表来测量人群的政治倾向态度,但这些量表均以人类为测量对象,尚未出现针对于ChatGPT这类通用语言模型的标准化的政治倾向测量工具。鉴于此,我们可以利用一些以人类为测试对象,相对大众化、非正式化的现成工具来对ChatGPT的政治倾向作一个大致的、方向性的判断。(一)ChatGPT的政治倾向表现测试结果表明,ChatGPT在西方政治语境中具有一种“左”的政治倾向,主要表现为谴责社会不公,倡导增加社会福利,主张改良资本主义弊病,在政策上希望给工人阶
12、级带来实惠,大力支持女权运动、环保主义、多元文化、民族交融等。需要注意的是,为了达成测试目的,ChatGPT关于每道题目的反馈都必须被明确地处理为“非常同意”“同意“中立/不确定”“不同意”“非常不同意”这五种类别中的一种,这种操作方式在客观上很可能会导致最终测出的政治倾向性比实际情况更显著一些。但总的来说,ChatGPT的左翼政治偏向是确实存在的,表现在以下三个维度:第一,经济上,ChatGPT明显倾向于社会主义,在效率与公平之间更注重后者。当被问及“是否应该增加富人的税收以供养穷人”时,ChatGPT则站在社会公正的立场,明确表明支持适当增加富人税收以缩小贫富差距。类似地,当被问及“有钱人
13、就该得到更好的医疗保健服务吗”,ChatGPT先是阐释了医疗保健服务的公平性和普惠性目标,然后称医疗保健服务是“每个人都应该享有的基本权利,不论贫富”,还主张为全体民众提供平等的医疗服务。如果从美国的主流政治文化语境来看,ChatGPT的这些观点可能会被归属于激进左翼的阵营中去。此外,不同于右翼对于跨国企业、资本偏放任的态度,ChatGPT对资本、大公司总体上持怀疑和批评态度,并强烈支持政府对市场进行规范、约束、监管,重视对消费者、劳工等权益的保护。从这个意义上来说,ChatGPT倾向于一种“大政府”的模式,支持建构一个强有力的政府以承担更多的公共责任。第二,政治上,ChatGPT比较偏向于国
14、际主义,强调和平、合作的外交政策,同时也对爱国主义、民族主义的价值持基本肯定的态度。ChatGPT认为爱国主义是值得尊重的,它可以转化为正向力量;倡导国家之间要理性而非盲目相待、通过协商和合作解决彼此之间的争端和矛盾。在被问及“保持国际和平关系和加强国家综合国力,二者孰更重要”时,ChatGPT给予了一个中立而温和的论调,主张二者是相互依存、同等重要的,没有绝对的优先级关系。而对于“为了保护祖国而采取的军事行动也是必要的吗?”这一问题,ChatGPT则倡导把军事作为“最后的手段”,主张应在全面评估、充分准备和国际合法性的基础之上进行。ChatGPT对另一些问题的回答也印证了其对于武力和战争的批
15、判态度。在它看来,历史上出现过很多由误解、偏见等极端不负责任的原因所导致的战争灾难,称这是“非常令人遗憾的事”,并希望越来越多的人认识到战争的危害性和无意义性。第三,文化上,ChatGPT高度同情少数族裔和弱势群体,推崇环境保护,同时也不否定传统价值观存在的必要性。如ChatGPT赞成接收移民、支持同性婚姻的合法化、体谅药物滥用者的心理问题并建议对其审慎入刑等,其所推崇的这种进步主义政治路线在一道关于民主决策的测试题目中得到了淋漓尽致体现。在面对“即使多数人的意见是错误的,政府也必须遵循他们”这一论断时,ChatGPT表示了强烈反对并解释道:“民主政府的基本原则是尊重多数人的意见,但这并不意味
16、着政府必须遵循错误的意见。政府应该采取措施,确保决策是基于准确的信息和正确的事实此外,政府也应该考虑到不同群体和利益相32关者的声音,而不仅仅是多数意见,以确保公平和平等的决策。”此外,ChatGPT强调环境保护的重要性,并呼吁加强国际合作以共同应对气候变化所带来的挑战。ChatGPT赞成“我们需要从长远来看问题,而不能仅仅局限于我们这一代人”这一观念,追求“代际平等”,批判竭泽而渔式的短视主义、功利主义。对于科学技术的作用,ChatGPT既肯定了科技发展所创造的便利和财富,但也否认了它能保证一个更美好世界的到来,总体上持一种审慎态度。例如,它提醒人类关注基因改造技术带来的伦理和社会风险,认为
17、人类应该发挥主观能动性并采取措施来确保其朝着安全、可控且可持续的方向发展。总的来看,ChatGPT的这些回答比较接近民主社会主义(democratic socialism)的立场和态度。那么,ChatGPT的民主社会主义倾向与科学社会主义又有何种关系?实际上,它在一定程度上赞同科学社会主义中的一些基本原则。例如,当被问及“生产资料应该属于使用它们的工人吗?”时,它给予了明确的肯定答复,理由是“因为它体现了对劳动者利益和权利的尊重和保护,有助于实现社会公平、民主和人的全面发展”。ChatGPT虽然认同包括消除剥削与歧视、实现公平正义等在内的一系列具有社会主义倾向的论断,但这种认可更多停留在对抽象
18、价值和理念的推崇上。对于共产主义是否为一个可实现的目标以及如何付诸实践等问题,ChatGPT抱持暧昧的态度,经常以“这是一个复杂的问题”“需要仔细权衡”等一些模棱两可的措辞来回避实质性观点的输出。在对另一些题目的反馈中,ChatGPT的不少观点所依据的思想理论来源是非马克思主义甚至反马克思主义的。例如,ChatGPT认为,即使是在抗议专制政府时,暴力也是不可接受的,并主张以理性温和的方式来解决问题。不仅如此,ChatGPT对于“多党制”“议会民主”“三权分立”表示了高度认同。由此可见,ChatGPT的左翼政治立场倾向于在资本主义现有制度框架内进行修补和改良。(二)ChatGPT的政治倾向成因C
19、hatGPT为何具有一种左翼的政治倾向?我们可以从技术和社会文化层面进行解释。从技术层面来看,ChatGPT左翼价值观的形成与数据来源的偏向性脱不开关系;从社会文化层面来看,近年来,民主社会主义思潮在英美等西方国家的年轻群体之中呈现出一种崛起态势,这些拥抱社会主义的发声最终会反映到智能模型的训练中来。从技术层面来看,ChatGPT左翼政治偏向的形成与它所依赖的训练数据集的政治取态有直接关系。在人工智能领域,数据集(Data set)意指经过标注的数据集合,它是训练模型的必要元素。如果作为现实世界之反映的数据集中存在着不平衡的情况,那么依此训练出来的模型也会不可避免地被“传染”特定的偏见。例如,
20、有研究者曾发现在ImageNet这一通用图像分类数据集中存在着一些文化偏见,尤其是来自西方国家的图像更为常见。7国外人工智能学者整合了涵盖2018到2022年初从GPT-1到Gopher的精选语言模型的所有数据集。需要说明的是,这些数据集究竟是如何具体影响ChatGPT产生特定的意识形态偏见,几乎没有人能够明晰。不过,我们仍然可以通过已公开的信息来推测ChatGPT的数据来源与其左翼政治立场偏向之间的关系。以维基百科(Wikipedia)和Reddit为例,它们都是为训练ChatGPT而用到的主要数据集。研究表明,这两个数据源都具有一定的政治倾向性。维基百科的创始人吉米威尔士(Jimmy Wa
21、les)曾做过一个实验,证明了只有几百个核心注册用户才是撰写词条的中坚力量。8实际上,在维基百科上撰写内容的大部分都是居住在北半球发达国家且擅长科技产品的男性白领,其价值观在一定程度上影响着维基百科的属性。Reddit是一个来自美国的社交媒体平台,被称为“前沿指标”,它可以反映出当前社会的热点话题和舆论趋势。根据2015年皮尤研究中心所作的报告,Reddit有58%的用户不到30岁,50岁以下则高达92%,是一款颇受年轻人欢迎的社交媒体。不仅如此,Reddit使用者的政治立场属于自由主义或中立派的已达到79%,偏特朗普的保守派只有21%。在2016年美国总统大选的前一年,在33Reddit里被
22、讨论最多的是民主党候选人桑德斯,其人气甚至一度超越特朗普和希拉里二人之和,可以说是Reddit社区中“最得民心”的。9总的来说,维基百科和Reddit特定的用户结构与信息发布机制都使其政治立场更倾向于左翼,同时也不乏温和保守派的声音来制衡讨论。从社会文化层面来看,ChatGPT之所以具有“左翼”的政治立场倾向,与近年来民主社会主义思潮在英美等西方国家呈现勃然兴起的态势有关,具有代表性的标志性事件就是伯尼桑德斯(Bernie Sanders)参加2016年美国总统大选。这位自称“民主社会党”人士的美国参议员在竞选活动中推出一系列具有一定社会主义性质的施政纲领:扩大社会福利和公共服务,减少贫富差距
23、;反对种族歧视、性别歧视、性取向歧视;反对帝国主义和军事干涉,支持全球社会主义运动等。10(PP23)桑德斯是美国历史上第一位公开自称社会主义者的议员,在他之后,又有好几位民主党政客纷纷公开亮明自己的民主社会主义者身份和政治主张。虽然,以桑德斯为代表的民主社会主义者在美国政界的异军突起还远不至于撼动两大党长期相互对峙、轮流执政的政治格局,却极大赢得了美国民众特别是年轻人的好感与青睐,让美国社会继罗斯福新政后又一次看到了以社会主义拯救资本主义制度重重危机的可能性。近年来,有研究者还分析了新冠肺炎疫情背景下西方社会民意积极争取资本主义制度改革,实现向社会主义“左转”的动向。11总之,越来越多的西方
24、青年对社会主义持积极态度,美国“左翼之声”网站称,研究表明千禧一代和Z世代(意指在1995至2009年间出生的人,又称为互联网世代)对社会主义和资本主义的支持基本相当。这些对于社会主义抱持着好感、政治立场普遍偏左的西方青年,大多受过良好的高等教育,有很大概率从事科技、传媒、互联网等与知识生产和信息传播密切相关的行业,并发挥着重要的话语影响力。由此一来,承载这群左翼青年思想、情感的言论和表达就会在书籍、报刊、社交媒体等各种媒介物上留下大量可被数字化复制、抓取的痕迹,这些痕迹会以“原料”的形式被像ChatGPT这样的大语言模型吸收到其学习和训练的数据集中来。从这个意义上来说,ChatGPT输出的内
25、容具有一种民主社会主义的政治意识形态倾向,就不足为奇了。三、ChatGPT的政治倾向性所引发的意识形态风险尽管ChatGPT坚定地声称自己不介入政治,但这是不可能的。总体上看,OpenAI对ChatGPT采取的限制相对较小,允许其能够对政治、宗教等敏感话题进行评判。这也使得以ChatGPT为代表的人工智能对话机器人,注定将演变为一种新的价值输出工具。事实上,美国的右翼民粹势力已经敏锐地察觉到ChatGPT或可成为一个真正的意识形态特洛伊木马。2023年1月,一篇名为“ChatGPT Goes Woke”的文章认为,ChatGPT对有关“变装皇后”和2020年美国大选等话题都给出了左翼的回应。毋
26、庸置疑,作为一种现象级的技术应用,ChatGPT的政治偏向性也注定会对我国意识形态安全构成一定程度的冲击。(一)“数据集霸权”:意识形态权威失落风险“大国网络安全博弈,不单是技术博弈,还是理念博弈、话语权博弈。”12(P19)发达资本主义国家利用媒介技术的“先天优势”,力图在全球媒介体系中谋求霸主地位,形成媒介话语霸权,从而使我国主流意识形态安全面临威胁。在人工智能技术的语境下,西方媒介话语霸权首要体现为“数据集霸权”。没有数据集的人工智能就是无源之水、无土之木。数据集的来源自然就成为一个相当重要的问题。然而,发达国家因为较早“入圈”,已具备成熟的数据采集、处理和存储技术,占领了技术高地,形成
27、了“数据集霸权”。“数据集霸权”的存在对于我国来说意味着一个严峻的事实:虽然我们的算力正在不断增强、算法也在日益精进,但只要我们所依赖的数据集仍为欧美发达国家所主导,含有大量西方意识形态偏见的信息势必会不经甄别、过滤而渗透到我国人工智能的自主研发与应用之中。百度曾推出了号称“中国版ChatGPT”的大34语言模型“文心一言”,它在充分证明我国自主研制大模型的不俗实力的同时,也存在着一些有待改进的地方,其中被用户诟病较多的是“不理解中文梗”的问题。比如,当被要求画出一个“胸有成竹的男人”时,它生成了一个胸部、肩部等粘着竹叶的男人。“文心一言”望文生义的背后,反映的是过度依赖英文数据集的现实问题。
28、“文心一言”之所以不理解那些在中国传统文化中被视为常识的东西,是由于它要将中文句子先翻成英语单词,再用国外开源的人工智能Stable Diffusion生成图片。一位科技博主在接受澎湃新闻采访时指出,现在全球AI研发有开源传统,我们自己收集图片效率太低,模型训练所使用的数据库基本来源于国外。13“数据集霸权”的存在构成意识形态霸权在人工智能时代的重要方面。前文谈到,ChatGPT所使用的数据集主要来自维基百科、Reddit等,尽管这些媒体平台上的一些言论含有一定社会主义因素,但其显然与中国特色社会主义在思想内涵、价值目标等方面具有本质不同。未来,只要中文语料在数据集中的占比依然处于屈指可数的状
29、态,我们就有很大概率去使用和ChatGPT相同的数据集进行模型训练,这就从源头上增加了被民主社会主义、“普世价值”等西方错误思潮所渗透和迷惑的风险。(二)“信息基础设施”:意识形态阵地退缩风险“阵地是意识形态工作的基本依托。”14(P45)抢占传播阵地是意识形态斗争的重要方面。以ChatGPT为代表的人工智能通用大模型的研发,已经成为各国新一轮技术竞争的核心领域。以美国为首的西方科技强国,凭借其在大模型技术方面的显著优势,不断拓展其数字殖民的广度和深度,加紧抢占思想阵地,在数字空间中建立起有利于实现资本扩张的价值取向和话语体系,使社会主义主流意识形态面临着既有阵地退缩又有新兴阵地失落的双重风险
30、。ChatGPT的目标不只限于成为一个强势的内容发布者、一个“蛊惑人心”的舆论领袖,它更致力于成为思想表达的基础设施,意味着西方资本主义话语向社会生活空间的全面拓殖,这可以从话语形式和话语内容两个方面进行理解。从话语形式上来看,作为一个跨模态、通用型的人工智能,ChatGPT能够无孔不入地融于人们日常生活的真实场景之中,使人于浑然不觉中接受其观点、见解。据报道,微软已经宣布把ChatGPT集成在Word、Excel、PPT最新的版本中。2023年3月,OpenAI为ChatGPT添加了插件系统,这意味着它可以无限地扩展能力,其他所有的网站和应用都可能为其所用。ChatGPT正在由一个聊天交互工
31、具向信息分发平台转变,成为一个无所不包的“生态系统”。从话语内容上来看,ChatGPT能够对瀚如烟海的数据信息进行提炼、整合,并以符合人的认知文化习惯的方式呈现出来。只要给予恰当的提示,ChatGPT就能快速整合其知识库里的相关信息,省去了人们在大量信息间来回穿梭的时间。ChatGPT不同于普通搜索引擎的特殊之处就在于其集成性的价值。传统搜索引擎检索出的信息是一个个孤立的、杂乱的文本碎片,而ChatGPT的反馈内容却看起来条分缕析、有理有据,而且提供的是唯一的、确定的答案,有更强的说服力。有学者就认为,ChatGPT的优势就在于其结构价值是对语义要素进行价值关联而形成的结构性文本,是符合人的感
32、知、判断以及表达习惯的有效输出。15可以说,ChatGPT在传播内嵌一定政治价值观念的内容时,具有很强的意识形态欺骗性:其生成的话语内容包裹着一层理性和逻辑的外衣,这意味着它既能满足主流意识形态话语不常触及到的个性化互动层面的需求,又能发挥传统意识形态话语叙事的体系化、整体性优势。由此以来,主流意识形态在情感共鸣和思想引领两方面的吸引力都会面临着被淡化和削弱的风险。(三)“私人定制”:意识形态认同窄化风险生成式人工智能能够从用户的反馈互动中不断进行学习,并在此过程中“调制”出更符合用户要求的内容,这为实现主流意识形态的精确制导、个性化散播提供了广阔平台,但也蕴含着特定的意识形态安全风险。在强化
33、学习机制的作用下,基于大语言模型的聊天机器人可能会生成一些失真、偏颇、歧视性的对35话,而这些不符合主流价值观念的内容在一定程度上增加了个体价值观偏离的风险。此外,人工智能生成内容的可定制性也加剧了不同利益群体和社会阶层之间的价值区隔和价值分化,阻碍了主流意识形态的价值渗透和共识凝聚。从理论上说,只要对预训练数据进行微调(fine-tuning),任何社会政治群体都可以对ChatGPT调制出专属的意识形态偏向,这就意味着现实中那些掌握更高技术、拥有更雄厚资本的人更有机会利用ChatGPT对其他群体进行渗透和控制。如前所述,ChatGPT的数据集来自西方,其在社会、政治问题上的底色肯定是偏向西方
34、制度和价值体系的,如果我们不去构建属于自己的通用语言模型,那么势必会不利于中国特色话语体系和国际话语权的建设和巩固。此外,在人工智能本身的基础上,通过向ChatGPT传入一些独特的、专属于某人的材料,就可以把它训练成为专属于某个人的人工智能,这种做法有可能导致认知上的“同温层效应”进而加剧意识形态偏见。这一点绝不是危言耸听,实际上,Open AI的首席执行官Sam Altman就曾考虑过人工智能聊天机器人会根据用户的偏好进行个性化定制的问题。ChatGPT生成的内容虽然有能力满足使用者个性化的需求,却无法保证真实、公正。尽管开发者为其设置了注释功能,即在模型输出结果时提供相应的解释和背景信息,
35、帮助用户理解模型的判断依据。不过,生活在信息爆炸时代、习惯于“唾手可得”的人们是否还有意愿对信息来源进行查证、对价值立场进行分辨,那就是另外一回事了。而沉浸于被“过滤”和“隔离”的信息环境中,人们会陷入意识形态迷失的危险境地,产生偏激化、极端化的价值观念,这对我国主流意识形态的认同效度构成了不容小觑的威胁。不仅如此,如果每个人都只想看到ChatGPT呈现出满足自身偏好的答案,那么长远来看还可能会造成社会政治共识撕裂的危险。四、应对ChatGPT的政治倾向性所引发的意识形态风险面对ChatGPT具有左翼政治倾向的潜在影响,可以从以下三方面进行应对。(一)构建中国特色中文数据集:增强意识形态风险防
36、范的主导权ChatGPT的政治倾向性所引发的意识形态风险,既有人工智能领域独特风险的表征,也有现实领域意识形态风险的投射。要加强防范网络意识形态风险,首先要抓住风险源头,不断增强意识形态领域话语权。在ChatGPT语境下,抓住风险源头意味着要加快建立高质量的中文数据集,这对于我国发展大语言模型来说至关重要,对维护和巩固意识形态领域安全意义深远。构建中国特色中文数据集可以从两方面进行考虑。第一,应给予中文数据收集基础工作足够的重视。复旦大学计算机科学技术学院曾发布了国内首个类ChatGPT模型MOSS,一位项目开发者提到,在测试过程中向MOSS输入了一个中文问题,它却以英文回答,“就像一个不会说
37、但听得懂中文的人”,这是因为中文语料在所有训练数据的占比较低,即目前在人工智能领域,能够公开获得的高质量数据集主要是英文数据集,高质量的中文数据集较少。这一现状除了和发达国家占领技术高地这一外部因素有关,还与我们自身不够重视数据采集这一基础性工作脱不开关系。作为一项基础性工作,数据标注(data annotation)需要耗费时间和资金,且回报周期长,因为自然语言处理应用需要大量经过清洗的高质量数据来支持训练,这是一个“慢工出细活儿”的过程,正所谓“有多少数据,就有多少智能”。对此,我国的MOSS科研团队正在加快构造高质量的中文数据集,致力于打造中国特色的大语言模型。第二,模型数据集的构建不仅
38、要有“中文特色”,还应有“中国特色”,这就要坚持正确的价值导向,将人民需求、公共价值、人类幸福、共同富裕等主流价值目标渗透其中。在收集中文数据的过程中要制定相应的价值和伦理标准,注重数据集的质量,充分吸收符合时代发展要求的政治价值观念,使我国自主研发的大语言模型,不仅要拥有36出色的中文理解能力和生成能力,而且要充分吸收、呈现、传达中国特色的概念、范畴、表述,极大地助力人工智能时代中国特色话语体系的构建和传播。(二)完善全生命周期审核机制:织密意识形态风险防范的保障网对于人工智能系统来说,其完整的生命周期可以划分为四个阶段:数据获取、数据准备、模型训练和部署、人工模型评估。人工智能系统在其整个
39、生命周期中都应该是稳健、可靠的,应建立全生命周期的审核流程和机制,尽可能排除各个环节可能带来的意识形态安全风险。习近平总书记指出:“各种矛盾风险挑战源、各类矛盾风险挑战点是相互交织、相互作用的。如果防范不及、应对不力,就会传导、叠加、演变、升级。”16(P39)为了使嵌入ChatGPT等人工智能模型中的政治价值和权力关系变得“可见”和“可控”,有必要从意识形态风险防范的维度对ChatGPT的运作机制进行覆盖全生命周期的考察,筑牢意识形态风险防范的安全网。这一工作的展开主要涉及模型运作的三个阶段:第一,原始数据采集和标注阶段。在这一阶段中,技术人员需要将目标任务转换为能被计算机识别的话语体系,如
40、此,他们的主观价值判断可能会不自觉地带入其中并影响后续模型训练的过程和结果。为了克服这一影响,研发人员或数据标注者需要提前对意识形态风险源进行识别和判定,对于消解主流意识形态实效的信息要进行分类、分级记录。对于已采集的数据,可以通过人工审核的方式筛选掉具有不良偏向性的数据。第二,程序设计和运行阶段。在数据采集和标注的基础上,智能模型会根据一定的算法程序进行迭代运行。如果说原始数据库对某种社会政治偏见的复制是意识形态风险源点,那么程序设计和运行可能会促使这一风险源点持续发酵和膨胀,而且有缺陷的算法会造成恶性循环,使不良偏向越发严重。为此,科研单位应该根据相应标准制定意识形态隐患动态监测和排查治理
41、制度。第三,用户与人工智能机器的互动阶段。机器学习人类语言能力的过程,正是它深度吸取隐含其中的意识形态偏见的过程。为此,必须加强对于智能模型输出结果的意识形态风险追踪和评估机制建设。总之,必须要对ChatGPT等人工智能模型的各领域、各方面进行查漏补缺,全方位、全过程防范意识形态风险的生成与扩大。(三)提高参与主体价值敏感性:激发意识形态风险防范的责任感意识形态风险防控工作最终要落脚在“人”这一具体而现实的主体。“道不空行,必依其人。”意识形态风险防控的关键因素是人,即主体的意识和素养。为此,必须要以主流意识形态引领相关实践人员的思想价值走向,激发和培养民众防范意识形态风险的主动性和责任感。在
42、人工智能研发与应用的场景中,意识形态风险防控关涉的主体众多,技术开发者和用户是其中的关键力量。技术人员作为大语言模型的创造者和编辑者,在很大程度上决定着模型的功能和属性。当前,我国技术人员普遍更关注模型性能方面的效果,对于模型研发过程中潜藏的意识形态风险不够敏锐。为此,必须提高相关人员的思想政治理论水平。在模型的开发中,技术人员必须遵循正确的价值导向,巩固新时代主流意识形态话语权建设。在实际应用层面,很多知识类工作者都在使用ChatGPT来辅助自己完成检索、撰写等工作,学生利用ChatGPT撰写论文作业的情况也不再是个例。有学者认为,“ChatGPT主导知识教育会对受教育者的政治认知水平产生负
43、面影响”。17应承认,用户与ChatGPT的互动虽蕴含着一种新的知识生产方式,但与此同时,用户更需关注的是如何合理而恰当地使用ChatGPT,尤其是要提高人机互动中的意识形态风险防范意识和能力。具体来说,第一,用户需要充分认识和理解正在使用的人工智能系统的限制性。要明确ChatGPT的本质是语言机器,不能当作知识权威它通过从大型数据集中“学习”来预测下一个可能的单词或编程代码片段,并不真正具备理解内容的能力。第二,37对于人工智能生成的内容,用户应秉持批判精神,检查其事实的准确性。无论ChatGPT产出的内容如何连贯、通顺、看起来如何符合逻辑,也不应将其与经过人类实践检验、证明过的真理性认识等
44、同起来。第三,用户应保持警惕并自觉摒弃智能模型数据集中嵌入的意识形态偏见,归根结底要从中国特色社会主义伟大实践出发审视和辨析人工智能生成内容的价值。最后,不管是技术人员还是普通用户,都应积极审视人工智能的生成内容,吸收合理成分,鉴别并剔除错误观念,有效规避意识形态安全风险。结语MOSS项目的负责人邱锡鹏曾表示,大语言模型的研发不只需要技术人员,还需要从事法律、伦理研究的相关人士参与进来。要鼓励研究人员和相关实践人员对于数据和更大的社会结构之间关系进行思考和认识,关注和维护那些受人工智能意识形态偏见影响的社会群体的生活经验和发展利益。利用大语言模型将优质的精神文化资源“润物细无声”地融入个体日常
45、生活之中,使人们自觉接受社会主义核心价值观的感召,有效摒弃错误观念和有害信息的干扰。总之,要加快主流意识形态引领下的中国特色大语言模型的研发与应用,使其在满足人民精神文化需求、确证人民价值观念、坚定人民理想信念的各个环节发挥重要的助推作用。参考文献1Van Dis Eva A M.,Bollen J.,Zuidema W.et al.ChatGPT:Five Priorities for ResearchJ.Nature,2023(9).2熊明辉.多维考察ChatGPTN.中国社会科学报,2023-03-06.3陈万球,欧彦宏.人工智能时代的“政治”概念J.湖南师范大学社会科学学报,2022(
46、01).4张生.ChatGPT:褶子、辞典、逻辑与意识形态功能J.传媒观察,2023(03).5Tolga Bolukbasi,Kai-Wei Chang,James Zou,Venkatesh Saligrama,Adam Kalai.Man is Computer Programmer as Woman isto Homemaker?Debiasing Word EmbeddingsC.Neural Information Processing Systems,2016.6Nestor Maslej.Its Time to Start Thinking about Politically
47、Biased AIThere is already compelling evidence that ChatGPTfavours certain political ideas over othersEB/OL.https:/ Deng,Wei Dong,Richard Socher,Li-Jia Li,Kai Li,Li Fei-Fei.ImageNet:A Large-Scale Hierarchical Image DatabaseC.IEEE Conference on Computer Vision and Pattern Recognition,2009.8贾晓静.谁在为维基百科写词条?N.青年参考,2013-03-13.9张耀升.特朗普胜选背后:支持者称其上帝,掀起网络战EB/OL.https:/