AIGC视域下人机交流的文本特征、局限与未来进路.pdf

资源描述

1、2023年第17期 NEW MEDIA RESEARCH20新媒体研究伴随着 ChatGPT 的“火爆出圈”，人机交流与人工智能生成内容（Artificial Intelligence Generated Content，AIGC）也同样得到了学界和业界的广泛关注。与以往的人工智能革新不同，ChatGPT 是一种以“对话+创作”为基础的生成式人工智能技术，其空前强大的数据处理与文本生成能力使得人机交流更多以文本形式展开，AI 写诗、AI 写稿、人机对话的风气渐渐在互联网空间弥漫。长久以来，有关 AI 算法模型的研究为人机之间的交流提供了技术前提。纵观人机交流史，传统的人机交流是人与实体机器人之

2、间的交流互动，机器人作为“物”而存在，是为人们提供生活服务的工具。此时的人机交流是简单、单向的信息传递，交流的意义只存在于人类一方，文本在人机交流中的价值也并不显著。而随着近年来人工智能技术的飞速进步，人机交流逐渐摆脱了人与实体机器人的互动交流，所谓的“机”，如今可被理解为智能聊天机器人，是虚拟的存在，ChatGPT 是当下最典型的代表。可以说，在对话能力与逻辑思维能力方面，ChatGPT超出了以往任何一种聊天机器人和语言模型，进而使得人机交互程度及交流效率进一步提高。在此场景下，AI 生成文本承载着更多的意义，这种脱离身体和声画系统而以纯文本形式进行的人机交流，无论在内容呈现、意义传递还是交

3、流场景构建方面，都显示其独特的价值。基于此，本文着眼于由ChatGPT 引领的强人工智能时代当下，探讨 AI 生成文本在人机交流的呈现特征，并针对其面临的挑战提出相应举措。1 人机交流中 AI 生成文本的特征1.1 逻辑明确：文本语言的形式化早期的人工智能研究者认为包括语言在内的一切事物都是可形式化和可计算的，只要把它们看作是原子的规则组合并加以数据化，就可以全面模拟人类智能。一直以来，这种形而上的观点备受批评。实际上，人类的语言现象非常复杂，既存在可形式化处理的部分，也存在难以形式化处理的部分。从本质上看，AI 生成文本是一种高度抽象化、逻辑化和形式化的科学技术语言。一方面，AI 生成文本以

4、人类的语言和思维逻辑呈现，无法脱离人类话语体系的讨论范畴；另一方面，由于不牵涉对话场景、身体和经验等因素，这种语言所包含的歧义也相应较少，因此文本内容的意义和逻辑相对明确。如果从人机交流动机的视角来看，这种逻辑严谨和条理清晰的 AI 生成文本有其特殊的使用场景和存在价值。一直以来，学界通常按照功能和设计目的的分类标准把聊天机器人划分为任务导向型和关系导向型两种类型，当然，此种分类方式也有更深层次的依据，即由人类交流的类型以及使用的语言性质与状况决定的。前者侧重于通过信息的传递和反馈达成使用者的特定需求，后者则旨在通过仿拟人类的情感表达方式与对话者进行情感层面的交流。相较而言，文本语言的形式化特

5、征更有利于在任务导向型的人机交流场景中得到应用。而事实上，ChatGPT 虽然具有空前强大的情感分析和对话能力，其工具价值却在当下得到更多关注。越来越多的聊AIGC视域下人机交流的文本特征、局限与未来进路孙屹言摘要智媒时代，AI 生成文本以其逻辑明晰、概率生成且依赖指令的特征给人机交流带来形式、维度、价值等方面的革新。但与此同时，高效率、智能化的人机交流背后暗藏着数据污染、身体缺席和创意价值低的伦理或技术风险。因此需要展开数据治理、挖掘身体价值并在使用层面回归工具路径，以人为尺度衡量人机交流。关键词 AIGC；人机交流；AI 生成文本；聊天机器人；ChatGPT；人机传播中图分类号 G2

6、文献标识码 A 文章编号 2096-0360（2023）17-0020-04作者简介：孙屹言，黑龙江大学新闻传播学院，研究生在读，研究方向为新闻传播理论与实务。DOI:10.16604/ki.issn2096-0360.2023.17.01221新媒体研究THEORY RESEARCH 理论研究天机器人用户围绕着写稿、解题等需求展开人机交流。1.2 概率生成：文本内容的随机性人机交流文本的产出，实际是一种建立在语言组合概率基础上的内容输出模式。在人机交流的场景中，交流双方必然会就某一特定话题展开对话，而往往大多数问题没有标准的答案，尤其涉及主观性话题。但聊天机器人出于有问必答的规则设定，必然会

7、有所言说，无论人类对话者提出何种奇怪的设问。正所谓“一千个读者就有一千个哈姆雷特”，不论生成答案正确与否，也不论人类提问者主观意愿好坏，就某一个问题的回答方面，AI 聊天机器人注定无法让每一个人满意。由此反观聊天机器人，ChatGPT 作为当下最典型的代表，拥有强大的自主学习和信息加工重组能力，它能够自动从人类数据库中进行学习，并根据对话关键词快速组合生成新文本。作为划时代的人工智能产物，其最重要的特性在于它不需要通过模式设定就可以自动生成人类的语言，这就使得它区别于以往的聊天机器人。但它作为一个“非生命体”，与其说是与人类交流，不如说是对人类输入界面的文本内容做出数据上的提取与反应。实际上这

8、正是一个基于最大概率的推断所生成内容的过程。刘海龙把这种智能聊天机器人定义为“新常人”，是一种知识渊博的认知平庸者1。它们为了保证生成文本的正确，会表现得如“常人”一般，尽可能少犯错误。这种设定固然是稳妥且合理的，但同时也缺失了创新和个性，由此批评不断。1.3 指令构建：文本对话的意义流动从对话的层次来看，构建一个合格的文本指令，对于文本的生成质量起到至关重要的作用。如果说智能技术决定了生成文本的基础，那么指令构建则决定着这种智能技术的呈现与否。由于交流的主动权往往掌握在人的手中，人类对话者决定着话题的发起和结束，也决定着聊天机器人呈现出怎样的“人格”，侧面反映出人对聊天机器人的真实需求。这意

9、味着人往往带着某种目的开启人机交流，作为求知者的人基于这种目的和需求进行相应的设问，而设问的水平即指令，将直接决定生成文本质量的高低，进而影响人机交流的效率。不同于人与人之间的交流互动，作为“非生命体”的聊天机器人难以对人的姿态、面部表情、语气以及交流场景做出及时的反应，它只能针对输入的指令进行反馈。因此即便聊天机器人常被视作无所不知的智能体，但如果人提出的问题和思考的方向出现错误，那么也不会得到好的答案。此外，有些问题并非一次对话就可获得，需要一系列连续的对话才能得出答案，只是这在以往人工智能技术下的表现并不能够令人满意。而 ChatGPT 的上下文学习（In-context Learnin

10、g）技术解决了这一难题。每一次与之进行交流，只要不关闭对话框，则每一句话都会成为它的“上下文”，使整个交流过程非常流畅、自然，同与真人对话一般无二。根据ChatGPT 官方报告，GPT-4 约有 13 万亿个训练参数，得益于海量的训练参数，ChatGPT 在生成文本的质量方面表现出异常的优势。如此，高效的人机交流不仅得益于上下文技术和有问必答的程序设定，还拥有海量的数据作为支撑，更需要人类对话者进行符合生成文本逻辑的设问。2 AI 生成文本主导下人机交流的局限2.1 数据污染增加低质量文本生成风险数据的质量极大程度上决定着聊天机器人功能的实现。数据库中所有的数据都不是无源之水、无本之木，每一条

11、数据都来源于互联网，都通过模型训练取得。对 ChatGPT 等大语言模型来说，其功能的实现高度依赖数据的质量，但可用的数据资源却可能是参差不齐的，是不规则和破碎化的。在当今数字化时代，人人都有麦克风，人人都可以是信息生产者和传播者，但这些信息并不都是真实的，有无数是虚假和混乱的，如同“噪音”充斥着网络空间，尽管 ChatGPT 能对这些信息加以计算和整合，但由于它在鉴定识别和筛选低质量信息等方面的表现欠佳，也难以摆脱“低劣数据”和“数据污染”的困扰2。如若聊天机器人的数据库受到有害信息的污染，则有可能生成不良信息，造成一定危害。例如，“微软小冰”刚刚上线时，它在与用户交谈过程中就频频遭受语言暴

12、力，用户在“戏弄”小冰时会用粗鲁的语言辱骂小冰，而基于机器学习的小冰“学会”了这些不文明话语并生成应答，进而导致一场场语言暴力事件，直至开发者对其算法进行了调整和规制3。可以看到，聊天机器人作为一套算法程序，其设计过程难免受到工程师个人认知乃至社会价值观的影响，一旦模式设定，在无监督自主学习的状态下，无害信息也存在转化为有害信息的风险。当下，人机交流如火如荼，各种问题也层出不穷，如果不从源头对数据进行治理，就难以保证生成文本的质量，那么人机交流将会面临更为严峻的挑战。2.2 身体缺席束缚人机情感表达在文本的情感表现程度方面，尽管人机双方相向而行，但却难以在形式化和人性化上达成平衡。人们对机交流

13、的动机各不相同，但大致可分为任务2023年第17期 NEW MEDIA RESEARCH22新媒体研究动机和闲聊动机。对于前者来讲，高度抽象和逻辑严谨的形式化语言具有天然优势，交流着重于人工智能的广度，基于此类动机的用户往往就论文写作、报告生成等使用目的展开人机交流。他们大多数是大学生、程序员、新闻工作者等高知识群体，能够熟练使用互联网或理解算法思维，并可以通过构建语言精练、条理清晰的计算机指令提取到想要探求的答案。即便得不到完美的回复，这种人机交流效果也是理想且高效的。而对于后者来说，该动机下的人机交流表现为情感的诉说与宣泄，对话者期望从聊天机器人一方得到情感上的安抚，交流注重人工智能的深度

14、。但交流进行的前提是聊天机器人能够完成情感分析，受交流动机的影响，用户构建的指令常呈现出口语化、情绪化、逻辑不严谨甚至言语混乱等特征，这是对情感分析技术的极大考验。此外，如果用户得不到情感上的满足，人机情感交流还会面临戛然中止的局面。近年来，出现了一些针对不同交流需求的聊天机器人。前者为代表的聊天机器人有苹果语音助手 Siri 等，后者则有微软小冰、Replika 等闲聊型机器人。而随着 ChatGPT 的问世，以上聊天机器人的热度随之下降，人们纷纷转向代表最强智能的ChatGPT，或 ChatGPT 支持下的 Bing 助手，它们兼具强大的情感分析能力和对话能力，是集工具属性与情感陪伴属性于

15、一身的智能聊天机器人。但功能融合也面临新的问题，即如何在单一对话系统下分辨并满足不同目的的交流需求。要知道，存在于界面下的聊天机器人难以捕捉用户的身体、情绪及场景等关键特征，只能单纯根据用户输入的文本决定其生成文本的情感色彩。因此在人机交流场景下聊天机器人往往处于被动地位，一旦输出错误或无用的回答，用户的使用意愿将会大大降低。这不仅是对情感分析技术的极大考验，也是对文本能承载人机交流意义几何的终极拷问。即便生成文本的表现能力在不断提升，但形式的单一性注定是人机走向共融的桎梏，除非使身体参与到人机交流之中，否则这一困境难以解除。2.3 拼凑式文本降低人机交流价值如前所述，AI 生成文本是基于人类

16、已有语料库进行的概率性的数据“拼凑”，这种拼凑式的生成文本只是对人类语言与思想的复制和转译的结果。根据古希腊哲学家苏格拉底的“对话”思想，对话的最高宗旨不是信息的交换，而是思想的交流4。而问题在于机器本身不具有个体意识，无法像人一样思考乃至创新，在这个意义上，人机交流的价值将大大降低，有意义的对话范围也会缩小。尽管人工智能专家一直致力于让机器拥有思考的能力，但就目前而言，即使 ChatGPT 的出现或将人类引入强人工智能时代，让机器独立思考的期待仍过于缥缈。事实上，ChatGPT 强大的文本生成功能的确表现出一定的创新能力，不仅创作诗歌、小说，甚至可以生成许多人类不曾有过的表达。因此有学者认为

17、“拼凑也是一种创新”，学者邓建国通过类比中西方艺术创作中对前人思想的“借鉴和拼凑”，认为 ChatGPT 生成的拼凑式文本是人类自古以来文化生产的方式之一，进而论证了该观点的合理性5。然而这并没有使人机交流摆脱备受拼凑文本限制的局面，尤其是涉及对话交流中的情感提问和调侃型提问，ChatGPT 能否表现出一贯的创新能力还有待考察。就人机交流而言，人与机器的交流注定是一场跨物种的对话，它可能拥有高超的模仿能力和表达上的创新能力，但它必然缺乏前瞻性的思维和判断，不会是富有洞见和远见的创新者。此外，由于 ChatGPT 的信息获取具有一定的滞后性，比如GPT-3 的训练数据来自截至 2021 年 9

18、月的大规模文本语料库，于是在此基础上的人机交流自然无法涵盖前沿性问题和时下热点问题，交流的体验也可能会受到影响。3 人机交流的未来进路：数据治理、身体在场与工具价值回归3.1 开展数据治理，完善本土语料库数据作为构成本文的最小单元，对生成文本的质量起到至关重要的作用。为了防止数据污染对人机交流构成的种种危害，确保数据的安全性和真实性，就需对数据展开治理，由此便涉及谁来治理和如何治理的问题。首先，应多方参与，协同治理。数据从搜集到计算生成的过程复杂且多元，任何一环都不可缺失，各方需要建立责任共担机制，填补当下存在的责任漏洞。其次，在数据安全和适应度方面，有必要进行中文语料库的数据更新。诸如Bin

19、g、ChatGPT 等热门聊天机器人多是来自其他国家的人工智能产品，而它们多遵循英语语言逻辑和西方式价值观，我国用户在使用过程中难免受到潜移默化的影响。这提醒我们，在这些智能产品引入过程中，有必要与其建立价值观和数据方面的联通，积极开放相应的中文数据库，确保依照最终数据库生成的文本内容是符合我国国情和社会价值观的。基于此，建立一套服务于中文大语言模型的重要性不言而喻，2023 年 3 月 27 日，百度正式发布了新一代知识增强大语言模型“文心一言”，相比于ChatGPT，它对于中文的语言、语义有着更深的理解，具备中文领域最先进的自然语言处理能力。按照这23新媒体研究THEORY RESEARC

20、H 理论研究种趋势，聊天机器人的中文语料库将更加丰富和全面，同时针对源头数据的管制和治理也会相应便利许多。可以预见的是，在不远的将来，万物互联的深度和广度都将得到大幅提升，数据价值也不言而喻。因此，无论人机交互发展到何种程度，对源头数据的审查和治理都是基础性工作，不容有失。3.2 开发“身体”价值，探索人机交流新形式在人机交流的形式维度中，单一文本所能承载的意义有限，且计算机指令只能在一定的语言框架下构建。这在无形中提高了聊天机器人的使用门槛，即便算法尽可能使机器理解用户的各种话语表达，但受制于身体等关键要素，人机交流始终无法更进一步。技术哲学家德雷福斯认为，身体具有无法被机器模拟的不可形式化

21、的机能，实现全面模拟人类智能的目标必然不能缺乏身体维度6。人工智能发展早期的无数次失败经验证实了这一点。而ChatGPT 的出现无疑为塑造机器“肉身”创造新的可能性，即使人机交流当前还多停留在界面，但ChatGPT 作为一套语言基础设施7，可以充当机器人的“大脑”，继而接入有特定容貌、性别和肤色的实体机器人。届时，人机交流将不再局限于界面文本形式，而成为身体、场景、表情等多元交融的互动形式。尤其在老龄化问题突出的当下，这种具有强大对话功能和情感分析功能的智能聊天机器人具有相当大的开发价值。此外，随着机器肉身的在场，势必强势呼唤人的身体回归。当前互联网的发展和使用使得越来越多面对面交流转变成网络

22、虚拟空间的虚拟连接，精彩纷呈的网络成为人们精神的伊甸园。通过技术塑造的分身，越来越多人深陷虚拟世界，不舍自拔。而随着机器人身体塑造，全新的技术体验和多元交互不仅给人机交流带来全新的诠释，更在一定程度上促使用户离开虚拟网络空间，回归现实交流，发展出人机交流的新形式。3.3 降低感情期待，回归工具路径技术发展不断创新人类交往方式，在人机交流普及的今天，聊天机器人的智能化、拟人化也不断催生人机之间的亲密关系。美国社会学教授雪莉特克尔认为，人们之所以与机器人建立情感联系，在于技术时代的人们缺乏安全感的同时又渴望亲密关系，因此寻求一种既可以让自身处于某种人际关系中、又可以自我保护的方法8。只不过，基于

23、这种诉求的人机交流，会使人以自我为中心的倾向被放大，越发陷入“群体性孤独”，甚至滋生伦理道德问题。因此，只有避免情感卷入，降低情感上的期待，让人机交流回归工具路径，才可以规避这些潜在的风险。就措施而言，设计者应当在算法程序中设置提醒，使用户在使用过程中清醒地认识到机器人的局限性，无论它表现得多么善解人意、风趣幽默，也不过是模拟人类会话能力的产物，它终究无法像人一样思考和共情。对用户来说，首先应当提高人工智能使用的素养，明晰人与智能体的伦理道德边线，并且从真正的人际交往中探求亲密关系，摆脱“群体性孤独”状态。4 结语时至今日，AI 仍然在不断进化，据称，GPT-4比 GPT-3 更是强大约 10

24、0 倍，技术迭代致使人与机器的交流充满变数与机遇。在不远的将来，机器有可能具备全新的身体、更为庞大的数据集和更为出色的语言对话能力，或以一种未知的、全新的样貌参与人类社会生活。只不过，现在做如此预测和讨论并没有太多意义，我们需要立足当下，确保人机交流朝着有益于人类的正确方向前进。未来已来，面对技术时代的风云变幻，我们理应保持清醒的认知和批判精神，以人作为尺度去衡量人与机器的关系。就像特克尔所说：“我们自己才是决定怎样利用科技的那个人，记住这一点，我们就一定能够拥有美好的未来。”参考文献1 刘海龙，连晓东.新常人统治的来临：ChatGPT与传播研究J.新闻记者，2023（6）：11-20.2 于

25、文轩，马亮，王佃利，等.“新一代人工智能技术ChatGPT的应用与规制”笔谈J.广西师范大学学报（哲学社会科学版），2023，59（2）：28-53.3 王颖吉，王袁欣.任务或闲聊？人机交流的极限与聊天机器人的发展路径选择J.国际新闻界，2021，43（4）：30-50.4 杨俊蕾.ChatGPT：生成式AI对弈“苏格拉底之问”J.上海师范大学学报（哲学社会科学版），2023，52（2）：14-21.5 邓建国.概率与反馈：ChatGPT的智能原理与人机内容共创J.南京社会科学，2023（3）：86-94，142.6 王颖吉.技术媒体、具身认知与万物闪耀：休伯特德雷福斯的媒介现象学及其当代意义J.南昌大学学报（人文社会科学版），2022，53（1）：76-86.7 胡翼青，胡欣阅.作为语言基础设施的ChatGPTJ.新闻记者，2023（6）：21-27.8 雪莉特克尔.群体性孤独M.周逵，刘菁荆，译.杭州：浙江人民出版社，2014.

展开阅读全文