数字人文的本体论反思——围绕离散主义的陷阱_张墨研.pdf

资源描述

1、197数字人文的本体论反思围绕离散主义的陷阱张墨研（中国艺术研究院马克思主义文艺理论研究所，北京 100012）内容摘要：数字人文的本体论反思始终是数字人文发展中较为薄弱的领域，而理解数字人文概念本身又是深入理解数字人文及其批判的首要环节。首先，应充分意识到数字人文所依赖的计算机科学及其相关计算科学的数理基础，这一点在莫莱蒂的世界文学猜想理论和远读中已显露端倪。数字人文所依赖的计算机技术拥有离散数学的数理基础，由此数字人文研究需警惕离散主义的陷阱。而与此相关，对计算技术应用于人文学科的过度信任又可能造成强计算主义的误区。最后，数字人文又面临解释自身方法论逻辑连通性的任务。而这三个方面的难题又

2、正由离散型的认识论所衔接。关键词：数字人文；莫莱蒂；离散数学；离散主义；强计算主义。作者简介：张墨研，文学博士，中国艺术研究院马克思主义文艺理论研究所助理研究员，主要从事后殖民理论、马克思主义美学、西方文论前沿研究。中图分类号：I0文献标识码：文章编号：1008-2026-（2023）03-197-15“数字人文”的概念问题是其本体论反思的重要环节，也是“数字人文批判”的核心主题之一1。数字人文的概念在内涵和外延方面均被不同的论争所牵绊，言人人殊、莫衷一是，关于这一点，甚至有“好事者”建立了一个独特的网站“http:/ 布鲁格（Niels Brgger）所认识到的那样，对这一“偏正短语”的修

3、饰部分却几乎从未加以过问2，如果说中心语“人文”可以以“约定俗成”的方式理解，那么以当下数字人文概念意涵的含混状态而言，反思的第一步理应指向“数字”。许多学者对这个未加过问的部分的认识同样五花八门，“数字”的具体所指既可以是“网络和计算技术”3，也可以是“媒介的数字化进程”4，甚至就是“数据”（data）本身，但细究起来，不论从历史维度还是从科技发展的逻辑上看，理解数字人文（Understanding Digital Humanities）一书的作者大卫贝里（David M.Berry）对这一点的说法更为直白和确凿，“数字人文是将计算机技术应用于人文研究的前沿学科”5。不过，上述诸解释也并非

4、误认，这其中既有时代发展的因素，也有方法论认同的关系，但归根结底，“数社会科学论坛2023/3 学科新探DOI:10.14185/ki.issn1008-2026.2023.03.018198社会科学论坛2023/3 学科新探字人文”所依赖的“数字化”是根源于计算机的出现。那么，值得反思的问题就落在了与计算机有关的“数字”究竟所指何物。此外，在处理世界文学和“远读”等问题时，学界较为一致地指出了美国文学理论家莫莱蒂与数字人文的关系，不过，在这样的描绘中，从莫莱蒂的文学理论向数字人文的科学逻辑的跳跃通常是描述性甚至想象性的，被忽视的则是莫莱蒂的数学想象与数字人文的深层关系，简言之，所谓的“莫莱蒂

5、远读数字人文”的脉络究竟为什么会发生？而对这一点的分析将为我们理解上述问题提供必要的前提。一、莫莱蒂、数字人文与离散数学仅就大陆学界，已有许多学者解释了莫莱蒂文学理论对数字人文整体发展甚至诞生的深远意义6，也同样有学者描绘出了数字人文的基本理念对莫莱蒂文学理论的巨大价值7。具有代表性的分析来自都岚岚，她将莫莱蒂所建立的“远读”方法和目前数字人文中的“远读”进行了区分，指出前后者之间的差距便是数字技术8，但这一区分可能忽视了莫莱蒂在数字人文发展史中的作用及其个人思想的转变。赵薇的文章对这一转变的实质描绘得更为清晰，在数字时代的“世界文学”研究：从概念模型到计算批评一文中作者指出，莫莱蒂在对世

6、界文学猜想和再猜想中提出的“世界文学猜想”议题引起了学界的广泛论争，但在“左、右两派的激烈批评”中更多的问题指向莫莱蒂“世界文学猜想”的方法论“远读”，此后“被逼上梁山的莫莱蒂，开始利用大量现实数据，以一项项量化的形式主义研究，向学界普及他所谓远读的要义”9。这之后，莫莱蒂在2005年的图表，地图，树图：文学史的抽象模型（Graphs,Maps,Trees:Abstract Models for Literary History）中开始了真正意义上的远读实践，赵薇认为，在这里，其对象成为了“实存而非观念意义上的文学史”10。并且在文集远读中回顾自己的猜想时，莫莱蒂坦陈其早期“世

7、界文学猜想”中的理想化倾向，即对世界文学的巨量信息进行建模存在现实困难，这一认识，赵薇称之为“莫莱蒂道路”的“关键性转折”，并且认为这一拐点的现实价值就是对量化手段的呼唤，效果上表现为，“导致一个独立的文学实验室（Literary Lab）于2010年在斯坦福大学创立”11，这时，“数字人文”已经基本上不再需要莫莱蒂这个“推进器”，而得以全速前进，“由此，在闭门造车地自行摸索了十多年后，远读研究彻底汇入数字人文”12。这一阵地转进或许与研究主体密切相关，但一种研究范式的更迭已然寓于其中，而这一点同样是许多数字人文学者未加反思而自动接受的。用陈晓辉的话进行总结，“莫莱蒂远读数字人文”的连

8、通性可以简要地表述为，“距离阅读（远读）的创新之处不仅在于它把数据算法引入文学研究，而且更有意义的是，量化模型成为一种推理和分析形式”13。如果说对莫莱蒂文学理论的研究或数字人文批判中缺少对上述理论路径进行逻辑上的反思，这一问题并不能归咎于研究者缺乏跨学科批判意识，问题更多地出在莫莱蒂本人身上。首先，其“世界文学猜想”的根199数字人文的本体论反思本创新性和价值实际上是对世界文学尺度中的资本主义的政治经济学批判，而他本人在具体实践层面（以远读为代表）尚未处理好这一创新性和价值的实现14。不过，这是另一方面的问题，尽管与此处主题有着更为复杂的联系，为行文计暂时将之剥离。我们主要来看莫莱蒂的所

9、谓“绘图”趣味。在图表，地图，树图：文学史的抽象模型的“图表”部分，当莫莱蒂试图揭示文学体裁的时段性变化时，曾经考虑以代际（generations）作为切入的解释性装置，并在曼海姆的观念中，迅速识破了其中的问题。莫莱蒂的疑问是：“精神氛围的整体变化：英国小说领域在1740年到1900年之间发生了五到六次转变。但是，既然人是每天都出生，而不是每隔25年出生的，那么生物学上的连续如何被理解为离散（discrete）的单元呢？”15仍是赵薇的文章对这一问题有所把握，她指出莫莱蒂在这一阶段关注的所谓“量化史学”是关于“统计和可视化”的16，不过，赵薇指出莫莱蒂“认为什克洛夫斯基（Viktor Sh

10、klovsky）只是定性地描述了这个现象，却无法发现这个隐秘的周期规律，其实最好的解释当然是卡尔曼海姆所说的代际更替（generation）”17，这一认识与莫莱蒂的分析存在一定偏差，在原文中，面对曼汉姆对代际问题的理解，莫莱蒂使用了一个法语习语“faute de mieux”（退而求其次），并称“似乎某种代际机制（generational mechanism）是解释小说周期规律性的最佳方式，但“代际”本身则是一个非常可疑的概念”18，所以“显然，我们必须做得更好”，很难说是否是因为对自己当时的解释有所顾虑，作者的行文就在这一“口号”中戛然而止了，这个“必须做得更好”的初步方法是以一个半页纸

11、篇幅的脚注所呈现的。但无论如何，莫莱蒂在此处的解释与反思说明，尽管他确实向曼海姆借取代际概念，但因为已充分地认识到其处理对象的离散性，曼海姆从生物学角度出发的代际解释只能是权宜之计。简言之，莫莱蒂在这一细节上已展现出他对自身寻求离散工具描绘以解读离散现象的感受，而这一点是几乎所有对莫莱蒂文学理论的解读中被忽略的事实。但是，纵然没有对这一“事实”的关照，如果对现代数学学科概念和范式有所了解，我们就能感受到从“图表”到“地图”再到“树”，一个清晰的离散数学范畴是延续其中的。事实上，莫莱蒂的与“绘图”有关的文学理论基础是马克思主义，他试图将文学置于资本主义世界体系之中加以理解，致力于发掘整体性的文学

12、动态背后的资本逻辑，正是在这个意义上，莫莱蒂称其世界文学理论的研究对象为“世界文学体系”（world literary system）19，但在具体论述层面，莫莱蒂确实被这一马克思主义“总体性”的表征本身所吸引住了。这就导致了大部分学者在研判莫莱蒂的文学理论时首先将之理解为文学的绘图学或地图学，或者文学的空间理解甚至想象。仅以“树”这一图形为例，莫莱蒂在对世界文学的猜想中说，他所采纳的讲解谱系意义的“树图”是由达尔文所发明，但他并未对此究其原理。在生物学或博物学意义上，树图的使用范围从属于分类学或系统学（体系学），也就是说树图的逻辑基础是分类学或系统学认识论，达尔文所使用的树图一般被称为“

13、进化树”，而在数学领200社会科学论坛2023/3 学科新探域中，“树”则从属于离散数学的图论部分，在逻辑上意味着集合论中的等价关系，相对于集合论关系法则中的另外两个，偏序关系与函数。“进化树”在数学的图论领域或可对应一类特殊的树，即“家族树”，但两者之间仍然有着不小的区别，前者拥有次第分化的概念并将发展观念暗藏其中，而数学中的“树图”则并不以此为着眼点。简言之，在分类学意义上的树与树的“生长”性相关，而树在数学领域只是看起来像是树，这是由它的定义所决定的，树是一种连通而无环的无向图，除表现着集合论中的等价关系，还意味着它具有图的属性，而图在图论中的基本特征只是点之间的连接20，那么，如果抛开

14、了上述区别，进化树与树图之间最大的共性便是离散性。由此，一个初步的小问题是，因为对上述问题的忽视，莫莱蒂只能注意到进化树所代表的“进化论”，即“如果语言因分歧而发展，那为什么文学不呢”21，他没有意识到树的“分支点”本身可能表述的数值关系，及其所特有的离散属性。提摩西伯克（Timothy burke）在其批评文章中指出，将文学或文化史以分叉树的形式表达的一个重要的问题是，很难解释全新的形式或体裁的形成22，换言之，如果没有从属于树图的根据，其活生生的、私人化的历史性的生成过程是无法落实于“一个萝卜一个坑”的分叉图形之上的，而这段历史可能更像是发生在两个整数之间的无限小数，属于“连续性”（co

15、ntinuity）的范畴。甚至，当莫莱蒂在对世界文学的猜想中考虑到了玛格丽特科恩的“伟大的未读作品”（great unread）时，其思维定式造成莫莱蒂忽视了更多的离散量是造成不了连续性的。在对世界文学的猜想中，莫莱蒂就曾经指出过，其将文学文本以更为抽象的图示如“树”来表示，可以使人们理解“从总体到多样的过程”，而这个多样是与语言和物种同构的，它们都首先要求“地理上的间断性”和“空间上的分散”23。更进一步，莫莱蒂将这一树的结构与波浪进行了对比，并且自陈道，“树和波浪都是比喻”24，而取消本体后，实际上是以隐喻的方式直接述说其世界文学理论，那么，当他在某一历史语境中使用“树”的图绘方法

16、时，事实上已经完成了对离散型的数学工具的挪用。另一方面的问题在于，如果莫莱蒂对离散数学的引入和其对数字人文的贡献仅仅囿于其文学、社会学的宏观层面，从社会学研究的角度来看似乎是较为合理的，因为数学离散化本身是对现实事物的抽象或描述的一种选择。但是，当数字人文学者延续这一思路“在文本内部进进出出”，而往往将文本阐释学层面和社会学层面批评实践仅仅视为“新批评”意义上的文学内部与外部研究之别，或者是尺度上的整体与局部之别，甚至就是量上的大数量与单个文本之别，问题就产生了。因为实际上，莫莱蒂从未放弃过在文本内部开展“远读”，将文本本身数据化，比如他对体裁的演化进行长时段的分析，为此专门从不为英美学界所熟

17、悉的意大利本土学者的理论中借用“喻形率”来表示某一文学风格25。这也就是为什么数字人文并不满足对文学史的长时段作出回应，而同样愿意深入单一文本和某一作家的“故事腹地”之中，这时，在与“细读”的对比中定义自201身的“远读”大有超越或取代后者的趋势，数字人文研究对对象的数据化抽象是普遍的，而如果我们意识到这种抽象可能是一种离散型抽象，情况还会一切如故么？但更重要的问题不仅限于此，莫莱蒂对图形学的偏好和对离散数学不自觉的引介，在某一阶段看或许无伤大雅，但在上述“莫莱蒂远读数字人文”的延伸之中则可能造成许多问题，其根本的问题就在于，在一开始就向数学思维中的“离散型”一端倾斜，并最终以一种受到“询唤”

18、的方式发现了计算技术的价值，却忽视了计算学科背后本身的离散基础。换言之，这种询唤很可能不过是两种相同基因的相互吸引。二、离散数学、数字人文与离散主义非常具有代表性的，在笪章难著名的数字人文批判文章以计算的方法反对计算文学研究中提及了图论（也是集合论）的经典问题“哥尼斯堡七桥问题”，也就是著名的数学家欧拉以图式解释城市规划的故事，以对现实路径的拓扑学转换解决了具体问题，尽管笪章难对这一故事作出了自己的重述，其核心目的只是要说明将具体图绘作拓扑学转换的必要性前提，也就是说，“在此情况下，简化复杂性是必要的，因为你不想穷尽所有路线组合就为了了解市政规划的答案”26。在作者看来，数字人文的拓扑学运

19、用严重忽略了这种实际需要的前提，造成一种没有章法的滥用，“CLS 理解拓扑学术语宏观和局部的方式不再充满图论的理论含义在其实践中网络绘图和拓扑学可以互换并倾向于重新配置信息，以便视觉化低维同源性（相似性并非基于全部文本而是基于非常有限的文本层面）”27。而其更为根本的结论即，“计算文学研究没有能力捕捉文学的复杂性”28。实际上，笪章难引入图论对数字人文研究方法的批判是低效的，须知哥尼斯堡七桥问题的解决本身就是图论研究的开端，后者以离散型的模拟法开创了数学研究的新的范式，如果忽视了这一点，也就无法认识到，如果计算文学研究的拓扑学转换忽视了文学的复杂性，恰恰不是因为忽视了拓扑学转换的前提，而是因为

20、缺乏对上述范式的明确认知，在此，笪章难将批判逻辑复杂化了。事实上，有部分数字人文学者注意到了研究中的离散数学属性。比如，布鲁格观察到，尽管在数字人文的研究文献中很少能看到关于“数字”的探讨，但亚丁伊文斯（Aden Evens）是一个例外，后者明确地将由“0”和“1”构成的二进制视为数字技术与文化的原点，“所有数字技术的共同要素，我们称之为数字的文化、艺术和媒体的一致方面是离散的二进制代码（discrete,binary code）”29。又如，在对数字人文发展进行历史回顾时，乔安娜杜拉克（Johanna Drucker）指出：“计数，排序，搜索和查找以数字形式编码的离散且可识别的信息

21、字符串的明确实例是数字技术执行语料库语言学任务以创建布萨神父30著述索引的能力。”31如果将0和1作为计算机对逻辑理解的基础，强调的是计算语言离散性的输入端，那么在输出端，计算同样提供着离散的结果，如“计算具有压缩的效用，能够生成扁平化的喻数字人文的本体论反思202社会科学论坛2023/3 学科新探体，而且计算视觉语言的空间性趋向常常会使这种可能性最大化，即将时间从一种历时性体验转换为共时性体验，而且输出结果往往是离散的”32。正是贝里在理解数字人文的导言中对此有基本的全面描述：“数字人文还尝试考虑数字形式的可塑性（plasticity）以及它们指向一种处理表征与中介的新方式，这可以称为记忆

22、与档案的数字折叠（folding），从而使人们能够以一种全新的方式对待文化。为了调解文化对象，数字或计算设备要求将此对象转换为它可以理解的数字代码。这种最小的转换是通过社会技术设备的输入机制实现的，模型或图像在其中稳定并受到关注。然后根据许多干预措施，过程或过滤器对其进行内部转换，并以最终计算形式（通常以视觉形式）显示。这导致现实世界中的情况，其中计算是事件驱动的，并被分为多个离散过程以承担特定的用户任务文化对象。关键在于，在没有离散编码的情况下，没有文化对象可供计算设备处理。但是，在以这种方式分割档案时，必须将有关档案的信息丢弃，以便将表示形式存储在计算机中。换句话说，计算机要求一切都从日

23、常生活的连续流转变为数字网格，可以将其存储为表示形式，然后可以使用算法对其进行操作。这些理解文化的消减方法（词义）为控制记忆和档案（技术）提供了新的知识和方法。他们通过数字调解来做到这一点，数字人文科学开始将其视为问题。”33简言之，在他看来数字人文概念实际是一种“使动”表述，首先为保证“人文”被“数字”所接收和理解，要将人文“数字化”，而这一过程的第一步是以对文化对象的“离散编码”为基础的。诚然，有学者试图以其他一些方式将人文学科的研究对象更为直接地理解为数据的或由数据构成的，但正如克里斯多夫舒赫（Christof Schch）所指出的那样，在人文学科的传统研究对象中谈论“数据”是强为之辞

24、的，我们或许可以谈论一幅绘画的视觉元素本身是数据，但是“这是模拟的、非离散的数据，也就不能被分析或进行计算转换；其次，语言、文本、绘画和音乐作为符号系统所具有的向度（dimensions）是超过了物理意义上的可测量范围的，这些向度取决于语义和语用，取决于上下文的意思34。如果这一问题已经解释清楚，那么数字人文的本体论反思中应该有意识地纳入对离散问题的反思，而基于此，所需警惕的问题也就随之出现，因为对离散性的偏好或者过于强调离散性的价值可能导致一种离散主义的思维方式。我们有必要意识到，离散数学并非一个简单的数学领域或方法，而是具有范式意义的，它是对微积分范式的超越。这一超越蕴含了三个方面的内涵。

25、首先，“从数学的应用性看，离散数学具有与当代社会生产力形态更好的匹配力和适应性”35。这一点与后文中徐晋提出离散主义的经济学研究的意义是完全一致的，它意味着离散数学的范式转变符合实践与理论的辩证法。其次，“离散数学范式具有与微积分范式迥然有别的思想方法、知识领域和知识结构。微积分用连续变化的观念去对客体做出一种刻画，在许多情况下只是一种简单化和理想化”36。因为微积分的连续性从某种角度来说是一种理想化的数理认知，离散数学正是在这个层面完203成了对前者的超越，而必须注意的是，这种超越并非一种扬弃，而是一种科学研究应用层面的选择，简言之，离散数学在满足更多、更新的问题分析的应用时并不代表我们要舍

26、微积分的价值，唯一可以确定的是，“与微积分相比，离散数学的突出特征之一就是离散化的思想与方法”37。而第三个特征正是此处所引述的黄秦安的文章所重点强调的东西，离散数学使得计算机实验理所应当地成为了一个基本方法。甚至，一个有趣的数学史事实是，正是计算机的发明造成了离散数学的兴起，“离散数学的异军突起与计算机的诞生密不可分。计算机的发明是人类科技史上一次重大的创造。受到计算机迅猛发展的影响，20世纪后半叶以来，数学发展开始从较为单一的微积分主线中分离出来，离散数学的思想方法由于其与计算机的紧密联系而日益受到数学共同体的青睐”38。而这一离散型的范式革命具有两个数学理论上的必要条件，第一，是“集合论

27、的语言与方法”，第二便是“理论计算机的科学基础，特别是其数学基础的形成、发展与成熟”39。如果将上述两方面结合起来，黄秦安认为离散数学的核心就是“计算”，“计算作为离散数学核心概念的革命性演进”，而反过来，“计算机本质上是离散型的机器”40。“在计算机的发展历史中，离散数学起着至关重要的作用，在计算机产生前，图灵机理论对冯诺依曼计算机的出现起到了理论先导作用；布尔代数作为工具对数字逻辑电路起到指导作用；自动机理论对编译系统开发的理论意义、谓词逻辑理论对程序正确性的证明以及软件自动化理论的产生都起到了奠基性的作用。此外，应用代数系统所开发的编码理论已广泛应用于数据通讯及计算机中，而应用关系代

28、数对关系数据库的出现与发展起到了至关重要的作用。近年来，离散数学在人工智能、专家系统及信息安全中均起到了直接的、指导性的作用”41。简言之，“离散数学与计算机学科间关系已不是间接的、松散的关系，而是直接的、紧密的关系”42。事实上，离散数学与计算机科学的发展存在着错综复杂的关系，恰恰是因为传统数学的连续性思维无法与计算机的机器逻辑和谐共生，“离散数学的思想方法由于其与计算机的紧密联系而日益受到数学共同体的青睐。因为无论是具有多么强大功能的计算机，也只能进行有限的计算和处理有限的数据，而不能完成实在无限的过程。这样，微积分的思想和理论就不能直接用于计算机，而必须做离散化的处理，才能发挥其效力”4

29、3。众所周知，作为电子计算机先驱的图灵机的基本思路本身是对“希尔伯特数学问题”的第十个问题的回答，后者本身体现二元论的思维方式，其目的是论证数理逻辑意义上的真伪，同时，图灵机来回答这一问题的方式也是离散型的，“图灵机的控制单元以离散步骤操作”44。离散型思维和方法在其社会形式上有可能被理解为一种“离散主义”，当徐晋倡议建立离散主义的经济分析方法，其根基便是宏观经济学意义上的数字化生存（being digital），而同时，“数字生产与数字化生存是建立在信息科技基础之上的新经济现象”45。所以，提出这一新的认知方法的根本原因，是整体性的范式转变，作者称数字人文的本体论反思204社会科学论坛202

30、3/3 学科新探之为“它由离散主义本体论、认识论和方法论具体构成”46，这与数字人文的发展是有着较远距离（distant）的内在联系的。而为了理解离散主义，也是为了使其为经济分析提供更为基础性的哲学根据，作者自觉地对离散主义的数理基础作出考察。首先，他指出:“哲学上的离散与连续是相互对立的关系，离散是绝对的，连续是相对的。这也是我们提出离散主义的哲学认知前提。任何连续的实体或者事件，必然归结于离散的个体去表达或者实现，而且所谓的连续必然是建立在最小离散区间基础上的定义。数学意义上的无限连续、处处可微仅仅存在于想象而不可能存在具体事实或者事件，也就是无法具象表达。而且，任何相对连续的事物，必然是

31、某一离散集合中的个体。”47所以，关于离散主义的第一个命题是“任何连续事物，必归属于离散集合”48。其次，“由于计算机本质上就是一个离散结构，计算机网络则是在单个计算机基础上构建的计算、存储、通信等功能离散式分布的网状关联结构，因此所有现代科技研究或者商业应用都必须把问题与模型离散化以利于计算机处理运算”49。作者之所以对基于离散数学的数理基础的离散主义如此热衷，其根本在于，作者认为离散主义已经在对象的层面影响了我们的整个经济生活，那么与其形式不一致的连续型数学工具就是无效的。姑且不论这种经济学学科中的同构或一致性思想是否适用于人文学科的阐释学传统，我们至少能意识到作者这一范式的提出背后的根据

32、体现为福柯意义上的“知识型”的断裂性，简言之，作者认为社会形态至少在经济层面已经发生了根本性的变化。而离散数学因此不仅必要也确实有效，比如“离散数学作为离散主义源发性思想内核，在我们的经济生活中已经广泛应用并产生质的影响。比如逻辑的概念可以用于网络行为分析，集合论可以用于大数据分析，组合数学可以用于产品配比，拓扑学可以用于网络结构分析，运筹学与博弈论可以用于效用分析，关系理论则用于社交网络等”50。如果对数字人文研究近年来的发展有所了解，作者所排列的诸应用方式，数字人文应悉有涉猎。因为该文作者指出其“离散主义”的分析模式是一种倡议，而对于“离散主义”作为一种科学范式也不必予以直接的价值判断，问

33、题在于将这种科学范式横向移植对人文学科是否是毋庸置疑的。对此，徐晋的论证本身便有值得借鉴之处，当作者有目的地提出一种面对当下社会经济领域的新局面的数学分析工具时，第一，他首先承认范式转变的诉求和必然性；第二，他清楚地意识到这种新的计算分析的数理基础的本源。当徐晋提出离散主义时，他并没有像许多数字人文学者一样存在认同与范畴性焦虑，他直言不讳地指出“本文提出的离散主义作为一种世界观，是适应现代信息科技对人类社会的全面改造而产生的哲学思想”51，而这恰恰是数字人文长久以来的一块“心病”。如果我们将徐晋所代表的计算型的数字经济分析中经济的主题和概念替换成人文，数字人文领域迄今的表达中都缺乏一种斩钉截铁

34、的范式定论，并且如上文所述，对数字一维的学科性和科学性基础都缺乏反思，这至少说明数字人文在全球范围内如火如荼地进展中有些步履匆205匆，其对自身本体论的反思仍显不足。在陈述离散数学与微积分范式的差异时，黄秦安指出离散数学的离散化特征使其“具有可以直接处理客观对象的特征，因为任何客观事物都是有限性的存在”52，必须要说这句表达同样有其范围，当主题转移到人文学科领域，可能并没有这样一个现成的理论，即使不论客观事物究竟意味着什么，人文学科研究对象如何或可否理解为客观事物显然都是需要反思的问题。三、离散主义与强计算主义一旦我们理解了离散数学与计算机学科的关联，另一个与此高度相关的问题便浮出水面，即近年

35、来与认知科学、心灵哲学和人工智能均有所关涉而同样引起广泛讨论的（强）计算主义问题。因为“计算主义”本身往往被视为一种理念甚至学科，渐渐丧失了其中的批判性或意识形态因素，故学者开始使用“强计算主义”53以强调后一方面，这些提法除与不同学者的认识和叙述相关，只是程度和范围的区别54。诚然，强计算主义的问题在认知心理学或心灵哲学方面尤为显著，但它首先就是字面意思的对计算的高度认可，甚或趋向拜物教（fetish）的程度，所以学界一般认为这一思想可上溯至以数为世界本质的毕达哥拉斯学派。强计算主义的野心远不止于人体或心灵层面，因为它首先意味着更新一种世界观，“计算主义的世界观的形成经历了三个阶段或过程：智

36、能和心灵的计算理论的形成、生命的计算理论的形成、世界或宇宙的计算理论的形成”55。到了第三个阶段也就在整体上完成了计算主义作为一种猜想的目标，至此，甚至已不是整个世界可以由计算所把握，而是“把整个世界的本质看作是计算”56。在这个阶段，当约翰阿奇博尔德惠勒（John Archibald Wheeler）放言“万物源于比特”时也就实现了与毕达哥拉斯学派的“数是万物本原”的遥相呼应，形成一个纵贯古今的闭环，但这个线性的闭环本身是理想化的。这个看似“有始有终”的梦想已经历经复杂的历史变化，两者之间至少存在着一些区别，其中最大的差异就在于计算、数、数字、数据和比特（bit）的理解与2500年前单纯

37、的数的想象并不一致，尤其是当惠勒把数换成比特，意味着支撑其宏大叙事的基础就是计算机，（当代）计算主义的第一阶段就像数字人文的复兴一样起始于计算机的出现。所以，对数的关注并不足以说明当下的计算主义的根基和目标，而所谓“强计算主义”就是将整个宇宙都设想为一台电脑57，“科学主义的一个极端就是强计算主义，强计算主义主张包括人类意识在内的一切内容都是可计算的”，或者“强计算主义的弱点就在于认为除了计算之外，在物质、生命和心灵中，一切都是计算的东西”58。那么此处的问题就在于，数字人文是否可能掉入强计算主义陷阱？这种可能性仍与离散主义的可能性相关。正如上文所说，作为现代计算机的先驱，图灵机的计算

38、方式就是离散型的，它首先是一种离散型动力系统，这一认知方式在最为成熟“元胞自动机”的计算方式中仍数字人文的本体论反思206社会科学论坛2023/3 学科新探未改变，正是将整个宇宙视为一个电脑的康拉德苏斯（Konrad Zuse）将“时间、空间和定律”都设想为离散的59，而这种认知方式与当代物理学中关于宇宙究竟是有限还是离散的有关60，针对苏斯等人的强计算主义观点，卢西亚诺弗洛里迪（Luciano Floridi）作出批判，他将强计算主义称为“数字本体论”（digital ontology），这指的是“现实的终极本质是数字的，而宇宙是一个相当于图灵机的计算系统”61。弗洛里迪的批判恰恰与离散

39、问题有关，在他看来，是以数字还是以模拟为世界观是对经典问题现实自然是“连续的”还是“离散的”的论争史的唤醒。他将数字本体论提炼为四个方面的特征，分别是：（1）物理宇宙的本质（时间空间以及时空中的每个实体和过程）最终是离散的。在本论文的其余部分中，我们将着重讨论这一论点，同时可能附有（与之相关的）其他三个相关论点；（2）可以通过离散值，例如整数，对物理宇宙进行适当建模；（3）物理世界的演化（状态转换）可以计算为一个（预计很短）的算法的输出；（4）支配物质宇宙的法则是完全的决定论的62。弗洛里迪对这些假定的批驳是十分巧妙的，他首先指出物理宇宙究竟是连续或离散是物理学范畴中的问题，真正的问题在于，不

40、论真相如何，数字本体论一方面试图以数字对其进行把握（建模），另一方面又将之确定为宇宙的本体论，换言之，造成了循环论证的悖谬。在此，我们同样无意讨论弗洛里迪论证的正确性，他所作出的批判对我们理解数字人文的一大帮助在于，作者充分地将数字与其“服务”的对象作了区分，对本文来说，也就是将物理问题中的离散与连续和数学问题中的离散（数字）和连续（模拟）区分开来。弗洛里迪的论证对我们有两点启发：首先，数字人文概念所直接表现出的数字与人文的联结是历史性的和人为的，其间的张力是思想性基础的东西；其次，起始于图灵机理论的强计算主义本质上是一种对世界的离散型建模，这为反思数字人文的数理基础提供了参考。数字人文研究在

41、其理论层面确实往往重点关注数字和人文两个维度的相互连接、转换或翻译的问题，比如，于连隆吉（Julien Longhi）借用让默尼耶（Jean-Guy Meunier）提出的包括“概念的、形式数学的、形式计算的和物理计算机”四者相互关系的所谓“环形动力学”（cyclical dynamics），将其数字人文分析分为“概念模型”“形式模型”“计算模型”和“计算机模型”的四步逻辑，以这样的拆解实现人文研究对象到计算机模拟的通路，将其分析模型也分为四种类型，一步一步地解决上述连接63，但这样的步骤一方面并没有跳出图灵机的离散模式，另一方面，与其在这种连接中寻求不同的解题思路，是否我们有时候应“跳出

42、盒子”，“远读”这一操作，在更为宏观的尺度上考察数字人文的跨学科理性？同样有一些数字人文学者对强计算主义有所警惕，这与数字人文在反躬自省中所试图保持的人文属性有关，比如有学者提出要放慢阅读速度，以使得“人文干预”在数字人文研究的进程中不断实现，从而可以对认识论中的计算主义因素作出反思64。但类似的反思常常在对于计算技术的信赖和“乱花渐欲迷人眼”的计算工具可选择性面前被忽视了。如果确如贝里207所说，“数字人文的相关研究需要一种新的计算思想批判性方法，通常称之为计算思维（computational thinking）”65，而最终这种计算思维落实为“对不同级别的计算进行批判性理解是数字人文的先决

43、条件，而这只能通过积极参与实际的计算机系统实现”66，当数字人文对计算机的要求和信赖是本质性的，就应该对“强计算主义”的思维陷阱有所警觉。四、围绕离散主义的陷阱以上，我们已经围绕数字人文的数字一维作了几点讨论，而在“人文”的角度，上述问题还有进一步挖掘的必要。如果离散主义以及与之相关的强计算主义值得数字人文警觉，那么是否充分考虑了连续性问题和连续型数学工具就能作出有效规避？这可能仍是一厢情愿的，因为我们面对的问题不是属于数学学科，而是属于“交叉学科”的，正如弗洛里迪所说，对现实世界是否离散的判断是属于物理学的，而对是否可以以离散型计算的方式对之进行把握则发生在数学物理之间，这里的离散与连续都首

44、先是数学层面的，数字物理和数字人文中的“化学键”是否稳定的关键即“可计算性”（computability）。从数学角度来说，可计算性在图灵的意义上意味着图灵机实现的基础和范围，可计算指的是图灵机可以处理那些“可以简要地描述为其小数表达式可以通过有限方法加以计算的实数”67，也显然与人文学科中的“可计算性”（如果有的话）并不一致。可计算性在上文对伊文斯的讨论中就出现过，作者指出，伊文斯将复数的“0”和“1”们的二进制理解为数字的可计算性，即计算机对数字的处理，而有另一些人将之理解为字母，以其如此，得以将数字从数学问题转换为文本问题68。正是在这一基础上，计算技术在处理文本上逐渐复杂和成熟，才有了

45、数字人文所有形式的可能性条件。基于对计算机计算模式的理解，在数字人文研究中，数字与人文的结合并非将前者简单地作为后者的研究工具，而是要将人文学科研究对象的可计算性加以抽象后翻译为计算机可以理解的语言，而这实际上才触及数字人文的核心，以何种计算工具模拟以及计算何种数据其实质仍然属于科学技术领域，可否或如何将人文学科研究对象提炼为计算领域的有效语言才是数字人文两极碰撞的根本所在，而这不仅是一个“质”的跳跃性的问题，同时也就触及了人文学科的核心领地。贝里认为现在最应该予以否认的观点是“数字技术正在侵犯人文学科”69，那么数字人文必须面对上述这一根本性的转换，在此处谈论“不侵犯人文学科”显然需要对技术

46、有着高度的自觉和自省。通过上文的梳理，目前看来这一点并没有得到有效保障。至少，在数字人文的论述中，与其他一些数学或计算机概念一样，不少作者往往缺乏对计算数学和人文属性的可计算性的区分。比如，“我们需要表征来驾驭这个新的世界，这些表征需要是可计算的，因为计算机是我们进入这个世界的中介”70，作者在回顾其设想时，干脆使用了“可计算人文”（computable humanities）这样的表述71。面对数字史学研究中存在的问题，王数字人文的本体论反思208社会科学论坛2023/3 学科新探涛区分了两种研究倾向，即由“数据驱动”和由“论证驱动”的，他将问题总结为：“数字人文研究所强调的数据驱动（da

47、ta-driven）可能偏离了史学研究的路径。传统史学研究是论证驱动（argument-driven）的，擅长分析问题，而数字史学研究者在数据驱动的思维指导下，花费大量精力去转换、提取、清洗数据，以为数据的获取就是研究本身，显然背离了史学研究的精髓。”72对于解决这样的问题，作者实际上是持乐观态度的，其主旨在于将问题提出，希冀对落此窠臼的研究方式作出合理的纠偏，基本方法即历史研究在具体研究课题中，应注意“数据驱动”和“论证驱动”的结合。然而一个根本的质疑也就由此而生，如果设想一个没有“数据驱动”的现实环境，我们还会看到数字人文的“应运而生”么？一个在“数字人文”这一方法论层面采用数字工具的人文

48、研究真的能摆脱数字意识形态或者计算主义的询唤么？当布伦南作出数字人文批判时，认为数字人文只是在研究他们能研究的东西，简言之，计算那些具有可计算性的东西73，那么，如果可计算性是由“数据驱动”的，如何保证“论证驱动”不被同样的“计算”或消减呢？须知可计算性还有另一种向度，有学者指出，当如诺依曼预想的那样，计算成了科学最重要的二次革命，可计算性意味着，你需要对自己的研究实现其可计算性，否则你只能“愈加失败”，被科技的发展所淘汰74。正是这种恐惧使得人文学科面对计算方法或定量分析时始终存在着相对保守主义的思路，并且与其本身所持的意识形态立场无关，比如相对保守的布鲁姆和相对激进的斯皮瓦克都对这一方向产

49、生了质疑75。有趣的是，上述两位学者恰恰提示了定量分析与人文学科产生抵牾的最常见的两个方面或者说法，前者指出人文研究不是冷冰冰的数据，而是“充满智慧的哲理性的思考”，我们或者可以称之为人文性，而斯皮瓦克则强调人文学科的复杂性。然而一方面我们可以说，两位学者显然还不具备充分的跨学科想象力，从大而化之的角度来看，将冷冰冰的数字转化为“活生生”的智识几乎对仗似地呼应着近年来另一个充满热情和论争的科技场人工智能，而复杂性就更不在话下，从20世纪90年代科学尤其是数学领域对复杂性的追求就表现出义无反顾的态度，“复杂性学科”便由此诞生，真正的问题恐怕仍然在于反思人文性的智性与计算型的智能，以及数学基础的复

50、杂和人文思想的复杂之间的区别。简言之，我们的质疑并非对数字人文发展的否定，而是对合理和全面的数字人文批判的倡议，而“数字人文批判”就像其他诸多学理性批判一样是其学术场域辩证发展的必须环节。几乎是迄今国内学界“数字人文批判”最优秀的文本，汉松在朝向“数字人文”的文学批评实践：进路与反思中为数字人文的界限提出了历史与学理逻辑兼具的设想。不过，当作者质疑数字人文是否能够准确掌握“机器学习的技术内核和细节层面”时，他将为此所需要的科学知识分为了“深水区”和“浅水区”，分别是我们耳熟能详，或者用他的说法，“文科生”有可能了解的“自然语言处理、知识库、数据挖掘、深度学习、分词、贝叶斯定律”以及令人眼花缭

展开阅读全文