收藏 分销(赏)

大数据的哲学问题——基于唯物史观的视野.pdf

上传人:自信****多点 文档编号:905444 上传时间:2024-04-07 格式:PDF 页数:8 大小:4.11MB
下载 相关 举报
大数据的哲学问题——基于唯物史观的视野.pdf_第1页
第1页 / 共8页
大数据的哲学问题——基于唯物史观的视野.pdf_第2页
第2页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、330大数据的哲学问题基于唯物史观的视野胡善男*【摘要】大数据面临五个哲学问题。一是数字本体,由静态走向动态,打破了主客二分的定式;二是数据认知,从程式性的清晰认知方式转变为建构性的模糊认知方式,进而由机械式叠加升华为辩证统一;三是数据实践,从分立走向公共,使得大数据应用从各自的分立领域走向了社会公共领域;四是数据推理,从传统科学的侧重演绎转向大数据时代的侧重归纳,其功能则从传统科学的解释与预测相平衡转变为侧重预测;五是数据评价,从因果到相关,侧重于关注现象和数据之间的相互关系。这五个哲学问题,反映出大数据的现象学的科学哲学倾向。【关键词】大数据唯物史观数字本体数据认知数据实践数字、大数据、云

2、计算、人工智能等概念是当今学术界的宠儿。由于互联网的兴起,原来离散的、分立的、静止的各种数据,突然之间汇聚起来形成大数据,并对传统的政治、经济、文化等各方面产生了前所未有的冲击。恩格斯曾经说过,“唯物史观是以一定历史时期的物质经济生活条件来说明一切历史事件和观念”。由此,本文试图以唯物史观的视野来看待大数据并构建一套相关的哲学解释。为此,本文将从数字本体、数据认知、数据实践、数据推理、数据评价这五个方面,考察大数据与唯物史观“相遇”之后的哲学效应。数字本体:从静态到动态数据是客观事物的一种属性,不仅用来记录自然界或人类社会本身,而且用来呈现各种各样的变化。自从数字发明以来,人类通过数字记录了从

3、石器时代到大机器时代的自然界和人类社会的各种数据。从最初的结绳记事,到第谷的天文观测记录,甚或是牛顿三大定律与爱因斯坦的相对论等,都是以数字、数据、数学公式来*胡善男,武汉大学哲学学院博士研究生,主要研究方向为马克思主义自然哲学、技术哲学。马克思恩格斯选集第3 卷,人民出版社,2 0 12,第2 5 9 页。331大数据的哲学问题记录和表征的。文字实际上也是一种质性数据。通过文字和数据,区域的面积、人口的多寡、生产的产量、未来的预测等都一览无余。自然界与人类社会对数据的依赖,从哲学的角度来看意味着如下两点:一是质,即数字是人类理性的起点,人类这个主体必须通过数字来把握自然客体和社会客体;二是量

4、,即数据是对自然界和人类社会测度的表征。主体认识客体的主要方式,是通过对客体进行测度的数据来把握自身,以获得安全感和行为依据。在这一意义上,数据是自然界和社会运行的基础。“人们的存在就是他们的现实生活过程。”马克思的这句话揭示了生活的本质,从数据的角度来看,人的生活及其本质是以数据的方式建构的。“一切在其研究中以数学方式行事的自然哲学家,在任何时候(尽管没有自觉到)者都利用了并且必须利用形而上学的原则。”康德的这句话开示了自然科学研究的本质。从数据的视角来看,揭示并解释自然客体的存在方式,就是揭示自然客体本身所蕴含的数学结构。数据的存在方式,从旧石器时代开始,到计算机发明之前,都是以上述两种方

5、式存在的。当然,哲学上的标志则可以定格在申农的两篇论文上:通信的数学理论(AMathematical Theory of Communication,19 4 8)和在噪声中的通信(C o mmu n i c a t i o n i n t h e Pr e s e n c e o f No i s e,19 4 9)。正是这两篇文章奠定了现代信息论的基础。如果说传统时代的数据所展示的是一幅幅静止的图景,那么大数据时代的数据,则是一幅幅动态的数据影像。申农的两篇奠基性论文发表之后,随着计算机的发明,尤其是移动互联网发明之后,世界逐渐进入了大数据时代。今天人们的生活都离不开大数据,无论是起床时看

6、早间天气预报,还是远行规划路线,抑或忙碌了一天之后的休闲活动等,都离不开大数据。可以说数据无时不有,数据无处不在。数据决定这个世界:无论是从形而上还是从形而下的角度来分析。变动着的数据流无时无刻不决定着这个世界的存在方式和存在形式。今天的数据与古代的数据最大的不同在于,古代的数据是彼此独立的、静止的,今天的数据则是以不断变化的数据流的形式存在的。客观世界的运动变化,所呈现的则是一串串运动变化的数据指标,所揭示的却是社会关系的运动和社会结构的变革。因此,当今世界所呈现的是一幅动态的数字本体图景。不仅世界的不同事物呈现为各种各样的数据,而且同一事物的不同层面同样呈现为各种各样的数据。这是一种全新的

7、数字过程本体论:从现象层面考察与现象学相连,从本质层面考察则与过程哲学尤其是与马克思主义的实践哲学相通,这就为弥合现代哲学主客二分的裂痕提供了可能。一方面,传统意义上主客体之间的对立消解于数字本体由参见余乃忠、解泽奇大数据时代的形而上学基础,中州学刊2 0 15 年第5 期。2马克思恩格斯选集第1卷,人民出版社,2 0 12,第15 2 页。参见余乃忠、解泽奇大数据时代的形而上学基础,中州学刊2 0 15 年第5 期。李秋零主编康德著作全集第4 卷,中国人民大学出版社,2 0 0 5,第4 8 1页。332马克思主义哲学研究总第3 1期2023年第1期静态向动态的变化过程。物质世界的客观运动,

8、在大数据面前展现为动态的数据流,打破了主客二分视角的单一维度和有限场域。另一方面,传统意义上主客体之间的对立又消解于组成数字本体的类的数据源之中。作为类的数据源,将一切数据解释为数据元向数据源的转化过程,既包括了数据元的初始态性,又涵盖了转化过程中的动态、变化、发展。数据认知:从确定到近似数是一种观念。数据的观念之所以深入人心,主要在于它的确定性和清晰性。数字资源是无限的,无论是自然界还是人类社会的各种事物都可以找到独一无二的数据来表征。正是在这个意义上,毕达哥拉斯派宣称:“万物皆可数。”自人类诞生以来,寻求确定性始终是我们不懈的追求之一。数据跨越时间和空间,表征确定性。考察人类社会的运行,譬

9、如对人口统计、土地丈量、灾难后果的评估等都是通过数据来完成的,因为数据具有清晰性和精确性。考察人类的科学研究,譬如“笛卡儿一牛顿研究法”,借助科学实验将自然界的对象拆分、分解为一个个数据,而后将这些数据再度还原为研究对象的整体,求得对自然界对象的认识。这同样离不开数据的清晰性和精确性。从哲学上来说,传统认知的路径是主体对客体的能动反映论。客体是客观的,表征客体的数据必须是客观的,由此才能达成对客体的准确表征。由于主体与客体之间有着天然的鸿沟,所以认识总是借助数据这个中介。正是因为每一个数据都是清晰的、准确的和独一无二的,故而其所表征的客体也就是清晰的和准确的。这一表征的哲学根基是建立在实体性思

10、维以及小数据的基础上的。因为各种数据基于各种角度,是离散的、分立的、静止的,但这些数据都是实体实在的数据反映,从不同的侧面还原出实体的清晰图景有一种观点认为,“数据自身属性(如数量和种类)的定义模糊造成了大数据的模糊性,所以大数据陷入了存在与虚无,的危险境地”。相反地,本文认为,大数据恰恰颠覆了传统数据概念的认知模式。因为大数据的根本特征在于,数据不断地循环导致数据再生产,再生产的数据参与下一轮的数据制造,这就从根本上颠覆了传统认知的主客二分模式,产生了一种新的认知模式一一主客体融合认知模式。任何数据都带有主体建构的成分,而一个个数据却一轮轮参与数据的再生产,主体的建构因素被一轮一轮地放大,最

11、初认知的对象不可避免地从清晰走向近似,其总体的图景在近似的认知中被整体性描写摹状,从而达成对事物本身的认识,此其一。其二,在大数据时代,数据来源于搜索引擎,其设计基于算法。搜索引擎的See Zeki Simsek et al.,New Ways of Seeing Big Data,Academy of Management Journal,2019(4):973.333大数据的哲学问题边界是事先就设定好的,用户根据偏好和需求事先设定其内核。搜索引擎经过一系列的算法,将用户所需要的信息定向推送。用户不再追求绝对清晰的目标,而是在宏观趋势下追求近似的模糊结果。这种认知方式已经偏离了传统数据的纯粹

12、客观,而是带有主观渗透的痕迹,然而其信息筛选的方式却是客观的,这就是大数据的悖论,以精确的方式求得近似的结果。从哲学上说,大数据的认知有两条路径。一是通过数据流表征自然客体或者社会客体,二是通过数据流建构自然客体或者社会客体。但是这两者很难截然分开,更多是相互交织和相互渗透,始终处于你中有我、我中有你的状态。就对自然界对象的数据认知而言,其本身充满着持续的数据流,或者说,自然界认知对象在数据流中被表征、被建构,主客体不断地被混杂,其界限不断被模糊。就对社会对象的数据认知而言,其对象本身充斥着真假难辨的数据流,多寡、真伪、歧义并存,其界限模糊不清。也就是说,社会客体的认知对象在模糊的数据流中被表

13、征被建构:实中有虚,虚中有实。最终,大数据的认知从清晰走向近似。三数据实践:从分立到公共“马克思研究任何事物时都考查它的历史起源和它的前提每一单个问题都自然要产生一系列的新问题”,这是恩格斯对马克思科学研究工作的总结。对于大数据,我们也必须考察其历史起源及发展脉络。历史上,数据实践经历了三次比较大的变革。数据实践的第一次变革是从0 到1的变革。在史前时期,各大文明都不约而同地发明了数字,继而形成数据观念,这与人的劳动实践密切相关。数的发明,一方面说明主体对客体世界的认识能力有了极大的提升,另一方面也说明主体找到了一种较为客观的方式来认识客观世界。数据在漫长的历史实践中缓慢增长,各种数据是分离的

14、、分立的、相对静止的,这些数据尽管可以小范围内分享但远没有弥漫到公共领域。数据在当时是掌握在少数人手里的,从事数据实践的人更是极少。此期间,数据的作用在于描述,数值是描述世界的结果。数据实践的第二次变革是从工具性的数据一跃而成为科学性的数据,其标志是第一次科学技术革命。尤其是牛顿开创了牛顿力学体系,其不仅能完满地解释地球上的各种运动,而且能完满地解释宇宙间的各种运动。牛顿的数据,使天上地下联结为一体。在牛顿定律的公式面前,一串串数据是科学的数据,所反映的是科学数据背后所承载的大自然的本质规律。在第二次科学技术革命之后,人类社会产生的数据量大约每经过十年就会翻一番。这一时期的数据实践还是在各种学

15、科的范围之内,数据仍然是各自独立的。数据之间尽管有着少量交叉,有着向公共领域蔓延的马克思恩格斯全集第2 2 卷,人民出版社,19 6 5,第4 0 0 页。334马克思主义哲学研究2023年第1期总第3 1期端倪和趋势,但还没有大规模侵蚀到公共领域上来。数据依然掌握在少数人的手里。此时数据的主要作用在于理论分析,数据从描述世界的结果演变为认识世界的中介桥梁。数据实践的第三次变革是从科学数据转身为数据科学,其标志是计算机的发明,紧随其后的是互联网、移动互联网的出现。从此以后,超量的数据变成一串串跳动字符。信息科技飞速发展,各种数据令人目不暇接,使得数据以庞大的数据流的形式喷涌而出,宣告了大数据时

16、代的到来。大数据所蕴含的自然规律以及与社会实在的内在关联,使得此前的科学数据一跃而成为当今的数据科学。挖掘数据丰富的科学内涵,不仅成了当今时代的显学,而且成了当今世界各国尤其是大国的战略方针。第三次数据变革的显著特征是数据从分立走向了公共。数据不仅从分立的个人领域走向了大众的公共领域,而且科学数据从纵向分立的各个学科走向了纵横交错的系统科学。在此期间,数据的主要作用也发生了翻天覆地的变化,侧重于模拟和建构。数据流从不同的侧面变得更加科学,更加客观,更加贴近客观事物的本来面貌。数据的上述三次变革,体现了人的认识不断深化以及认识成果越来越客观化。变的是数值,不变的是人类对自然界和人类社会规律永恒的

17、追求。数据的变革历程,生动反映了人之主观能动性的呈现历程。从哲学上考察,数据从分立走向公共,存在两个前提。一是主体方面必须发展到社会上的绝大多数人掌握了相当深度、广度和厚度的知识量;二是客体方面必须发展到计算机、互联网、移动互联网的使用非常便利的程度。据此考察当今的世界,尽管大数据被世界各国所重视,但是以国家而论,真正的大数据“玩家”也就那么几家。这也从另外一个方面解释了美国为何要对其他国家实施打压的原因。其目的是显而易见的:争夺大数据的科学高峰,因为数据就是生产力。占据大数据时代的科学高峰,不仅意味着能快速发展本国的生产力,而且意味着可以主导全世界公共领域的话语权。四数据推理:从演绎到归纳数

18、据的本质就是人的本质。无论是自然客体还是社会客体,都是作为认识对象而存在的,数据的表征即是对认识结果的确认。那么,从一开始描述客体的数据,到中间阶段揭示客体内在结构的数据,再到最后表征认识结果的数据,数据走过了一条怎样的推理路径呢?近代科学有两种传统一“经典科学”和“经验科学”,前者包括力学、光学、天文学和数学,以数学为理性工具,后者注重定性和定量测量,强调实验结果,以数据为理性工具。前者重演绎,后者重归纳,但两者都离不开科学假说和演绎推理。在经典科学的传统中,演绎推理被发挥到极致,牛顿定律就是其杰出的代335大数据的哲学问题表。爱因斯坦说:“牛顿成功地解释了行星、卫星和彗星的运动,直至其最微

19、末的细节,同样也解释了潮汐和地球的进动一一这是无比辉煌的演绎成就。”而经验科学依据实验结果,建立科学模型,提出科学假说,再用实验验证,最后提出科学理论,演绎推理在其中同样极为重要。从哲学的角度考察,传统科学肩负着双重责任,既要解释世界,又要预测世界。故而,传统科学的推理路径既包括归纳推理又包括演绎推理,这正是近代以来理性主义的科学方法论的推理路径。“科学方法论建立在可检验的假说基础上。这些模型,大部分是科学家心理构思的系统。之后,这些模型被检验,实验证实或证伪世界运行的理论模型。这就是数百年来科学的工作方式。”在这种“理论一驱动”(theoryd r i v e n)的研究范式中,演绎推理取得

20、了巨大的科学成就。声、光、电、热、磁、生、化等领域,无一不打上演绎推理的烙印。道尔顿的化学系统、卢瑟福的原子系统、库伦的静电学公式、安培的电力公式、门捷列夫的元素周期表等,无一不代表着演绎推理的科学成就。然而,大数据时代的到来,颠覆了以往科学研究的推理模式。“只要有足够的数据,数字就可以自已说话”“除了上帝,任何人都必须用数据来说话。”在科学研究、技术发明、工程建造、经济运行等领域内,任何数据只是对客体单一维度的摹写,大数据则是对客体3 6 0 度的整体记录。在大数据面前,客体被全方位地展示,这就为归纳推理提供了绝佳的土壤。只要数据量接近完备,客体的特征量也就接近完备。数据的各个侧面相互印证与

21、支撑,大数据为归纳推理提供了扎实的基础,从而达成科学研究的预知与预测。这正是科学研究的新趋势,在归纳推理的基础上成功“预测”。一种新的经验主义在大数据时代应运而生。“模型基础上的科学理论是相对武断的,经常是可错的,因为它建立在溯因和演绎实践以及过度的批判性思维之上。”既然传统的科学理论模型所依据的演绎推理并不总是绝对可靠的,那么,大数据时代何不把科学研究直接建立在海量数据的归纳推理的基础上呢?实际上,大数据的推理路径,与近年来流行于西方的现象学科学哲学相吻合。爱因斯坦文集第1卷,许良英、范岱年编译,商务印书馆,19 7 6,第2 2 5 页。Chris Anderson,“The End of

22、 Theory:The Data Deluge Makes the Scientific Method Obsolete,Wired,2008(23):2.参见贾向桐论当代大数据发展中的理论终结论,南开学报(哲学社会科学版)2 0 19 年第2 期。4Chris Anderson,The End of Theory:The Data Deluge Makes the Scientific Method Obsolete,Wired,2008(23):2.5转引自涂子沛大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活,广西师范大学出版社,2 0 12,第13 页。参见董春雨、薛永

23、红大数据时代个性化知识的认识论价值,哲学动态2 0 18 年第1期。Cristian S.Calude and Giuseppe Longo,The Deluge of Spurious Correlations in Big Data,Foundations ofScience,2017(3):597.参见贾向桐论当代大数据发展中的理论终结论,南开学报(哲学社会科学版)2 0 19 年第2 期。336马克思主义哲学研究2023年第1期总第3 1期围绕客体的各种现象被数据所取代,现象学被数据化了,尤其是被大数据所包围五数据评价:从因果到相关对以往的科学技术革命而言,无论是归纳推理还是演绎推理都

24、建立在因果律的基础之上。因果关系是一种确定性的关系,隐藏在其背后的是必然性。数字、数据、数学公式等所揭示的,正是大自然的本质结构。近代科学技术所取得的辉煌成就之一,突出表现为科学和技术的数学化。判断一门学科是否属于科学的范畴,其中最为重要的判据就是其是否将数学引人了该学科。数学代表着确定性,是真理的化身。科学发现与科学真理的表征,就是一个个确定性的数学公式。这曾经是近代机械自然观不可或缺的组成部分,它背后所呈现的就是因果决定论。正是因果决定论,使得近代自然科学迅猛发展,取得了从宇观到宏观再到微观领域等一系列令人眼花缭乱的辉煌成就。数学公式背后所隐藏的是大自然的数学结构一一因果关系,这是科学家探

25、索大自然背后秘密的经典路径。换言之,数学公式所揭示的是一种科学评价:是否揭示了大自然的因果关系。譬如第谷通过观测得到了大量的天文数据,开普勒在此基础上再次研究,终于发现了其中所蕴含的天体运行规律,并用公式表征为开普勒定律。不仅如此,连带天文学本身,也借此身科学的大家庭。然而,大数据同样颠覆了这种评价。随着计算机的发明,互联网的出现,尤其是移动互联网和云技术的发明,人们已然处于数据的汪洋大海之中。我们的生活无时不在数字之中。但是,这些数据背后有因果关系吗?无论是个体的消费、心理、价值偏好乃至社会关系,还是集团的规模大小、赢利能力、市场定位与战略宗旨,抑或较大空间区域的产业现状、资源储备、经济潜力

26、等,甚或中小国家的战略选择,都逃脱不了大数据这只巨眼。但是,大数据背后有因果关系吗?大数据起作用的方式已经发生了变化,从注重因果性到注重相关性。如前所述,传统科学时代的决策,必须依据科学理论,对蕴含其中的因果性进行判断。然而大数据时代的来临,使决策发生了转向:不依赖因果性,只依赖相关性。比如,对个体在电商平台的消费数据进行发掘,准确描绘并界定其消费潜力以及消费偏好,而后投其所好。在这里,大数据发掘的就是相关性。又比如,对城市的车辆数据、上下班高峰、拥堵时间段、红绿灯技术等进行大数据分析,而后设计出最佳的城市交通通勤方式,减少拥堵时间。在这里,大数据所发挥的作用还在于相关性。于是,在当今的大数据

27、时代,“相关性”取代了“因果性”。“大数据特别强调参见程显毅等大数据时代的人工智能范式,江苏大学学报(自然科学版)2 0 17 年第4 期。337大数据的哲学问题关联,即在现象或事物之间或数学或统计变量之间的关系。”D“这种观念背后的新哲学理念是,足够强大的算法可以探究巨大的数据库,并且能够发现其中的关联和规则。”这说明了大数据评价背后的现象学倾向:以“相关性”为目标,仅关注现象和数据之间的相互关系。Several Philosophical Issues of Big Data:From the Perspective of Historical MaterialismHu ShannanA

28、bstract:Big data faces five philosophical issues.The first is the digital ontology,which changes from static to dynamic,breaking the dichotomy between subject and object;The second is data cognition,which changes from the clear cognitive style of formula to thefuzzy cognitive style of construction,a

29、nd then from the mechanical superposition to thedialectical unity;The third is the practice of data,from the separation to the public,makingbig data applications from their separate areas to the social public domain;The fourth isdata reasoning,which shifts from the traditional sciences emphasis on d

30、eduction to the bigdata eras emphasis on induction,and its function has changed from the balance oftraditional scientific interpretation and prediction to the emphasis on prediction;The fifth isdata evaluation,from causality to correlation,focusing on the interelationship betweenphenomena and data.T

31、hese five philosophical issues reflecting the phenomenologicalscientific philosophy tendency of big data.Keywords:Big Data;Historical Materialism;Digital Ontology;Data Cognition;Practiceof DataFulvio Mazzocchi,Could Big Data Be the End of Theory in Science?A Few Remarks on the Epistemology ofData-Driven Science,EMB0Reports,2015(10):1252.Cristian S.Calude and Giuseppe Longo,“The Deluge of Spurious Correlations in Big Data,Foundations ofScience,2017(3):596.参见贾向桐论当代大数据发展中的理论终结论,南开学报(哲学社会科学版)2 0 19 年第2 期。

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服