收藏 分销(赏)

云上车间中的劳动折叠:人工智能数据标注的劳动过程研究.pdf

上传人:自信****多点 文档编号:607947 上传时间:2024-01-12 格式:PDF 页数:15 大小:8.28MB
下载 相关 举报
云上车间中的劳动折叠:人工智能数据标注的劳动过程研究.pdf_第1页
第1页 / 共15页
云上车间中的劳动折叠:人工智能数据标注的劳动过程研究.pdf_第2页
第2页 / 共15页
云上车间中的劳动折叠:人工智能数据标注的劳动过程研究.pdf_第3页
第3页 / 共15页
亲,该文档总共15页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、新媒体研究General,No.240Journal of FujianNormal University(Philosophy and Social Sciences Edition)(总第2 40 期)No.3,2023福建师范大学学报(哲学社会科学版)2023年第3期D0I:10.12046/j.issn.1000-5285.2023.03.011云上车间中的劳动折叠:人工智能数据标注的劳动过程研究戴宇辰,袁冰雨(华东师范大学政治与国际关系学院,上海200241)摘要:数据标注员是当前人工智能产业从业者中的一个典型工种。通过对其具体劳动过程的研究发现,平台技术对劳动过程的一个显著改变在于

2、部分劳动呈现为一种“幽灵化”的状态:首先,工厂车间的云端化成为幽灵劳动诞生的前提。以“公会”为核心形式的众包式、分包式网络可以完成从认领工作、准备生产材料到完成生产、分发薪资等一系列流程的组织。其次,可见性的改变是劳动幽灵化的核心轴承,平台技术通过对可见性的精巧控制,实现了劳动者与监督者肉身的实际消失。进而,劳动协作不再是人与人之间的流水线生产,而变成了机器安排下的技术延伸。最后,以平台为中心的数字关系本身也呈现为一种幽灵般的抽象结构,它遮蔽了传统的社会关系,使得劳动者的职业认同显得矛盾重重。关键词:幽灵劳动;平台劳动;数据标注;零工经济中图分类号:G206文献标识码:A文章编号:1 0 0

3、0-5 2 8 5(2 0 2 3)0 3-0 1 0 8-1 4一、问题提出根据中国信息通信研究院发布的数据,2 0 2 2 年中国人工智能产业规模为5 0 8 0 亿元人民币,同比增长1 8%,相关产业链的发展一片繁荣。然而,产业蓬勃发展背后不能掩盖的是人工智能迈向全面自动化的“最后一英里”悸论,即为了完成从“数据”向“智能”的过渡,人工智能技术目前仍然需要许多人力劳动的加持。从本质上来看,人工智能并不是天生的“无所不知”,它在成为“智能”之前,还需要学习大量已经处理好的数据资源,而这些数据均来自人力劳动。同时,在许多人工智能的典型应用场景中,它又往往显得不是那么“智能”,需要引人人力劳动

4、来辅助其完成数据的自动化处理。例如为了校验司机身份,网约车公司优步(Uber)推出的“实时ID检查”技术所依托的不仅是算法主导的人脸识别,还同时需要许多外包的人工劳动者在后台进行实时核验。人力与智能矛盾凸显的“最后一英里”悖论提示我们,为了实现全面自收稿日期:2 0 2 3-0 3-1 0基金项目:国家社会科学基金青年项目“物质性视野下传播理论的发展路径与新进展研究”(2 1 CXW023)。作者简介:戴宇辰,男,华东师范大学政治与国际关系学院副教授。主要研究方向:媒介社会学、物质性理论。袁冰雨,女,华东师范大学政治与国际关系学院硕士研究生。主要研究方向:政治传播。人工智能产业化应用加速,2

5、0 2 3年3月2 5 日,http:/w w w.x i n h u a n e t.c o m/f o r t u n e/2 0 2 3-0 3/2 5/c _ 1 1 2 946 2 98 2.h t m2023年4月1 日。109戴宇辰,袁冰雨能数据标注的劳动过程研究第3期动化,当前人工智能技术的发展仍然需要大量人力劳动作为饲料进行“投喂”。数据标注员即是这样一种“喂养人工智能”的典型职业工种。一般来说,他们的主要工作职责是为网络上不同的图片、语音、文本等数据进行分类标识。这些识别完成的材料将会输人人工智能,成为它学会识别数据的“基础学习资料”。就雇佣方式而言,目前的数据标注行业大多

6、以数字平台的分包劳动为主,采取按件计费的计酬方式。因而在学理层面,数据标注工作同样属于“平台劳动”的一种。但与学界关注较多的网约车司机、外卖骑手等平台劳动者不同的是,数据标注工的主要服务对象是“算法技术”本身一一他们是隐藏在庞大自动化数据流背后的劳动者,而前者虽同样受到算法的管理,但仍然服务于现实中的顾客。玛丽格雷(Mary L.Cray)和西达尔特苏里(Siddharth Suri)用“幽灵劳动”(ghostwork)一词来概括这样一种藏在自动化与人工智能背后的劳动者:“真正驱动许多手机应用程序、网站和人工智能系统运行的竟是人类劳动力,但我们很难发现一一事实上,这些劳动力往往是故意被隐藏起来

7、的。这是一个不透明的雇佣世界,我们称之为幽灵劳动”。”“幽灵”一词传神表达出这种劳动新现象的讽刺与自相矛盾之处:不同于传统的劳动环境工人在轰隆作响的大车间中,共处于同一流水线上,按照规定好的图纸进行协作;对于数据标注工而言,劳动是“孤独”的,他们位居于人工智能产业的后台,从事保障技术自动化的人力辅助工作一一因而他们犹如“幽灵”一般隐藏在机器之后,难以被大众察觉。从根本上说,劳动过程“可见性”(visibility)的改变成为幽灵劳动与传统劳动的一大区别,平台对于劳动者、劳动过程、劳动监管等机制可见性的控制成为它的显著特征。在这些数据标注员的工作中,算法取代了监督者、商家和顾客,变成了对劳动者发

8、号施令的一方。人彻底成了技术的延伸那么,这样一种隐藏在算法背后的劳动是如何在平台中持续性地生产和维系的?劳动的“幽灵”是如何诞生的?劳动的“幽灵化”意味着劳动者的具体劳动过程在平台时代发生了何种变化?以上问题构成了本研究发问的起点。二、文献综述一数字技术与劳动过程研究按照马克思的定义,劳动过程即“劳动者制造使用价值的有目的的活动也是资本家消费劳动力的过程”。劳动过程理论的提出则源于资本家在“消费劳动力”过程中面临的双重不确定性。一方面,对于资本家来说,购买的劳动力如何以及多大程度上能够投入到商品生产中,是他们必须关注的核心问题;另一方面,劳动者也可以随时选择终止雇佣关系,选择为其他雇主劳作。因

9、而就劳动力的流动来说,它同样存在着不确定性的风险。垄断资本主义时期,大量管理手段和科学技术的引入丰富了资本家对劳动力的控制手段。布雷弗曼(HarryBraverman)系统地阐述了泰罗制管理技术对工人的控制方式。埃德沃兹(Richard Edwards)则将资本家对工人的管理控制体系分为简单控制、技术控制、科层控制三个方面,强调了技术对于劳动过程控制的1【美玛丽L.格雷、【美西达尔特苏里:销声匿迹:数字化工作的真正未来,左安浦译,上海:上海人民出版社,2 0 2 0 年,第9页。马克思恩格斯文集(第5 卷),北京:人民出版社,2 0 0 9年,第2 1 5-2 1 6 页。Smith,C.,T

10、he Double Indeterminacy of Labour Power:Labour Effort and Labour Mobility,Work,Employment and Society,20(2),2006,pp.389-402.【美 哈里布雷弗曼:劳动与垄断资本:二十世纪中劳动的退化,方生、朱基俊、吴忆宣、陈卫、张其骚译,北京:商务印书馆,1 97 8 年。2023年福建师范大学学报(哲学社会科学版)110重要性。此外,劳动控制实现也离不开工人的主体性认同,如布若威(Michael Burawoy)认为资本家可以在意识形态领域“制造同意”,利用如“赶工游戏”的方式来掩盖劳动

11、过程中的劳资冲突,达到劳动控制的目的随着数字和平台技术的发展,劳动的生产过程发生了显著变化:它不再局限于物理意义上的工厂内部,而是可以利用平台技术在任何时刻任何地点发生。同时,劳资双方的社会关系也不再限制在传统的雇佣关系中,各种分包、众包的雇佣形式,以及零工、短工的劳动方式也在平台中出现。从这个角度来看,依赖数字化技术搭建的平台成为新的劳动实施场所与分配主体。“平台劳动”(platform labour)成为晚近新兴的一种特殊劳动形态。就劳动过程而言,平台的介人一方面以其数据化的方式重新协调和形塑了劳动者的协作方式、时空属性、社会关系,另一方面也带来了资方对劳动组织、监视与控制方式的更新。从理

12、论取径上看,上述数字技术介入劳动过程的讨论仍然延续了布雷弗曼、埃德沃兹等学者提出的技术控制路径,其中,“算法逻辑”一一由算法带来的去中心化、多节点化的劳作形态和算法赋予的对劳动者的隐秘监视、自我规训手段被视为平台管理劳动者的核心原理值得注意的是,根据服务对象的不同,平台劳动的从业者可以分为两类群体:一类是服务于人的劳动者,如学界普遍关注的外卖骑手,网约车司机等。他们的具体劳动形式一般为接收由数字平台分配的客户订单,并在现实世界中完成服务。另一类人则以技术为服务对象。这类群体的劳动不以物理世界的交接为最终完成劳资价值交换的标志,而是把实现技术请求的某项任务视为劳动完成的终点。这一类群体的典型代表

13、如“亚马逊土耳其机器人”(AmazonMechanicalTurk)、“云工厂”(Cloud Factory)等云技术平台中的数据标注员、内容审核员等。他们的主要职责在于对算法所提出的数据请求进行识别、分类、纠错和批注等。作为人工智能之中的“人工”,数据标注员是当前增长迅猛的人工智能产业链的重要一环,为该行业发展提供了源源不断的“燃料”与外卖员、网约车司机不同的是,数据标注员群体的一个典型特征在于,他们的劳动目标是以人机交互为主导诉求的。这意味着他们劳动产品的最终指向是服务于算法自动化目标的某项代码,或者某类指令。也正因为此,相较于外卖员穿梭于城市的大街小巷,数据标注工们往往像幽灵一样藏身于代

14、码之后,在现实生活中令人难以察觉。“幽灵”意味着劳动“可见性”的消失,从劳动过程理论视角来看,正是平台技术的引入成了劳动可见性变化的核心轴承。为了更精Edwards,R.,Contested Terrain:The Transformation of the Workplace in the Twentieth Century,New York:Basic Books,1979.【英】迈克尔布若威:制造同意一一垄断资本主义劳动过程的变迁,李荣荣译,北京:商务印书馆,2 0 0 8 年。2Van Doorn N.,“Platform Labor:On the Gendered and Racia

15、lized Exploitation of Low-income Service Work in the“on-demandEconomy,Information,Communication&Society,20(6),2 0 1 7,p p.8 98-91 4.孙萍:“算法逻辑”下的数字劳动:一项对平台经济下外卖送餐员的研究,思想战线2 0 1 9年第6 期,第5 0-5 7页;胡杨娟、叶韦明:移动社会中的网约车一一深圳市网约车司机的工作时间、空间和社会关系,传播与社会学刊2 0 1 9年第47 期,第1 35-1 6 5 页。5束开荣:构建数字劳动的物质网络:平台规训、算法协商与技术盗猎一

16、一基于“送外卖”的田野调查,新闻与传播研究2 0 2 2 年第9期,第39-5 8 页;李胜蓝、江立华:新型劳动时间控制与虚假自由一一外卖骑手的劳动过程研究,社会学研究2 0 2 0 年第6 期,第91-1 1 2 页。6陈龙:“数字控制”下的劳动秩序一一外卖骑手的劳动控制研究,社会学研究2 0 2 0 年第6 期,第1 1 3-1 35 页;吴清军、李贞:分享经济下的劳动控制与工作自主性一一关于网约车司机工作的混合研究,社会学研究2 0 1 8 年第4期,第1 37-1 6 2 页。姚建华:人工智能中的“人工”:众包平台的实践与反思,新闻战线2 0 2 0 年第4期,第7 5-7 6 页。8

17、贾文娟、颜文茜:认知劳动与数据标注中的劳动控制一一以N人工智能公司为例,社会学研究2 0 2 2 年第5 期,第42-6 4页。111戴宇辰,袁冰雨上车间中的劳动折能数据标注的劳动过程研究第3期确地描述这种“幽灵性”白的不同层面,我们将在下文引人对劳动幽灵性问题的理论梳理(二)劳动的为“幽灵性”劳动的“幽灵性”向度并非一个全新的问题,可以追溯到“隐形劳动”(invisible labor)、“隐藏劳动”(hiddenlabor)等近似概念。事实上,早在大工业生产时代,许多看似流水线上制造的产品本身也需要依靠熟练技工进行缝补、贴合、烫染等手工工艺的加持。也就是说,这些看似标准工艺流程制造出的产品

18、本身已掩盖了其背后所涉及的关键人类劳力。格雷、苏里提出“幽灵劳动”这一概念,指代的是以“亚马逊土耳其机器人”平台里的劳动者为代表的众包工人他们像“土耳其机器人”中的象棋大师一样藏身于算法之后,无法被人察觉。从本质上来一说,两位作者意在强调劳动过程在平台环境中的变化。这些幽灵工作者成了技术自动化的供养者,通过反复的机械标注工作在客观上保证算法的“智能”化。因此就原初理论语境而言,幽灵劳动不是一种新的劳动类型,其主要指称的是平台劳动过程中的视觉关系及其背后折射出的权力结构问题因而其本质上仍是零工劳动的一种特殊形态幽灵意味着劳动者具体劳动过程的不可见性,寓意这样一群零工劳动者的劳动过程被“折叠”进了

19、算法的自动化进程之中,普通人完全无法察觉到他们的存在。同样从光学可见性角度出发,谈论幽灵劳动问题的路径亦可延展至近代经济学研究中的“影子劳动”(shadowlabor)概念。与格雷、苏里对劳动过程的聚焦点不同,影子劳动者主要指“从雷达消失的/不被主流关注的”(belowthe radar)的零工从业者。在具体劳作中,他们往往只与以中介形式出现的平台发生联系:平台通过分配雇主下发的任务来安排具体工作。对于劳动者来说,雇主是完全隐身的,他们也被迫承担了来自企业的风险转移。影子劳动是伴随零工经济出现的特有现象,随着数字技术的发展、互联网平台的遍及,使得这种劳动形式越来越规模化,劳动者的肉身进一步“藏

20、身于屏幕之后”(behind the screen)除去上述的两类隐喻用法,对劳动幽灵性问题的探讨可以追溯到早期西方马克思主义代表人物卢卡奇对商品结构之谜的剖析,即“人与人之间的关系获得了物的性质,并从而获得了一种“幽灵般的对象性”。在卢卡奇看来,彼时资本主义大工业生产方式与科层制管理体制的广泛结合形成了一种普遍的社会趋势:人与人的社会关系被商品与商品的交换关系所替换。进而,这种物与物的关系所形成的结构获得充足的自律性,形成了一种类似幽灵般的抽象控制力,可以反过头来支配其中的个体。卢卡奇以“物化”现象概括资本主义商品结构所形成的抽象统治力,即“人自己的活动,人自己的劳动,作为某种客观的东西,某

21、种不依赖于人的东西,某种通过人的自律性来控制人的东西,同人相对立”。从本质上来看,卢卡奇对资本主义劳动所带来的“幽灵般对象性”的指涉并非着力于描绘某类事物的不可见性一质言之,他的关注点在于一种Craig,M.,Poster,M.,Cherry,M.,(Eds.),Inuisible Labor:Hidden Work in the Contemporary World,Berkley:University ofCalifornia Press,2016.2Hatton,E.,Mechanisms of Invisibility:Rethinking the Concept of Invisib

22、le Work,Work,Employment and Society,31(2),2017,Pp.336-351.Irani,L.,The Cultural Work of Microwork,New Media&Society,17(5),2015,pp.720-739.姚建华、丁依然:“幽灵劳动”是新瓶装旧酒吗?一幽灵劳动及其概念的传播政治经济学省思,新闻记者2022年第1 2 期,第30-40 页。5Friedman,G.,Workers without Employers:Shadow Corporations and the Rise of the Gig Economy,Revi

23、ew of Keynesian Econom-ics,2(2),2 0 1 4,p p.1 7 1-1 8 8.Roberts,S.T.,Behind the Screen:Content Moderation in the Shadow of Social Media,New Haven:Yale University Press,2019.【匈牙利】卢卡奇:历史与阶级意识,杜章智、任立、燕宏远译,北京:商务印书馆,1 999年,第1 49、1 5 2-1 5 3页。20233年福建师范大学学报(哲学社会科学版)112“表象”与“本质”对立的紧张关系。资本主义劳动所建构的普遍社会体系在表象上

24、表现为“庞大的商品堆积”D,遮蔽了人与人之间的感性交往关系。也正因为此,幽灵性在卢卡奇这里具备了双重的含义:其一是物化结构对于个体的抽象统治力问题,即由资本主义劳动所生产出的异已的、普遍的抽象体系;其二是表象对于本质的遮蔽问题,正是商品交换的遍及掩盖了人与人之间的社会联系。可以说,诸如“原子化个体”的现代人形象只有在商品成为社会存在的普遍范畴的资本主义社会才得以可能。卢卡奇对幽灵性的判断同样适用于我们理解今天作为普遍社会交往中介的“平台”:“幽灵般的对象性”同样建构了不可见的、容纳各种社会关系的平台。它作为一种新型数字技术的呈现方式,以其景观化和技术化的外表,遮蔽了其本质中人与人的交往关系。简

25、单总结,围绕幽灵这一术语,存在三种不同层面的指涉:其一是劳动诸要素在光学意义上的“从雷达消失”(belowtheradar)。这一维度不仅体现在数据标注工这一典型工种中一他们藏身于巨大的自动化机器之后,也体现在各种典型平台劳动者案例中。例如,在外卖骑手的一般劳作中,算法就代替监工重新分配了劳动的控制权。其二是由自动化“最后一英里”悖论所导致的劳动方式的变化。被机器隐藏的劳动者不仅变得无法被人察觉,而且他们本身的劳动也是为了服务算法的自动化运行而存在的。这导致了一种“人彻底成为机器延伸”的论。其三是卢卡奇所言的表象与本质的对立问题。在“幽灵化”的过程中,作为抽象结构的表象遮蔽了事物的本质,并且对

26、其施加抽象的统治力。基于以上思考,笔者在数字技术介人劳动过程的背景下,选取数据标注工这一典型平台劳动者,对人工智能标注的具体劳动方式展开考察,并尝试揭示出其劳动过程所呈现幽灵化的不同向度。三、研究设计与资料来源数据标注作为一个特殊职业工种,最早可以追溯至“亚马逊土耳其机器人”平台里的众包工人。近年来国内的一些互联网公司和人工智能公司也纷纷推出了自已的数据标注众包平台,例如百度众测、京东众智、曼孚科技等等,如上数据标注平台基本上都能对图片、视频、文本和语音等数据进行标注,但各自的业务方向各有一定侧重。其中,线上标注平台的管理基本单位一般被称为“公会”。作为数据标注工作中的最小成员集体,每个公会需

27、有自己的“会长”,相当于传统劳动中的“包工头”角色。平台下发的标注任务由公会的会长来完成认领和内部分发。由于线上众包形式的不稳定性,一些人工智能公司也会选择将批量的标注任务外包给成规模的线下数据标注公司进行采集和标注。线下的标注公司与线上的公会工作形式基本类似,由数据标注的需求方指定标注内容和标注平台,在线上平台完成大部分的标注任务。在此意义上,线上与线下的区别只在于标注工是否需要肉身到达公司。据标注公司介绍,在少部分情况下,他们也会使用自己所研发的标注工具完成客户的项目需求。由于条件限制,有时也会将数据存到硬盘中,直接寄送给需求方基于以上行业背景,笔者采用质化田野研究,主要使用参与式观察和质

28、性访谈两种研究方法1【德】卡尔马克思:资本论(第一卷),北京:人民出版社,2 0 0 4年,第47 页2蓝江:元宇宙的幽灵和平台一用户的社会实在性一从社会关系角度来审视元宇宙,华中科技大学学报(社会科学版)22022年3期,第1 0-1 7 页3姚建华:作为数据流的劳动者:智能监控的潮源、现状与反思,湖南师范大学社会科学学报2 0 2 1 年第5 期,第92-100页。智能数据标注的劳动过程研究113戴宇辰,袁冰雨上车间中的劳动折叠第3期获取研究资料。本研究第二作者在2 0 2 1 年1 2 月一2 0 2 2 年2 月间,先后在三个线上数据标注公会(R X公会、BD公会、HT公会)累计田野时

29、长约1 2 0 小时,每个工作日4-6 小时,以及线下数据标注公司(D公司)累计田野时长约1 1 0 小时,每个工作日9小时,作为“数据标注工”的一员,亲身参与数据标注劳动。其中,线上数据标注公会主要通过网络发帖的方式招揽数据标注工。研究者在百度贴吧“标注吧”回帖应征以后,进人公会会长组建的QQ群进行后续联系和任务分配。而线下数据标注D公司是从2 0 1 5 年起步接触数据采集和数据标注业务,目前有固定员工2 0 余人。D公司作为实体公司,与线上公会相比,承接项目范围更广,同时也会对外分包自已承接的项目。研究者在田野中共参加数据标注项目五项,涉及,数据采集、标注、分类等工作。研究者从事的具体任

30、务包括:道路语义分割、障碍物框选、地下车库标注、动作捕捉采集等等。它们覆盖了目前数据标注项目的基本任务。在田野期间,研究者同时与数据标注工(5 人)、公会会长(2 人)、标注公司老板(2 人)、标注公司主管(1 人)等公司员工各开展了半个小时以上的深度访谈,以及工作过程中的随机访谈。其中,与线上标注公会中的数据标注工以线上电话的方式进行访谈,与数据标注公司的数据标注工以线下方式进行。此外,本研究同时参考了互联网与数据标注有关的新闻报道、调研报告和行业统计数据,以上资料均为本研究提供了背景性知识的支撑四、“云上车间”:数据标注劳动的生成与维系劳动“幽灵化”的前提在于劳动环境的变化。与传统热闹的工

31、厂流水线不同,数据标注工的工作环境是孤独的。得益于互联网与平台技术的发展,数据标注工人的大部分工作都可以在数字空间完成,而不需要每天“朝九晚五”地在公司进行定时定点的打卡上班。因而,幽灵劳动的起点依赖于以平台为核心的“云上车间”的出现。如前所述,云上车间的基本管理单位为“公会”,会长成为连接众多标注工和标注平台的最小枢纽,从而在平台中实现更高效的内部协作,“云”传输也更方便实现劳动资料的生产运输。笔者在HT公会所参与的障碍物框选任务可以说明数据标注生产的大致流程。标注项目主要服务于无人驾驶。标注工需要将道路实拍图片中的车辆、行人进行属性标注(见图1)。圈出图片中的车辆之后,按照项目规定的划分标

32、准,标注车辆的类别(轿车、越野车、公交车、大货车、小货车、面包车、专业作业车、微型车、自行车、摩托车、电动三轮车、人力三轮车、其他、成片车辆)、遮挡率、车辆朝向、截断率、截断位置等等。行人同理。之后标注出图片中的天气状况(晴天、阴天、阴晴之间、下雨、下雪)和道路位置(城区路、高速路)。这些信息将服务于无人驾驶中车辆对道路状况的识别和判断。除去上述案例中的为事物进行标签分配的“分类标注”外,其他类似的标注任务还包括识别图像的“边框标注”,识别地图和区域的“区域标注”,以及服务于人脸识别系统的“秒点标注”等。当数据标注员完成一项基本的标注任务后,相关数据会提交给提出需求的人工智能模型训练人员。他们

33、会利用标注好的数据来训练出适合算法的模型。标注的质量会有审核员来检验,有时候标注的数据无法在训练师那里得出最优算法模型,此时审核员就会将该任务重新返回给标注工,要求其重新标注。线上标注的任务分配一般由作为管理者的会长进行。以研究者的田野实践中使用最多的百度众测平台为例:公会会长从平台领到一定数额的标注任务之后会在公会内部进行再一次的分发。对于线下标注公司来说,有时候为了节省人力和空间成本,也会将任务“外包”或“分包”给2023年福建师范大学学报(哲学社会科学版)114图片标注题标注类型机动车行人新车人新车公交车大车大货车小货车面包车微型车不确定其他机动车鱼行车类别摩托车/电动车(两轮)电动三轮

34、车/摩托三轮车人力三轮车非机动车其他成片车辆应免车警车、教范车等名路ID3遮挡完全可见部分造档(30%严量速档(30%-7 0%完全可见7 0%载断率完全来技所严重或5/30%-7 0%纯全严可贝7 0%车辆朝向后三前右隔离带遮挡无连挡部分速当0-30%产严童30-7 0%70-90%截断方向上载活右上载糕布下载新无载断品口豆坐标约:(2 1 97 1 1 0 5),编放:47 3%铺无至挡无图1障碍物框选标注项目实例其他线上小型标注组织来完成。外包对企业来说意味着用更低的成本换取更多的资源而受到青。研究者的田野点之一D公司就有专门的对外联络岗位,老板韩哥称这个岗位为“打电话”。其主要的工作内

35、容就是将D公司已经谈到手的标注项目联络到合适的标注组织分包出去,而D公司自已本身其实也是承包商。这样外包之后再外包的情况在数据标注行业并不算少见。“这种很正常,如果我们自已内部消化不了就会选择外包出去。这样的话他们有生意做,我们有钱赚。其实是双向(互利)的。”(韩哥,标注公司老板)据韩哥介绍,D公司在所在省份属于规模数一数二的公司,平时经常会接到一些比如阿里巴巴、华为之类的大客户。接到的项目较多时,就会采用外包的形式。每外包一次,公会所获得的收益就减少一些,标注工收获的利益就更减少一些。由此一层一层的外包使得标注工无法知道自己的雇主是谁。因此,就劳动者的实际处境来说,平台带来雇主或者用人单位的

36、实际消失,但是工人应当承担的劳动风险却并没有减少在传统的资本主义工业生产之中,资本可以通过将工厂搬迁至劳动力更低廉的地区来化解危机。大卫哈维曾用“时空修复”来描述资本主义在空间层面的扩张,认为空间修复能够部分解决资本自由扩张的界限问题,从而规避马克思所界定的资本主义的内在矛盾。在数字时代,路途中的货物折损已经完全消失,没有空间上的损耗,重新开辟一个云上车间对平台来说几乎毫无成本。媒介技术的进步推动资本的空间修复能力进入了前所未有的新阶段。包括数据标注产业在内的各种以平台为中介的数字产业,在赛博空间中可以完全不受物理空间限制进行自由扩张,从而为资本的增值服务。同时,网络也可以实现完整的、没有任何

37、损耗的生产资料运输,也不产生租用场地、保障人身安全等额外固定支出。因而以平台为中介的外包、众包等雇佣形式越来越受到青睐。对于数据标注工的管理而言,云上车间几乎可以实现从认领工作、准备生产材料到完成生产、分发薪资等一系列对传统车间的复刻。与之不同的是,在这个过程中,工厂厂主可以彻底消失,他们对于无法进人云端的劳动工人的肉身在现实生活中的遭遇毫不关心。当标注工的具体劳)【美】大卫哈维:资本社会的1 7 个矛盾,许瑞宋译,北京:中信出版社,2 0 1 6 年。车间中的劳动折叠戴宇辰,袁冰雨:云115工智能数据标注的劳动过程研究第3 期动过程被选择性地折叠进了这个2 4小时不间断工作的平台生产机器内,

38、劳动的幽灵在此时诞生五、“劳动折叠”:不可见的幽灵诞生在“云上车间”的新型工作环境中,数据标注工的一次次鼠标点击作为喂养人工智能的“饲料”,被源源不断地生产出来。这一方面使得标注工人的具体劳动呈现为极度单调和机械化的重复操作,另一方面也使得他们的整个劳动过程转化为人工智能技术的“附庸”,被“折叠”进了人工智能的自动化进程中,令人难以察觉。具体而言,这一幽灵化过程体现在三个不同层面:首先是劳动的诸要素“从雷达消失”,在光学意义上变得不可见;其次是劳动协作形式发生变化,劳动者的具体劳动过程是以人工智能的运行逻辑为核心基准的;最后是“表象”对“本质”的抽象控制维度,数字关系遮蔽了劳动者的一般社会关系

39、,且转化为一种抽象统治力。一身体从雷达消失:劳动者、监工与雇主的幽灵化马克思指出,工具与机器的差别,不仅仅局限在使用动力的类型上一一两者更为本质的区别在于机器的去身体化。马克思所指的去身体化,并不指人脱离机器而存在,而意在表明人的肉身已转化为机器中的一个组成部分,身体在劳动过程中的参与度显著降低。在数据标注劳动中,由于云上车间及其生产机制的存在,劳动者、劳动监工与雇主分别实现了光学意义上的“去身体化”。劳动者的肉身消失很容易理解。由于标注员主要从事的是服务机器的工作,一般大众对其职业认知往往相当模糊。在访谈过程中我们发现,尽管应聘的是数据标注行业,5位标注工里有3位表示在此前完全没有听过数据标

40、注这项工作。他们是看到公司的招聘信息之后才了解到有这样一类工种存在,“(之前)不知道(这个职业),但是看网上有人说这个行业能赚钱,还能在家,我就想试一试”(成姐,数据标注公会会长)。同时,对于日常使用平台的普通用户而言,“可见的事物”只是界面呈现的程序员整合好的数字编码与操作指令。在社会关注层面,相对于“被凝视”状态的外卖骑手等平台劳动者,数据标注工的职业处境很少被大众所知。直到2 0 19 年12月,在人力资源和社会保障部就业培训技术指导中心下发的关于拟发布新职业信息公示的通告中,包括数据标注员、内容审核员等群体才被规划为“人工智能训练师”这一新的职业工种。同时,由于标注工的具体劳作过程是在

41、云上进行的,这使得传统流水线上劳动监工的职业角色不再存在,取而代之的是各种不透明的算法进程。我们在田野中发现,平台所创造的“云上车间”使得数据标注的全流程可以被算法实时记录。更进一步来看,没有了上级监督的数据标注工被算法卷人了另一种形式的同级竞争。在标注过程中,所有人都可以互相看见彼此的工作量与工作时间,了解彼此的生产过程与进度。以研究者在田野中最常使用的B标注平台为例,在个人的项目显示页面,会有项目“风云榜”不断更新显示此项目的参与人数与其他人的工作量。(见图2)因为“风云榜”的存在,标注工似乎面临着全方位的竞争压力而不敢在生产劳动过程中懈怠。标注工的劳动产品和劳动效率时刻被平台记录,同时,

42、因为榜单中也有其他工友的存在,当自已的速度明显落后于人的时候,标注工也会被迫加快速度。“这种感觉就像是老师站在你身边“折叠”一词参考了郝景芳在北京折叠中描写社会阶层分化使得部分人被选择性地折叠进不同空间的用法。在幽灵劳动的个案中,我们认为被“折叠”的不仅是劳动者本身,同时包括其具体的劳动过程一一它成为算法逻辑的某种延伸。【德卡尔马克思:机器。自然力和科学的应用,北京:人民出版社,19 7 8 年。2023年福建师范大学学报(哲学社会科学版)116项目指南风云榜答题管理名次用户答题数正确率1题121题图2“风云榜”显示所有项目参与者的工作量看你写作业一样,你也不敢抬头,只能赶紧写,老师走没走也不

43、知道,最怕的就是明明就只是偷懒了那么一下,抬头就被老师看见。”(小牛,数据标注工)史蒂文瓦拉斯(StevenVallas)和朱丽叶朔尔(Juliet Schor)形象地将平台比喻为一个牢不可破的“数字牢笼”,对每一位平台中的零工劳动者实施着密不透风的监控。在云上车间中,工人的每一个动作都会被记录,没有人可以掩盖自己的工作失误。从某种程度上来说,标注工已经通过自我规训的方式将平台和公会的要求内化。作为公会实际控制者的会长无论是否在线,标注工都要保持高效劳动。最后,传统劳动者与雇主的关系也在云上车间中也变得日益模糊:双方的关系被简化成为命令下达与任务提交的指令性关系。在笔者的田野中,最常接触的任务

44、指令就是由平台下发的各种“数据标注题包”。通过评估任务、完成项目、点击提交和领取报酬的方式完成一轮数据标注的工作循环。作为数据标注工的一员,笔者无法也不需要知道雇主是谁;同样,对于提出需求的程序员或者人工智能开发公司来说,他们所见的也只有一整串隶属于数据标注工的数字ID,以及这些ID所提交的已经完成的任务。因此,云上车间的劳动经由数字平台中介,事实上解构了传统的雇主和劳动者的关系,造成了雇主自身的“去责任化”:他不再需要承担传统雇佣关系中诸如劳动者保障、技能提升、培训等各项职责,而只关注具体需求的进度如何。也正是在这个意义上,流水线上的劳动者、监工与雇主的“肉身”在光学意义上消失,藏身于庞大的

45、算法之后(二)成为机器延伸的人工:劳动协作的幽灵化劳动“幽灵化”的第二个层面体现在劳动协作方式的变化。与劳动诸要素隐藏在机器背后不同,“成为机器的延伸”意味着具体的劳动协作将以算法逻辑重新组织。传统车间的生产协作主要依赖线性的生产链条,工人可以依据一定的流水线模式进行分工和协作。而在云上车间中,平台通过数字技术打破物理空间的局限,对各个生产环节进行了直接的拆分。标注工的整个生产流程围绕着算法需求这样一个“核心”来进行多“边缘”同时协作。也就是说,“核心-边缘”的网络层级化劳动分工取代了传统的流水线作业模式。(见图3)“核心-边缘”的层级化体系首先体现在,云上车间的劳动分工存在着以算法逻辑为核心

46、的“概念劳动”与“执行劳动”的分离。按照布雷弗曼的说法,泰罗制管理技术的引人使得作为管理者的经理极大地掌握着劳动的控制权:管理者主要负责对工作流程的概念分类,普通工人只需直接执行管理的命令而无须理解其技术内涵。在数据标注劳动中,算法取代了传统车间中经理对“概念”的垄断,成了对工人发号施令的一方。在“执行”层面,数据标注工的劳动分工首Vallas,S.,Schor,J.B.,What Do Platforms Do?Understanding the Gig Economy,Annual Review of Sociology,46(1),2020,Pp.273-294.2徐景一:算法主导下的平

47、台企业劳动关系与治理路径,社会科学辑刊2 0 2 1年第5期,第16 6 页。3【美 哈里布雷弗曼:劳动与垄断资本:二十世纪劳动的退化,方生、朱基俊、吴忆宣、陈卫、张其骚译,北京:商务印书馆,19 7 8 年117戴宇辰,袁冰雨上车间中的劳动折叠工智能数据标注的劳动过程研究第3 期传统车间下达简化指令流水线生产生产出经理劳工A劳工B产品云上车间采集标注算法事核用户反馈图3“核心一边缘”的生产机制先被转换为包括数据采集、数据标注、数据审核、提交与反馈几个环节,每一个环节都被简化为轻点鼠标、框选目标、点击提交等重复性劳动。其次,对于标注工的劳动技能提升来说,每一个标注工上岗之前都要经过培训-试标-

48、考核三个环节,考核通过,确认熟悉规则之后才可以正式上岗工作。第一次培训通常都是看视频,视频中讲解的人通常是某个标注项目的工程师或负责人。在研究者的田野实践中,这类培训视频通常不进行任何劳动技能方面的介绍。面对复杂繁多的规则,讲解人几乎不解释“为什么”,比如哪些是遮挡,哪些属于截断,哪些标注地点应该画在框内等等。对标注规则的理解和把握都掌握在作为需求提出方的技术工程师手中,标注工被边缘化为需求的附庸,失去了在标注中的劳动控制权“核心-边缘”的结构同时使得算法掌握了劳动节奏的主导权。其中,数据标注工的具体劳动时间被平台的算法时间所形塑。在此前的研究中,数字资本对劳动的时间控制有两种方式:一是将不同

49、地点的劳动力聚集在同一个虚拟空间中,形成劳动时间的同步化;二是移动传播技术实现数字劳工们“自由灵活”的办公,打破了劳动实践与休闲时间的界限。车间的云端化不仅使得上述劳动时间的控制得以可能,在数据标注工的具体劳动中,还存在着依照平台的算法时间,而非自然时间或社会时间开展劳动的第三种时间控制方式。在研究者进行田野实践的B平台上,每个项目都有着自已的劳动时间倒计时,而这个时间只在工作日的早上9 点到晚上6 点之间流动,标注工称之为“走时间”。也就是说,如果当天上午9 点钟标注工甲打开了一个新标注题包A,那么此公会所有此项目劳动者都要在倒计时9 小时(也就是当晚6 点)之前结束在题包A中的标注。倒计时

50、结束,题包会自动回收,没有标注的题会被视为不合格而被审核方打回。如果大家在下午4点就结束了题包A的标注并完成提交,平台会自动下发题包B,重新开始倒计时,但B的倒计时将会在当天晚上6 点的时候停止倒计时,而到了第二天早上9 点继续开始倒计时,B题包真正的截止时间也就在第二天的下午4点。此时,劳动者必须根据技术的特点动态调整自己的工作节奏。依据平台“走时间”的特点,想要多做工作、继续劳动的劳动者就会选择在即将结束当天的任务时打开新的题包,从而继续延长自己的劳动时间、做更多的工作。但是,这样的走时间也在某些时刻成为劳动者的阻碍,比如当某个题包异常复杂,难度突然增大,9 个小时内无法完成全部的标注,标

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服