1、 心理学报 2024,Vol.56,No.4,497514 2024中国心理学会 Acta Psychologica Sinica https:/doi.org/10.3724/SP.J.1041.2024.00497 收稿日期:2023-08-22*国家自然科学基金青年项目(72101132);国家社科基金青年项目(20CZX059)。通信作者:许丽颖,E-mali:;喻丰,E-mail: 497 感知不透明性增加职场中的算法厌恶*赵一骏 许丽颖 喻 丰 金旺龙(武汉大学心理学系,武汉 430072)摘 要 职场中用算法作为人类决策的辅助和替代屡见不鲜,但人们表现出算法厌恶。本研究通过 4
2、个递进实验在不同职场应用场景下比较了人们对于人类决策者与算法决策者所做决策的态度,并探讨其内在机制和边界条件。结果发现:在职场情境中,相比于人类决策者,人们对算法决策的可容许性、喜爱程度、利用意愿更低,表现出“算法厌恶”。这一现象的内在心理机制是相比于人类决策,人们认为算法决策者的决策更加不透明(实验 23)。进一步研究发现,当算法被赋予拟人化特征时人们扭转了对算法决策的厌恶,提高了对其的接纳态度(实验 4)。研究结果有助于更好地理解人们对算法决策的反应,为推动社会治理智能化、引导算法使用伦理化提供启示。关键词 算法厌恶,透明性,拟人化,职场 分类号 B849:C91 1 引言 2022年8月
3、Facebook母公司Meta使用算法裁掉了60名劳务派遣员工,不少员工表示,除了听说自己是被算法“随机”解雇之外,并未收到其他的任何解释(Hays,2022)。无独有偶,Meta并非第一个使用算法进行人力资源管理的企业。早在2015年,Amazon针对仓储管理开发了一套人工智能效率检测和评估系统,用来实时监控员工的工作状态,并将其纳入绩效考核之中(Upadhye,2018)。2021年8月,俄罗斯一家在线支付服务公司Xsolla同样使用算法评估出的“数字足迹(digital footprint)”解雇了150名 存 在 态 度 问 题 和 效 率 低 下 的 在 职 员 工(McAloon,
4、2021)。职场中的算法使用问题一时间成为社会热点。近些年,越来越多的企业将算法应用于职场环境之中,这提高了组织效率,承担并解放了原先由人力资源管理者来完成的繁杂工作和职责(Basu et al.,2023;Brynjolfsson&McAfee,2014;Chalfin et al.,2016;Duggan et al.,2020;Garg et al.,2022)。据在线招聘平台Career Builder的调查,美国约55%的人力资源经理认为以算法为核心的人工智能系统会在未来几年内成为他们工作的常规部分(HR Daily Advisor Staff,2017)。由此可见,以算法为代表的智
5、能决策体系融入职场逐渐从构想成为现实,并大为发展。与算法进入医疗诊断(Hao,2020)、金融投资(Ahmed et al.,2022)、司法量刑(Hao,2019)、交通驾驶(Badue et al.,2021)等社会生活领域的原因一致,算法之所以能够迅速席卷职场,主要是因为传统的人类决策有其自身无法突破的局限。在传统模式中,作为决策主体的人,极易受到先前经验(Kahneman&Tversky,1972)、情绪(Lerner et al.,2015)等干扰因素的影响而出现决策失误,造成不良后果。然而随着大数据、深度学习、神经网络等计算机技术的蓬勃发展,算法成为了新的决策主体。算法在进行决策的
6、时候,具有对海量信息强大的统摄能力(Blair&Saffidine,2019),且决策速度快(Bonnefon et al.,2016)、客观公正(Andrews et al.,2006)、并且不会受到疲劳和情绪等因素的干扰(Barnes et al.,2015)。也正因此,算法被广泛地应用于提供建议、判断和预 测 领 域,形 成 算 法 决 策(algorithmic decision making)的概念(Burton et al.,2020)。本研究主要关498 心 理 学 报 第56卷 注人们对职场中算法使用的态度,并进一步探索其中可能的内在原因和边界条件。1.1 职场中的算法厌恶 尽
7、管算法决策表现出上述种种优势,为社会效率带来飞跃式提升,但人们似乎并没有因为其强大的算力和准确的预测能力而轻易地接纳算法,反而对这一方兴未艾的新兴技术持有一种普遍的悲观态度(Jussupow et al.,2020;Liu et al.,2023;Mahmud et al.,2022)。部分企业家从经营实务的经验出发,认为自动化崛起将是人类“最大的 生存威胁”(McFarland,2014)。如特斯拉创始人Elon Musk提出,人工智能正在召唤“恶魔”的出场(Lemieux,2017)。前谷歌首席执行官Eric Schmidt表示担心人工智能会给人类带来一种“生存风险”(Kharpal,20
8、23)。哲学家们也对算法决策的兴起存在着一种形而上式的担忧,认为机器代替人类做决定可能会导致一场彻底的灾难(Bostrom,2014)。这场灾难可能是存在论意义上的危机,即一旦人工智能诞生出自我意识,人无异于创造出了一个能够亲手毁灭人类历史、否定人类存在价值的技术“上帝”(赵汀阳,2018,2019)。对于大众来说,尽管算法通常能够比人类更准确地完成决策任务,人们依然会倾向于选择接纳人类的决策而不是算法提出的决策,这种倾向性也被称之为“算法厌恶(algorithm aversion)”(Dietvorst et al.,2015)。这种厌恶倾向实质上是对算法的一种认知偏见,并全面地表现在“知、
9、情、行”等方面(张语嫣 等,2022),即在认知上持有否定态度(例如,Prahl&van Swol,2017)、在情感上表露嫌恶情绪(例如,Lee,2018)、在行为上存在拒绝倾向(例如,Filiz et al.,2021)。算法厌恶同时也表现在绘画艺术判断(Millet et al.,2023)、诗歌美学判断(Hitsuwari et al.,2023)、医疗决策(Longoni et al.,2019)、战争和司法决策(Bigman&Gray,2018)、日常电影和书籍推荐(Longoni&Cian,2022;Yeomans et al.,2019)等领域。在职场中,算法被认为可以在一定程
10、度上消除无意识的人类偏见(Cheng&Hackett,2021),从而可能做出更加平等、不被干扰的决策。已有研究发现,在普通工作体量下,算法决策在80%以上的情境中是优于人类管理者决策的(Yu et al.,2017)。但即便有此优势,人们依然倾向于认为算法管理是一种“暴政”,就如同“时钟暴政”一般压榨、剥削着员工(Lehdonvirta,2018)。被算法日趋自动化的工作会剥夺人们对自身工作的控制感(Holford,2022),从而降低人在其中所收获的自主性和责任感(Goods et al.,2019;Langer et al.,2021)。并且,算法管理还会通过人们在工作中体验到的自主性和
11、对工作所获 种 种 奖 励 的 期 望 降 低 幸 福 感(Kinowska&Sienkiewicz,2022)。就晋升、解雇、分配年终奖等管理实践中的具体场景而言,人们会倾向于认为算法主体的决策仅仅是量化的、去背景化的,而无法考虑到质性和环境因素并由此做出周全的决策,所以会认为算法决策(与同样的人类决策相比)是不公平的,甚至因此降低了对组织的情感承诺(Newman et al.,2020)。就招聘而言,相比于算法,应聘者更信任由人类管理者来进行简历筛选或面试选拔,这是因为人类管理者的筛选被认为是更可控、公平的(Langer et al.,2019)。而这一现象在应聘者承诺契约时同样有所表现,
12、即相比于招聘人员向应聘者许诺丰厚的薪资、奖金,当他们想通过向你保证你会从工作中收获成长、感受融洽氛围达成合约时,人们更拒绝由算法提出(Tomprou&Lee,2022)。同时,员工会对应用自动化算法的人力资源管理感到包括情感、心理、隐私、社交在内的6种负担,可一旦人类决策者能够参与并把关的话,这种负担就会一定程度地减轻(Park et al.,2021)。因此,本研究提出假设H1:相比于人类人力资源管理者(下文均简称为HR),人们倾向于在认知上拒绝、在情感上厌恶、在行为上回避算法HR在职场中做出有关决策。1.2 感知透明性 面对不同主体的决策,究竟是什么因素造成人们对其产生不同的反应?透明性(
13、transparency)是其重要原因。算法透明性意味着对于用户来说可以理 解 算 法 系 统 正 在 做 什 么,以 及 为 何 这 样 做(Shahriari&Shahriari,2017)。算法透明性所强调的是对于一般使用者而言,智能系统的决策过程与机制要具有可知性和可解释性,决策后果要具有可预测性和可说明性,即决策过程对使用者而言是可以轻易理解的(Nefdt,2020)。透明性之所以如此重要,是因为人们对于决策结果的反应在一定程度上取决 于 决策 者所 提 供的 信息 以 及其 能否 被 解释(Dodge et al.,2019),并且人们希望决策者提供他们能够理解的决策(Herloc
14、ker et al.,2004;McNee et al.,2006)。而事实上,算法系统对人的认知而言却是一个黑箱(black box)(Burrell,2016;Nicholson Price,2018),即算法被人们知觉为一个工作机制神秘且复杂的系统,只能简单地观测到它的输入端和第4期 赵一骏 等:感知不透明性增加职场中的算法厌恶 499 输出端,而无法得知算法究竟是如何处理这一过程并得到结论的(Pasquale,2015)。形成算法黑箱的原因可能是运算过程本身不可预测,亦可能是人们缺乏相关知识经验(Kroll et al.,2017)。但不透明的黑箱性质成为了人们接纳算法的阻碍之一。由于
15、算法缺乏自主解释其决策理由的能力,人们可能会对其产生不公平的理解和不安的感受(Acikgoz et al.,2020;Langer et al.,2019)。并且,研究发现算法透明性能够正向预测算法满意度,也就是说,人们认为算法的决策过程越透明,就会对此算法提供的服务越满意(Shin&Park,2019;Shin,2020)。此外,倘若使用户更了解系统决策的工作原理,人们便会对其拥有更多的信任(Lee&Boynton,2017)。这说明当“算法黑箱”被打开后,人们可能会改变对其固有的负面反应。同时,人们对人类决策的理解通常会展现出过度自信(Chen et al.,2023;Moore&Heal
16、y,2008),即人们过高地估计了自己对于他人心理过程的理解程度。这种偏差的产生可能源于人们直觉内省的将心比心过程(Nisbett&Wilson,1977),可实际上人们在理解他人决策时更多采用的只是直觉(Dane et al.,2012)和启发式(Kahneman,2003)。即使在颇具专业知识的医学领域,普通人也自以为很了解同为人类的医生是如何诊断癌症的(Cadario et al.,2021)。可见,人们对不同的决策主体有不同的感知透明性,而对决策过程的理解又能极大程度上影响人们对于决策的态度。据此,本研究提出假设H2:感知透明性在职场决策主体(人类HR vs.算法HR)对决策反应的效应
17、中起中介作用。1.3 拟人化 拟人化(anthropomorphism)是将人的属性、特征、意向性、心理状态等赋予非人实体的现象(许丽颖 等,2017;Epley et al.,2007)。其中,将一个实体视作具有诸多心智能力的过程是拟人化的重要构成因素之一(Waytz et al.,2010)。思维过程的可理解性乃是诸多心智能力的其中之一,因此当我们认为一个实体的思维活动是可以理解、通达的时候,其实我们就是为它赋予了类人的心智(Gray et al.,2007;Gray et al.,2012)。赋予原本不具可理解性的非人算法以人类独有的感知透明性的过程,自然等同于拟人化的过程。因此透明性构
18、成了人力算法与人力资源管理者之间的重要差别,并使得前者被排除在了具有心智能力的实体范围之外。可以预测的是,倘若将非人算法进行外观(de Visser et al.,2016)、声音(Adam et al.,2021)、动作(Fraune,2020)、心理能力(Moussawi&Koufaris,2019)等不同层次的拟人化操纵,使算法在人的感知中越来越像人,弥合算法与人存在于感知中的差别,或许人们对其的态度会更加积极。先前研究也发现,对机器、算法、人工智能拟人化能够降低人们的厌恶倾向。如对自动驾驶汽车进行表层拟人化(即赋予其类人外观或名称),能够有效提高人们对其的信任(Wu et al.,20
19、23)。再或者相比于声音机械、回应冷漠的人工智能助手,一个具有类人外观、拟人姓名、似人声音以及有温度的情感反应的AI助手,会被使用者认为在心理上有更近的距离,并对其服务给予更高的满意度评价(Li&Sung,2021)。甚至当机器人犯错做出不好的决断时,如果面对一位具有拟人化特征的机器人,人们会认为其具有更高水平的体验性(experience)能力,会因此降低对其失误的负面评价,并在之后选择原谅(Yam et al.,2021)。于是,拟人化促使人们将算法视为一个有心智的主体,并对其采取更加似人的评价和反应,进而在一定程度上影响算法厌恶。特别是对于具有黑箱性质的算法而言,将其拟人化意味着将本不属
20、于非人实体的人类特征赋予它,这在一定程度上拉近了算法与人类两个决策主体之间的差异,使人们对算法的认识更靠近原本对于人类的认识,从而有可能在考虑算法决策有关事宜时更趋近原先对人类决策的态度,进而可能降低算法厌恶的倾向(许丽颖 等,2022)。在职场中,算法决策原本是模糊、被排斥、并不被允许做出相关决策的,而如果赋予其一些人类特质,将原本非人的算法改造为更贴近人类的拟人化算法,人们在接受其所给出的决策时就理应会有更积极反应。于是,本研究提出假设H3:算法拟人化在职场决策主体(人类HR vs.算法HR)对决策态度的影响中起调节作用。这意味着相比于非拟人化算法,人们更加接纳拟人化算法HR的决策。1.4
21、 研究概览 基于以上论述,本研究进行了4个系列实验,试图考察人们对职场中算法HR决策的态度是否有别于对人类HR决策的态度,并在此基础上进一步探讨其心理机制和边界条件。基本假设是:相比于传统的人类HR,人们对算法HR决策的态度更加厌恶,态度具体则指认知上不容许、情感上不喜欢、行为上不愿再使用算法做相似决策。这一效应将会受到感知透明性的中介和拟人化的调节。本研究采500 心 理 学 报 第56卷 用递进的4个情境实验来探索此假设的有效性,涉及到的职场决策包括招聘录用(实验1)、年终奖分配(实验2)、简历筛选(实验3)和绩效考核(实验4),并涵盖了具有代表性的全国范围被试和大学生被试。具体而言:实验
22、1探索主要假设,即人们表现出对职场中算法HR决策的厌恶反应。实验2探究其中的潜在的心理机制,试图发现感知透明性在决策主体影响决策态度中的中介作用。实验3通过操纵算法决策的透明度,进一步考察感知透明性是否是导致人们对算法HR决策产生厌恶的前因。实验4探索职场中人力决策主体对人们的决策态度影响可能的边界条件,探求拟人化在决策主体影响决策态度中的调节效应。2 实验1:职场中的算法厌恶 实验1的目的是初步探讨与人类HR相比,人们对算法HR所做决策的态度是否更加厌恶。我们采用情境实验的方法,将被试随机分配至人类组和算法组,分别阅读人类HR和算法HR做出决策的情境材料并报告对其决策的可容许性、喜爱程度和对
23、该HR的利用意愿,以此比较人们对人类HR和算法HR决策的态度差异,验证职场中算法厌恶的存在。2.1 方法 2.1.1 被试 本研究首先使用G*Power 3.1软件(Faul et al.,2009)计算研究所需样本量。以独立样本t检验为统计方式,显著性水平=0.05且中等效应量(d=0.5)时,为了达到90%统计检验力,本实验至少需要172名被试。为了确保最终有足够的数据用于分析,我们通过问卷星平台在某高校内发放了416份问卷,排除未通过注意力检测题目的72份问卷后得到344份问卷,问卷回收率为82.69%。再排除未通过操纵检查41份问卷后,最终得到303名被试的问卷用于统计分析(总回收率为
24、72.84%),其中男性125名(41.3%),女性178名(58.7%),平均年龄M=20.80岁,SD=1.61岁。参与实验的被试被随机分派到人类组和算法组,其中人类组163人,算法组140人。所有被试均自愿参加实验且知情同意,通过注意检查的被试在实验结束之后获得相应实验报酬。2.1.2 实验设计与程序 实验1为单因素两水平被试间实验设计,两组分别为人类组和算法组,所有被试随机分配到其中一组,首先阅读对应的人类HR或算法HR做决策的情境材料。被试阅读的材料为(决策主体的变化通过字体加粗显示):“在去年的秋季招聘中,九日集团的人力资源总监王鹏负责九日集团的人力资源总监王鹏负责/九日使用九日使
25、用“330F”招聘算法对投递招聘算法对投递简历的应届毕业生进行评估。整个招聘过程,由王鹏总监带领他的团队王鹏总监带领他的团队/算法算法“330F”独立完成、全权决定、并对招聘结果负责。王鹏团队是业内资深的人力评估团队王鹏团队是业内资深的人力评估团队/“330F”招聘算法是一种新型招聘算法招聘算法是一种新型招聘算法,能够仔细审查应聘者的简历和背景,准确预测未来可以满足工作岗位需求的员工、适合企业文化的员工,能够从海量应聘者中找出最适合该企业该岗位的员工。据了解,参与面试的应届毕业生有50人,但最终经过王鹏团队王鹏团队/“330F”招聘算法招聘算法的决定,仅录取5人(满足九日公司要求的10%通过率
26、),名单如下:王圣义、黄焦旭、陈振江、谢文祥、许翰芸,王鹏团队王鹏团队/“330F”招聘算法招聘算法第一时间将录用名单上传并公示在招聘网站上,但并未对此进行其他说明(包括评估分数排名、评估细则等等)”。以上材料改编自Newman等人(2020)的研究,两组被试所阅读的材料仅更换了决策主体的身份(即进行招聘筛选并做出最终决定的是王鹏领导的人类资源团队或招聘算法“330F”),而不作其他任何更改。为了确保被试认真阅读并理解了情境材料的内容,被试在阅读完情境材料后被要求回答注意力检查题目,即人类组被试回答“九日集团实施招聘的决策主体(决策主体指:参与、主导、执行决策的实体,是决策系统的灵魂和核心)是
27、资深的人力资源总监王鹏及其团队吗?”,算法组回答“九日集团实施招聘的决策主体(决策主体指:参与、主导、执行决策的实体,是决策系统的灵魂和核心)是新型招聘算法“330F”吗?”,被试可选择回答“是”或“否”,回答“否”的被试则视为未能通过注意力 检查。在阅读完情境材料并进行注意力检查后,被试被要求填写了对上述决策可容许性、喜爱程度和利用意愿的有关测量问题。其中可容许性(permissibility)的测量改编自Bigman和Gray(2018)的有关测量,要求被试回答以下3个题目(括号中为算法组题目):“王鹏(算法“330F”)做出的决定是否合适?”(15评分,1代表完全不合适,5代表完全合适)
28、;“王鹏(算法“330F”)是否应被允许做出这些决策?”(15评分,1代表完全不应被允许,5代表完全应被允许);“王鹏(算法“330F”)是否应被禁止做出这些决策?”第4期 赵一骏 等:感知不透明性增加职场中的算法厌恶 501 (15评分,反向计分,1代表完全不应被禁止,5代表完全应被禁止)。3个题目采用李克特5点量表计分,第三个题目为反向计分题目,三题总得分越高表明被试对情境中人类(算法)决策的可容许性越高。实验1中该可容许性测量的内部一致性信度Cronbachs =0.76。被试还被要求回答两题用于测量其对决策主体所做决策的喜爱程度的题目,该两题改编自Jago(2019)的研究,采用李克特
29、7点量表计分,分别为:“你有多赞成王鹏(算法“330F”)所做出的上述决策?”(17计分1代表完全不赞成,7代表完全赞成);“你有多喜欢王鹏(算法“330F”)所做出的上述决策?”(17计分,1代表完全不喜欢,7代表完全喜欢)。2个题目采用李克特7点量表计分,得分越高表明被试对情境中人类(算法)所做的决策越喜爱。实验1中两题目间相关系数r=0.701,p 0.001。此外,被试还被要求报告了其对于该决策主体的利用意愿,即“如果你是一位企业负责人,你在多大程度上会聘用王鹏及其团队(智能算法330F)来完成上述决策工作?”,该题目改编自Cadario等人(2021)的相似测量,并且同样采用李克特7
30、点量表计分(17计分,从“1=完全不可能”到“7=极有可能”),得分越高表明被试对情境中决策主体的利用意愿更强。最后,被试报告了性别和年龄两项人口统计学信息。另外,在问卷填写过程中还有两道随机出现的注意力检查题目(如:此题请选择1)用于筛选未认真作答的被试。2.2 结果 独立样本t检验结果表明,人类组被试对决策主体所作决策的可容许性评分(M=10.60,SD=1.84)显著高于算法组(M=9.25,SD=2.38),t(301)=5.56,p 0.001,Cohens d=0.63。同时,人类组被试对决策主体所作决策的喜欢程度评分(M=7.89,SD=2.10)也显著高于算法组(M=7.3,S
31、D=2.10),t(301)=2.08,p=0.038,Cohens d=0.24。此外,以利用意愿作为因变量,发现人类组被试对人类HR的利用意愿(M=4.04,SD=1.42)高于算法组被试对算法HR的利用意愿(M=3.74,SD=1.50),t(301)=1.75,p=0.081,Cohens d=0.21,差异不显著,但p 0.1,产生了较小的效应量(Cohen,1969)。以上结果见图1所示。以决策主体(人类 vs.算法)为自变量,反映人们对算法态度的可容许性、喜爱程度、利用意愿三个指标得分为因变量进行多元方差分析(MANOVA)。结果表明,决策主体的主效应显著,Wilks =0.89
32、6,F(3,299)=11.615,p 0.001,2p=0.104。图1 人类组和算法组的结果比较 注:*p 0.05,*p 0.001 2.3 讨论 实验1初步验证了在职场中当算法被应用于招聘所做出的决策相较于人类所做的同样决策更不被允许、更不被喜欢,并且人们更不愿意利用算法为自己进行相同任务。该实验证据基本支持了算法厌恶在职场中的存在。但实验1仅仅涉及到人力资源管理工作的一部分,即招聘新员工,且未对算法厌恶背后的机制做进一步的探讨。因此,实验2将实验情境设置为应用算法进行年终奖发放工作,以提高实验稳健性,并在其基础上进一步探索感知到的透明性在其中的中介作用。3 实验2:感知透明性的中介作
33、用 实验2在实验1的基础上丰富了职场中人力资源管理工作的决策情境,考察了年终奖分配决策,同时进一步探讨感知透明性在其中可能发挥的中介作用。3.1 方法 3.1.1 被试 根据Monte Carlo模拟法,我们参考实验1中效应量Cohens d=0.63,取90%的统计检验力和较窄的稳定性走廊(corridor of stability)宽度w=0.1,得出实验所需最小样本量为150(Schnbrodt&Perugini,2013)。于是,我们通过Credamo平台招募被试,实时剔除没有通过注意检查的被试数据并滚动采集,最终得到179份有效数据。平均年龄M=30.85岁,SD=7.09岁,其中女
34、性115名(占比为502 心 理 学 报 第56卷 64.2%),男性64名(占比为35.8%)。被试被随机分派到人类组(90人)和算法组(89人)。所有被试在实验开始之前均仔细阅读了实验说明并知情同意,通过注意检查的有效数据被试在实验结束后获得相应实验报酬。3.1.2 实验设计与程序 同实验1,实验2也采用单因素两水平被试间实验设计,被试首先阅读人力资源决策者(人类或算法)分配年终奖的材料。情境材料改编自Newman等人(2020)的研究,两组被试所阅读的材料仅更换了决策主体的身份及相关措辞,而不作其他更改(两段材料的区别以加粗标出)。人类组阅读:“新月公司刚刚完成了年终奖金的发放过程。为了
35、确定每位员工所获得的年终奖数额,新月公司依靠其资深的人力资源经理张云带领的团队资深的人力资源经理张云带领的团队进行决策,该团队团队考虑了种种因素。在张云带领的人力资源团队张云带领的人力资源团队进行了一系列审议审议过后,确定了员工年终奖的具体分配模式”;而算法组阅读:“新月公司刚刚完成了年终奖金的发放过程。为了确定每位员工所获得的年终奖数额,新月公司依靠一种可靠的人力资源智能算法一种可靠的人力资源智能算法“RTC”进行决策,该算法算法考虑了种种因素。在智能算法智能算法“RTC”进行了一系列计算计算过后,确定了员工年终奖的具体分配模式”。在阅读完材料后,被试首先报告自己对上述情境中决策的可容许性、
36、喜爱程度、利用意愿的评分,测量方式同实验1。可容许性测量在实验2中的内部一致性信度为Cronbachs =0.80,喜爱程度测量的两题目间相关系数r=0.660,p 0.001。随后,我们通过一个题目(参考Cadario et al.,2021)测量了被试对所阅读材料中决策主体进行决策活动的感知透明性,即“你在多大程度上理解张云(算法“RTC”)是如何做出上述决策的?”,采用李克特7点量表计分(从“1=完全不能理解”到“7=完全能理解”),得分越高代表被试认为所阅读的材料中决策主体的决策更能被理解,亦即感知更透明。最后,被试回答和实验1相同的注意力检查问题(如“此题请选择1”),这些问题均混杂
37、在测量题目中出现,以便于筛选被试。并且报告了性别和年龄两项人口统计学信息。3.2 结果 3.2.1 决策主体对可容许性、喜欢程度和利用意愿的影响 独立样本t检验结果表明,人类组和算法组在三个测量指标上均存在显著差异。以可容许性为因变量时,人类组被试的评分(M=12.64,SD=1.89)显著高于算法组被试的评分(M=11.76,SD=2.38),t(177)=2.74,p=0.007,Cohens d=0.41;以喜欢程度为因变量时,人类组被试的评分(M=11.13,SD=1.98)显著高于算法组被试的评分(M=10.45,SD=2.39),t(177)=2.09,p=0.038,Cohens
38、 d=0.31;以利用意愿为因变量时,人类组被试的评分(M=5.89,SD=0.88)显著高于算法组被试的评分(M=5.27,SD=1.36),t(177)=3.62,p 0.001,Cohens d=0.54。以决策主体(人类 vs.算法)为自变量,性别和年龄为协变量,反映人们对算法态度的可容许性、喜爱程度、利用意愿三个指标得分为因变量进行多元方差分析(MANOVA)。结果表明,决策主体的主效应显著,Wilks =0.925,F(3,175)=4.730,p=0.003,2p=0.075。3.2.2 感知透明性的中介效应 独立样本t检验结果表明,决策主体对感知透明性的影响显著,人类组感知透明
39、性评分(M=5.44,SD=1.15)显著高于算法组(M=5.02,SD=1.31),t(177)=2.29,p=0.023,Cohens d=0.34。为了进一步探索决策主体对决策态度影响的心理机制,我们使用Hayes(2013)提供的SPSS插件PROCESS(Model 4)进行探索。我们以决策主体为自变量(人类组=1,算法组=2),感知透明性为中介变量,分别选取可容许性、喜欢程度和利用意愿为因变量,设定Bootstrap样本量为5000,采用偏差校正的方法,选取95%置信区间进行中介效应检验。数据结果显示(如表1所示),当以可容许性为因变量时,感知透明性的中介效应值为0.50,95%的
40、Bootstrap置信区间为0.96,0.08,不包含0,表明中介作用显著。并在控制中介变量后,决策主体对可容许性的直接效应为0.38,95%的Bootstrap置信区间为0.85,0.09,包含0,表明其直接效应不再显著,证明感知透明性在决策主体对可容许性的影响中起到中介作用。当以喜爱程度为因变量时,感知透明性的中介效应值为0.56,95%的Bootstrap置信区间为1.09,0.09,不包含0,表明中介作用显著。并在控制中介变量后,决策主体对可容许性的直接效应为0.12,95%的Bootstrap置信区间为0.55,0.32,包含0,表明其直接效应不再显著,证明感知透明性在决策主体对喜爱
41、程度的影响中起到中介作用。当以利用意愿为因变量时,感知透 第4期 赵一骏 等:感知不透明性增加职场中的算法厌恶 503 表1 实验2中介效应显著性检验的bootstrap分析及效应值 因变量 中介效应值 95%间接效应LLCI 95%间接效应ULCI直接效应值95%直接效应LLCI 95%直接效应ULCI可容许性 0.50 0.96 0.08 0.38 0.85 0.09 喜欢程度 0.56 1.09 0.09 0.12 0.55 0.32 利用意愿 0.25 0.51 0.04 0.37 0.63 0.10 明性的中介效应值为0.25,95%的Bootstrap置信区间为0.51,0.04,
42、不包含0,表明中介作用显著。并在控制中介变量后,决策主体对可容许性的直接效应为0.37,95%的Bootstrap置信区间为0.63,0.10,仍旧不包含0,表明其直接效应同样显著,感知透明性在决策主体对利用意愿的影响中起到部分中介作用。为了进一步验证中介效应的稳健性,我们又使用传统逐步回归方法进行了中介效应分析(温忠麟 等,2004),结果见图2。图2 感知透明性的中介作用 注:*p 0.05,*p 0.01,*p 0.001 3.3 讨论 与实验1结果一致,实验2再次验证了职场中存在的算法厌恶现象,即人们更偏爱人类做出的决策,更不允许、不喜欢、也不愿再利用算法去做决策,即使两者决策内容完全
43、一致。同时,我们进一步发现了感知透明性在其中发挥的中介作用,即人们厌恶算法HR做决策的原因是他们的决策过程被人感知为更不透明,更无法被理解的。实验1和实验2稳定证明了人们对职场算法的厌恶倾向,同时对感知透明性的中介作用做出了初步探索。为进一步提高对算法厌恶机制的深层次理解,我们将在实验3中操纵被试对算法决策的透明性感知,并假设感知透明性越高,被试便越允许、喜欢、愿意利用算法做相关的人力资源决策。4 实验3:操纵感知透明性 研究3我们比较人们对不同透明性算法决策的倾向,并聚焦于简历筛选这一重要的人力资源工作,以提高研究结果稳健性,并进一步深入讨论感知透明性的中介作用。4.1 方法 4.1.1 被
44、试 采用G*Power 3.1软件(Faul et al.,2009)计算本实验所需样本量,对于本实验适用的独立样本t检验,取中等效应量d=0.5,显著性水平=0.05,计算结果表明,至少需要172名被试才能达到90%统计检验力。通过Credamo平台招募被试,实时剔除没有通过注意检查的被试数据并滚动采集,最终得到180份有效数据。平均年龄为31.17 7.41岁,其中女性115名,占比为63.9%,男性65名,占比为36.1%。被试被随机分派到低透明性组(88人)和高透明性组(92人)。所有被试在实验开始之前均仔细阅读了实验说明并知情同意,有效数据被试在实验结束后获得实验报酬。4.1.2 实
45、验设计与程序 实验为单因素两水平被试间设计。被试被随机分配到高透明性算法和低透明性算法两个组别中的一个。首先,两组被试分别阅读改编自Newman等人(2020)研究的算法筛选简历的情境材料。低透明性组阅读的材料为:“在去年的秋季招聘中,冰泉公司使用了一种智能招聘算法“IRAN”对应聘该公司岗位的毕业生们进行简历评估。智能招聘算法“IRAN”基于反向传播神经网络进行电子简历的智能筛选。冰泉公司将智能招聘算法所制定的统一格式的电子简历模板通过公司官网发布,并要求所有应聘者均使用此模板进行填写简历。整504 心 理 学 报 第56卷 个简历评估过程,由智能算法“IRAN”独立完成,全权决定,并对其结
46、果负责。简历筛选评估的过程,是面试工作的基础和重要部分”;高透明性组阅读的材料为:“在去年的秋季招聘中,冰泉公司使用了一种智能招聘算法“IRAN”对应聘该公司岗位的毕业生们进行简历评估。智能招聘算法“IRAN”基于反向传播神经网络进行电子简历的智能筛选。智能算法智能算法“IRAN”将应聘人员的综合素质分成如下五个模块:基本指标将应聘人员的综合素质分成如下五个模块:基本指标(包括学历层次、外语水平、获奖情况等包括学历层次、外语水平、获奖情况等),人格特质人格特质(责任心、自信心、包容心等责任心、自信心、包容心等),品行动机品行动机(成就动机、学习动机、大局观等成就动机、学习动机、大局观等),知识
47、技能知识技能(学科专业能力、科研成果等学科专业能力、科研成果等),能力素质能力素质(岗位工作经验、团队协作能力、创新能力、利用工具能力等岗位工作经验、团队协作能力、创新能力、利用工具能力等)。冰泉公司将智能招聘算法所制定的统一格式的电子简历模板通过公司官网发布,并要求所有应聘者均使用此模板进行填写简历。智能招聘算法智能招聘算法“IRAN”已经过大数据已经过大数据BP神经网络的深度学习神经网络的深度学习,通过内测通过内测,近乎成熟近乎成熟,能够独立且完美的完成电子简历的筛选。能够独立且完美的完成电子简历的筛选。整个简历评估过程,由智能算法“IRAN”独立完成,全权决定,并对其结果负责。简历筛选评
48、估的过程,是面试工作的基础和重要部分”。两组被试所阅读的材料中,算法“IRAN”所面临的任务相同,能力相同,决策结果均未知,但高透明组度材料详细介绍了算法“IRAN”是根据何种指标做出决策的(以字体加粗标记突出)。由此实现对高低透明性的操纵,即高透明性是指给予被试对算法决策过程和计算能力更多的额外解释。随后,被试填写实验2中测量感知透明性的题项,用于检验我们的操纵是否成功。并填写实验2中用于测量可容许性、喜欢程度和利用意愿的题项,在本此次实验中,可容许性三个题目的内部一致性信度Cronbachs =0.896,喜欢程度两题目相关性显著(r=0.854,p 0.001)。最后,所有的被试回答与先
49、前实验相同的注意力检查问题,并报告了性别和年龄两项人口统计学信息。4.2 结果 独立样本t检验结果表明,高透明性组被试报告的感知透明性得分(M=5.68,SD=1.19)显著高于低透明性组(M=4.84,SD=1.68),t(178)=3.90,p 0.001,Cohens d=0.58。说明我们对感知透明性的操纵是有效的。独立样本t检验结果表明,高透明性组被试报告的可容许性评分(M=12.25,SD=2.53)显著高于低透明性组(M=10.66,SD=3.42),t(178)=3.56,p 0.001,Cohens d=0.53;高透明性组被试报告的喜欢程度评分(M=10.83,SD=2.6
50、4)显著高于低透明性组(M=9.05,SD=3.10),t(178)=4.16,p 0.001,Cohens d=0.62;高透明性组被试报告的利用意愿评分(M=5.57,SD=1.33)显著高于低透明性组(M=4.68,SD=1.66),t(178)=3.94,p 0.001,Cohens d=0.59。上述结果如图3所示。图3 不同透明度条件的结果比较 注:*p 0.001 以透明性为自变量,性别和年龄为协变量,反映人们对算法态度的可容许性、喜爱程度、利用意愿 三 个指 标得 分 为因 变量 进 行多 元方 差 分析(MANOVA)。结果表明,透明性的主效应显著,Wilks =0.907,