1、反垄断43中国价格监管与反垄断2024 年第 3 期大数据时代算法偏见法律治理研究刘润贤摘要:在大数据时代,算法偏见呈现出日益严重的趋势。算法偏见易产生不正当竞争、抑制创新能力、固化社会既存偏见的消极后果。结合域外经验和本国实际情况,可以从明确算法偏见责任主体、提升算法透明度、完善市场准入与内部治理机制三个方面来解决这一问题,为纠正算法偏见现象提供合理对策。关键词:算法偏见 法律治理 算法责任引言大数据时代的到来给传统的工作和生活方式带来了极大的变化,人们在作出消费决策、预测市场行情、评估风险时,都要通过海量的数据分析来进行。从旅游购物到教育医疗,形形色色的数据充斥着社会的方方面面。然而,仅仅
2、拥有数据无法实现预测、评价、决策的目的,海量的数据必须通过计算机算法才能够挖掘出其内在的价值。随着社会信息化、数据化程度的加深,算法必然会在社会发展进程中扮演越来越重要的角色,对算法进行正向引导,加强技术监管,深化法律治理具有重大意义。一、算法偏见的内涵与成因(一)算法偏见的内涵“偏见”一词多用于生活中的价值判断,意为对某一事物或者某一现象做出的不公正的价值评价或者价值判断。因此先前的主流观点认为偏见更多包含的是人类心理上的主观因素,算法作为数据的综合运用程序,是由 0 和 1 组合成的二进制代码,缺乏人类主观意识独有的价值判断。因此,算法始终能够保持客观、中立的立场进行判断和决策。但是随着算
3、法应用的扩大,已经有很多案例表明,算法依然会输出不公正的结果。1例如,在就业推荐服务系统中,针对高薪工作岗位的推荐数量男性是女性的 6 倍。类似案例不胜枚举,可见看似客观中立的算法系统依然存在传统的偏见现象。“算法”一词来源于计算机学领域,指的是将输入项转换为输出项的一系列的指令和步骤。算法偏见可以认为是社会生活中存在的偏见在计算机网络中的映射,算法上的偏见往往可以反映出社会的主流价值观、阶层分布等情况。因此算法偏见可以定义为根据预先设计的算法输入数据所产生的违背社会公正、客观、中立价值并产生法律、伦理风险的输出结果。(二)算法偏见的成因1.客观数据存在“主观偏见”。如前所述,算法是为了完成特
4、定的任务而预先设计的一系列计算机指令、步骤,算法自身并不能完成设计者所预期的任务,必须通过输入相关数据,算法才能够发挥自身的作用。因此所输入数据的质量高低是影响算法发挥预期作用的重要因素。数据作为算法的自变量(x),一旦存在偏差,那么经过算法处理后的数据结果因变量(y)也必然会存在偏差,二者呈现函数式的相关关系,即 y=f(x)。在数据收集阶段,必须要保证所收集的数据能够充分反映出对象的性质,如果数据收集不够全面,出现片面化的倾向,那么少数数据所代表的特性就无法被自变量所反映,导致输出结果忽视少数数据的特性,从而造成对少数主体的不公正偏见现象。2其次,数据本身可能存在丧失时效性的问题。众所周知
5、,数据是生产生活中,例如在线购物、网上聊天、刷脸等活动中即时产生的,因此数据的有效性是建立在时效性基础之上的,数据一旦丧失其时效性,也就意味着失去了内在的价值。因此,在数据收集的过程中,应当要及时筛选出不合时宜的过时数据予以清除,否则数据将难以反映样本的真实情况,导致输出的结果存在偏差,甚至是得出错误的结果。2.主观偏见见之于“客观偏见”。算法虽然是利用数据之间的相关性来导出结果,更多地是呈现出函数式的逻辑运算关系,与自然人内心的价值判断并无直接联系。3但是算法并不是凭空产生的,而是由设计者为了完成特定的任务而设计、研发形成的,其基本要素包括算数运算、逻辑运算、关系运算和数据传输,这些要素都是
6、由设计者所设计、反垄断44中国价格监管与反垄断2024 年第 3 期研发形成的,因此设计者内心的偏见会自然而然的映射在其所研发设计的算法之中。如果设计者本身对某一对象存在主观偏见的话,那么在对数据进行筛选或者在对算法进行标签的过程中,往往会按照自己的偏好进行,使自变量充分反映出自己的偏爱的部分样本特征,而忽略了本身所厌恶的样本特性,使算法结果产生偏见,导致个人主观偏见影响了算法的公正性。二、算法偏见法律治理必要性探析(一)算法偏见导致不正当竞争以信息化、科技化、数据化为特征的现代化生活方式,造就了区别于传统社会的购物、休闲、旅游等新型消费方式。以往购物需要到实体店进行挑选、购买,现在仅需要在手
7、机 APP 上点几下,就可以享受到送货上门的服务。通过各种线上软件,人们可以大致了解到旅行所需的费用和最佳出行路线等相关信息;利用网络算法推荐的商家排名,人们可以作出消费决策等。市场是供需关系形成的产物,消费者消费方式的变化必然会引起商家销售方式变化。网络平台开始成为商家竞争的主阵地,通过各种手段和网络算法影响消费者的消费选择,成为获取竞争优势的重要途径。例如,引起广泛争议的百度竞价机制,商家通过与百度平台的交易,以缴纳的费用高低作为排名的依据,使出价高的产品与服务在平台上获得更有力的推荐,从而在市场角逐中取得竞争优势。其次,商家更倾向于从 APP 中获取消费者的消费数据,通过数据分析来获取消
8、费者的消费偏好,实现产品和服务的定向推送,同时抑制消费者的选择空间,形成商家对消费者的强势地位。所谓的“大数据杀熟”就是商家通过捕捉消费者的消费习惯和消费能力所形成的。因此,尽管算法能够实现产品、服务的定点推荐,提高交易效率,但是会造成商家的不当竞争,忽视产品和服务质量的提升,将竞争的重点放在如何在网络上吸引消费者的注意力上。4这对市场经济的长期发展显然是不利的,助长了不当使用网络算法现象的滋生,抑制了实体经济的正向发展。(二)算法偏见抑制创新能力从自然人的角度来看,思维的创新往往源于所接触到的事物打破了以往固有的认知局限,从而产生一种进步性、开创性的创新意识,之后再将这种创新意识付诸于行动,
9、实现社会的发展。在这一过程中,第一步需要个人接触到大量的、新颖的信息和事物来激发思维的活跃性。因此,个人接触到的事物和信息越多、越新颖,产生的思考就会更多,进行创新的可能性也就越大。然而,在一个充满算法偏见的社会中,人们所接触到的信息都是算法所推荐、生成的符合自身偏好的事物,这在无形中极大地限制压缩了个人的认知层面,使其只能看到算法希望人们看到的内容,而对经过算法偏见已经排除在外的事物和信息则很难接触到。这无疑对打破固有思维惯性、激发创新意识有着消极的作用。另一方面,算法根据个人的喜好来推送目标商品或服务,久而久之会加重对偏好以外事物的排斥,囿于自身的舒适圈之内,更不愿意涉足陌生领域,尝试新兴
10、事物。从商家的角度来看,如果对算法偏见采取放任态度的话,商家会想方设法在算法本身中获取竞争优势,通过算法偏见排除竞争对手,吸引消费。而产品、服务本身质量的提升会被商家所忽略,降低商家对自身产品、服务本身质量的投资。另一方面,消费者单纯通过网络算法推荐来作出消费决策,易导致消费选择减少,某些被算法所认为不符合消费者需求的产品或服务实际上并不见得比算法所推荐的要差,只是无法通过算法的筛选进入消费者的选择范围。这对于那些品质优良但未被算法认可的产品和服务来说是不公平的。这种情况与市场经济优胜劣汰的法则相左,长此以往,在大数据时代,市场经济的活力不增反减。(三)算法偏见固化既存偏见算法是由人类设计并且
11、用之于人类生产、生活的新型工具,在算法的设计和运用中,人类社会的既存偏见不但不会消失,反而可能会被固化和加深。人类社会的既存偏见形形色色,比如性别偏见、年龄偏见等,这些社会的既存偏见会反映在算法当中。一般情况下,算法的设计者会将这些既存偏见作为算法的标签,通过标签实现算法的过滤作用,将受偏见影响的对象直接排除在算法结果之外。一个常见的例子是用于简历筛选的算法,其中性别被用作一个标签,导致女性求职者的简历会被算法运作过程中被直接筛选排除,从而反映了对女性的性别歧视在算法中被反映出来。三、算法偏见的法律治理路径法律是定纷止争的依据和准绳,具有最高的约束力,在大数据时代,法律不仅要发挥对现实世界的规
12、制功能,更要对虚拟世界的乱象进行拨乱反正,如此,才能实现法律对社会的全方位保护。因此要实现对算法偏见持久而有效的治理,必须依靠法律手段。(一)明确算法偏见的责任主体算法是大数据时代的新兴产物,依托于计算机反垄断45中国价格监管与反垄断2024 年第 3 期信息技术的发展而产生,具有很强的虚拟性,如何确定算法偏见的责任主体是明确法律责任的重中之重。一般而言,算法偏见的受害者包括消费者、求职者、求学者等主体。实务中,以商事主体使用算法最为普遍,发生争议也最多,因此可以借鉴有关产品责任的法律规定对算法偏见进行归责。同时应当考虑到算法责任的特殊性,即受害方往往难以知晓幕后的算法研发方,直接接触到的是算
13、法使用方,例如商家、用人单位等。因此从诉讼效率和便宜维权的角度出发,可以将算法的使用方、研发方作为不真正连带责任的主体,受害方遭受到算法偏见的话,可以直接要求算法使用方承担责任,使用方承担责任后可以向有过错的研发方追偿。如果消费者因遭受算法偏见而遭受损失,可以直接向商家要求承担责任,如果商家对算法偏见没有过错的话,可以向算法的研发机构进行追偿。(二)提升算法运行透明度算法是依托于信息技术的产物,高度的技术化、虚拟化是其源发性的特征。对于大多数人而言,算法输入的自变量和输出的结果因变量是有直观感受并且能够理解的。但是算法内部的构成要素、函数模型、推导过程对没有计算机专业知识的人来说是一无所知的。
14、5这对算法维权和算法监督来说是不利的。整个算法运行的过程类似于一个黑箱,人们只能看到放进去和拿出来的东西,至于黑箱内的情况则一无所知。数据时代,算法往往涉及企业的商业秘密,要求企业公开算法的整个运作流程和技术原理显然与实际情况不符。我们可以借鉴欧盟通用数据保护条例的规定,在个人信息保护法中赋予算法偏见受害者以算法解释权以提升算法运行过程的透明度,公民因算法偏见遭受损失有权申请算法使用和研发主体对算法原理、数据推导过程是否存在偏见因素等进行说明和解释。算法使用和研发主体也必须回应该申请,需要向受害者承担解释算法的义务,让申请人对结果是如何产生的、是否存在算法偏见等疑问有更深刻的理解。(三)完善市
15、场准入与企业内部自律机制企业通过算法技术实现不正当的竞争优势,即使产品与服务并无过人之处,占领算法高地的企业也能轻而易举地取得行业竞争优势,这种现象对竞争者和消费者来说都是不利的,因此必须要重视企业的源头治理。应当要牢牢把握市场准入的尺度,对于使用算法的企业必须经过市场监管部门的审批,对企业的信用等级、拟用算法、经营状况等情况进行考察,通过考察后再进行备案登记,特别是所用算法的情况,必须登记备案。同时,在不侵犯商业秘密的大前提下,要求企业承担一定的信息披露义务,将拟用算法的原理向社会公布。此外,市场监管部门应定期对企业的算法使用情况进行跟踪监督,设置不同等级的处罚标准,例如警告、罚款、降低资质
16、等级等,随时纠正企业滥用算法的行为。除外部监管之外,企业的内部自律机制对纠正算法偏见同样重要,可以借鉴国外的做法,在企业内部设立专业的数据合规官,负责对整个企业的数据、信息等事务的专项管理。作为企业内部的算法监督责任人,由数据合规官来承担算法监督、算法解释、算法信息披露、处理算法维权等事务,提升企业算法事务的处理效率,实现企业算法自律管理。6四、结语机遇与挑战总是并存的,信息化、数据化、智能化程度的不断加深,使社会呈现出焕然一新的面貌,但也带来了前所未有的风险和挑战,在这其中算法偏见是我们在大数据时代无法回避的问题。算法作为智能化、信息化生活、生产的必备工具,在未来的社会发展中将扮演者重要的角
17、色。通过完善立法、加强外部监管、完善企业内部治理结构等多措并举,相信算法偏见的现象一定能得到有效的治理,使算法助力大数据时代不断发展。参考文献1 贾诗威,闫慧.算法偏见概念、哲理基础与后果的系统回顾J.中国图书馆学报,2022,48(06):57-76.DOI:10.13530/ki.jlis.2022051.2 孟令宇.从算法偏见到算法歧视:算法歧视的责任问题探究 J.东北大学学报(社会科学版),2022,24(01):1-9.DOI:10.15936/ki.1008-3758.2022.01.001.3 赵学刚,马羽男.算法偏见的法律矫正研究 J.辽宁大学学报(哲学社会科学版),2020,
18、48(05):82-90.DOI:10.16197/ki.lnupse.2020.05.011.4 刘友华.算法偏见及其规制路径研究 J.法学杂志,2019,40(06):55-66.DOI:10.16092/ki.1001-618x.2019.06.006.5 陈洪兵,陈禹衡.刑法领域的新挑战:人工智能的算法偏见 J.广西大学学报(哲学社会科学版),2019,41(05):85-93.DOI:10.13624/ki.jgupss.2019.05.012.6漆晨航,陈刚.大数据侦查算法的规制:以检察监督为思路J.中国人民公安大学学报(社会科学版),2022,38(06):67-73.基金项目:国家社科基金“企业合规视野下企业认罪认罚从宽制度构建及适用研究(21CFX071)”;安徽法治与社会安全研究中心一般项目“全面法治视野下企业合规从宽机制改革的问题展现与制度纾困”.中图分类号:F49(作者单位:安徽大学法学院)