1、数据交易安全港书 Safe Harbor for Data Exchange White Paper 录 Contents 报告要点.?、国内外数据交易实践简介.?.?国外数据交易实践简介.?.?我国数据交易实践简介.?、数据交易现状解析:竞争挑战与法律险.?.?数据交易主体临的竞争性险.?.?数据交易主体临的法律险.?三、数据交易所的未来定位:独特服务优势探索.?.?点对点交易:场外交易的核优势分析.?.?场内交易的优越之处:与场外交易的对分析.?四、上海数据交易所“安全港规则”的理论构建.?.?合规技术层的安全港规则.?.?作为数据交易制度撑的安全港规则.?.?.?安全港规则的功能优势.?
2、.?.?安全港规则设计的难点.?.?.?安全港规则设计的原则.?五、探索之路:安全港规则在上海数据交易所的应.?.?落地路径:创新容错机制与安全港规则.?.?安全港规则激活数据交易的制度价值.?.?数据交易所的蓝图规划:安全港规则的愿景.?六、安全港适前景:案例分析与规则应.?数据交易安全港书 Safe Harbor for Data Exchange White Paper?.?某公司及其业务简介.?.?某公司在数据交易中的问题与安全港规则的适.?七、结论.?参考献.?数据交易安全港书 Safe Harbor for Data Exchange White Paper 1 报告要点“安全港规
3、则”(译自英文“safe harbor rules”,也常被译作“避风港规则”)。目前在我国,包括个人信息保护法 数据安全法 网络安全法等在内的数据领域基础性法律,已建构出一个强调风险预防、损害问责的原则性制度框架。但由于法律中的许多规定较为笼统,市场主体对更高法律确定性和责任可预期性的需求尚待满足。安全港规则旨在为数据交易市场主体提供一个清晰、明确的合规路径,在提升数据交易活动自身安全性的同时,也为交易提供相应的法律保障,从而促进交易规模的扩大、体量的释放和活跃度的提升。具体而言,安全港规则将以数据交易所场内交易的安全保障和技术服务条件为基础,设置更为明确的市场主体合规路径,为后者提供可操作
4、的合规要求和合规方案,从而既降低交易自身带来的数据风险,又为交易主体带来更为确定的合规预期。根据目前的设想,数据交易安全港规则包含“2+2”框架。首先,“合规技术”与“法律规则”相结合,不仅将使用区块链存证、AI智能检测、隐私计算等合规技术手段确保数据交易安全可信,也将引入合规、透明、可操作的法律规则,明确安全港的适用条件、免责后果。其次,“主动投入”与“预期免责”相结合,安全港要求企业满足特定的资质、合规条件,并进行可信披露,主动投入相关成本进行“驶入”安全港的动作,从而获得免责预期:在监管部门的授权下、在数据交易场所建构的可信空间内开展交易,可以避免因为事先未曾预料的风险而事后被追责。安全
5、港规则并不意味着放任市场自由。对于“驶入”安全港的数据交易活动,权威机关仍然有责任和权力对其进行监管。权威机关还可以通过定期审核、随机抽查等方式,确保市场主体真正遵循安全港规则,从而确保数据交易的合规性、透明性和公正性。安全港规则在交易所以集中、透明的方式施行,会更有助于规则倡导的合规交易模式产生溢出效应。相对规范、安全的场内数据交易模式,基于披露机制,可对场外交易产生引导作用,成为更大范围内市场主体在进行数据交易活动时协调行为的聚焦点。即使市场主体因种种原因,不选择或无法选择进行场内交易,也可参照场内交易所适用的安全港规则的要求规划自身行为。这种参照不仅对自行探索合规的企业有价值,对整体层面
6、的风险控制也有价值。上海数据交易所针对案例中展示的市场需求和痛点,建构了包含下列具体措施的数据交易安全港:其一,智能接入,基于企业主动申请和特定场景(特别是创新容错场景)主动接入,对流通交易数据进行智能分类分级、按需接入安全港。其二,可信交易,在合规技术保障下,在监管部门授权、监管、验收等流程下按照特殊规则在港内交易。其三,风险响应,在安全港港内交易,如果存在侵权投诉、情势变更等风险警示情形,及时启动中止交易、信息披露等响应机制,并保障市场主体取得与前期合规投入、创新容错政策相适应的责任豁免。其四,反馈迭代,成立数据交易合规委员会,对安全港规则进行动态调整,并与行业主管部门、监管部门、司法部门
7、进行定期沟通反馈,根据安全港运行情况和需求情况迭代完善相应规则。数据交易安全港书 Safe Harbor for Data Exchange White Paper 2 数据交易安全港白皮书(“白皮书”)开创性地提出应运用“安全港规则”这一制度工具,提升交易主体参与数据交易活动的积极性,释放数据交易动能,并更为高效、平衡地推动数据要素配置过程中安全保障和价值创造两大政策目标的实现。在数据交易的场景中,安全港规则以一套“2+2”框架为主要内容,即“合规技术”与“法律规则”相结合,“主动投入”与“预期免责”相结合。将数据交易所等专业、可信、高效的中介交易场景探索打造成为安全港规则的核心制度适用场景
8、,不但有助于提升数据交易活动的整体安全性,而且有助于市场主体有效管理其在参与创新性、具有高价值产出的数据交易活动时面临的法律风险,降低其不确定性,从而提升市场主体参与交易的积极性和整体交易活跃度。白皮书将在检视当前国内和国际数据交易市场现状的基础上,分析数据交易市场进一步发展所面临的与竞争环境和法律环境有关的核心障碍与挑战。在各方积极寻求数据交易进一步破局的大背景下,应当看到,以上海数据交易所为代表的数据交易中介平台类机构,其提出和开展的多项数据交易安全合规探索,均体现出交易所场内交易在兼顾安全性和效率性方面所具有的独特优势。据此,结合对安全港规则一般制度原理的阐释,白皮书提出,安全港规则是将
9、数据交易实践向前推进的一种可行思路,而数据交易所应被建设成为安全港规则的核心制度适用场景。对于具备相应技术和服务条件,有能力高效保障场内交易相对场外交易安全优势的数据交易所,有关部门应考虑在政策层面为其中的场内交易活动提供基于安全港规则的合规效力,从而促进更大规模的数据交易活动以更安全的方式开展,使得数据要素在流通中获得更高的整体配置效率。、国内外数据交易实践简介 1.1 国外数据交易实践简介 数据交易并非互联网时代的独有现象,它的根源追溯到远早于数字化浪潮的时代。实际上,数据的交换和利用在商业活动中一直占据着核心地位,无论是古代商人通过手稿记录和交换贸易信息,还是工业时代通过统计数据优化生产
10、流程,1数据交易始终是推动知识发展和经济增长的重要力量。然而,互联网时代的到来加速了数据交易的速度与规模,使其成为日常商业活动中不可或缺的一部分。随着科技的不断发展,数据交易的概念和实践也经历了深刻的变革。特别是在 1970年代左右,随着电子技术的普及,海外特别是美国的数据交易开始步入电子化时代,这一变化使得数据交易的模式和效率都发生了质的飞跃。具体来看,美国的数据交易模式主要分为三种类型,各自有着不同的运作机制和参与主体。1 由于商业需求的存在,即便当时还没有如今这般便利的数字技术,美国也已经开始了实质意义上的数据交易。伴随着独战争与南北战争,美国近代业初步形成,产值在 1810 1860
11、年间增了 10 倍;在这过程中,美国企业在商业活动中越发需要更准确的信息以帮助完成商业决策,这便促了纽约布鲁克林在 1860 年出现了第家信局,开启了美国数据经济市场的时代并在 1956年促成了基于数据的 FICO 信分的诞。数据经纪(data broker)在这个过程中起到了重要作。数据经纪通过与各类数据提供的合作,负责收集、整合和维护量的个和企业数据。他们的职责涵盖数据的获取、处理和管理,以确保数据的完整性和准确性。同时,数据经纪还与数据需求合作,如融机构和保险公司,为他们提供可靠的数据资源。通过数据交易的式,数据经纪将数据提供给 FICO 体系,于信评分和险分析。数据交易安全港书 Saf
12、e Harbor for Data Exchange White Paper 3 第一种是 C2B分销模式,这种模式下的数据平台直接与消费者打交道,用户主动向平台提供自己的个人数据。而作为交换,平台会提供商品、服务、现金回报,或者是优惠、折扣和积分等形式的利益,从而吸引用户分享自己的数据。第二种是 B2B集中销售模式,这里的数据平台起到连接数据提供方和数据购买方的桥梁作用。这一模式更接近于数据市场的概念,类似于中国对数据交易所的构想。在这个模式中,平台为双方提供撮合服务,确保交易的正规化和合规化。参与方必须通过平台的审核,他们可以自主定价,设定销售期限和使用条件,而平台则负责确保交易的顺畅和安
13、全。第三种数字经纪人模式是对前一模式的扩展。中介性数据平台在这里充当数据经纪的角色,它们从个人用户那里收集数据,并将这些数据转让给其他企业使用。这种模式的运作涉及复杂的数据流转和处理过程,要求平台在确保数据质量、保护个人隐私以及遵守相关法律法规等方面有着更高的标准和能力。通过这三种模式,不难看出,数据平台在美国数据交易中扮演着极为重要的角色。他们不仅是数据交易的促成者,更是维护交易安全、保护交易主体数据相关利益、公民个体数据隐私权益乃至国家安全等一般社会利益的关键力量。随着数字经济的不断发展,这些模式的创新和完善将对全球的数据交易实践产生深远的影响。在美国的数据交易实践中,虽然也有学者曾经主张
14、建立全国的数据交易市场来进行个人数据的公开交易,2但是美国的数据交易实践的主流,仍然是数据经纪人(data broker)模式。这一模式的核心在于数据经纪公司的运作,这些公司精于从各种途径搜集和加工用户数据,并将其转化为商业智能或营销工具出售给企业。美国联邦贸易委员会对数据经纪人的定义凸显了这些机构在现代商业中的角色它们是搭建企业与消费者之间桥梁的专家,但同时也引发了一系列隐私与监管的问题。3 在美国,政府对数据经纪人的监管相对宽松,他们在处理消费者数据时的不透明做法常常让消费者在交易中感到处于劣势,且在事后很难找到保护自己利益的有效途径。而在中国,以广东省 2022 年 5 月的试点为代表,
15、虽然数据经纪人的概念和实践也在蓬勃发展,但在市场规模和成熟度方面与美国仍有一段距离。4 综上所述,数据经纪人模式在美国已经成为数据交易的一个标志性实践,而这一模式的影响力和问题也引起了全球的关注和思考。对于中国来说,借鉴和适应这一模式,同时考虑本土的法律、文化和市场特点,对于建立更加成熟和规范的数据交易市场至关重要。2 See Kenneth C.Laudon,Markets and Privacy,39(9)communication of the ACM 92,99-100(1996).3 See Justin Sherman,Data Broker Registries in Bills
16、:the ADPPA and the DELETE Act,Lawfare,Jun.6,2023,accessed Nov.17,2023.4 参刘珊:全国批“数据经纪”在州海珠诞 3 家企业选,涉及电业、电商务、融等领域,载南报2020年 5 28,第 4 版。数据交易安全港书 Safe Harbor for Data Exchange White Paper 4 在全球范围内,数据交易的模式和理念正处在快速演变之中。除了美国所倡导的数据经纪人模式,欧盟也在探索一条不同的路径,那就是创建一个欧洲共同数据空间。这一宏伟的构想意在打造一个跨领域、统一的欧洲数据市场,其宗旨与数据交易所有着异曲同工
17、之妙。5 欧盟委员会不仅在理念上提出了这一计划,更通过了一系列的立法措施以支持其实施。例如,欧盟数据治理法(European Data Governance Act)于 2022 年 6 月 23 日通过,于 2023 年 9 月 24 日适用于欧盟各成员国;而后,欧洲议会于 2023 年 11 月 9 日通过数字法案(EU Data Act),该法案将在完成余下程序后生效。上述立法行动,均体现了欧盟对于包括数据交易在内的数据领域的重视,或将在后续进一步影响数据交易市场的经营。尽管欧洲共同数据空间还处于起步阶段,还未展现出明确的成果,但其目标十分明确:促进数据共享和流通,以此加快欧洲数字经济的
18、发展,为企业和创新者开拓更广阔的市场和提供更多的机遇。在这一框架下,欧洲共同数据空间计划为各行各业的数据使用者提供一个安全、可信的平台,从而更有效地管理和利用数据资源。这一平台将成为加速跨国合作、激发技术革新的重要力量,并为欧洲的数字化转型铺平道路。当然,这个雄心勃勃的计划并非没有挑战。在推进过程中,欧盟必须应对众多复杂的法律、隐私以及安全问题。实现这一计划需要欧盟委员会、各成员国以及企业和其他利益相关者之间的紧密合作,共同确保数据的安全和个人隐私得到严格保护。虽然欧洲共同数据空间的实际成果还有待观察,但这一进程无疑彰显了欧盟对于数据经济的高度重视和对未来发展的明确愿景。随着技术的不断创新和全
19、球数字化转型的加速,欧洲共同数据空间不仅有潜力为欧洲数字经济带来新的活力,也为全球数据交易模式的多样化和发展提供了新的视角和可能性。在审视全球数据交易的不同模式时,可以注意到美国和欧盟各自的做法提供了有益的参考。美国的数据经纪人模式强调了市场的自由流动和效率,而欧盟的共同数据空间则侧重于打造安全、规范的跨国数据交易环境。这两种做法都在各自的法律和文化背景下发挥了作用,并为世界其他国家,包括中国,提供了值得借鉴的经验。然而,这些国际经验并不能简单地移植到中国。中国在数据交易方面的发展必须立足于本国的经济结构、法律体系和市场环境。中国需要根据自己的国情,借鉴国外的先进做法,同时结合本土的实际情况,
20、来构建适合自己的数据交易模式。5 具体到数据市场/平台,境外市场的主要参与者包括 Dawex、Datarade 等公司。Dawex 是家于 2015 年成的科技公司,其总部位于法国,业务拓展欧洲、亚洲、北美和中东。Dawex 的主要业务是为各个公司/集团构建的数据交换平台(Data Exchange Platform)提供技术持,例如 Dawex 在 2023 年 9 25 推出的企业数据中解决案(Corporate Data Hub solution)即是旨在帮助集团公司内部数据孤岛、促进组织内数据流通。5在 Dawex 积极运营的本,也由私营部牵头成了依托于 Dawex 数据交换技术的本数
21、据交换公司(JDEX),该本公司旨在创建个跨越业、学术界和政府的型数据交易社区,为促进跨业和跨境数据交换环境作出贡献。5Datarade 则并单纯的技术提供者,其市场平台整合了超过 2000 家数据提供商,是全球最的数据交易平台;Datarade 的多样化交易环境促进了全球的数据交易,买家有机会找到更合适的数据,数据商则可以通过 Datarade 的平台将数据交易到全球各地。5在这个意义上 Datarade 类似于淘宝等 B2C 的交易平台,只是其交易标的从常品变成了数据Datarade 给了买家与卖家交互的场所,并同时提供了买家对卖家的评价机制,致于打破数据交易市场的不透明。数据交易安全港书
22、 Safe Harbor for Data Exchange White Paper 5 对于中国来说,重要的是要找到一个既能保护个人隐私和数据安全,又能促进数据流通和经济创新的平衡点。这可能意味着需要制定更加创新性的法律规范,确立更加严格的数据管理框架,并建设透明、可信的数据交易场所。1.2 我国数据交易实践简介 追溯我国过去二十余年中不同种类的数据和信息使用方式,也能看到和海外数据交易实践相似的发展路径数据和信息交换行为一直存在于平台企业构建的市场中,但直到近些年才凝结为“数据交易”这一观念。当前,数据已经成为数字经济时代的基础性资源、重要生产力和关键生产要素。总书记强调,数据基础制度建设
23、事关国家发展和安全大局,要统筹推进数据产权、流通交易、收益分配、安全治理,加快构建数据基础制度体系。6其中,建立合规高效、场内外结合的数据要素流通和交易制度成为了主要的关切。深入理解国家关于要素市场化配置的政策就不难发现,该政策的目标是培育和建立数据要素市场,且对相关举措有比较明确的看法和指引:首先是利用公共机关的地位解决数据供给侧问题(即开放共享),其次是通过标准化等措施提升数据价值,最后是加强资源流通和整合,加强市场基础设施(如数据资产评估、登记结算、交易撮合、争议仲裁)。7 可见,若要释放数据的全部价值,就需要让数据在全社会流动起来。目前无论是学术界还是实务界,基本能够对数据需要自由流通
24、、扩大共享达成共识。人们已经逐渐认识到,不同于传统的生产要素,数据具有非排他性、非竞争性的特点,而数据实现价值又要以大规模聚合(aggregation)为前提。例如,亚马逊在进行产品销售预测时,随着积累的数据周数增加,预测的准确性也随之提升,而在机器学习领域,以提高汽车安全性的算法为例,当算法训练所用的数据量更大时,它能够执行更复杂的任务(如自动驾驶),这说明在数据量大的情况下,技术解决方案的质量和效能会显著提高。总的来说,无论是在商业预测、技术创新还是企业发展等方面,数据的大规模聚合都是实现其最大价值的关键。8 由此,如果能让数据在全社会的范围内流动起来,就可以让数据在不同主体的开发下,被激
25、发各个维度的价值潜力。9因此,建立成熟的数据要素市场,被认为是刻不容缓的要事,10不仅因为我国的数据产量从 6 陆 娅 楠:构 建 数 据 基 础 制 度 更 好 发 挥 数 据 要 素 作 国 家 发 展 改 委 负 责 同 志 答 记 者 问,http:/ 7 国务院发布的要素市场化配置综合改试点总体案,载中央政府 http:/ See Charles I.Jones and Christopher Tonetti,“Nonrivalry and the Economics of Data”,American Economic Review,Vol.110,No.9,2020,p.2821
26、.9 唐郡:数据基础制度奠基:淡化所有权,优先流通,载微信公众号“财经五花”,2022 年 10 8。10 如东省数据要素市场化配置改书中指出,东抢占发展先机,前瞻性、全局性、整体性推进数据要素市场化配置改。参东省政务服务数据管理局站,http:/ 年第 10 期,第 1402-1409。数据交易安全港书 Safe Harbor for Data Exchange White Paper 6 2017 年的 2.3ZB 增长至 2022 年的 8.1ZB,以占比 10.5%的规模位居世界第二,也是因为数据被视为深刻改变生产和生活的新型生产要素,是我国未来经济发展超越主要竞争对手的战略制高点。1
27、1 然而,即便数据的流动、共享、开放依然成为了热议的话题,但“专网林立”“信息孤岛”“数据烟囱”12才更能揭示真正的现实情况:尽管人人都知道数据只有流通起来才能被释放尽可能多的价值,但是企业或其他组织为了维持自己的竞争优势,并不会主动地拥抱数据共享和数据流动,反而是控制数据的获取和流动,甚至在特定数据产品市场实施的排除限制竞争。这是因为企业或其他组织可以利用数据优势提高产品质量或服务水平,从而保持较高的客户粘性并不断扩大市场规模,而规模效应的提升又会反向增强企业的数据优势,有利于形成市场进入壁垒,13因此,初创企业进入数据驱动型产品市场可能会面临较高的进入障碍,比如在搜索引擎与社交产品市场。1
28、4 观察当前的数据产业格局,可以发现无论是企业还是其他组织,都在积极地“圈地”,以牢固地控制自己的数据资源。“划地为王”的现象普遍存在,组织倾向于保护和内部利用其数据,而非轻易地分享或出售。因此,一个合理的推论是,如果政府能够在外部建立一个数据要素交易市场,并且这个市场能够提供足够的激励机制,那么它可能会吸引那些控制数据的企业和组织参与进来。如果这个市场能够确保数据出售方得到合理的报酬,同时也满足数据购买方的需求,那么它可能会促成一种互利共赢的局面。因此,在2020 年3 月中共中央、国务院发布的关于构建更加完善的要素市场化配置体制机制的意见(以下简称“数据二十条”)首次提出了要加快培育数据要
29、素市场之后,15通过建立数据要素市场来解决数据封闭的逻辑成为了主流。在实践中,全国各地迅速开启了一轮数据要素市场的建设,并将数据交易所或数据交易中心作为发展模式;在理论上,也有不少学者畅想数据交易市场也能像证券交易市场一样,发展出登记、尽调、评估、挂牌、交易、结算、交割、审计等一系列流程。16 尽管我国政府在政策和财政上都对数据交易所的建设投入了巨大的支持,期望通过数据交易所刺激企业在场内开展交易,但实际成效却并不如人意。尽管政策上的激励措施不断,交易所内的项目仍然难以聚集成有效的交易量。17近年来,虽然全国各地纷纷推动数据交易所或交易平台的建设,但那些已经投入使用的交 11 参于施洋、王建冬
30、、郭巧敏:我国构建数据新型要素市场体系临的挑战与对策,载电政务2020 年第 3 期,第 2-12。12 唐郡:数据基础制度奠基:淡化所有权,优先流通,载微信公众号“财经五花”,2022 年 10 8。13 参梅夏英、王剑“数据垄断”命题真伪争议的理论回应,载法学论坛2021 年第 5 期,第 99-101。14See Kerber,Wolfgang.Digital Markets,Data,and Privacy:Competition Law,Consumer Law and Data Protection,Journal of Intellectual Property Law&Prac
31、tice 11.11(2016):856-66.;Argenton,Cdric,and Jens Prfer.Search Engine Competition With Network Externalities,Journal of Competition Law and Economics 8.1(2012):73-105.15中共中央国务院关于构建更加完善的要素市场化配置体制机制的意提出地、劳动、资本、技术、数据五个要素领域的改向,其中针对数据要素,第次明确了加快培育要素市场的发展向,要求加强数据资源整合和安全保护。16 参范仲:完善数据要素基本制度 加快数据要素市场建设,载中国融20
32、22 年第 1 期,第 14-17。17 据统计,2020年,交易所场内数据交易只占我国数据交易市场总规模的4%。参中国络空间协会、温州市委信办及南都数据研究院:布局与破局2022 年中国数据交易实践趋势报告,第 31,载道客巴巴站 https:/ 年 1 2 访问。数据交易安全港书 Safe Harbor for Data Exchange White Paper 7 易所普遍面临着交易活跃度不高的窘境。这反映出,在数据交易所的建设上,还需更深入的市场研究和制度创新,以实现真正有益于企业和整个经济生态的发展。尽管政府试图通过数据交易所提供一个正规化的交易环境,但实际上交易所的交易量和活跃度却
33、远未达到预期。与此形成鲜明对比的是,场外交易正在如火如荼地进行着,它几乎已成为数据交易领域的主流方式。数据交易所的最初设想,是希望将地下或黑市的非正式数据交易引入光明、规范的交易环境中,以实现数据流通的合法化和标准化。但现实情况却是,许多场外交易的参与者并没有太大的动力去适应交易所更为严格的标准和流程,特别是对于那些通常只涉及一次性交易的数据。18 这种现状反映出,尽管数据交易所在理论上提供了一个更加安全和透明的交易平台,但若不能提供足够的激励或降低交易成本,它们难以吸引那些已经习惯于场外交易的市场参与者。因此,如果数据交易所想要在未来的数据经济中扮演更重要的角色,就必须创新其服务方式和制度,
34、提供真正能够吸引并满足市场参与者需求的解决方案。在当前关于如何优化数据交易所的讨论中,一个关键的问题往往被忽视:交易主体为何持续对场内交易保持着谨慎甚至是回避的态度?讨论如何完善交易所的各种机制包括定价、流通、信用和支付等19固然重要,但这些讨论之前,必须首先理解交易主体的真实顾虑和需求。事实上,仅仅通过建立一个数据交易平台,并不能自动地满足交易参与者的所有需求。如果要真正吸引交易主体走入交易所,更需要做的是站在交易主体的角度,深入挖掘交易主体的真实担忧,从而提供更为切实的解决方案。因此,要想激活场内交易,需要重新定位数据交易所的角色和功能可能是更好的处理这不仅仅是简单地复制互联网平台早期的逻
35、辑和行为模式,而是基于对交易主体深层次需求的洞察,设计出更为精准的策略和规则。目前可能最需要先做的,是构建一个真正能激发交易热情的环境,这样交易主体才会被吸引进场,积极参与交易,从而让数据交易所真正发挥其应有的作用。18 参胡凌:数据要素财产权的形成:从法律结构到市场结构,载东法学2022 年第 2 期,第 120-131。19 有学者提出,数据交易所的重点在于思考如何通过公共机构的外部量重新规制市场各类核机制。参陈越峰:超越数据界权:数据处理的双重公法构造,载华东政法学学报,2022 年第 1 期,第 18-31。数据交易安全港书 Safe Harbor for Data Exchange
36、White Paper 8、数据交易现状解析:竞争挑战与法律险 2.1 数据交易主体面临的竞争性风险 数据,这个在数字化时代日益被提及的词汇,往往被轻率地比作现代的“石油”或“黄金”。然而,这一比喻忽略了数据本身的复杂性和多样性。数据并不仅仅是一串串数字的堆砌,更不是简单的电子表格可以囊括的。20真正的价值产生于数据的原始性和其与买方产品结合时所展现的潜力。原始数据是对现实世界中的人、物、事件的直接记录它们是未经加工的数字化信息,它们的价值在于能够准确反映被记录对象的状态。21这些数据集在被整合、清洗或分类后,才能够作为分析的基础。22然而,仅仅拥有这些原始数据集,并不能自动转化为商业智慧,它
37、们必须被妥善利用。数据转化为商业价值的过程可以概括为以下四个主要模式。23第一种是数据的聚合,这一过程涉及将来自不同来源的原始数据集中于一点,以便于用户访问和利用,就像“天眼查”或“万德”所做的那样。第二种是数据的应用化,这是指将数据以用户友好的形式,如 App,直观呈现给用户,降低他们获得和理解数据的门槛,正如“车来了”或“飞常准”所展现的。第三种是数据的变现,这经常体现在咨询公司、智库或企业战略团队的工作中,他们通过分析数据产生的深层次信息和知识,创造出新的商业模式和价值。第四种是数据的赋能,这在算法优化和机器学习领域表现得尤为明显,大量多维度的数据集对于精炼算法和预测模型至关重要,从而推
38、动企业在未来的商业实践中获得成功。总而言之,数据的真实价值并非仅仅在于其原始形态,而是在于这些原始数据如何被加工、分析并最终被应用,它们在与买方产品的融合中,才能释放出巨大的商业潜力。在我国的数据交易所中,尽管众多数据产品已经被列出以供交易,但这些产品往往并未能满足市场的实际需求。关键的问题在于,这些所谓的“数据产品”通常缺乏可机读性,不符合原始数据的要求,从而未能吸引到那些真正需要数据来推动商业创新的买方。许多在交易所挂牌的所谓数据产品,实际上是对原始数据进行了某种程度的加工处理,转变为了带有特定解释或结论的“知识产品”。购买者获得的可能只是一个指标、一个趋势或者一项结论,而这些成果往往缺乏
39、用于进一步分析或整合的潜力,难以与其他数据产生协同效应,创造新的价值。20 例如,很多政府认为发布 pdf 格式的数据件也属于开放数据的表现形式。参郑磊:开放不等于公开、共享和交易:政府数据开放与相近概念的界定与辨析,载南京社会科学2018 年第 9 期,第 83-89。21 参富平:数据经济的制度基础数据全开放利模式的构想,载东社会科学2019 年第 5 期,第 5。22 参富平:数据流通理论数据资源权利配置的基础,载中外法学2019 年第 6 期,第 1405。23 笔者参照 Andrew Stott 撰写的为了经济增的数据开放(Open Data For Economic Growth)
40、报告,作了中的分类。See Andrew Stott,Open Data for Economic Growth(Jun 25,2014),at https:/openknowledge.worldbank.org/handle/10986/19997.数据交易安全港书 Safe Harbor for Data Exchange White Paper 9“数据一旦转化为具有特定含义的信息或知识,原始数据的生命就此结束。”24原始数据的真正价值在于其未经加工的、原生态的状态,它们能够被购买者自由地分析和探索,以挖掘出更深层次的商业机会。一旦数据被固化为特定的信息或知识,它就失去了作为数据的活力
41、和多样性。因此,对于数据交易所而言,想要迅速吸引并聚集买方的关键在于提供能够直接被商业界利用、具备创新潜力的真正的数据产品。只有那些能够被灵活运用、并能够促进新模式商业价值转化的原始、机读数据,才是买方真正期待和愿意为之支付的产品。只有当数据交易所把握住这一核心需求,并据此调整其产品供给策略时,才可能在数据经济的大潮中占据一席之地。市场对于原始数据的渴望几乎无处不在,但数据持有者对于出售这些原始数据却显得异常谨慎,这种现象背后的逻辑值得深入探讨。在信息时代,数据的潜在价值是难以预测的,且未来可能呈现指数级增长,正是由于这种潜在价值的不确定性,数据持有者对于原始数据的保护态度尤为慎重。数据虽然不
42、具备物理意义上的排他性,理论上它的分享和开发能够最大化其价值。然而,在现实的商业竞争环境中,数据的拥有者往往选择保护自己的数据资产,以避免潜在的竞争挑战。数据一旦公开,就相当于将企业的策略和知识财产暴露给可能的竞争对手。企业之所以谨慎出售原始数据,是因为数据的真正价值在于其预测能力通过解析用户偏好、揭示模式并构建连接,数据能够对用户的决策产生影响。25这种预测能力并非固有,而是需要与企业内部的数据分析结构和用户账户体系紧密结合,通过个性化推送等手段实现,才能确保数据的价值与现实世界紧密相连,而不是虚构的泡沫。26 综上所述,原始数据的出售与保留之间的平衡,需要每个数据持有者根据自己的业务目标和
43、市场策略来权衡。在数据价值的转化过程中,人类行为的复杂性不容忽视。即使拥有大量关于某个用户的行为数据,算法也不能完全预测其未来的选择,27因为行为背后是错综复杂的偏好和权重。28数据算法的智慧在于,它不是去穷尽每一个偏好的缘由,而是通过模式的识别,将分散的数据点连接起来,从而得出大概率的行为预测。29 24 富平、冉苒:数据要素市场形成论种数据要素治理的机制框架,载上海经济研究2022 年第 9 期,第 70-86。25 参胡凌:论赛博空间的架构及其法律意蕴,载东法学2018 年第 3 期,第 87-91。26 See Katerina Pistor,“Rule by Data:The End
44、 of Markets?”,Law and Contemporary Problems,Vol.83,No.2,2020,p.110-112.27 的为远想象得复杂,个为的背后不仅存在多个偏好,而且不同偏好之间还存在权重低即便算法“知道”个顾客年买了 50 次草莓口味的雪糕,也不能预测该顾客会不会买草莓口味的蛋糕。算法在定程度上也和脑样,不会去追问究竟为什么该顾客会买 50 次草莓口味的冰淇淋,而是当“知道”该顾客年吃了 50 次草莓口味的雪糕,喝了 40 次草莓口味的奶昔,买了 30 罐草莓口味的曲奇,才能致“推断”出个为模式:该顾客在选择甜的时候尤其偏好草莓味,所以该顾客概率会选草莓口味的
45、蛋糕。28 See Viktor Mayer-Schnberger and Kenneth N.Cukier,Big Data:A Revolution That Will Transform How We Live,Work,and Think,Houghton Mifflin Harcourt,2013,Chapter 1-3.29 See Ethem Alpaydin,Machine Learning,MIT Press,2016,Chapter 4.数据交易安全港书 Safe Harbor for Data Exchange White Paper 10 由此可知,“数据+算法”能输出
46、精准预测的前提,不仅是被输入大量数据,而且还被输入多个维度的数据30:比如电商平台不是仅从用户购买的商品中,就直接捕捉到了用户的偏好,而是收集了用户在电商平台有关的所有网站的数据,从买的衣服、吃的外卖、看的视频、玩的游戏、住的酒店这些数据中,提取到了用户的偏好。31 在现实中,各家企业或其他组织都已在自家的赛道中深耕多年,已经积累了大量的同维度数据,但真正能发挥最大潜力的,是多个维度的数据。或许可以设想,以往一个电商平台可能需要 10年的积累,才能从用户浏览、购买商品的数据里,大致推测出用户的消费偏好,但如今一个短视频平台若想发展电商业务,可能只需要拿到用户近半年的商品购买数据,再结合上用户已
47、经在短视频平台留下的大量视频观看、点赞、下载数据,就能大致定位用户的消费偏好。企业对原始数据的保护态度之严格,源于其深知数据的潜在价值和竞争优势。在企业看来,原始数据是宝贵的资产,通常会首先自行挖掘开发,希望从中获得创新和增长的动力。仅当内部开发遇到瓶颈,无法进一步挖掘其价值时,企业才可能将这些数据出售,但这样的决策通常伴随着高度的谨慎,因为一旦原始数据落入竞争对手之手,潜在的竞争风险巨大。这种风险不仅仅在于数据的匿名化程度,即便是去标识化的数据,在精心地分析和对特定群体的细致研究下,也能够产生强大的预测力,为竞争对手带来意料之外的市场洞察。原始数据在不同企业手中的价值可能天差地别,一个数据点
48、的加入,可能使得竞争对手的数据分析得到质的飞跃,从而在市场上获得巨大的优势。同时,由于算法和机器学习的发展日新月异,每一次迭代都可能带来颠覆性的变化,这使得数据价值的估算变得极其复杂。32企业难以预测,自己出售的数据在他人手中的应用和价值转化能力,因此在不确定性如此高的情况下,售出原始数据带来的直接现金流入,可能与潜在的商业损失相比显得微不足道。在这样的背景下,出售原始数据不仅可能削弱企业自身的创新能力和市场地位,还可能无形中增强了竞争对手的力量。因此,对于许多企业而言,保留并内部开发原始数据,而非将其贸易于市场,更是一种长远的战略选择。这一逻辑同样能在国外企业中得到验证:即便是谷歌“高调宣传
49、”将会开放数据和代码,但从来没有开放过它收集的原始数据和算法;亚马逊虽然向程序开发者开放了编程接口,但一向严格控制接口深入原始数据。33 30 See Rostek and Nathan Yoder,“Matching with Multilateral Contracts”(July 2,2017),at https:/ 例如,阿巴巴集团旗下有淘宝、饿了么、优酷、阿游戏、猪等公司,乎涵盖了各种领域。32 例如,计算机领域著名的莱斯定理(Rices Theorem),就证明了某类算法的不可知属性,算法复杂化模块化,会令各个部分算法之间的相互反应变得更加不可预测。参沈伟伟算法透明原则的迷思算法规
50、制理论的批判,载环球法律评论2019 年第 6 期,第20-39。33 See Julie E.Cohen,Between Truth and Power:The Legal Constructions of Informational Capitalism,Oxford University Press,2019,p.45.数据交易安全港书 Safe Harbor for Data Exchange White Paper 11 实际上,企业或其他组织,尤其是互联网企业不倾向于出售自己的原始数据,是由其生产方式本身所决定的。互联网作为一种新型生产方式,不断连接线上与线下各类生产性资源,在社会