收藏 分销(赏)

数据交易PDCA模型.pdf

上传人:Stan****Shan 文档编号:1266000 上传时间:2024-04-19 格式:PDF 页数:40 大小:3.04MB
下载 相关 举报
数据交易PDCA模型.pdf_第1页
第1页 / 共40页
数据交易PDCA模型.pdf_第2页
第2页 / 共40页
数据交易PDCA模型.pdf_第3页
第3页 / 共40页
数据交易PDCA模型.pdf_第4页
第4页 / 共40页
数据交易PDCA模型.pdf_第5页
第5页 / 共40页
点击查看更多>>
资源描述

1、数据交易 PDCA 模型 The PDCA Model for Data Transactions 录 Contents 报告要点.?、前.?.?数据要素流通交易中建信任机制的意义.?.?国内外数据要素流通交易信任机制的研究现状.?、数据要素流通交易中的信任理论及概念.?.?信任的本质及相关理论.?.?数据要素流通交易过程中信任关系的形成机制.?三、数据要素流通交易中的可信险识别.?.?业务命周期视的主体可信险分析.?.?数据命周期视的客体可信险分析.?.?流通使环境视的环境可信险分析.?四、基于 PDCA 的数据要素可信流通交易评估指标和测度体系.?.?“PDCA”信任模型.?.?评估指标体

2、系.?.?指标测度体系.?五、基于全国数据交易链的 PDCA 模型实现路径.?.?全国数据交易链.?.?向场景的数据要素安全交易体系设计.?.?向数据要素流通全过程的追溯体系设计.?六、基于 PDCA 模型的保障体系.?.?向制度与规范约束的 PDCA 监管策略分析.?数据交易 PDCA 模型 The PDCA Model for Data Transactions?.?向理论与技术撑的 PDCA 监管策略分析.?.?管理与技术协同的数据要素可信流通机制.?参考献.?数据交易 PDCA 模型 The PDCA Model for Data Transactions 1 报告要点 数据作为数字经

3、济的核心生产要素和创新动力源泉,蕴含着事物的关联性及其发展规律,对提升国家安全管理能力、社会治理能力、经济发展质量等各方面具有重要的价值。然而,数据要素流通使用环境复杂,承载多方主体利益,流通使用过程环节众多,容易引发多重安全风险和隐私泄露问题,威胁个人隐私、商业秘密、国家安全以及各参与主体的合法权益,严重制约数据要素大规模流通使用。近年来,政府组织、学术界和产业界围绕数据要素在产权分配、数据治理和数据资产等方面的问题,很少有研究在中观或者微观层面关注数据流通交易、数据市场可持续发展的基础条件市场信任。由于数据要素市场的双向信息不对称性,供需双方存在信任壁垒问题一方面导致了供需双方对另一方道德

4、风险和资质风险的感知,降低其市场参与的信心,另一方面导致参与主体间高昂的信任沟通成本,降低了市场运行效率。建立数据要素市场可信生态,构建诚实、守信和公平的营商环境不仅可以避免“劣币驱逐良币”,还可以促进数据要素市场的可持续发展。因此,构建数据要素流通使用的信任理论基础,建立数据要素流通使用全过程合规信任机制,对破解数据要素市场信任壁垒,促进数据要素高效流通使用、推动数据要素市场化配置、健全完善数据要素市场、加快数据要素价值释放具有重要意义。本报告以数据要素如何高效可信流通使用为主线,综述了数据要素可信流通使用理论与方法。首先辨析了信任的概念和相关理论,界定了数据要素可流通交易信任的概念,并通过

5、文献调研,对数据要素流通交易中的关键主体、关键客体和流通环境进行风险识别分析。综上,本报告面向数据要素流通交易过程涉及道德关键主体和客体,提出了 PDCA可信模型,即主体可信(Participant)、数据可信(Data)、合约可信(Contract)和算法可信(Algorithm)。其依据数据要素流通交易全流程可信的要求,即事前审查阶段需要保障主体资质可信、数据质量可信和合约内容可信,在事中监控阶段要保障主体行为和算法行为可信,在事后审计阶段,要对数据流通使用过程进行追溯,更新主体和数据的信用评估。此外,本报告还给出了基于PDCA 模型的数据可信流通交易评估指标和测度体系,以及数据交易 PD

6、CA 可信模型的实现路径和保障体系。数据交易 PDCA 模型 The PDCA Model for Data Transactions 2、前 近年来,随着我国一系列政策的出台,数据要素市场建设已经取得了重要进展,也受到了国内外学者和业界的广泛关注。这些关注主要是在产权分配、数据治理和数据资产等方面,很少有研究在中观或者微观层面关注数据流通交易、数据市场可持续发展的基础条件市场信任。1.1 数据要素流通交易中建信任机制的意义 数据要素的可信流通使用是数字经济可持续发展的客观要求。数字经济即将进入创新发展阶段,促进高质量数据要素供给、流通以及开发利用,实现数据要素流通和利用的制度创新是数字经济高

7、质量发展的内在要求1。数据作为新型生产要素,只有经过市场可信流通,才能彰显数据要素的价值,实现数据产品化2。另外,推动数据要素在国际上的可信流通,可以进一步引领全球化数字经济的发展3。数据要素的可信流通使用是破解主体间信任壁垒,提高市场运行效率的重要举措。在数据要素市场,供需双方存在信任壁垒问题,深层次的原因在于:供需双方对数据价值的双向不确定性,在传统商品中,一般来讲产品的价值决定了产品的价格,但是数据产品的价值检验和产品使用是重叠的,供需双方都无法确定数据产品相对于对方的价值4。现有研究关注较多的另一个问题是数据使用过程中的不可证实性,数据供方无法得知自己的数据将被如何使用以及数据需方是否

8、具有数据保护的能力,数据需方也很难向第三方证实自己是否滥用了供方数据5。这种信息不对称性和不可证实性所导致的问题是供需双方对对方道德风险和资质风险的感知,一方面降低了其市场参与的信心,另一方面参与主体间存在高昂的信任沟通成本,降低了市场运行效率。数据要素的可信流通使用是促进数字产业与传统产业融合的有效途径。数据要素作为一种新兴生产要素,只有与传统要素相结合才能更好的发挥价值6。而当前主要存在的问题是除了传统企业在进行数字化转型方面的动力不足,数据要素的供给和流通还缺乏成熟的服务生态。一方面,数据要素市场缺乏成熟的数商生态,同时传统的中小企业很少具备专业的数据治理能力和数据管理意识。因此,数据资

9、源向数据产品转化成本较高,市场供给动力不足。另一方面,第三方数据交易机构与传统企业在发展中的协调程度不高,中小企业对数据价值认知不足,无法准确描述数据产品需求,亟需数据交易平台搭建双边市场,提供智能匹配和数据推荐服务。通过专业的数据处理服务、精准的供需匹配和细心的数据管理辅导等方式实现数据产品的可信流通使用,才能促进传统产业与数字产业的深入结合以及协同创新。数据要素的可信流通使用是合规高效释放数据要素潜在价值的核心引擎。数据要素的可信流通并不是单方面保证数据流通使用的安全,而是兼顾隐私保护、数据安全和数据流通使用效率。随着算法技术的不断发展,不断衍生出更多种类、更加智能的数据加工及处理服务,以

10、透过数据发现知识。但是算法本身是一个“黑匣子”,很难检测算法是否安全合规、公平透明。目前学术界已经致力于解决 AI算法的治理问题,例如关于算法的安全性7、公平性8和可解释性9等算法要求受到国内外学者越来越多的关注。因此,实现数据要素的可信使用才能促进释放数据要素价值,推动产业数据流通。数据交易 PDCA 模型 The PDCA Model for Data Transactions 3 1.2 国内外数据要素流通交易信任机制的研究现状 2022 年我国数据产量达 8.1ZB,同比增长 22.7%,数据要素市场的交易规模得到明显提升,构建数据要素的可信流通交易体系已经成为数据要素市场未来发展的方

11、向。面向数据要素流通的关键节点,构建数据要素流通使用的可信模型及评估方法,为建立数据要素可信生态体系提供理论基础,是当前数据治理研究中的重点目标。然而数据要素市场涉及多级数据产品、多元市场主体以及多种交易方式对我们认识数据要素可信流通的本质特征和内在逻辑带来了巨大的挑战。不同区域、不同机构的数据管理制度、数据交易规范和数据治理技术相互割裂,对实现全国一体化的数据要素可信流通带来挑战。因为数据要素易复制、易传播和难确权等特征,数据窃取、数据泄露等安全事件频发,为解决数据要素价值挖掘和风险防范之间存在的天然矛盾,实现数据要素的“可信流通”,成为学术界、产业界和政府组织关注的热点问题。1.2.1 政

12、府组织 近年来,国内外数据要素流通使用领域涌现大量意见和战略(如图 1),在国内,2022 年 12 月,中共中央、国务院印发的关于构建数据基础制度更好发挥数据要素作用的意见(以下简称“数据二十条”)中,多次强调要促进数据可信流通。例如,在基本原则部分提出“建立数据可信流通体系,增强数据的可用、可信、可流通、可追溯水平”。在建立流通和交易制度部分提出“有序发展数据跨境流通和交易,建立数据来源可确认、使用范围可界定、流通过程可追溯、安全风险可防范的数据可信流通体系”,2023 年,围绕“数据二十条”各地各部门纷纷出台了数据要素流通交易的相关细则,例如北京市委政府印发了关于更好发挥数据要素作用进一

13、步加快发展数字经济的实施意见的通知(以下简称意见),意见中提出了关于加强分类分级、数据安全和治理、数据监管模式创新等一系列措施和政策,被称为北京版“数据二十条”。2023 年 2月中共中央 国务院印发数字中国建设整体布局规划,明确了强化数字中国的关键能力,包括构筑自立自强的数字技术创新体系和筑牢可信可控的数字安全屏障两大方面。随之在 2023 年 3 月,中共中央、国务院印发了党和国家机构改革方案,提出组建国家数据局。在 2023 年 10 月,国家数据局正式揭牌,国家数据局的成立有助于规范数据要素市场交易;有助于加强数据安全和隐私保护,降低数据滥用、数据泄露的风险,从近年来有关数据要素国家政

14、策和法律法规的颁布,可以看出“国家安全”仍是数字中国发展的主线。在国际上,2018年 5月欧盟正式推出通用数据保护条例(GDPR)用于保护欧盟公民个人数据。2018年德国成立国际数据空间协会(IDSA)1致力于建立一个开放、安全、可信赖的数据生态系统,目前IDSA 在全球范围内拥有来自 28 个国家和地区的 140 多个会员单位。2019 年德国和法国又相继联合推出基于身份识别和可信认证的数据基础设施信任平台:GAIAX项目。2019年日本首次提出“基于信任的数据自由流动体系”(DFFT),提倡在保护个人隐私的基础上,打造安全、共享、互信的数据自由流动空间,试图打造美欧日数字流通圈。英国在 2

15、021年和新加坡启动了数字贸易协议的谈判,致力于促进数据要素自由和可信的跨境数据流动。同年日本发布了综合数据战略,以“可用、可控、可信、互联”与“共创价值”为指导方针挖掘数据价值。2022 年 4 月欧洲议会通过了数据治理法希望可以通过可信的数据中介机构打破信任壁垒,促进欧 1 国际数据空间协会官站 https:/internationaldataspaces.org/数据交易 PDCA 模型 The PDCA Model for Data Transactions 4 洲数据高效流通共享。不同于欧盟宏观数字战略的制度导向模式,美国则是选择市场导向模式,在美国的数据交易流程中,主要是通过数据经

16、纪人(Data Broker)作为可信第三方,构建一种“信用许可”体系进行数据交易。如同电商平台,当交易双方不具备可交易的信赖关系时,数据经纪人作为可信第三方,为双边履约提供了“担保”,从而纾解了双边数据交易的信任困境问题。图 1 关于数据的政策布局 1.2.2 产业界 产业界也正在积极从技术支撑和规范管理入手,探索数据要素的可信流通交易范式,帮助数据要素市场建立可信生态。在可信环境技术研究上,北京国际大数据交易所结合隐私计算、区块链及智能合约技术、数据确权标识技术、测试沙盒等技术构建数据交易系统,为数据供需双方提供可信的数据融合计算环境。华为和中信银行为促进金融数据的可信流通提出了由数据可信

17、流通管控中心、具有安全可信执行环境的可信数据空间连接器、安全存储资源池、以及安全的数据流通网络构成的金融数据可信流通解决方案2。在数据可信计算研究上,华控清交3推出了 PrivPy 多方安全计算平台,允许多个数据所有者在互不信任的情况下进行协同计算,输出计算结果。蚂蚁集团基于多方安全计算、联邦学习、可信执行环境、区块链等技术构建了蚂蚁链摩斯隐私计算平台4,通过计算前分级授权、计算中算法+规则双重保护,计算后日志审计,解决了数据流通使用过程中的数据安全和隐私保护问题。在数据可信学习技术研究上,腾讯基于联邦学习框架推出了“腾讯神盾沙箱”,能够让联邦学习各参与方在不披露底层数据和底层数据加密(混淆)

18、形态的前提下,通过交换加密的机器学习中间结果,保证数据不出本地即可完成联合建模,最大化各个合作企业的数据价值。BaseBit.ai 自主研发了联邦学习框架 XFL5,XFL 不仅运用多种加密计算技术保护用户的原始数据不泄露,还使用了安全通信协议保护通信安全,实现人工智能模型的安全开发。在数据可信交付研究技术上,中国信息通信研究院则提出根据合约需求构建可信数据空间的框架,面向数据流通协议确认、履行和维护,解决多方 2 融数据可信流通技术书,中信银和华为技术有限公司.3 https:/ https:/ 5 https:/www.basebit.me/sys-nd/21.html 数据交易 PDCA

19、 模型 The PDCA Model for Data Transactions 5 主体之间的信任问题。上海数据交易所面向数据要素流通的全过程,研究构建数据可信交付框架,以构建内生安全的数据交易可信平台。数据要素流通中的风险更多的来自参与者的机会主义行为,因此仅依靠可信流通技术还不足以保障数据要素市场的长期稳定,还需要管理规定来规范交易流程。在 2021年上海数据交易所发布了数据交易配套制度,并确立了“不合规不挂牌,无场景不交易”的基本原则。北京国际大数据交易所也相继发布了北京数据交易服务指南,并积极探索建立监管沙盒、市场风险防控、交易规则等政策体系。贵阳大数据交易所在2022 年发布了包括

20、数据交易安全评估指南在内的数据交易规则体系,主要从交易主体登记、交易标的上架、交易场所运营、交易流程实施和监督管理保障五个方面进行了规定,以规范数据交易市场秩序。截止目前数据交易机构已有 60家,随着各地数据交易机构在科学技术上的研发和管理制度上的创新,数据要素市场正在向诚信、互信和可信的数据交易生态有序发展,如图 2 所示。图 2 数据要素市场生态 1.2.3 学术界 数据要素可信流通也在学术界引起广泛关注,在市场制度建设方面,文献10从政府层面研究了政府数据资产管理的要素框架和运行模式,提出可信数据生态,但缺乏对企业数据、个人数据可信管理的探讨。文献11基于场内交易视角,从制度层面构建数据

21、事前可信交易体系,重点关注交易前的合规审查与合法性确认,交易过程透明等问题。黄京磊等人12提出一种新型可信的数据流转模式数据信托,通过设计数据信托运行机制和相关制度,提出数据信托的组织结构、特征、功能和监管方案等,有效隔离参与者的市场风险,从而增进数据要素市场的可信性。包晓丽和杜万里13从场内交易视角,构建数据要素可信流通制度体系,重点回答数据进场交易的功能意义、交易前的合规审查与合法性确认、交易过程的公示公信等问题。林镇阳等人14提出从“数据要素、数据业务主体和制度规范”三个维度,构建包括“数据流业务流信任流”在内的价值驱动的可信数据要素市场化生态系统,并从生态系统视角构建数据运营平台的监管

22、体系,动态持续监管整个数据生命周期,保障数据进行长期保存、组织、维护、利用等。在业务管理制度层面,相关研究主要围绕数据流通使用的业务环节制度设计展开。例如在交易申请环节,范文仲15指出,一个合规可信的交易模式,需要实现“上市有审核、采买有资质”,建立数据源的合法性审核制度和售后管理制度等。在交易磋商环节,Rohn等人16提出,数据交易平台不仅要构建资产交易的撮合、交割和清算机制,还要能够为数据供方和数据需方数据交易 PDCA 模型 The PDCA Model for Data Transactions 6 创造价值并实现价值交付或分配。在交易实施环节,很多研究者提出通过安全计算技术实现数据的

23、流通交易和价值释放。窦悦等人17指出不同的隐私计算平台的算法原理和系统设计不一致,使得异构平台间难以进行信息的交互,容易形成数据壁垒,如何构建异构隐私计算平台间的互联互通方案亟待进一步的研究。在交易结束环节,安全审计作为一种监督手段,有效迎合了数据要素市场合规可信的管控需求,面对数据要素流通安全风险的复杂性,需要建立一套成熟的交易安全审计策略18。在数据要素可信流通的影响因素研究方面,文献19面向主体可信进行了讨论,认为不同主体在交易中扮演的角色、市场能力、交易行为以及他们之间的相互作用是影响数据要素可信流通使用的关键因素,但缺乏对市场其他要素可信的探讨,如数据可信。文献20认为不可信数据带来

24、的风险会在数据价值链中所有关键环节传播,强调了数据可信的重要性,但是缺乏对数据可信属性的进一步研究。综上所述,虽然学术界围绕数据要素流通使用的可信问题,在管理制度、技术体系等方面已经开展了大量研究,取得了丰富的研究成果。但现有对管理制度与支撑技术的研究是两条独立的研究路径,也多是从主体可信或数据可信单方面讨论数据要素的可信流通问题,缺乏对数据要素可信流通使用整体的刻画。数据要素流通与其他传统商品流通具有显著差异,且数据要素流通使用过程涉及参与主体多元、数据类型多样、交易合约复杂、使用算法多变等特点,有关不同类型可信因素间的相互联系,以及不可信因素对数据要素可信流通使用的作用机制需要开展深入研究

25、,以建立数据要素流通使用的可信模型,揭示数据要素流通使用的可信机制。数据交易 PDCA 模型 The PDCA Model for Data Transactions 7、数据要素流通交易中的信任理论及概念 2.1 信任的本质及相关理论 2.1.1 信任的本质 数据要素市场一直以来存在双向信息不对称问题,即在数据交易前买方无法掌握数据质量、数据来源等信息,相比数据卖方,买方处于信息劣势地位。在数据交易中后期,数据卖方则无法得知买方的数据使用行为、是否转卖等信息,此时卖方处于信息劣势地位。数据要素市场的双向信息不对称会带来道德风险、数据泄露风险等问题,影响数据安全、人民隐私安全,甚至国家总体安全

26、,这些问题在现实中往往表现为信任问题。信任作为行为学、心理学、管理学和经济学等多个领域共同关注的话题,学者们也从多个角度给出了信任的不同定义。心理学家从认知、情感、经历和人格特征等因素出发,认为信任是一种期待心理或预期行为的个人化反应21。经济学家则是将信任看作个体在风险与收益之间博弈的一种理性选择22。在行为学领域普遍认为信任是基于对对方表现出行为的预期,而愿意处于受对方行动影响的薄弱状态23。而在管理学领域中更多的是用参与、控制、制度及合约等内容去建构信任的涵义24。Rousseau 等人25整合了不同学科的观点,将信任定义为一种自愿将自己放在易被伤害地位的心理状态,这种状态是基于个体对他

27、人意图和行为的一种积极期望。在数据要素流通交易情境下,即期望被信方的交易意图和交易行为不会损害信任方的利益。2.1.2 信任理论 随着信任理论的不断发展,学者们将信任根据不同的标准将信任划分成多种类型。我们对信任理论进行了简要的梳理,并识别出数据要素流通交易中的信任应当包括哪几种类型。Zucker 根据信任的来源不同,将信任分为三类:经验信任、特征信任和制度信任26。经验信任是主体根据以往交易历史,对市场其他主体有初步的了解,从而建立起来的信任关系。特征信任是指个体之间的信任建立在对对方具备特定特征或属性的信念之上,这种信任也可以是来源于群体规范,因为规范对成员行为的约束作用,从而不同的群体在

28、市场上具有不同的可信度。制度信任则是在给定制度下,主体迫于制度惩罚带来的违约成本,不得不采取守信的决策行为。在社会学领域,Luhmann 的社会系统理论将信任分为人际信任与系统信任,人际信任则表示信任个体与被信个体之间的信任关系,而系统信任则是主体对群体、机构、市场或者是制度的信任,Luhmann 认为系统信任取代人际信任是市场不断发展的必然结果27。Sako28研究了在买卖活动过程中的信任关系,提出了合同信任、能力信任和声誉信任。合同信任来源于对另一方道德水准的依赖,相信对方会信守既定的协议,无论是这个协议是口头协议还是书面协议;能力信任是指一个人在对他人或者某个系统的信任中,主要基于对其能

29、力和技能的评估和信赖,能力信任建立在认为对方具备足够的知识、经验、技能和资源来完成某个任务或者达成某个目标的基础上。声誉信任是指在与他人互动时,基于对其良好意图和善良行为的信任和依赖,这种信任是建立在我们认为对方有良好动机和诚实行为的基础上。数据交易 PDCA 模型 The PDCA Model for Data Transactions 8 2.2 数据要素流通交易过程中信任关系的形成机制 信任在数据要素流通交易中起着重要的作用,普遍认为,信任可以降低数据评估成本、简化交易流程,是数据要素市场得以良好运行的润滑剂,但是数据交易的盲目信任不仅会给企业带来经济损失,严重的还会危害国家安全。虽然信

30、任在各个学科中已经得到了充分的研究,但对数据要素流通交易框架下的信任问题还缺乏系统性的探讨。本报告将通过对已有的信任理论与数据要素市场的信任困境相结合,阐述数据要素可信流通交易过程中信任关系的形成机制。Zucker26认为信任来源于:经验、特征和制度。数据要素市场的经验信任来源于过去双方的交流和交易,由经验建立起来的信任关系往往是有限的,尤其对于首次参与数据交易的主体。特征信任则是在对方客观事实基础上的一种主观认知,在数据要素市场,不同类型主体的可信任特征有所不同,例如数据需方可能基于以下几方面对数据供方的可信任特征做出评价:数据供方的资质条件、数据处理水平、沟通服务能力等,但是数据供方可能是

31、基于另外几个方面对数据需方的可信任特征做出评价:数据保护能力、行为可靠性、合同的履行等。其中由于制度产生的信任来源于对公开透明、有公信力的社会规章制度的信赖,如资质证书、信用证明和各种法律法规的保证产生的信任。Sztompka29认为信任的重要基础是强制性的监督和惩罚机制。但我国包括数据产权制度、数据要素流通和交易制度、数据要素收益分配制度等内容在内的数据基础制度体系还有待建设。Sako28则从企业采购与销售活动中的信任关系出发,提出了三种新的信任来源:合同信任、能力信任和信誉信任。在数据要素流通使用中充满数据滥用、数据泄露和攻击等诸多风险的情况下,签订合约是预防双方机会主义行为的有力手段。因

32、为合约可以起到约束行为的作用,可以降低主体数据交易的不确定性,提高交易的可信任水平。但是由于风险的不可预测性,交易双方无法通过合同对所有风险做出详尽的约定。进而提出了能力信任,一般会通过观察或企业履约能力测评认证证书获取对方履约能力和技能的信息,以建立能力信任关系。在数据要素流通交易的场景中,数据供方普遍会关注数据需方是否具有良好的数据保护能力以应对外部攻击风险,而数据需方可能会更加关注供方的数据采集、数据处理等能力以降低数据质量风险。声誉信任来源于对方履约动机的评估,是一种相信对方会履行约定、不会侵犯和泄露隐私的善意信任。声誉可以分为基于过去双方长期交往或交易的直接声誉和基于信用评价和信息传

33、递的间接声誉,Bohnet 和 Huck30通过实证研究发现这两种声誉都对市场的信任水平和可信水平产生积极影响。数据要素市场作为一个双向信息不对称的市场,声誉机制的引入(如资质评估、交易评价等)可以有有效缓解市场中的道德风险问题。Lucy31从博弈的角度提出了策略信任。策略信任主要指数据供方只有在需方通过数据交易产生的价值大于违约带来的风险收益,或者交易违约成本大于数据滥用、转卖的收益时,才会选择建立信任关系,是一种通过理性博弈后形成的信任。从上述对数据要素市场中信任关系的分析,建立数据要素可信流通交易机制不仅需要明确的惩罚机制以约束不可信的行为,还需要建立信用体系提高整个市场的可信水平,使诚

34、实、守信和公平交易成为数据要素市场参与主体的行为准则。数据交易 PDCA 模型 The PDCA Model for Data Transactions 9 三、数据要素流通交易中的可信险识别 数据要素流通使用环境复杂,参与主体类型多、交易过程环节多。如何有效识别数据要素流通使用中存在的可信风险?本报告从主体(业务生命周期)、客体(数据生命周期)和环境(流通使用技术)视角,对可信风险进行了系统识别。3.1 业务命周期视的主体可信险分析 业务生命周期指数据要素流通使用的全过程,本报告根据文献32将数据要素业务生命周期划分为交易申请、交易磋商、交易实施和交易结束四个阶段。交易申请阶段的安全风险可归

35、纳为交易主体资质安全风险、数据准入安全风险和产品质量风险。数据要素流通使用过程涉及供方、需方、交易服务机构等多方主体,主体资质直接关系到数据来源和流通使用的合法合规性33,肖建华等人认为不同交易主体应有不同的资质审核要求,对于法人主体,交易平台需要审核其法人信息、营业执照、税务信息等;对于个人主体,交易平台需要审核其身份信息、交易目的、数据使用范围等34,确保数据交易参与主体不存在法律、法规禁止或限制的任何情形;数据是流通与使用的标的物,如果出现不合规的数据流入市场有可能严重影响个人隐私安全、商业安全和国家安全,数据准入安全风险需重点关注数据产品是否包括禁止交易数据、未授权的个人数据、商业机密

36、数据等;参与流通使用的数据要素除需满足准入的安全要求外,还要考虑数据质量风险。若因审核不严而使伪造或错误的数据上线,可能导致基于数据的分析结果无效,给需方造成巨大损失。交易磋商阶段主要存在供需匹配风险、交易公平风险和交易透明风险。在供需匹配上,数据市场中充斥着大量的数据,面对丰富的、不同规模、不同重点的数据供给,如何找到最适合需求的数据非常困难,匹配在时间和质量上能否契合成为供需匹配的最大风险;在交易公平性上,由于大多数的数据流通使用通过既充当交易的组织者又充当裁判的数据交易平台进行,如果出现平台与买方或卖方合谋,交易的公平性将难以保证,此外,由于数据产品边际成本接近于 0,使得卖家具备了实施

37、价格歧视的更大弹性;在交易透明性上,供方往往面临着数据如何出售、哪些数据更有价值的挑战,需方无法获得数据的透明访问,了解原始数据的真实性;供需双方在支付细节、上市、数据发现和存储等方面缺乏透明度保证。交易实施阶段的安全风险主要体现在权限分配、定价和交易清结算方面。在数据交易中,交易的不仅是数据本身,更是与之相关的各项权限,数据产品交割后所有参与者主张的排他性权限能否得到保障,关系到数据要素流通交易能否顺利进行。数据作为一类特殊产品,相较于传统商品,在成本上以及消费单位、聚合性、消费方式、再利用和转售上存在着巨大的差异,导致了在定价原则和方法上的不同考虑,版本控制成为设计和定价数据要素的常用机制

38、,不同版本的价格可以与不同客户群体的价值相关联。这对数据要素的定价提出了一系列新要求,其中包括公平性35、无套利36、真实性37、隐私保护38以及计算效率39等要求;与此同时,数据要素定价还面临着与传统市场类似的操纵风险,即恶意打压或哄抬价格等。在交易清结算时,供需双方均可能面临交易违约风险,需方付款后所收到数据的真实性、时效性和完整性是否与供方声称的一致,供方是否会因为需方发生拒不交付、抵赖等行为导致其无法得到约定的款项。交易结束阶段违规使用、转卖、再识别等安全风险。在交易结束阶段,安全风险主要来自于需求方。当数据交付给需方后,面临着不诚实的数据需方没有按照约定而是超范围地使用数据,从而侵犯

39、供方的合法权数据交易 PDCA 模型 The PDCA Model for Data Transactions 10 益,甚至威胁多方安全,面临着需方将其购买的数据产品进行二次流转、转卖的风险。尽管在数据交易前,已对涉及用户身份信息的数据进行清洗、加密、匿名化等操作,但是随着公开资料的不断增多和互联网信息技术的不断发展,经过匿名化处理的数据都有可能被再识别。3.2 数据命周期视的客体可信险分析 数据生命周期指数据从产生或获取到销毁的全过程。本文按照数据要素流通使用的相关操作流程,将数据生命周期划分为采集存储、交付传输、加工使用、备份销毁四个阶段。采集存储的安全风险主要有采集安全风险、侵权风险和

40、存储安全风险。数据采集的质量标准会影响整个链路的数据质量,原始数据的真实性、完整性、可靠性直接关系着后续的数据挖掘和分析工作40;如果采集的原始数据无法反映客观真实的情况,在此基础上的模型预测结果就会出现偏差,影响数据产品的可用性41。数据采集时还需要严格遵守用户知情同意和最小必要等相关法律原则,但在实际中不少智能设备厂商和app公司为了精准营销,得到更准确的用户画像,而过度收集用户个人信息,甚至“监听”用户的智能设备,使用户在网络空间中变为透明人,严重侵犯了个人知情权、隐私权等。数据一般存储在云端或分布式文件系统中,云端直接加密会带来巨大计算开销,增加密钥管理风险,而分布式存储中一个节点或多

41、个节点遭受攻击,可能直接影响计算结果。交付传输的安全风险主要源自网络硬件风险和外部攻击风险。数据在长距离网络传输过程中,面临着网络不稳定导致的数据包丢失风险、网络带宽不足导致的传输时效风险,特别是面临大规模数据传输时网络硬件风险将更加突出;数据在多路径中快速集群和转发,容易遭受病毒植入和攻击,大规模数据的汇集与传输会降低外部攻击成本,提高单次攻击的收益,从而引起黑客的攻击,用户与服务器间共享和生成密钥是数据传输中的重要风险点,社会工程已经成为外部攻击和窃取数据的一种重要手段。加工使用的安全风险突出表现在隐私泄露风险、安全攻击风险和数据滥用风险。从原始数据得到可流通交易的脱敏数据、模型化数据,必

42、须借助大数据技术进行脱敏、分析、测试等加工操作39,但大数据技术在学习训练过程中面临着两类隐私泄露风险,即非授权用户直接获取数据的隐私泄露风险和攻击者通过一定方式推断数据集中敏感信息的隐私泄露风险。在数据加工使用时,还容易遭受来自多方面的攻击,如伪造数据或修改数据、攻击模型参数、恶意攻击服务器等。由于数据要素的使用用途和用量难以监控和衡量,受利益驱动,在数据使用过程中往往存在超权限使用现象,甚至滋生出非法数据交易产业链,对个人隐私、国家安全造成严重危害。备份销毁的安全风险有备份审计安全风险和销毁安全风险。数据流通交易结束后需要生成相关交易日志并进行备份,但备份过程可能存在未经授权擅自更改或删除

43、、异机备份等情况,无法为交易过程的查询、分析、审计和争议仲裁等提供可靠依据。数据销毁安全是指在监管业务和服务所涉及的系统及设备中清除数据时,通过建立针对数据的删除、销毁、净化机制,防止数据被恢复而采取的一系列防控措施。不及时、不彻底的销毁给内部人员和黑客提供可乘之机,可能产生数据泄露、个人信息重新识别、数据二次转售等恶性影响,特别是当数据存储在云端时,云服务商可能拒绝按照用户的删除指令销毁数据,而是恶意保留数据,从而使其面临被泄露的风险。数据交易 PDCA 模型 The PDCA Model for Data Transactions 11 3.3 流通使环境视的环境可信险分析 流通使用环境是

44、指数据要素在流通使用的整个业务生命周期中所涉及的环境。具体而言,可分为流通交易平台、软件环境、硬件环境三大部分。数据要素流通使用过程中,从交易申请到交易结束的全过程都在流通交易平台中完成,检测、脱敏、挖掘等各个具体操作都依赖于流通交易平台的大环境实现;同时,数据要素的汇集整理、建模分析等计算操作是依靠软件环境的相关算法实现的;而软件中算法的运行需要硬件基础设施提供算力资源才能完成。流通交易平台的安全风险主要表现在访问控制能力、环境应变能力、运行能力和内容交换控制能力。访问控制能力是指有益用户都应能访问系统,而有害用户都应被拒绝,体现了平台的可扩展性和安全性;环境应变能力是指平台对内外部变化应具

45、有的灵活性和可靠性,一方面体现了平台可以在不同的环境下运行,另一方面体现了平台内部结构的相对稳定性;运行能力是指平台有效实现数据要素流通利用的性能,有用性体现了平台的事务处理能力,易用性是指实现业务功能时占用最小系统资源的能力从而保证系统的运行性能,如访问速度快、操作方便等;内容交换控制能力是指平台的连通性和隐私性,要求既能够保障正常内容的交换,又能保护隐私内容。软件环境的安全风险体现在系统软件风险和应用软件风险。数据要素流通使用过程中需要各类系统软件和应用软件的支撑,这些软件存在着各种各样的漏洞甚至隐含着恶意代码,而检测此类软件中存在的恶意代码非常困难,给数据要素流通使用带来了巨大的潜在风险

46、。算法是数据要素流通应用中的一类特殊应用程序,随着各类深度学习模型、协同学习模型的应用,算法的计算逻辑、交互逻辑日益复杂和多样化,使得算法结果的可解释性差强人意,算法自身的安全性也难以控制,此外很多算法的设计基于某种安全假设,例如,假设多个参与方之间均遵守指定规则及协议流程且不存在同谋等,这额外地增加了一种安全假设风险,即当算法的安全假设不能被满足时,算法结果可能会难以预料6。硬件环境安全风险指数据存储、运行等所需要的关键信息基础设施安全风险,主要分为计算机物理安全和计算机网络安全。计算机物理安全风险包括计算机的异常损毁、被盗、非法使用等;计算机网络安全风险包括对计算机网络设备、计算机网络系统

47、、数据库等的攻击行为。此外,供应和搭建硬件环境的厂商是否可信任、是否曾发生未经允许自动读取设备信息和产品质量不合格事件、设备是否存在故障、传输是否存在延迟、是否存在硬件木马等都是与硬件环境相关的安全风险。如果硬件设备易遭受攻击、频频出现故障,将严重影响数据要素相关产业的健康发展。6 云程发轫,精耕致远 中国隐私计算业研究报告C/.艾瑞咨询系列研究报告(2022 年第 3 期),2022:1026-1110.数据交易 PDCA 模型 The PDCA Model for Data Transactions 12 四、基于 PDCA 的数据要素可信流通交易评估指标和测度体系 4.1“PDCA”信任

48、模型 本报告依据数据要素流通交易全流程可信的要求,即事前审查阶段需要保障主体资质可信、数据质量可信和合约内容可信,在事中监控阶段要保障主体行为和算法行为可信,在事后审计阶段,要对数据流通使用过程进行追溯,更新主体和数据的信用评估。本报告面向数据要素流通交易过程涉及道德关键主体和客体,提出了 PDCA可信模型,即主体可信(Participant)、数据可信(Data)、合约可信(Contract)和算法可信(Algorithm)。(如图 3 所示)图 3 数据要素可信流通使用体系(1 1)主体可信主体可信 主体是数据要素市场运行的引擎,包含了个人、企业和政府等多元主体,各主体之间的信任关系和相互

49、合作构成了数据要素可信流通的底层逻辑。不同主体在交易中扮演的角色、市场能力、交易行为以及他们之间的相互作用是影响数据要素可信流通使用的关键因素。不可信主体可能会造成数据要素市场的瘫痪,加大市场的数据质量风险、交易道德风险和违约风险。例如,由于数据要素具有易复制性的特点,不可信的数据供方可能会转售他人数据,侵害数据实际拥有者的合法权益;而不可信数据需方可能滥用数据,包括未经授权的数据访问、数据滥用、数据泄露等行为。因此,拥有数据的企业出于对其他主体道德风险的感知,为维护自身的利益,往往不愿意甚至不敢将数据出售给其他企业,极大阻碍了数据要素价值的释放。此外,由于数据要素在流通使用过程中数据供方无法

50、得知自己的数据将被如何使用以及数据需方是否具有数据保护的能力,数据需方也很难向第三方证实自己是否滥用了供方数据。这种信息不对称性和不可证实性造成了主体间的信任壁垒问题。因此,保障主体可信可以降低主体间信任沟通的成本,提高数据要素流通的效率。(2 2)数据可信数据可信 数据交易 PDCA 模型 The PDCA Model for Data Transactions 13 数据是数据要素市场发展的血液。可信的数据供给可以促进数据跨区域、跨行业配置,降低企业的数据获取和科技创新的边际成本,提升数字经济产业链供应链的质量。数据是数据驱动分析和预测的基础,低质量的数据可能会导致错误的业务判断和预测,损

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服