资源描述
2021年8月2021中国电子与清华大学数据治理工程联合课题组City-Wide Data Governance Project White Paper城市数据治理工程白皮书2021年8月2021中国现代数字城市建设是推进国家治理体系和治理能力现代化的一个关键的行动。然而,当前数字城市建设面临着一个主要困难:如何高效、安全、合法合规地把数据利用起来?一方面我们需要解决数据本身以及数据开发利用过程中的安全、隐私等问题;另一方面,我们还需要解决效率和标准化的问题。在此背景下,中国电子和清华大学联合课题组围绕数据安全和数据要素,形成了2021 中国城市数据治理工程白皮书(以下简称白皮书),第一次系统地从安全、法律、技术、经济和制度等方面对城市数据治理开展理论研究和实践探索,为城市数据治理工作提供理论参考和实践指引,具有较高的理论价值和实践意义。白皮书主体有四部分内容,包括形势与意义、现状与问题、总体目标与思路,以及解决方案。第一部分讲形势与意义。阐明在数字时代,数据上升为新的生产要素,充分释放数据要素价值,发挥好数据在数字社会发展中基础性和支撑性关键作用,是数字社会时代发展的必然规律,更是我国把握新发展阶段的内在要求、贯彻新发展理念的实践路径和构建新发展格局的关键支撑。第二部分介绍现状与问题。说明当前数据治理工作现状,分析数据要素利用所面临的难题及其原因,重点阐明数据流通与数据安全的矛盾,数据资源开发利用的紧迫性与数据资产化体系建设的滞后性的矛盾,以及数据供需两旺与数据要素市场缺位的矛盾,并对生产要素一般规律和数据要素市场化的基本特征进行分析。第三部分介绍总体目标与思路。提出数据治理总体目标、核心理念、要素化模型和治理框架。强调通过创新制度、市场以及技术体系,将数据资源加工为可析权、可计量、可定价且风险可控的初级产品,落实“打造一库双链,培育三级市场”数据要素核心理念,以及“关键数据入库、双向风险隔离、三级安全管控”数据安全核心理念,促进数据的安全流通与高效配置,实现发展与安全的有机统一,推动社会全面进步。第四部分介绍解决方案并对架构设计方案进行整体阐述。构建了以数据归集系统、数据金库、序 言数据要素操作系统、全栈式数据安全防护体系、数据治理标准体系和应用生态体系等为内容的技术体系方案;以组织机构、管理制度、法律法规和安全管理为内容的制度体系方案;以三级市场、定价机制和市场监管为内容的市场体系方案;以“发挥市场决定性作用、政府主导作用和企业主体作用”为内容的运行机制。面向十四五,城市数据治理工程具有划时代的意义。数字化消费与生产将全面助力高质量发展,数字融合将全面助力经济体系优化升级,数字化转型将全面助力产业链现代化水平提高,数字化资源配置将全面助力产权制度改革和要素市场化配置改革。我们衷心希望各城市以白皮书的发布为契机,以积极有效的制度和政策促进数字经济发展,利用数字技术更有效地调控经济和监管市场,不断提高社会管理和公共服务的数字化水平,同时对数字技术应用进行有效监管。城市数据治理是一个极其复杂的社会科学和管理科学问题,没有现成的理论体系可循,我们也希望国内学术界更多有识之士真正关注这个问题,共同参与到白皮书的理论研究与实践探索中来,共同推进数据安全和数据要素一体化治理迈上新的台阶,共同推动国家治理体系和治理能力现代化的发展。2021 年 8 月于北京中国科学院院士、大数据分析与应用技术国家工程实验室联席主任兼技术委员会主任、北京大数据研究院院长 鄂维南序 言 02一、形势与意义 06二、现状与问题 08三、总体目标与思路 18CONTENT目 录2.1 现状分析 .082.2 存在问题 .102.3 原因分析 .12 2.3.1 数据流通与数据安全的矛盾 .12 2.3.2 数据资源开发利用的紧迫性与数据资产化体系建设的滞后性的矛盾 .12 2.3.3 数据供需两旺与数据要素市场缺位的矛盾 .122.4 一般规律 .13 2.4.1 土地、劳动力、资本、技术的市场化规律研究 .13 2.4.2 数据要素市场化的基本特征 .153.1 总体目标 .183.2 核心理念 .18 3.2.1 数据要素的核心理念:打造“一库双链”,培育三级市场 .19 3.2.2 数据安全的核心理念:关键数据入库、双向风险隔离、三级安全管控 .213.3 要素化模型 .23 3.3.1 数据元件模型 .24 3.3.2 数据应用模型 .24 3.3.3 定价与安全审核模型 .243.4 治理框架 .27四、解决方案 284.1 架构设计 .284.2 技术体系方案 .29 4.2.1 建设数据归集系统 .29 4.2.2 构建数据金库 .29 4.2.3 建设数据要素操作系统 .30 4.2.4 构建全栈式数据安全防护体系 .30 4.2.5 打造数据治理标准体系 .33 4.2.6 构建应用生态体系 .344.3 制度体系方案 .35 4.3.1 组织机构 .35 4.3.2 管理制度 .37 4.3.3 法律法规 .38 4.3.4 安全管理 .434.4 市场体系方案 .44 4.4.1 三级市场 .44 4.4.2 定价机制 .45 4.4.3 市场监管 .454.5 运行机制 .46 4.5.1 发挥市场决定性作用 .46 4.5.2 发挥政府主导作用 .46 4.5.3 发挥企业主体作用 .46五、后记 47附录 1:中国电子与清华大学数据治理工程联合课题组成员名单 .48附录 2:数据治理工程 2021 年大事记 .50城市数据治理工程白皮书06中国电子与清华大学数据治理工程联合课题组一、形势与意义数据上升为新的生产要素,充分释放数据要素价值、发挥好数据在数字社会发展中基础性和支撑性的关键作用,是数字社会时代发展的必然规律,更是我国把握新发展阶段的内在要求、贯彻新发展理念的实践路径、构建新发展格局的关键支撑。数字经济已经从数据资源化利用阶段转向数据要素市场化配置与数据资源化利用相融合的新阶段。2017 年,习近平总书记强调“数据是新的生产要素,是基础性资源和战略性资源”,标志着数字经济进入一个全新的阶段。在此之前为数字经济 1.0 时代,之后进入数字经济 2.0时代。数字经济 1.0 时代的主要特点体现在“政府推动”,重点强调通过数据资源化利用,赋能数字产业化和产业数字化,实现政府治理能力、民生服务水平以及经济发展质量三个方面的提升。数字经济 2.0 时代的主要特点体现在“市场配置”,强调通过数据要素化配置,实现经济社会的效率倍增、安全倍增以及财富倍增。数据成为生产要素是数字社会时代发展的必然规律。生产要素的变迁和演进不仅是技术-经济范式的变革,更是社会运行方式、管理范式的跃迁。在农业时代,土地和劳动力是关键生产要素,与工业革命推进相伴,技术和资本也加入关键生产要素之列,随着社会全面迈入数字时代,数据成为新要素为生产力跃升注入新动力。从本质而言,物质、能量、信息作为经济社会运行的三大基础要素,随着经济社会发展阶段跃迁,逐步迭代演进而发挥主导角色,在农业和工业社会,物质和能量转换扮演主导,但迈入数字社会时代,信息则扮演了牵引三大基础要素更精准、更高效、更合理转换的关键角色。数据作为信息的关键载体,成为新生产要素,这是时代发展演进的必然规律。充分释放数据要素价值是准确把握新发展阶段的内在本质要求。党的十九届五中全会指出,我国将进入新发展阶段,这是以习近平总书记为核心的党中央作出的重大战略判断。新发展阶段是着力解决新时代我国社会主要矛盾、实现高质量发展的阶段,也是经济、政治、文化、社会和生态文明建设“五位一体”全面协同发展的新阶段。“信息论之父”香农认为,“信息是能够用来消除不确定性的东西”,数据要素的价值源于减少不确定性、提升要素使用者的决策质量。在新发展阶段,数据是在劳动力、土地、资本、技术等传统要素增长边际递减的形势下,引领人才流、物质流、资金流和技术流全面升级,提升全要素生产率、注入高质量发展的新动力;更是推动国家治理能力、民生服务、社会运行、文化传播、生态文明的重城市数据治理工程白皮书07中国电子与清华大学数据治理工程联合课题组要抓手。在全球新冠疫情爆发和碳中和发展目标要求之下,进一步凸显了释放数字要素价值,加速国家治理数字化转型、加快实现“五位一体”协同发展的紧迫性与战略重要性。数据要素市场化为全面贯彻新发展理念提供了有效路径。满足新发展阶段的新任务新要求,必须坚定不移贯彻新发展理念。数据要素市场化将全面加速经济社会各领域的数字化转型进程,推动各领域的质量变革、效率变革、动力变革,推动供给侧生产组织方式走向网络化、绿色化,驱动产品和服务迈入智能化,不断满足需求侧个性化、多样化的新要求,真正让创新成为第一动力、协调成为内生特点、绿色成为普遍形态、开放成为必由之路、共享成为根本目的,推进物质文明和精神文明相协调,促进社会全面丰富和人的全面发展。数据要素成为加快构建新发展格局的关键支撑。构建“双循环”新发展格局是应对当前国内外经济形势变化的重大战略之举。“双循环”发展战略的关键在于循环,即推动生产要素公平自由地流动与使用。数据作为一种全新的生产要素,在经济循环的生产、分配、流通和消费环节中,成为打通供需错配、结构失衡、配置低效、流通壁垒、消费不足等堵点的重要手段。数据在国内统一大市场的构建与产业有序转移中,在实现需求牵引供给、供给创造需求的更高水平动态平衡中,在优化国民经济重大比例关系和空间布局中,将发挥基础支撑和核心牵引作用,进而推动全球范围内的数据要素高速流动、融合共享和开放应用,释放数据红利,聚合并构建一个多层级、多产业,能够实现国内高质量稳定增长、国际辐射带动能力强劲的现代化经济体系。城市数据治理工程白皮书08中国电子与清华大学数据治理工程联合课题组自上世纪90年代“三金”工程开始,我国城市信息化、数字化建设持续推进,尤其是在“十三五”期间取得快速发展,大量的政务、企业、人口、经济等数据在城市汇集,然而数据要素的利用却面临流动性差、应用潜力无法有效发挥的难题,难以支撑“发展数据要素市场、激活数据要素潜能”的目标实现。当前,围绕数据治理相关的应用、技术、安全、法律、制度等方面,已开展了大量的实践探索,但仍有诸多问题尚未有效解决,总体呈现出“技术活跃、市场混乱、制度滞后”的特点。“十四五”期间,“推进数据要素市场化配置改革”必须走一条新路子,真正破解数据治理难题。在数据应用方面,数据在治理现代化、经济高质量发展、民生服务等领域的应用场景不断拓展,逐步成为驱动数字政府、数字社会以及数字经济加快建设的核心力量,整体上呈现出以下典型特征:一是政府想法多,落地路径少,中央和地方各级政府普遍认可数据开发利用的必要性与紧迫性,但数据要素市场化配套的法律法规、规章制度、市场定价、技术方案仍然不成熟;二是企业需求旺盛,灰色供给活跃,由于数据要素化市场机制尚不完善,企业的数据需求难以通过公开、合法的途径得以满足;三是社会广泛共识,数据共享需求强烈,社会各界对数据资源的开发、利用、保护积极开展实践探索,但各级政府、企业、科研机构等主体尚未形成有效的内外协同机制。在数据交易方面,自 2014 年贵阳市成立大数据交易所以来,截至 2021 年 4 月,我国已建成22 个大数据交易所(中心),尤其是 2020 以后,新一轮的数据交易中心快速发展,整体上呈现以下典型特征:一是多种交易模式并行,主要包括政府指导参与的大数据所(中心)模式、以行业机构为主的行业数据交易模式、以垂直数据服务商为主的市场化数据交易模式、以大型互联网公司和大型 IT 厂商为主导的数据交易平台模式等;二是区域性和国际性交易中心成为新阶段的发展特点,在 2017-2019 年数据交易中心的沉寂后,2020 年交易中心建设正迈入以区域性、国际性为主要特征的第二轮建设爆发期;三是从交易中心交易模式来看,主要以撮合为主,盈利模式以佣金分成为主。2.1 现状分析二、现状与问题城市数据治理工程白皮书09中国电子与清华大学数据治理工程联合课题组在数据治理技术方面,数据治理技术快速演进迭代,以数据归集、数据处理、数仓开发、数据分析和挖掘为核心环节的数据技术框架体系逐渐成型,为全面推进数据要素化奠定了重要技术基础,整体上呈现以下几个特征:一是数据治理手段智能化,人工智能技术广泛应用在数据治理的各环节;二是数据治理技术多样化,体现在数据治理技术本身的多样化、数据应用多样化以及数据产生主体的多样化;三是数据应用开发敏捷化,将数据治理过程与业务开发过程抽象出来模块化,根据业务场景和实际需要实现敏捷式开发已成为主流的数据应用开发模式。在数据治理安全方面,作为数据要素化的基石和保障,以本质安全、过程安全以及主体安全为核心的数据安全体系成为数据治理领域关注的焦点,整体上呈现出以下几个特征:一是我国数据安全体系是建立在国外技术支撑之上。数据安全的底层技术与产品依然存在“卡脖子”现象,尚未实现自主可控与“真正”的安全。二是单体安全发展成熟,整体安全得到重视。传统的单点防御技术已经步入成熟期,以完全安全运营能力、安全防护能力、安全产品服务能力为核心的整体安全建设成为重点。三是多部门监管多主体。工业、电信、自然资源、卫生健康、教育、国防科技工业、金融业等行业主管部门各自承担所在行业与领域的数据安全监管职责。在法律法规体系方面,数据治理相关法律基本原则已经确定,面向不同数据类型、不同应用场景的数据治理法治体系基本成型。整体上呈现以下典型特征:一是相对于欧美国家,中国在立法上处于并行和跟随发展的状态;二是我国有关数据的法制体系正在逐步形成,各地方竞相探索数据要素流通的法制方案;三是数据合规要求逐步增加且相关法律责任后果不断加重;四是在法律法规实施方面,数据相关的司法和执法在相对原则的立法背景下有较大的自由裁量空间。在组织运行体系方面,近年来各地各部门从政策、机构、认识水平等方面积极推动,取得显著进展,制度建设和统筹管理不断加强,整体上呈现出以下典型特征:一是政策区域化特征明显,国家层面的专门政策文件尚未出台,各地普遍结合自身情况制定数据治理相关的制度文件,没有形成统一的共识;二是数据主管部门的性质和职能差异明显,编制类型既有行政机构也有事业单位,隶属关系分属不同系统,针对管理、发展、产业、安全等方面职能设置各有侧重;三是运营主体的商业模式正处于积极探索中,政府购买服务、市场化运作以及两者相结合的商业模式均在探索运行。城市数据治理工程白皮书10中国电子与清华大学数据治理工程联合课题组从上述数据要素化发展的现状来看,虽然数据应用需求不断提升,但数据有效供给是不足的,尤其是我国转向高质量发展阶段后,以数据要素充分赋能市域治理、经济发展、民生服务等方面出现明显“瓶颈”。这种问题的原因是数据流通体系缺位、缺乏统一的技术和安全体系、法律和制度体系建设滞后等。数据有效供给不足。一是数据共享融通壁垒尚未彻底破除,导致跨地区、跨层级、跨部门、跨业务、跨系统的综合型大工程推进难度较大,对治理现代化的赋能效应有待释放;二是数据对传统生产要素的“融合、倍增”价值难以充分释放,阻碍了全要素生产效率水平提升,对数字经济的促进作用有待提速;三是数据安全及隐私保护的高标准一定程度上阻碍了企业信息、社会公众个人信息等数据的流转与价值开发,对民生服务的支撑作用有待加强。数据要素市场缺位。一是由于缺乏合适的交易标的物,当前大数据交易所(中心)主要承担简单的“数据中介”角色,导致数据交易规模十分有限;二是数据交易配套制度体系建设滞后,缺乏对数据开发全流程的有效监督与管理,对数据交易过程中法律和制度的建设存在不足。技术体系尚不完善。一是在数据治理领域,缺少以城市为单位的规模化、工程化的数据治理技术方案;二是缺乏统一、科学的数据流通规约,数据封锁带来的市场壁垒导致企业创新积极性受创,数据治理技术进步受阻,社会公众难以充分享受科技成果;三是现有技术难以支撑深度挖掘过于分散的数据,数据价值尚未得到释放;四是数据治理缺少统一的技术标准,难以实现城市级规模的数据共享、开放与流通。安全问题日益严峻。一是本质安全难以保障,我国数据安全的底层技术与产品依然存在“卡脖子”现象,尚未实现自主可控,本质安全难以保障,信创亟需从党政领域加速扩展;二是过程安全日益严峻,数据流通交易与隐私保护的矛盾日益突出,亟待从外挂式安全向主动安全、从被动防御向主动防御转变;三是制度安全权责不清,数据治理主体安全权责不清,数据安全管理制度尚不完善,数据在不同机构之间流动、共享和交换过程中的权责边界模糊。法律体系亟待健全。一是数据相关立法明显滞后于数字经济的快速发展,需要进一步细化规则来平衡发展与安全之间的矛盾;二是支撑数据要素市场发展的数据财产立法不足,中国亟需探索一条依托可信的数据流通中心开展数据要素利用的新道路;三是企业数据相关的立法2.2 存在问题城市数据治理工程白皮书11中国电子与清华大学数据治理工程联合课题组显著滞后,导致企业数据只能依赖反不正当竞争法的保护,但往往又会面临反垄断法的限制;四是部门利益牵制,阻碍了数据相关立法的建设进度。制度管理体系滞后。一是数据主管部门职责和定位不清晰、不准确,数据治理领域力量分散、多头管理的问题依然突出,难以形成合力;二是各方参与主体的权责利益不清晰,运营模式陈旧,尚未建立起政企结合、多方参与、共同获益的健康、高效的长期运作机制,难以适应快速发展的数字时代治理需求;三是数据运营机构参与数据治理的工作仍然处于探索阶段,数据运营主体在运营数据工作中的制度支撑不够明确,导致不敢用、无法用的现象普遍存在。城市数据治理工程白皮书12中国电子与清华大学数据治理工程联合课题组造成上述六大问题的原因,主要是由于数据流通与数据安全的矛盾、数据资源开发利用的紧迫性与数据资产化体系建设的滞后性的矛盾、数据供需两旺与数据要素市场缺位的矛盾没有得到有效破解。2.3.3 数据供需两旺与数据要素市场缺位的矛盾当前,我国尚未建立适应数据要素市场化配置的制度体系、法律体系和组织体系,造成了数2.3 原因分析2.3.1 数据流通与数据安全的矛盾数据治理运行体系不合理导致数据流通和数据安全的矛盾难以有效解决。基于数据产生方式,数据具有显著的分散特性,但真正促使数据成为社会生产要素的是“数量大、类型多、价值密度低、时效要求高”的巨量数据集合。因此,数据汇集、融合、流通是释放数据价值的基础与前提。数据产生之后,逐级流转向数据开发商,并由数据开发商开发利用后,才能为社会提供数据产品与服务,产生市场价值。基于数据的隐私性与敏感性,数据流通面临着存储管理风险、黑客攻击、信息泄露风险等安全问题,严重威胁个人隐私、社会稳定与国家安全。在实现隐私和敏感性保护前提下,现阶段我国还缺少有效的数据要素运行体系高效实现数据的融合、流通。2.3.2 数据资源开发利用的紧迫性与数据资产化体系建设的滞后性的矛盾价值体系不完整造成数据资产化路径不畅,数据资源开发利用的需求难以满足。数据资源对社会经济发展的支撑作用日益增大,加快数据资源开发利用、大力发展数字经济,已成为我国培育发展新动能、促进新旧动能转换、推动高质量发展的必由之路和战略抉择。数据逐渐成为传统企业转型升级、新兴企业创新发展的重要支撑,农业、工业以及服务业等各行各业对数据的需求日益增强。现阶段数据资产的定义与内涵尚未达成共识,数据交易标的物难控制、难计量、难定价的问题尚未得到解决,数据资产化的途径受阻,进而制约了企业对数据的有效利用,限制了数据作为资本参与经济循环,阻碍了数据价值释放,无法有效支撑经济高质量发展。城市数据治理工程白皮书13中国电子与清华大学数据治理工程联合课题组至上世纪 90 年代末,以价格改革为核心的商品市场改革已基本完成,土地、劳动力、资本、技术等四类生产要素的市场化配置改革也取得长足进步,持续推动我国经济 20 年来的繁荣增长。传统生产要素市场培育已经基本成型,其市场化的一般规律对数据要素市场化的实现路径具有重要借鉴意义。数据作为新型生产要素,既遵循生产要素市场化配置的一般规律,也呈现诸多新特征,生搬硬套已有制度,难以解决数据流通中的标的物确权、定价和交易机制设计等关键问题。采取“从特殊到一般再到特殊”的方法,提炼土地、劳动力、资本、技术等要素市场化的一般规律,结合对数据要素特点及其市场化特征的深入剖析,或将是探索数据要素市场化实现路径的关键突破口。2.4.1 土地、劳动力、资本、技术的市场化规律研究土地、劳动力、资本、技术等要素经历了多轮次配置方式的改革探索,已建立起较为完善的市场化配置体系,其由“资源”到“要素”再进行“流通”,需经历多环节演进过程,权属、形态等均发生显著变化。(1)四要素市场化的一般过程土地。土地要素实现市场化配置的三个阶段:一是土地征收,国有土地、乡村集体土地资源经过土地储备机构评估和定价,经政府或其授权委托的企业统一征地、拆迁、安置、补偿,并建设市政配套设施,达到“三通一平”、“五通一平”或“七通一平”的建设条件(即“熟2.4 一般规律据供需两旺与数据要素市场缺位的矛盾加剧。随着大数据、物联网、人工智能、5G 通信等技术快速发展,数据规模呈现爆炸式增长的态势,各类机构、企业、个人通过合法或者非法途径售卖数据,数据供给十分活跃。随着市域治理、经济发展、民生服务、科技创新等领域的数据应用不断拓展和深入,对有效数据供给的需求日益增强。数据供给侧与需求侧呈现出快速增长趋势,供需通道亟待打通。在原始数据不能交易的前提下,现阶段数据交易中心“数据中介”模式难以支撑数据要素的高效配置。但由于法律和制度体系仍不成熟,政府、企业和社会机构的责权利界定不清晰、主体作用不明确,导致有效的数据要素市场迟迟难以建立,数据供需两侧难以实现有效对接。城市数据治理工程白皮书14中国电子与清华大学数据治理工程联合课题组(2)规律总结总结提炼四类要素市场化的一般过程,得出“确定中间形态、完成三次确权、进行三次定价”的普遍规律,如表 1 所示。地”),纳入土地储备库;二是土地出让,政府把用途、范围和质量界定清晰的“熟地”,通过市场化定价机制,以“招拍挂”、协议出让等方式,将其使用权在一定年限内让与土地使用者;三是土地商业开发,土地使用者经过开发建设,形成房地产、厂房等产品,具备生产、生活等丰富多样的承载功能,并进入市场流通。劳动力。劳动力要素实现市场化配置的三个阶段:一是教育培训机构对适龄人口进行培训,适龄劳动人口作为原始劳动力资源,拥有就业权,在支付培训费用后,经各级各类教育及培训机构培训,取得就业所需的行业专业技能,并以证书等形式完成技能认定;二是市场对劳动力进行技能和薪金的评估认定,在劳动力市场,人力资本拥有自主择业权,凭借证书等标准化、共识广的标的物,完成劳动技能的市场化价值认定;三是劳动力进入企业参与价值创造,用人方通过签订劳务合同,取得劳动力在一定时期内的使用权,以企业培训等方式使劳动人员掌握特定企业、特定岗位的工作技能要求,实现将劳动力融入生产的社会化分工体系中。资本。资本要素实现市场化配置的三个阶段:一是资金归集,银行通过储蓄存款等方式筹集个人资金,实现资金使用权的转移;二是包装金融产品,加工各类金融产品,并基于风险评估和货币的市场价格确定利率水平,进而通过发放贷款等形式实现金融产品使用权向企业转移;三是资金融入企业,企业在取得资金使用权后,用以购买生产资料,加工产品并投放市场,通过市场活动实现资金回笼循环。技术。技术要素实现市场化配置的三个阶段:一是知识积累,各类研发主体获取支撑技术创新的知识、工具、人才等科技资源,并依法取得其使用权;二是成果产出,创新主体通过申请知识产权保护等形式,对所取得的技术创新成果进行权属确定,技术成果基于收益法、市场法、成本法等评估方式,确定市场价值;三是成果转化,生产主体通过竞价转让、协议转让等方式,取得知识产权的所有权或使用权,并基于科技成果构建或改造生产体系,生产出投放市场的终端产品或服务,完成技术要素在市场经济循环中的价值创造。城市数据治理工程白皮书15中国电子与清华大学数据治理工程联合课题组中间形态:要素在完成大规模市场化流通的过程中,普遍在原始资源、终端产品之间确定一个具备共识基础的中间形态(本文称之为“中间态”),作为交易标的物,以便开展标准化、专业化的价值评估评定。如熟地、资格证书、银行贷款、知识产权等。三次确权:在流通的各个环节,每当要素发生形态转换时,均需要对其权属进行准确划分和确定,为定价、交易创造条件。三次定价:要素在流通过程中,因形态转换通常伴随着价值创造,导致要素价格和定价机制在每一个环节均产生巨大差异。因此要素定价并非一次完成,而是在每次确权之后,根据要素当前所处形态开展差异化定价。2.4.2 数据要素市场化的基本特征(1)数据要素的特点由于数据具备分散性、多样性、易复制性、时效性、再创性等特性,使得数据作为一种新的生产要素,相对于传统生产要素而言,具有“资源分散多元、流通风险大、价值后验突出”三大特点:表 1 四类要素市场化的规律技 术科技 资源公有/组织/个人市场 定价科技 成果成果 所有人价值 评估产品/服务生产 主体市场 定价资 本货币 资源企业/个人固定 利率金融 产品银行风险 评估生产 资金企业资产 价格劳 动 力劳动 资源个人技能 评价劳动 证书个人价值 共识生产 劳动用人 单位绩效 评定土 地土地 资源集体/企业/个人标准 补偿出让 地块政府地价 评估房地产/厂房 等开发商市场 定价要 素初始 形态一次 确权一次 定价中间 形态二次 确权二次 定价最终 形态三次 确权三次 定价城市数据治理工程白皮书16中国电子与清华大学数据治理工程联合课题组资源分散多元。一是数据来源极为分散,数据来源表现为一个巨大“开集”,个人、企业、政府和各类社会组织以及各类机器设备产生大量的、分散的数据,既有结构化、半结构化、非结构化数据,还有数字量、模拟量等表现形式,只有经过汇聚和挖掘才能发挥价值;二是数据需求多元,海量的组织及多样化的应用场景需要多元数据支撑,要实现分散海量的数据资源向多样的应用需求高效流动,就需要建立类似土地、资本等要素市场中基于中间态的流通体系。流通风险大。一是数据隐私性、敏感性强,数据的隐私性、敏感性和安全性并存,既关系到个人隐私,又可能在汇集过程中形成国家安全相关的重要信息,因此,数据资源需要经过治理形成脱敏的、无安全隐患的中间态才能实现高效流通;二是安全风险较多,数据具有显著的非排他性、复制成本低,未授权使用、数据泄露等违规违法行为难以察觉,因而在流通过程中面临着隐私泄露、黑客攻击等多样化风险。因此,需要构建全过程、体系性的安全防护技术及监管制度体系作为基本保障。价值后验突出。一是价值转化路径多元,数据价值转化的场景极为丰富,既作用于现有生产活动和社会活动,带来价值提升,如智能制造、智慧交通等,还可在数字世界中产生原发性创新应用,形成全新价值,如网络游戏、AR/VR 等;二是价值事前评估困难,同一条数据的实际价值可能因使用场景、使用时间不同而产生巨大差异,且通常仅能在事后估算,先验知识难以发挥作用,为估值定价带来巨大挑战。(2)数据要素市场化的特征数据要素的上述特点决定了其在市场化过程中,既遵循传统要素的市场化规律,又要设计出适合符合自身特点的操作路径。一是构建“中间态”,实现数据源和数据应用解耦。从对接方式看,海量、分散、“多对多”的供需对接形态下,需要以可计量、可定价的“中间态”作为交易标的物提升供需链接效率。从标的物形态看,由于数据具有隐私、敏感性,数据资源只有经过融合、特征提取后形成消除隐私和安全隐患的、可控制的标准化“中间态”,才具备高效流通交易条件。二是通过三次确权,使数据确权的复杂问题得到有效解决。数据确权涉及隐私权、财产权、安全权等多种权利,直接交易原始数据情况下,确权难度大、风险高。需要引入“中间态”,城市数据治理工程白皮书17中国电子与清华大学数据治理工程联合课题组将数据确权分解成针对数据资源、数据元件、数据产品的三次确权,在确保数据价值有效传递的前提下,逐级降低隐私和安全风险,降低确权复杂度。三是数据定价要以价值为核心,兼顾成本、收益,通过市场化方式确定。数据要素面向不同领域、行业、群体特点和属性,其利用价值不同。根据信息消除数据应用中“不确定性”的多少,应建立差异化估值体系,并通过议价和竞价等市场化方式定价。四是交易方式灵活,协议、竞价等多种方式并存。当前数据要素交易方式仍处于创新探索阶段,主流交易模式多达八种,对技术支撑能力、撮合平台柔性、市场机制设计、制度环境建设、安全保障能力等提出了更高要求。综合分析,强调数据安全,流通受到阻碍;强调数据流通,安全面临挑战。数据流通与数据安全之间的矛盾阻碍了国家治理体系和治理能力现代化建设及高质量发展,亟待破解。随着数据量爆发增长和数据要素的价值潜力日趋显著,数据安全问题已成为数字化发展最大的制约。促进发展和安全的统一,成为“十四五”经济社会高质量发展的内在要求。因此,我们亟需以数据治理工程为抓手,灵活借鉴土地、资本、劳动力和技术等传统生产要素市场化“确定中间形态、完成三次确权、进行三次定价”普遍规律,推动“理论+实践”相互融合,探索“制度+市场+技术”深度结合的发展新模式,打通数据要素市场化实现路径,实现数据价值链和数据资产链“双链融合”,释放数据价值,推动我国经济社会高质量发展。城市数据治理工程白皮书18中国电子与清华大学数据治理工程联合课题组通过创新制度、市场以及技术体系,将数据资源加工为可析权、可计量、可定价且风险可控的初级产品,促进数据的安全流通与高效配置,打通以数据要素为核心的数据资产链与价值链,充分挖掘数据所蕴含的信息价值;实现数据从资源端到应用端的泄露风险以及数据从应用端到资源端的滥用风险的双向风险隔离,实现发展与安全的有机统一,推动社会全面进步。3.1 总体目标针对当前数据资产化体系不健全、数据要素化路径不清晰、数据治理运行模式仍未形成的问题,数据治理工程研究以习近平新时代中国特色社会主义思想为指导,全面贯彻党的十九大和十九届二中、三中、四中、五中全会精神,探索数据治理的新理念、新模式和新方法,从法律、技术、安全、制度等多个视角,构建统筹协调、相互补充的数据治理体系,为系统性地推进数据治理工程提供有效支撑。本方案创新性地提出“数据元件”的概念。数据元件是通过对数据脱敏处理后,根据需要由若干字段形成的数据集或由数据的关联字段通过建模形成的数据特征,以及图片、音视频等非结构化数据构成的数据集。数据元件作为连接数据供需两端的“中间态”,实现原始数据与数据应用“解耦”,从而不能从数据产品中可逆获取到原始数据,破解“安全与流通对立”难题。3.2 核心理念图 1 数据元件成为连接数据供需两端的“中间态”数据 资源数据 产品数据源数据 用户之 前数据 资源数据 元件数据 产品数据源数据 用户之 后受限的数据流转开放的数据流转归集开放 流通三、总体目标与思路城市数据治理工程白皮书19中国电子与清华大学数据治理工程联合课题组数据元件具有安全属性和价值属性。安全属性主要体现在风险隔离、安全审查和精准监管。在风险隔离方面,当数据元件作为“中间态”,起到数据资源与数据应用“解耦”作用的同时,可以有效形成数据保护层,实现数据从资源端到应用端的泄露风险以及数据从应用端到资源端的滥用风险的双向风险隔离。在安全审核方面,通过对数据字段数量及其组合关系进行安全审查,消除数据元件交易中的隐私与安全风险,从而为高效流转提供市场和安全保障。在精准监管方面,数据元件作为交易标的物,既精简了数据资源到数据应用之间复杂多样的链接路径,又发挥了数据全生命周期追溯管理的关键节点作用,有效实现数据流通交易的精准监管。价值属性主要体现在可析权、可计量、可定价。在析权方面,通过构建数据元件,将数据的人格权、用益权在数据资源、数据元件、数据产品的三个阶段分别进行确权,降低确权复杂度。在计量方面,数据元件标准对数据元件中数据的使用量进行了明确的界定,从而使数据价值评估有了计量单元,提升数据计量精准度。在定价方面,数据元件的价值关键在于其蕴含的信息量,即消除“不确定性”的多少。数据元件的信息量可以通过信息熵理论建模进行评估,从而提高数据定价可行性。3.2.1 数据要素的核心理念:打造“一库双链”,培育三级市场本方案以“一库双链、三级市场”为数据要素化的核心理念,建设一个全自主、高安全的数据金库作为底层运行支撑,通过数据资源两次赋能,打通数据资产链和数据价值链“双链融合”,同步催生数据资源、数据元件和数据产品三级市场,实现数据要素安全流通和高效配置,带动提高全要素生产率和创新水平,促进社会经济全面发展。3.2.1.1 数据资产链和数据价值链以数据元件为中心,实现数据价值链和数字资产链“双链融合”。一是数据资产链,是指数据在开发利用过程中,数据形态不断转化的过程,“数据资源-数据元件-数据产品”的形态转变,使得数据更有效地承载高价值信息,推动由“数据资源”转化为“数据资产”,形成“资产链条”;二是数据价值链,是指数据在深入挖掘过程中,价值不断释放的过程,从数据资源到数据元件的转化提升了数据品质,提高了数据价值密度和标准化程度,实现了第一层的数据增值。从数据元件到数据产品的转化完成从标准化的数据元件到特定应用场景和专业化服务的适配,实现了第二层的数据增值。城市数据治理工程白皮书20中国电子与清华大学数据治理工程联合课题组3.2.1.2 数据资源市场、元件市场和产品市场以数据元件为中心的数据要素化路径通过数据资产链和数据价值链得以实现,同时催生出数据资源、数据元件、数据产品三级市场。(1)数据资源市场在原始数据归集阶段,政府主导,通过建立面向各类数据源的归集系统,并形成购买、协议以及激励等多种方式相结合的机制体系,有效归集各类社会数据,催生更有生命力的数据资源市场。强大的数据资源市场为数据元件市场提供了基础支撑。(2)数据元件市场为形成可析权、可计量、可定价且风险可控的数据元件体系,需带动相关能力主体对数据资源进行有效的开发和利用,以便快速扩展数据元件品类和数量,并依托规范化的流通平台进行交易流转,进而催生数据元件市场。(3)数据产品市场数据应用开发主体在数据元件市场通过交易获取数据元件,并对数据元件进一步开发利用,面向政府、企业、个人用户需求,打造成数据产品及服务,进而形成丰富的数据产品市场。图 2 数据要素市场化示意图元件市场资源市场产品市场三级市场资源元件产品数据源数据 用户数据要素金库(数据金库)数据价值链数据资产链城市数据治理工程白皮书21中国电子与清华大学数据治理工程联合课题组3.2.1.3 数据要素金库为支撑数据要素化过程,需建设一个“数据要素金库”(简称“数据金库”),形成数据要素运行的安全底座。数据金库定位于解决目前关键数据过于分散、安全保障不足等难题,由政府主导构建的自主安全的数据中心,存储影响国家及区域安全发展的核心数据、影响个人隐私以及国家长期发展战略的重要数据为主的城市数据,以及对数据进行治理形成的数据元件。数据金库同步建立配套的安全技术、法律制度、监管体系等三位一体的保障体系,确保为数据要素运行提供强有力的安全支撑。3.2.2 数据安全的核心理念:关键数据入库、双向风险隔离、三级安全管控本方案以“关键数据入库、双向风险隔离、三级安全管控”为数据安全的核心理念,构建全栈式安全体系,确保数据归集、数据元件开发和数据应用的全生命周期安全。数据资源经过两次赋能充分释放数据价值。第一次赋能是指将分散度高、用途不确定、信息密度低的数据资源,通过建模加工成形态稳定、用途明确、信息密度高的数据元件,实现数据资源的规模化开发,初步释放数据价值。第二次赋能是指多种数据元件通过业务建模,推动业务流程再造,提升各类生产要素的能级和配置效率,为市场提供各类数据产品和服务,实现数据元件的规模化应用,全面释放数据价值。图 3 二次赋能示意图产业数字化数字产业化AI云 计 算物 联 网大 数 据数 字 工 厂数 字 海 洋数 字 金 融数 字 服 务模态 元件组态 元件异构态 元件组合态 元件数据资源一次赋能二次赋能城市数据治理工程白皮书22中国电子与清华大学数据治理工程联合课题组图 4 数据安全的核心理念示意图3.2.2.1 关键数据入库自主安全的数据金库
展开阅读全文