收藏 分销(赏)

数据要素白皮书(2023年).pdf

上传人:Stan****Shan 文档编号:1289304 上传时间:2024-04-22 格式:PDF 页数:52 大小:1.54MB
下载 相关 举报
数据要素白皮书(2023年).pdf_第1页
第1页 / 共52页
数据要素白皮书(2023年).pdf_第2页
第2页 / 共52页
数据要素白皮书(2023年).pdf_第3页
第3页 / 共52页
数据要素白皮书(2023年).pdf_第4页
第4页 / 共52页
数据要素白皮书(2023年).pdf_第5页
第5页 / 共52页
点击查看更多>>
资源描述

1、No.202308中国信息通信研究院2023年9月数据数据要素白皮书要素白皮书(20232023 年年)前言前言2022 年 12 月,中共中央、国务院印发关于构建数据基础制度更好发挥数据要素作用的意见(下称“数据二十条”),这是我国首部从生产要素高度系统部署数据要素价值释放的国家级专项政策文件。“数据二十条”确立了数据基础制度体系的“四梁八柱”,在数据要素发展进程中具有重大意义。随着“数据二十条”等一系列政策措施相继出台,数据要素市场培育进展加速,畅通数据资源大循环的方向愈加明确。尤其是在人工智能快速迭代、大模型与大数据相得益彰的发展态势中,数据要素战略地位进一步凸显。各地方、各部门、各大企

2、业纷纷加快数据要素领域布局,从体制机制、市场流通、产品研发、标准规范等多层次、多角度开展落地方案的深度探索,涌现出数据要素价值释放新热潮。本白皮书在数据要素白皮书(2022 年)的基础上,进一步探讨数据要素理论认识,聚焦过去一年来数据要素探索过程中不断涌现的新模式、新业态、新热点,重点关注资源、主体、市场、技术四大方面的发展:资源方面,公共数据授权运营、企业数据资产入表、个人数据权益保护是各类数据发展的新趋势和着力点;主体方面,企业和政府逐步提升能力,双向发力推进数据要素可持续探索;市场方面,场外场内各有突破,相互促进、共同发展,推动数据资源的最优配置;技术方面,基于业务需求支撑数据要素发展的

3、技术体系正加速创新。期望本白皮书的研究成果能为社会各界进一步参与数据要素实践探索提供有价值的参考。目录目录一、数据要素再认识.1(一)国家战略全方位布局数据要素发展.1(二)人工智能发展对数据供给提出更高要求.3(三)数据要素概念聚焦于数据价值释放.5二、资源:分类推进数据要素探索已成为共识.7(一)不同类别数据资源面临不同关键问题.7(二)授权运营促进公共数据供给提质增效.11(三)会计入表推动企业数据价值“显性化”.15(四)权益保护仍是个人数据开发利用主线.18三、主体:企业政府双向发力推进可持续探索.21(一)企业侧:数据管理与应用能力是前提.21(二)政府侧:建立公平高效的机制是关键

4、.26四、市场:场内外结合推动数据资源最优配置.29(一)数据流通存在多层次多样化形态.30(二)场外交易活跃,场内交易多点突破.33(三)多措并举破除数据流通障碍.35五、技术:基于业务需求加速创新与体系重构.37(一)数据技术随业务要求不断演进.37(二)数据要素时代新技术不断涌现.38(三)数据要素技术体系重构加速.42六、趋势与展望.42参考文献.46图 目 录图 目 录图 1 数据基础制度体系.2图 2 公共数据、企业数据、个人数据的复杂关系.8图 3 北京公共数据专区运营模式.13图 4 数据要素分级授权体系示例.20图 5 DataOps:敏捷协同的一体化管理.24图 6 地方数

5、据相关条例出台情况.28图 7 数据要素流通的多种形态.31图 8 数据要素流通技术流程图.39图 9 数据要素重构技术体系.421一、数据要素再认识数据的爆发式增长和规模化应用不断催生新产业、新业态,对生产力和生产关系的发展和变革具有重要影响。将数据增列为生产要素意味着对数据要素价值释放提出更高目标,需要通过深度研究、广泛实践,反复认知和领会数据要素战略布局、时代背景与理论内涵,不断推进数据要素发展,有力支撑数字中国建设。(一)国家战略全方位布局数据要素发展(一)国家战略全方位布局数据要素发展我国数据要素政策进入体系化构建阶段。自 2014 年大数据首次写入政府工作报告以来,在关于数据的系列

6、政策布局推动下,数据与实体经济融合程度不断加深,数据技术、数据产业、数据应用、数据安全等方面都取得长足发展。2019 年,十九届四中全会首次将数据增列为生产要素,关于数据资源整合共享、开发利用、安全治理、市场化配置等方面的数据要素体系化顶层设计正式启动。四年来,关于构建更加完善的数据要素市场化配置体制机制的意见 “十四五”数字经济发展规划 关于构建数据基础制度更好发挥数据要素作用的意见数字中国建设整体布局规划等文件相继出台,数据要素政策体系架构初步形成,擘画出数据资源大循环、数据要素价值充分实现、全体人民共享数字经济发展红利的宏伟蓝图。“数据二十条”为推动数据要素发展筑牢政策基础。习近平总书记

7、指出,数据基础制度建设事关国家发展和安全大局,要维护国家数据安全,保护个人信息和商业秘密,促进数据高效流通使用、赋能实体经济,统筹推进数据产权、流通交易、收益分配、安全治理,加快2构建数据基础制度体系。2022 年 12 月,“数据二十条”的出台明确了数据基础制度体系基本架构(如图 1),提出建立保障权益、合规使用的数据产权制度,建立合规高效、场内外结合的数据要素流通和交易制度,建立体现效率、促进公平的数据要素收益分配制度,建立安全可控、弹性包容的数据要素治理制度。以“数据二十条”为指导,各地各部门将制定数据要素相关细则规定,围绕“数据二十条”不断丰富完善数据要素各方面制度体系和配套政策,打造

8、“1+N”数据基础制度体系。来源:国家发展和改革委员会图 1 数据基础制度体系数字中国建设引领数据要素价值释放方向。建设数字中国是数字时代推进中国式现代化的重要引擎,是构筑国家竞争新优势的有力支3撑。2023 年 2 月,数字中国建设整体布局规划指出,畅通数据资源大循环是数字中国建设的两大基础之一,要构建国家数据管理体制机制,健全各级数据统筹管理机构,推动公共数据汇聚利用,释放商业数据价值潜能。规划提出的“五位一体”总体布局为数据要素价值释放指引了方向,数字技术与经济、政治、文化、社会、生态文明建设的深度融合将带动数据要素在各场景发挥独特作用,从而充分激活数据要素内在价值,全面赋能经济社会发展

9、。数据要素统筹管理、协调发展的体制机制进一步完善。2022 年 7月,国务院批准建立由国家发展改革委牵头,中央网信办、工业和信息化部等 20 个部委组成的数字经济发展部际联席会议制度,强化国家层面数字经济战略实施的统筹协调。2023 年 3 月,党和国家机构改革方案 提出组建国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等工作。国家数据局的组建有利于破除“九龙治水”的数据治理环境,平衡数据要素安全和发展的辩证关系,从而进一步推动数据要素的开发利用,推进多层次数据要素市场建设,促进数据要素、数字经济与实体经济的深度融合。(

10、二)人工智能发展对数据供给提出更高要求(二)人工智能发展对数据供给提出更高要求2023 年,以 ChatGPT 等为代表的 AIGC 技术应用火遍全球,大模型技术取得的突破使人工智能技术发生了深刻的变革,而这个突破离不开高质量数据的发展。可以说,数据已成为未来人工智能竞争的关键要素,人工智能正在从“以模型为中心”加速向“以数据为中心”4转变。人工智能发展驱动数据要素市场需求爆发。伴随着大模型时代的到来,通用人工智能(AGI)产业正迎来爆发期,更加需要大规模、高质量、多样化的数据集提升模型效果和泛化能力。大模型训练使用的数据集规模持续增长,例如根据公开资料显示,2018 年 GPT-1 数据集约

11、4.6GB,2020年GPT-3数据集达到了753GB,而2021年Gopher数据集已达 10550GB,2023 年 GPT-4 的数据量更是 GPT-3 的数十倍以上。当前,主流大模型预训练数据主要来源于公开数据集、合作数据分享、大规模网络数据以及通过数据众包方式获取的数据。然而,我国人工智能领域高质量数据集缺乏、数据供给的产业生态不健全、企业数据资源获取成本高等问题依然严峻。一是国内人工智能领域高质量数据集缺乏。虽然我国已有部分中文开源数据集,但在数量上远远少于国际英文公开数据集,在数据质量方面参差不齐、部分内容十分陈旧。由于高质量数据集的缺乏,部分国产大模型采用“英文数据集+翻译软件

12、”的方式生成中文语料库,导致训练结果出现巨大的文化冲突。二是人工智能领域数据供给的产业生态不健全。由于国内数据要素市场发展尚处于初级阶段,数据流通规则和数据供需对接机制未有效建立,目前国内尚未形成高效完整的人工智能数据产品供应链。三是企业数据资源获取成本高。在模型训练过程中,通常 80%的工作是数据构建和准备高质量数据,人工智能企业需要花费大量的人力和物力进行数据集采集、清洗和标注,成本极高。同时,人工智能企业5通常难以获取行业高质量数据集,常陷入“寻数无门”的困境。对此,各类主体通过数据要素市场积极应对上述问题。部分地方和行业推出一系列举措加强高质量数据供给,为大模型成长提供充足“养料”。例

13、如,2023 年 5 月印发的深圳市加快推动人工智能高质量发展高水平应用行动方案(20232024 年)提出,“建立多模态公共数据集,打造高质量中文语料数据”。2023 年 8 月,近 50 家单位成立“开放算料联盟”,围绕高质量中文训练数据和多模态训练数据,协调数据要素、数据治理、训练数据、数据标注等相关标准制定,协助数据交易所增加大模型相关的新品类和新专区。此外,合成数据也成为模型训练中的重要类型,为数据要素市场带来了新需求。据专家预测,模型训练中必不可少的语言数据将于2030-2040 年耗尽,其中能训练出更好性能的高质量语言数据将于2026 年耗尽,而视觉数据恐将于 2030-2060

14、 年耗尽。未来,合成数据将成为模型训练的关键数据。根据 Gartner 的预测,2024 年用于训练大模型的数据中有 60%将是合成数据,到 2030 年大模型使用的绝大部分数据都将由人工智能合成。这是否会对数据要素市场带来结构性的变化,还有待未来观察。(三)数据要素概念聚焦于数据价值释放(三)数据要素概念聚焦于数据价值释放数据要素概念的内核是提高生产效率与资源配置效率。生产要素是对某一时期经济发展中所需重要资源的科学抽象,是对生产过程中所投入成本的高度凝练。作为一种理论视角下的概念,从外延角度看,数据要素固然包括根据特定生产需求汇聚、整理、加工而成的计算机6数据及其衍生形态1,但数据要素这一

15、概念不只是对各行业各领域各类数据的指代,更是对数据所蕴藏巨大价值的强调。数据支撑业务贯通、推动数智决策、流通对外赋能的三次价值2是挖掘、释放数据要素价值的主要手段,而激活数据要素的根本目的是将数据以多样、创新的方式投入于经济社会发展全过程,通过数据开发利用增加生产经营活动的投入产出比,促进跨领域活动过程中资源的高效流动,从而全面提高生产效率与资源配置效率。业界对于数据要素阶段划分有诸多探讨。为推动数据要素价值释放,可将具体过程进行分解。例如,按照供应链可分解为数据供给、数据流通、数据应用、数据安全等阶段;按照数据价值增值的阶段性目标,可分解为数据资源化、数据资产化、数据资本化或产品化等阶段。每

16、个阶段均可进一步细分,例如,不同意义层次上的数据资产概念突出了数据要素价值释放的不同需求:在经济意义上,凡能产生价值的数据资源都可以用数据资产强调,从而提升组织对数据管理、数据应用的重视程度;在会计意义上,参照我国企业会计准则基本准则第二十条“资产是指企业过去的交易或者事项形成的、由企业拥有或者控制的、预期会给企业带来经济利益的资源”定义,数据资产需具备组织拥有或控制、能够产生经济利益等性质,这对数据的确权、流通提出了要求;而在资产负债表列报意义上,参照我国企业会计准则基本准则第二十二条“符合资产定义和资产确认条件的项目,应当列入资产负债表;符合资产定义、但不符合资产确认1数据要素白皮书(20

17、22 年)2数据要素白皮书(2022 年)7条件的项目,不应当列入资产负债表”要求,数据资产若要入表,还应满足“有关经济利益很可能流入企业”“成本或价值能可靠计量”两大资产确认条件。总之,类似的分解有利于数据要素政策、目标等落地,各阶段的活动职能成为实现数据生产要素价值的必要环节。二、资源:分类推进数据要素探索已成为共识数据资源是释放数据要素价值的“原材料”。随着数字经济的迅猛发展,各类主体在生产、经营、管理、服务、消费等过程中产生大量数据。在推进数据开发利用、释放数据价值过程中,不同类型数据面临不同的重点任务与关键问题,分类推进数据要素探索已成为当前共识。(一)不同类别数据资源面临不同关键问

18、题(一)不同类别数据资源面临不同关键问题数据分类存在多种维度和多种方法,适用于不同场景。按照数据资源存储的维度,可分为基础层数据、中间层数据、应用层数据等,不同层次对数据的集成性、灵活性等要求不同。按照对数据资源加工程度的维度,可分为原始数据、衍生数据、数据产品等,数据加工者在其中的劳动和贡献存在差异。按照数据安全的维度,可分为一般数据、重要数据、核心数据等,通过数据分类分级降低数据安全风险。数据分类的维度和方法多种多样,反映出数据在存储、加工、应用、安全等过程和场景中的复杂性。国外主要根据公共利益或个人权利划分数据类型。例如,美国 开放政府数据法案等按照数据持有者类型的不同,将数据分为公共数

19、据、非公共数据两类,以区分数据是否具备公共属性及相应的流通导8向与策略。美国开放政府数据法案确立公共数据可以被所有人公开使用、非公共数据需通过许可协议获得使用的原则,规定美国的所有政府部门都要向公众开放非敏感类的政府数据,从而加强公众、企业或其他组织对政府公开数据的利用。欧盟通用数据保护条例(GDPR)按照数据所描述对象的不同,将数据分为个人数据、非个人数据两类,凸显出因数据来源主体实际掌控数据能力不同,需采取差异化的数据相关权利措施。GDPR 在个人数据方面赋予用户知情权、被遗忘权、携带权等权利。针对非个人数据,欧盟制定非个人数据在欧盟境内自由流动的框架 数据法案等推进非个人数据的自由流动与

20、跨境传输。来源:中国信息通信研究院图 2 公共数据、企业数据、个人数据的复杂关系我国“数据二十条”在总述探索数据产权结构性分置制度时,提出“建立公共数据、企业数据、个人数据的分类分级确权授权制度”,按照数据相关权益归属的不同,将数据分为公共数据、企业数据、个9人数据三大类型,突出不同类型的重点关切,探寻相应的突破方向。从数据实际生成与持有角度看,三种类型的划分尽管存在复杂交叉(如图 2),但有利于根据不同类型数据的特性建立细化的分类标准与流通使用规范,也有助于建立不同主体的权责利动态调整机制,促进相关探索向“深水区”推进。公共数据的概念与范围仍处于不断讨论和迭代中。“数据二十条”总体描述了公共

21、数据是在各级党政机关、企事业单位依法履职或提供公共服务过程中产生的数据,但并未明确划定公共数据的范围和边界。当前,来自政务体系的数据(部分文件中称“政务数据”)和来自公共事业的数据(包括科研、教育、文化、供水、供电、公交等公共事业)由于受公共财政支持或在履行公共管理或服务职能中产生,归属于公共数据基本不存在争议。但是,另有一类数据是企业在经营公共服务性质业务时收集、产生的关乎公共利益的数据,其是否属于公共数据仍存争议。在企业经营的复杂过程中,数据是否因提供公共服务而产生不易区分,讨论该类数据时务须审慎判断企业所持有数据与公共服务、公共利益的关系。逐步厘清公共数据的范围,有针对性地引导和促进公共

22、数据开发利用,对提升公共治理与服务水平、发展壮大数字经济具有重要意义。对于来自政务体系的数据和来自公共事业的数据,一般认为,其归国家或全民所有,管理、开放等职责由政府或其他公共部门代为行使。本着“取之于民、用之于民、造福于民”的原则,在保障国家安全、商业秘密安全、个人信息安全的前提下,按用途加大供给使用范围将使公共数据价值更好回馈全社会。因此,如10何加大供给规模、推动供给提质增效成为公共数据发展的关键问题。企业数据来源广泛,有丰富的生成方式。由于企业的生产、经营、管理链条较长,企业的数据需求多元复杂,对数据需要进行不同形式和程度的加工、整理与分析,这一过程中形成的多种衍生数据也丰富了企业数据

23、的表现形式。按照企业数据生成方式的不同,可将企业数据划分为三种主要类型:一是企业自行采集、记录客观现象所得到的数据;二是企业在生产经营活动中,采集与用户的交互记录所得到的数据;三是企业基于已产生的数据,在赋予数据全新价值过程中所得到的数据。在不同类型企业数据的生成过程中,企业尽管付出的资源和劳动有所不同,但为数据赋予了独特的业务价值,需要得到有效地评估与认定。因此,如何认定企业数据的业务贡献,促进数据价值“显性化”成为企业数据的关键问题。个人数据大多由公共部门和企业实际持有。对于描述或标识特定自然人信息的数据,如自然人的姓名、身份证号码等,其承载的信息具有一定的客观性,即这类信息不依赖于数据持

24、有者所搭建的业务系统或应用软件,但数据持有者掌握这类信息后,有可能出现隐私泄露、滥用等风险。对于自然人与数据持有者交互产生的描述行为痕迹信息的数据,其所承载的信息对人来说可读性较弱,一般依赖于数据持有者设计或搭建的表格、系统和软件。数据持有者汇集大量个人痕迹数据后,经数据挖掘与分析可将数据价值不断放大,但也可能出现“大数据杀熟”等风险。此外,自然人创作的各类信息也形成了大量数据。个人创作的作品一般用于其他目的,而随着数据挖掘的深入,尤其是11人工智能大模型的迅猛发展,个人作品被数据持有者收集汇聚,成为特定场景中独具价值的数据。但这一过程中,个人相关权益可能被侵犯。总体来看,由于个人对不同类型个

25、人数据的掌控能力均有限,保障个人的隐私、人类道德伦理乃至人的主体性等已成为大众关注的焦点,如何在加强相关个人权益保护的基础上开发利用仍是个人数据的关键问题。(二)授权运营促进公共数据供给提质增效(二)授权运营促进公共数据供给提质增效各地各部门积极开展公共数据开放实践。近年来,各地方政府、部分行业主管部门以建立公共数据开放平台为抓手,积极推进公共数据开放,逐步完善公共数据开发利用体系。截至 2022 年 10 月,我国已上线 208 个省市公共数据开放平台3。基于开放平台,各级政府开放大量公共数据集,覆盖市监、工商、交通、生态、公共设施等多个领域,并且多个地区建立了开放数据需求反馈机制,以便满足

26、社会对公共数据的应用需求。此外,行业主管部门也通过建设平台开放高质量数据。例如,中国气象局通过中国气象数据网开放气象数据,在2023 年 2 月、7 月先后发布两批基本气象数据开放共享目录,共包含 106 项气象数据产品,在天气预报、农业指导、物流运输等场景发挥着极为重要的作用。由于责任与激励机制缺乏,公共数据高质量供给受到制约。总体而言,我国公共数据仍然存在供给质量不佳、开发利用程度有限等问题。当前公共数据分布较为分散,同主题公共数据汇聚整理不便。公3数据来源:复旦大学数字与移动治理实验室.,中国地方政府数据开放报告省域(2022 年度)12共数据开放范围仍然不足,且开放平台数据更新频率整体

27、较低。各地组织公共数据创新利用活动持续性不强,有效成果数量有限。主要原因在于,公共部门履职以“三定”职责作为核心依据,大部分公共部门承担数据安全责任,但对公共数据进行治理和开放的职责则不明确,推动公共数据开发利用的激励机制不完善。因此,公共数据开放对于公共部门来说没有明确的动力,特别是对于从事非信息化领域的部门来说,也往往不具备足够的能力。以上原因导致仍有大量高价值公共数据“深藏闺中”,高质量供给受到制约。各地、各行业开始探索公共数据授权运营,引入社会化力量进行开发利用,促进公共数据供给提质增效。当前,授权运营在公共数据领域的实践探索中具有关键意义,可以充分发挥社会力量,解决公共数据开发利用中

28、开放质量不佳、供需匹配不足、应用挖掘不够等问题,是大量高价值、高敏感的公共数据开发利用的核心路径。国内各地区、各行业积极开展授权运营实践。各个先进地区纷纷落实试点举措,在机制、平台等方面均取得成效。在机制探索方面,各地方推进探索各具特色的授权运营机制,以释放公共数据价值为核心,逐步形成了几类不同的发展模式。一是集中 1 对 1 模式,以浙江、安徽、贵州、成都、青岛等地为代表。地方政府集中统一授权某一机构承担该区域平台建设、数据运营、产业培育等公共数据运营相关工作。一方面,集中授权具有权威性,有利于通过地域数据整合实现价值最大化;另一方面,集中授权存在市场效率不够高的问题,单一运营主体响应市场需

29、求变化的速度可能有限。13二是分行业的 1 对 N 模式,以北京市的金融公共数据专区为代表(如图 3)。地方政府授权不同的行业属性机构,按照行业特点开展公共数据运营工作,专业性更强,有利于充分发挥行业属性作用,但统筹协调的难度也随之增大。2023 年 7 月,北京市公共数据专区授权运营管理办法(征求意见稿)发布,在金融场景的实践基础上推进专区制度体系建设,并深化交通、位置、空间、信用等各专区建设和应用。三是分散的 1 对 N 模式,以广东、上海、武汉等地为代表。地方政府根据不同数据与不同机构特点进行匹配,授权各类型市场主体分别开展公共数据运营工作。分散授权的灵活性更好,有利于发挥市场主体主观能

30、动性作用,但一定程度上也容易出现混乱,对监管的要求更高。同时,由于地域数据未能完全整合,数据可发挥的价值有限。来源:中国信息通信研究院图 3 北京公共数据专区运营模式14在平台运营方面,部分地方通过建立统一的地域性公共数据运营平台探索公共数据产品或服务的应用与流通。一类是公共数据运营服务平台,例如贵州省的云上贵州平台,在明确授权统一平台对全省公共数据进行汇集、存储、共享、开放的基础上,依托全省资源打造数据产品及服务体系,与贵阳大数据交易所协同推动构建贵州大数据产业生态。成都市政府授权成都数据集团搭建公共数据运营服务平台,已于 2020 年上线。平台直接接入公共数据并作为供需对接桥梁,基于应用需

31、求,经协调获取相应数源部门授权后,与应用方共同打造数据产品并接受数据使用监督。另一类是兼具公共数据加工与数据交易的综合服务平台,例如海南省的“数据产品超市”,以授权运营的思路搭建集数据归集、管理、加工、交易为一体的公共数据平台,将各类型参与主体纳入平台,由应用主体对公共数据进行加工增值后以数据产品的形式开放给市场。此外,众多行业主管部门的公共数据也得到有效开发利用,通过授权运营的模式引入社会化力量推进数据价值的充分释放。相较于地方的公共数据,行业主管部门持有和控制的公共数据是纵向的数据归口,在行业领域内具有相对完整性和全面性,推进行业主管部门公共数据的应用与流通也是公共数据授权运营的关键工作之

32、一。例如,司法数据作为来自各级司法体系履职和提供服务过程的公共数据,包含法条、立案、审判、裁判文书等多方面的司法相关数据,具有非常独特的应用价值。当前,司法数据由最高人民法院信息中心下属中国司法大数据研究院统一推进开发利用,应用主要集中在为政府及公共部15门提供决策支撑、为金融领域产品提供服务依据、为企业或个人主体提供司法大数据服务等场景。此外,人力资源和社会保障部将社保数据授权金保信社保卡科技有限公司运营,人民日报社将人民日报历史数据授权人民网科技(北京)有限公司运营,中国气象局将气象数据授权北京天译科技有限公司等相关机构运营,这些均是行业公共数据授权运营的典型案例。(三)会计入表推动企业数

33、据价值“显性化”(三)会计入表推动企业数据价值“显性化”近年来,虽然“将企业数据资源视为资产进行管理”逐渐成为众多企业的共识,但这里的“资产”往往只是经济意义上的资产,体现了企业数字化过程中数据资源的重要性。而对于数据能否真正成为会计意义上的资产、能否计入企业资产负债表,始终是各界讨论的焦点。今年 8 月 21 日,财政部正式发布企业数据资源相关会计处理暂行规定(以下简称暂行规定),并规定自 2024 年 1 月 1 日起施行。暂行规定的出台肯定了数据资源可具有资产属性,是数据要素市场发展的重要里程碑。作为报表意义上的“资产”,企业数据的市场价值与业务贡献将在财务报表中得以“显性化”。暂行规定

34、 明确了企业数据资源在财务报表中进行会计确认和计量的思路。出台暂行规定的主要目的是,为消除相关企业实务中对“数据资源能否作为会计上的资产确认”“作为哪类资产 入表”等疑虑提供指引。因此,暂行规定在不改变现行企业会计准则的基础上,给出了将数据确认为无形资产、确认为存货和不确认资产三条入表思路。具体来说,暂行规定规定:企业使用的数据资源,16符合企业会计准则第 6 号无形资产(财会20063 号)规定的定义和确认条件的,应当确认为无形资产;企业日常活动中持有、最终目的用于出售的数据资源,符合 企业会计准则第 1 号存货(财会20063 号)规定的定义和确认条件的,应当确认为存货;企业出售未确认为资

35、产的数据资源,应当按照收入准则等规定确认相关收入。企业数据资源“入表”有利于内外部发现并确认企业数据的价值。在将数据确认为无形资产或存货进行会计计量的过程中,企业需要明确取得和持有数据资源过程中产生的各项成本或增减值,企业数据的产生成本或应用价值将得到更加完整、准确的列示,基于企业数据资产产生的收入进一步明确。继而,对于从事数据产品(或数据服务)供应的企业来说,有助于企业确定更为市场所认可的数据产品定价,促进企业参与市场化的数据交易流通;对于数据密集型企业来说,有助于投资者更好发现和理解企业整体的价值,提升企业的融资机会,扩大企业的发展空间。同时,针对企业如何贯彻实施暂行规定,财政部会计司表示

36、,企业应当主动按照相关披露要求,持续加强对数据资源的应用场景或业务模式、原始数据类型来源、加工维护和安全保护情况、涉及的重大交易事项、相关权利失效和受限等相关信息的自愿披露,以全面地反映数据资源对企业财务状况、经营成果等的影响。因此,在实施“入表”的过程中,通过对数据资源相关情况的盘点和披露,企业将更加了解、重视和明确数据资源的分布、特点和应用价值,有利于企业进一步挖掘数据应用,释放数据要素价值。17需要注意到的是,暂行规定还不是真正意义上的“数据资产会计准则”。暂行规定目前只给出了“满足资产确认条件且价值确定的数据资源如何计入报表”的解决思路,但是没有解决“数据价值如何确定”的问题。由于数据

37、具有未来经济利益难确定、经济寿命不确定、价值易变性等区别于传统要素的特性,成本法、收益法、市场法等估值方法均有其局限性。一些企业探索综合三种方法,基于收益法建立数据资产估值体系,通过评价数据资产业务经济贡献值指导形成数据资产价值基准。例如,浦发银行提出的数据资产价值评估框架,围绕数据资产潜能预测、效能评估和收益测算,将数据资产价值分为内在价值、成本价值、业务价值、经济价值以及市场价值五类,并给出了每类价值的价值因子及计算公式。2023 年 9 月,中国资产评估协会印发数据资产评估指导意见,对资产评估机构按照成本法、收益法和市场法开展数据资产评估提供了进一步指导。然而,企业数据估值问题是个复杂的

38、难题,当前全社会仍未完全取得共识,还需要企业、专业研究机构、资产评估机构、会计和审计事务所等进一步探讨。总的来看,暂行规定的出台迈出了我国为发展数据要素而建立相关会计核算制度的第一步。暂行规定是在现行企业会计准则体系下的细化规范,在会计确认计量方面与现行无形资产、存货、收入等相关准则是一致的,不属于国家统一的会计制度要求变更型会计政策。现阶段,暂行规定只是将既有的会计处理规则迁移到“符合相应条件的数据资产”上,而并非从数据资产的特点出发来设计针18对性的会计规则,也就是说,数据资产暂时将按照与传统资产同样的方法进行会计计量。从形式上看,只是在企业资产负债表的“存货”“无形资产”和“开发支出”三

39、个报表项目下分别设置了“数据资源”子项目;对应的企业核算时将会在相应总账会计科目下面设置“数据资源”二级科目。但是,只按照这样的会计方式,数据要素区别于传统要素的特殊性或将无法从报表中得到充分体现,无法被适应。“数据入表”目前还只是一个试点的过程,真正建立适应数字经济发展需求、符合数据要素特殊属性的会计核算方法,未来仍将有很多复杂、挑战性的工作有待完成。下一步,如何与国际会计准则相协调,如何建立相适应的审计制度,如何厘清企业数据资产与信息资产的划分,企业是否会通过数据资产实现增值,银行是否会普遍接受数据资产作为质押等,这些问题仍然需要时间的检验。(四)权益保护仍是个人数据开发利用主线(四)权益

40、保护仍是个人数据开发利用主线个人数据方面,个人信息保护法针对个人信息数据确立了保护原则。个人信息保护法是中国首部规范个人信息处理活动的专门立法,旨在保障公民个人信息安全,遏制个人信息泄露、滥用等现象的发生。该法规定了个人信息处理全过程中应遵循的原则和要求,明确了相关主体的权利和义务,健全了个人信息保护工作的体制机制。该法既通过个人信息处理规则、敏感个人信息处理规则、个人信息对外提供规则、单独同意规则等保障个人权益,又通过匿名化处理、个人信息处理者不需取得个人同意可以处理个人信息的若干场景等方面的规定保证个人信息数据可得到合理的开发利用。国际横向比较看,19我国个人信息保护法在规则严厉程度上基本

41、对标欧盟 GDPR,两部法律文本均赋予个人全面、细致的权利,均对信息处理者施加了较高的合规义务。同时,我国关于个人信息违法犯罪相关罪名适用主体广泛,入罪门槛较低。因此,我国已建立起较为严格的个人信息数据保护原则。个人对个人数据掌控能力有限,权益保护落地实践未达预期。由于个人数据主要由公共部门和企业实际掌控,个人数据相关的权利在具体场景和问题中又较为复杂,因而世界各国在操作层面都还未能完全适配个人信息、个人数据保护的法律要求,个人信息泄露时有发生、个人数据越权滥用仍然存在。例如,国外许多网民发现自己在网上分享的照片成为 Flickr 数据集的素材,自己此前既不知情,又很难将自己创作的照片数据从数

42、据集中删除。2020 年 7 月以来,工业和信息化部开展纵深推进 APP 侵害用户权益专项整治行动。截至 2023 年 7月,工信部已发布关于侵害用户权益行为的 APP(SDK)通报 30 批。通报并责令整改的 APP、SDK 中,违规收集个人信息、强制频繁过度索取权限、违规使用个人信息等问题仍然突出。通过分级授权细化个人数据采集使用规范已有理论探索。个人数据开发利用所需的数据多样、场景多变,个人理应可以根据场景和需求,分级、分步骤进行个人数据的授权,也可以按照意愿撤回相应级别、步骤的授权。个人数据处理者则应严格遵守个人对数据开发利用场景、范围等要求,保护个人数据权益。在个人信息保护法施行前,

43、大量收集、处理个人数据的过程属于“一揽子授权”,个人在使20用服务过程中可能需要让渡许多与服务无关的数据。个人信息保护法 规定了数据收集与处理的最小必要原则和单独同意原则,支付宝、微信、美团等平台逐步增加了新业务首次使用单独授权同意、广告权限管理、个性化推荐权限管理、第三方授权管理、清除历史行为等功能,实现了初步的个人数据分级、分步骤授权模式。“数据二十条”再次强调数据处理者应按照个人授权范围依法依规采集、持有、托管和使用数据,不得采取“一揽子授权”、强制同意等方式过度收集个人信息。学界和业界正在探索更加细化、完备的数据要素分级授权体系(如图 4),以更简洁清晰的方式划分数据开发利用场景,用户

44、既可以选择授权必要数据来使用基础服务,又可以授权更多数据享受改进服务乃至支撑数据流通,从而以较低成本实现个人对数据处理范围的控制。来源:数据要素论图 4 数据要素分级授权体系示例通过专业数据托管服务机构降低个人数据行权门槛已有国际实践。“数据二十条”提出探索由受托者代表个人利益,监督市场主体对个人信息数据进行采集、加工、使用的机制。个人数据管理机构作为受托人,可以根据用户的授权委托,代理大量用户进行个人数据集21中存储与管理应用,在遵循相关法规和用户意愿、保护数据隐私和安全的基础上,以忠诚义务和专业水平帮助个人行使个人数据权利。通过受托人提供的平台,个人可以集中化管理自己的数据,自主决定每个机

45、构、平台对自己数据的收集、使用和共享情况,自行携带、转移自己的数据。因此,个人数据统一托管可向个人赋予更多控制权,有效降低个人行权门槛。个人数据委托在国际范围内仍属于探索早期。韩国 MyData 服务于 2021 年开始落地,MyData 运营商通过开展个人数据汇总整合工作,向个人提供一站式查询和管理服务,但这种模式的可持续性仍有待观察。三、主体:企业政府双向发力推进可持续探索企业和政府构成推进数据要素发展的核心力量。其中,企业是冲锋在前的创新主体,政府则主要发挥有序引导和规范发展的作用。在数据要素市场建设过程中,企业和政府需着力提高自身能力,在扮演好各自角色的基础上守正创新、双向发力,共同推

46、进数据要素发展的可持续探索。(一)企业侧:数据管理与应用能力是前提(一)企业侧:数据管理与应用能力是前提企业作为数据要素的创新主体,在丰富的生产经营活动中,积累了大量宝贵数据有待挖掘使用,同时也是数据要素市场的主要需求方。结合业务发展目标构建数据管理体系、在业务场景中深度应用数据是企业整体数据能力提升的必要环节,构成企业数据价值释放的基础。数据管理规范了数据采集、加工、使用过程,是企业丰富数据应用、参与数据要素流通的前序基础。数据应用将数据真正转化为生产力,22是释放数据要素价值的最后一公里。在不断夯实自身数据能力的基础上,企业才能进一步探索参与数据要素市场、构建核心竞争力的方式。企业不断通过

47、 DCMM 贯标评估提升数据管理能力。自 2020 年国家标准数据管理能力成熟度评估模型(简称 DCMM)贯标评估工作启动以来,随着全国范围内的持续宣贯,截至目前已有十余个行业的千余家企业参与到了 DCMM 评估中,显著提升了全社会数据管理意识,使得贯标企业数据管理能力得到明显增强。以评估贯标为契机,企业在战略规划、组织架构、技术工具等方面推动开展数据管理相关工作:在战略规划方面,通过建立全景数据管理工作视图,确立数据管理中长期目标和管理活动优先级,统筹、协调各层面工作,明确所需资源投入总量和分配机制,监督、评价和优化企业数据管理工作的执行。在组织架构方面,企业通过成立专职团队增强数据管理执行

48、效率,成立统一数据管理归口部门,普遍形成了决策、管理、执行的数据管理三层架构组织,并设置专门的数据管理管理岗位,建立了数据部门、技术部门、业务部门协同机制。在技术工具方面,企业通过构建统一的数据管理技术平台,将各分散的单一功能型技术工具进行集成,消除数据管理协同难点,提高数据管理效率。例如,中国联通集团以中国联通集团数字化转型行动计划(2022-2025 年)为战略纲领,明确了数据管理工作的总体目标、发展路径及保障体系,形成以数字化转型领导小组为领导,数字化转型推进办公室统筹落实推进,总部数据治理组、省分数据治理组、地市数据治理组纵向联结协同的数据管理组织架构,依托联通云底座,打造“湖仓一体、

49、批流23融合”的数据中台,实现全域数据统一采集加工,强化数据管理能力。同时也应看到,DCMM 标准聚焦在数据管理体系的建设,它的贯彻落实能帮助企业建立数据能力的基座,但无法直接解决企业数据应用场景不丰富、业务价值赋能不充分的问题。为此,需要在贯彻 DCMM标准的基础上,结合数据资产价值评估、会计入表、交易流通等实践,以价值为导向,推动数据资产运营能力建设,建立常态化的数据资产运营体系,为数据价值持续释放提供坚实保障。数据研发运营一体化(DataOps)在数据管理的基础上,解决开发管理“两张皮”的问题,有效提升数据管理与应用的协作效率。随着数据应用场景日益丰富,数据分析需求快速变化,数据加工链路

50、日益复杂,数据工程师、数据管理员、报表开发人员、运维工程师等各类数据管理角色逐渐增多,导致企业数据交付任务难度大大增加。DataOps 倡导协同式、敏捷式的数据管理,建立清晰通畅的数据管道,明确数据管理的流转过程及环节,采用先进的数字化技术推动数据管理自动化,缩短数据项目的周期,提高各数据管理相关人员的数据检索、获取和应用效率,并持续改进数据质量,降低管理成本,加速数据价值释放(如图 5)。例如,通过标准设计、模型设计指导数据开发,前置化数据质量管理,并建立 SLA 开展数据资产运维,实现开发与管理的协同;数据管理成果通过被业务分析人员、数据科学家等角色自助使用,支撑业务运营,同时运营结果反向

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服