1、商业银行数据资产体系白皮书 商业银行数据资产体系白皮书 CONTENTS 目录目录 第第 1 1 章章 数据资产化与数据要素市场化相辅相成,相互促进数据资产化与数据要素市场化相辅相成,相互促进 .1 1 1.1 企业数据资产化方兴未艾,数据要素市场化起到了催化作用.2 1.2 数据要素市场建设迫切需要企业数据资产化.3 1.3 企业数据资产化所需具备的条件正在成熟.5 第第 2 2 章章 数据资产化是企业数据治理向上演进的必经之路数据资产化是企业数据治理向上演进的必经之路 .7 7 2.1 先行开展数据治理的企业,数据治理工作步入深水区.8 2.2 当前数据治理工作的局限与困境.10 如何做到
2、“神形兼备”.10 如何避免“孤军作战”.11 如何体现“物有所值”.13 2.3 数据资产管理是企业数据治理向上演进的必经之路.14 第第 3 3 章章 数据资产体系发展概述数据资产体系发展概述 .1717 3.1 数据资产体系发展阶段.18 3.2 数据资产相关术语.19 3.3 数据资产管理相关术语.21 3.4 国内外数据资产标准概述.23 第第 4 4 章章 “三位一体”数据资产体系的构思“三位一体”数据资产体系的构思 .2525 4.1“三位一体”数据资产体系的构成与工作机制.26 数据资产管理.27 数据资产运营.28 数据资产评价.29 商业银行数据资产体系白皮书 数据资产体系
3、工作机制.29 4.2“三位一体”数据资产体系的相互作用关系.29 4.3“三位一体”数据资产体系的构建.31 4.4“三位一体”数据资产体系的优势.33 第第 5 5 章章 商业银行数据资产商业银行数据资产体系建设体系建设实践实践 .3434 5.1 商业银行开展数据资产体系建设的背景和目标.35 外部背景.35 内部需求.35 实践目标.35 5.2 商业银行数据资产体系建设的工作步骤.36 明定义:厘清数据资产的范围.36 成规矩:建立数据资产体系.37 落系统:数据资产体系落实.37 展规划:数据资产价值实现规划.38 5.3 上海银行数据资产体系建设实践的主要成果.38 数据资产体系
4、建设.38 “三层七域一管控”数据资产目录搭建.39 数据资产盘点梳理.39 数据资产穿透管理.40 数据资产服务运营优化.40 数据资产评价及估值.41 第第 6 6 章章 数据要素流通市场赋能企业数据资产化数据要素流通市场赋能企业数据资产化 .4242 6.1 全国多层次数据要素市场的建设.43 全国多层次数据要素市场结构基本概况.43 全国多层次数据要素市场互联互通的基本要求.44 6.2 上海数据交易所赋能企业数据资产化.46 基于互联互通市场的数据资产凭证.46 商业银行数据资产体系白皮书 上海数据交易所赋能企业数据资产估值.47 上海数据交易所赋能企业数据资产入表.48 6.3 数
5、据要素流通交易市场赋能企业数据资产化的展望.52 第第 7 7 章章 未来演进与展望未来演进与展望 .5454 附件一:上海银行数据资产价值评估方法与实践附件一:上海银行数据资产价值评估方法与实践 .5656 数据资产价值评估的原理.56 商业银行数据资产价值评估试点探索采用的方法、逻辑与实践分享.56 数据资产价值评估方法的应用设想.57 商业银行数据资产体系白皮书 声明声明 本白皮书由上海银行股份有限公司(“上海银行”)、上海数据交易所有限公司(“上海数交所”)、以及德勤企业咨询(上海)有限公司(“德勤企业咨询”)共同撰写,三方共同享有相关知识产权。关于上海银行的声明:本白皮书所作出的分析
6、与判断,仅代表编写者的观点,并不构成任何专业建议或服务。本白皮书受法律保护,转载、摘编或利用其它方式使用本白皮书或者观点的,应注明来源。违反上述声明者,我行将追究其相关法律责任。关于上海数交所的声明:本白皮书版权受法律保护,转载、编撰或其他方式使用本白皮书或者观点的,应注明来源。违反上述声明者,将追究其相关法律责任。关于德勤企业咨询部分的声明:本白皮书中所含内容乃一般性信息,任何德勤有限公司、其全球成员所网络或它们的关联机构并不因此构成提供任何专业建议或服务。在作出任何可能影响您的财务或业务的决策或采取任何相关行动前,您应咨询符合资格的专业顾问。我们并未对本白皮书所含信息的准确性或完整性作出任
7、何(明示或暗示)陈述、保证或承诺。任何德勤有限公司、其成员所、关联机构、员工或代理方均不对任何方因使用本白皮书而直接或间接导致的任何损失或损害承担责任。德勤有限公司及其每一家成员所和它们的关联机构均为具有独立法律地位的法律实体,相互之间不因第三方而承担任何责任或约束对方。德勤有限公司及其每一家成员所和它们的关联机构仅对自身行为及遗漏承担责任,而对相互的行为及遗漏不承担任何法律责任。德勤有限公司并不向客户提供服务。请参 了解更多信息。商业银行数据资产体系白皮书 序言序言 从数字中国战略,到数据要素市场布局,再到企业数字化转型实践和数据资源“入表”探索,数字经济和数据要素驱动千行百业创造了新的业务
8、模式、新的产业生态和新的认知洞察。数据作为新型生产要素,是我国在数字经济时代一项重要的制度创新。2022 年中共中央、国务院印发关于构建数据基础制度更好发挥数据要素作用的意见(简称数据二十条),为深化数据要素市场化配置改革,释放数据要素价值,推动数字经济高质量发展提供了方向指引。中国人民银行发布金融科技发展规划(2022-2025 年)(银发2021335 号文印发),原中国银行保险监督管理委员会发布中国银保监会办公厅关于银行业保险业数字化转型的指导意见为金融机构开展数字化转型、业务经营管理数字化和数据能力建设等五大领域提供了落地指导。近期,上海市印发的立足数字经济新赛道推动数据要素产业创新发
9、展行动方案(2023-2025 年)的通知,阐述了上海市数据要素产业发展的具体目标和策略,以及实现目标的关键行动领域。在顶层设计的框架和政策引领之下,数据要素流通交易的参与主体是企业,数据要素价值体现于企业生产经营活动之中,企业做好数据要素的管理和经营,创造数据要素的价值,成为数字经营时代赋予每个企业的使命。当前,企业数字化转型方兴未艾,如火如荼。企业通过数字化能力建设,可以实现更广泛业务流程的信息化覆盖,更通畅的产业链上下游连接,更具吸引力的客户服务体验,更敏捷的管理层级和业务条线间的融合协同。所有这些举措,都极大地丰富了企业数据资源的广度和深度,可以说企业的数字化转型之路,就是企业数据资源
10、丰产丰收之路。但是,数据资源丰富不是目标,也没有终点,企业成建制地将数据资源管好用好,形成可辨识、有边界、多形态、可使用的数据产品,在企业生产经营的过程中,通过人机交互或机机交互,持续使用数据产品,以实现预期的收益,进而形成可被认定的数据资产,这一围绕数据的“蒸馏提纯”过程以及配套的管理体系,就是企业的数据资产化过程。“春江水暖鸭先知”,金融业的信息化基础设施较为完备,数字化转型启动较早,每年投入较大,业务经营对数据依融程度较高,同时又有明确的数据治理与监管报送数据质量要求,所以金融业一直都高度关注并践行数据要素流通和企业资产化。2023 年IDC PeerScape:中国金融业数据治理实践与
11、案例研究报告中提到,中国金融业数据治理正在进入全新阶段,但是也伴随着困难,包括数据治理整体战略规划与项目落地之间的衔接、数据确责、数据的持续运营、数据治理工作的价值衡量、数据治理工作与业务应用的结合等难题。这其中,数据治理在完成铺底建设后,需要提升能级,通过数据资产化的建设和运营,着力解决上述大部分问题,例如数据确责、持续运营和价值衡量等。上海银行股份有限公司(以下简称“上海银行”)乘金融行业数字化转型的东风,于 2021 年将“数字化转型”写入行内的战略规划,并且成立了由董事长亲自挂帅的“战略推进领导小组”,成立了牵头全行数据管理和数据应用开发工作的一级部门“数据管理与应用部”(以下简称“数
12、管部”)。近几年,全行高度重视数据资产化建设与数据要素流通工作,2021 年成为上海市数商协会首批签约数商,2022 年与商业银行数据资产体系白皮书 上海数据交易所建立了战略合作伙伴关系,2023 年成为首家通过“数据管理能力成熟度(DCMM)”量化管理级(4 级)的城市商业银行。上海银行于 2013 年开始数据治理工作,并将数据管理贯穿数据平台建设与数据应用开发的全过程。在行领导的带领以及全行各业务部门、金融科技部、数据管理与应用部的齐心协力下,建成了“盘古”数据中台、“昆仑”AI 中台两大数智赋能体系,形成多层级、类型丰富的数据产品和数据服务,深入业务场景中为业务经营与管理决策提供数据洞察
13、。银行以“极客大赛”为主要载体,打造全行数据文化,培养数据人才。2022 年启动全行数据资产体系的建设升级工作,在第三方专业服务机构的配合下,提出“打造数字生态,价值共建共赢”的愿景,明确了“保障数据资产长效运营、提升数据资产活跃应用,推动数据资产价值评估”的三大目标,根据愿景和目标构建数据资产研发运营(以下简称“数据资产运营”)、数据资产全生命周期管理(以下简称“数据资产管理”)、数据资产价值评估(以下简称“数据资产价值”)三位一体的数据资产体系,明确实现以上内容所需的五大支撑组织团队、制度体系、平台工具、安全合规和文化建设。经过研讨辨析,明确了行内数据资产的定义,建立了数据资产分类体系,形
14、成了数据资产认定、确权、登记、使用和退出的全生命周期管理机制,厘清了专门的数据资产管理职责,并试点了数据资产价值评估。通过数据资产体系建设,数据治理的能级得以提升,数据资产管理工作真正走出了“数管部”,使用数据资产而受益的业务部门成了数据资产主人,以数据资产的管理与运营,实现业数融合,缩短数据需求的满足时长,提升数据服务的响应效率,提高数据产品使用的活跃度。通过数据资产体系建设工作的开展,银行也更深刻体会了数据作为生产要素对企业“把数据由生产资料转变为生产力”的推动作用。数据要素的生产力来自于对数据的创新性劳动,所带来的经济价值的创造,这也正是企业数据资产获得或者生产、管理并运营,其价值被识别
15、和计量的过程,也是数据要素在企业内外流通,为企业经营提质增效的应有之义。我们将开展数据资产体系建设升级工作以来所面临的困惑、遇到的挑战、进行的思考、引起的争论、设计的方案、开展的试点、形成的成果,以及上海数据交易所对我们提出的建议和帮助,汇聚成本白皮书。一方面是对前期工作进行归纳总结,提请业界同行批评指正,另一方面,希望能在欣欣向荣的数据要素市场化建设中,提供一些我们的管理经验和劳动成果,贡献一份绵薄之力。风云动,旌旗胜,数字中国展宏图,上海银行将在数据资产化的道路上,与各方数据生态伙伴携手并肩,孜“资”以求,耕耘不辍。商业银行数据资产体系白皮书 1 第第1 1章章 数据资产化与数据要素市场化
16、相辅相数据资产化与数据要素市场化相辅相成,相互促进成,相互促进 到 2025 年,基本形成横向打通、纵向贯通、协调有力的一体化推进格局,数字中国建设取得重要进展。数字基础设施高效联通,数据资源规模和质量加快提升,数据要素价值有效释放,数字经济发展质量效益大幅增强.”“释放商业数据价值潜能,加快建立数据产权制度,开展数据资产计价研究,建立数据要素按价值贡献参与分配机制。”-中共中央 国务院数字中国建设整体布局规划,2023 年 2 月 https:/ 商业银行数据资产体系白皮书 2 数据天生具有很强的业务属性,企业的生产经营活动通过电子表单、信息系统、数字化连接以及数字孪生等技术手段,形成不同类
17、型、不同时效、不同价值密度的数据。数据是企业生产经营行业和外部竞争势态的刻画,包含了丰富的业务信息和价值。数据的价值蕴藏于业务经营与管理决策中通过数据分析与应用,对过往业务经营状况的准确反映,或是对未来趋势发展精确预测,以提升管理者的对业务经营的认知和决策的准确性,形成企业差异化以及可持续的竞争力。企业的数据资产化是通过信息化及数字化建设和技术应用,构建内外部数据生态,将内部生产运营数据、管理数据和生态圈数据,进行整合、加工和应用,为企业提供商业洞察、机会捕获、运营增效以实现商业价值的一系列技术和管理活动,最终实现以数据资产为主体的新型价值体系。我们认为,在数字化时代,数据资产在企业资产结构中
18、的比重将逐步提升。数据要素是对数据经济价值更社会化的表述,反映了数据作为社会化生产资料的特质。根据全国信标委大数据标准化工作组 2022 年发布的数据要素流通标准化白皮书中的定义,数据要素是指参与到社会生产经营活动、为使用者或所有者带来经济效益、以电子方式记录的数据资源。从实践来看,国外尚未把数据上升为数据要素,多是从产业本身出发,注重数据在企业转型升级和经营决策中的重要作用。把数据作为第五大生产要素,是我国的一项重要创新。党的十九届四中全会首次提出将数据纳入生产要素范畴,参与生产和分配。2020 年 3 月,中共中央、国务院印发的关于构建更加完善的要素市场化配置体制机制的意见中,正式将数据列
19、入与土地、劳动力、资本和技术并列的生产要素。数据要素化特征体现在生产经营和服务提供过程中作为生产性资源投入,能够创造经济价值。因此,经济价值是数据资产化和数据要素化的共同且唯一的特征。数据要素市场化则进一步突出和彰显了数据作为生产资料在价值实现过程中的交易关系和市场属性。数据要素商品化、社会化后,通过数据要素市场进行货币化交易,实现数据商品权属的交换,进而实现价值置换。2022 年 4 月,中共中央、国务院印发的关于加快建设全国统一大市场意见中,明确提出加快培育数据要素市场,建立健全数据安全、权利保护、跨境传输管理、交易流通、开放共享、安全认证等基础制度和标准规划,深入开展数据资源调查,推动数
20、据资源开发利用。近几年,多个省市陆续出台数据要素市场化促进文件,推动了我国数据要素市场的蓬勃发展。企业的数据资产化与数据要素市场化相辅相成,相互促进。企业数据资产化是数据要素市场的前提,为数据要素市场提供充分的产品供给。数据要素市场化为数据产品流通变现、价值实现提供了规范合规的市场条件和交易环境,进一步激发企业数据资产化的意愿和活力。1.11.1 企业数据资产化企业数据资产化方兴未艾,数据要素市场化起到了催方兴未艾,数据要素市场化起到了催化作用化作用 企业数据资产化自有其内生动力。数据资产化其本质是企业数字化战略的迭代升级,是基于数字技术、数据技术和数据管理,与业务经营全面融合,对企业的业务边
21、界、竞争能力和资产价值进行重构的过程。首先,通过数据资产化,企业可以将数据资源转化为有价值的资产,可以为企业提供更准确、更全面商业银行数据资产体系白皮书 3 的商业洞察。通过对数据资源的深度分析和挖掘,企业可以发现潜在的市场机会、了解客户需求、优化产品和服务,从而提升竞争力。其次,数据资产化可以优化企业的运营效率。通过对数据的实时监控和分析,企业可以及时识别风险并调整策略。最后,数据资产化可以促进企业的创新和业务模式的转型,发现新的商业模式、创新产品和服务,从而在市场中获得竞争优势。根据2022 年全国数商产业发展报告中介绍的数据要素全链路 15 类数商,数据产品供应商、数据资源集成商、数据加
22、工服务商、数据分析技术服务商、数据治理服务商是围绕数据要素开展加工、治理、应用使其产品化的服务商,其中自身拥有数据资源,并能形成数据产品,进而资产化的企业主要是数据产品供应商,在该报告中定义为数据要素型企业,指自身拥有大量数据且能够提供自身数据给第三方数据处理商、存储商、分析商的企业,通常这些企业来自于数据密集型行业,如金融、互联网、交运、医药健康、能源、工业制造和通信运营 7 大行业。截止 2022 年 11 月,数据产品供应商样本占比为 5.11%,与其它类型数商相比,占比偏低。以银行为例,银行通过长期多轮信息化和数字化建设,从业务经营、客户服务、生态伙伴中积累了海量数据,数据技术储备充分
23、,并较早开展了数据治理工作,形成了一批用于企业经营分析、营销获客、风险评估、运营提效等数据应用。虽然大部分银行参与数据要素生态是以数据需求方的角色出现,较少作为数据产品供应商,但在数字化转型过程中,银行的数据搜集和应用能力得到进一步提升。随着银行金融科技能力的提升和数据资产化进程的深入,银行与专门的金融科技公司、或是与第三方金融科技公司联合,在安全合规的框架下,将有场景需求的行业级数据产品通过数据要素市场挂牌,以数据产品供应商的角色参与数据要素市场,探索并引领金融数据产品创新。当然,银行作为金融机构,还可以通过数据交易清结算、数据资产抵质押融资、数据资源受托开发、数据咨询服务等多种角色,借助金
24、融资源和专业服务参与数据要素市场,护航数据要素的金融属性发展。数据要素市场化是企业数据资产化的“催化剂”。数据要素市场提供了数据生态体系中各类企业发挥优势的场所,供需匹配、合规流通和价值发现的优势,会进一步激发企业数据资产化的意愿和动力,同时数据要素市场也是顺应数据要素发展趋势、创新型业务模式和提升自身数据研发能力的实践平台。1.21.2 数据要素市场建设迫切需要企业数据资产化数据要素市场建设迫切需要企业数据资产化 任何要素市场的主体都是企业,数据要素市场也不例外。数据要素市场主体包含供给主体、需求主体和中介服务主体,数据商品是交易标的,通过场内或场外开展流通交易。数据商品供给是市场建设与运行
25、的基础原料,数据商品的生产过程,同频同步就是企业数据资产化的过程。供给主体企业建立数据商品生产体系,同时配套建立完善的数据治理体系,严格管控数据商品生产全过程的质量,及时收集要素市场和需求主体的数据商品的反馈,迭代优化产品,不断创新升级,保持自身商品在数据要素市场的活跃度和认可度。数据需求是数据要素市场价值实现的来源。需求主体通过要素市场交易获得数据资产后,作为生产资产投入企业内部数据资产研发工序,与企业内部业务场景数据分析需求相结合,通过创新性加工和实质性商业银行数据资产体系白皮书 4 劳动,以管理认知的价值或是业务创新迭代的价值,达到数据再次资产化的条件。由数据供需双方的数据资产化,形成了
26、数据要素流通与交易的主轴线。数据要素市场的运行机制有赖于企业数据资产化。国家给数据要素市场的定位,激发数字经济的活力,驱动企业数字化创新。数据要素市场运行的逻辑,是有效匹配数据供需,发现数据价值,实现数据合规有序流通。数据要素供需双方可能存在以下问题,从而影响要素市场发展,企业数据资产化可以在供需矛盾解决中发挥积极作用。数据要素供需矛盾 企业数据资产化解决之道 数据商品数量不足。发展多元化数据要素型企业;聚焦数据产线提升产能。数据商品可信度存在缺陷。企业增强数据管理能力,完善数据合规体系,企业数据管理能力评级与数据交易商评级挂钩。不同层级数据商品有所欠缺,如满足普适性需求的标准化数据商品和特定
27、场景需求的非标准化数据商品。企业建立产品经理责任制,建立数据产品核心竞争力,从产品规划、产品形态、产品设计和产品规范四个维度打造数据产品。数据商品的行业属性较强,但缺少行业示范性应用而导致需求侧潜力未能充分挖掘。牵手行业头部企业建立示范数据产品应用案例;进行充分的市场/行业/用户调研;引入数据经纪人。数据商品价格不透明,未能充分发挥市场价格发现机制。企业数据资产化过程中,建立数据资产价值自我评估体系,并引入外部第三方独立开展数据资产价值评估;企业数据资产参与数据要素流通的定价可参与数据资产价值评估结果;发挥数据资产金融属性,为数据资产价值背书。图 1 数据要素供需矛盾与解决之道 数据要素市场的
28、高品质商品供给,离不开企业高质量的数据产品生产和高质量的数据治理。尽管我国数据要素市场刚刚兴起,配套设施正在完善中,各类“数商”企业的数据资产化的实践进程,将促进数据要素市场规范化与规模化发展。我国将数字经济作为高质量发展的强国之策,提出了构建数据要素大市场的宏大愿景,“摸着石头过河”,同时“实践出真知”,需要每一位市场参与者“躬身入局”,“细嗅蔷薇”,共同探索出具有中国特色的数据要素市场体系。商业银行数据资产体系白皮书 5 1.31.3 企业数据资产化所需具备的条件正在成熟企业数据资产化所需具备的条件正在成熟 在实践中,企业数据资产化有三大难题,分别是数据资产确权、数据资产价值评估、数据资产
29、会计处理。一方面数据资产化还是新兴事物,在国家顶层设计的框架下,相关理论体系、法律法规、实施细则等还在制定完善中;另一方面,企业在数据资产化实施过程中碰到的阻碍,也驱动着各类配套制度措施制定出台。我们欣喜地看到,企业数据资产化所需具备的条件逐渐成熟。首先是数据资产确权。数据资产的产权明确是企业数据资产化的前提条件,也是数据要素收益得以合理分配的基础。数据二十条提出“探索数据产权结构性分置制度,建立公共数据、企业数据、个人数据的分类分级确权授权制度”,特别是“建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”,这一项极为鲜明的制度创新,创造性地指出了一条旨在解决数据资产化过
30、程中企业群体性贡献和个体性拥有之间可能存在的冲突的路径。尽管目前还未有进一步明确的数据产权立法出台,但以数据二十条为先导,可预见各地方会积极寻求法规层面的突破,以促进数据要素流通和市场化,我们可以拭目以待。在此之前,企业间的数据交易可以以合同条款的形式,明确所交易的数据权属,同时以技术手段保障各自权属主张可追溯和无争议。企业内部也可以建立数据资产登记确权的试点,集团公司以下属实体企业为单位,单一法人以部门为单位,界定数据资产以及生成该资产所需的数据资源的权属类型和权属对象。统一登记数据权属,以权属分配数据管理职责,明确数据共享机制,决定收益分配或绩效考评。企业内部数据资产权属管理为后续参与数据
31、要素市场打好基础,积累经验。其次是数据资产价值评估。由于数据资产的特有性质,数据资产的价值实现不仅与数据资产的内容和质量相关,也与数据资产利用过程中的算法、模型和算力相关,并依赖于数据资产的使用者在业务场景中的应用能力和执行能力,其易变性、多样性、可复制性和弱排他性是价值评估的难点。企业建立一套逻辑自洽的数据资产价值评估方法,对数据产品研发的投入产出进行量化分析,推动数据产品研发成本的准确归集,展现数据产品在业务经营中带来的经济利益并达成内部共识,进而推动数据资产再研发再运营的良性循环。企业寻求独立第三方开展数据资产价值评估,通常有三个目的,一是数据产品参与数据要素交易,实现合理客观的定价;二
32、是企业将数据资产抵质押给金融机构以实现融资,这是数据资产金融属性的体现;三是在财务报告和信息披露中,通过第三方对数据资产特定价值进行评定和估算,向外界展现企业应用数据资产产生的经济利益。中国资产评估业协会为规范资产评估机构及专业人员执业操作,先后发布资产评估专家指引第 9 号数据资产评估和数据资产评估指导意见。企业可根据数据资产价值主张的目标和评估结果的使用途径,自行决定采用何种评估方法,细化评估参数。现阶段以内部应用为主的数据资产,仍以成本法为主。数据要素类企业,有较为明确的数据产品交易场景且收益认定直接,可试点采用收益法。无论采用何种方法,数据质量都是需要重点考量的因素,数据质量对数据价值
33、的认定起着决定性的作用。实现数据资产化闭环的数据资产会计处理政策,也在近期得以突破。数据资产在业务端的认定、分类、管理与运营,部分企业启动较早,陆续开展试点,但财务端的准则基准、科目设置、会计处理与信息商业银行数据资产体系白皮书 6 披露一直未有政策指导和具体行动。2023 年 8 月,财政部印发的企业数据资源相关会计处理暂行规定实现了财经领域的突破,引起了广泛关注和持续研讨。尽管在会计准则层面主要是基于现有关于存货和无形资产的定义和确认条件进行规范,企业判断数据资源是否可以“入表”的原则没有发生重大的变化,但单独针对数据资源设定特定科目、以业财一致性为原则开展成本计量、初始会计处理和后续处理
34、,以及针对企业数据资源来源、加工、使用以及发挥作用情况进行自愿披露,以展示企业在数据资产领域的投入和成效。暂行规定出台后,已经有企业在研讨解读,从数据产品立项选择、可行性分析、研发成本台账、内部控制和财务系统等方面,积极准备在生效日后,试点数据资源入表从 0 到 1 的第一步,也为各行业数据资源入表积累典型案例。后续,随着法律法规、地方条例、实施细则的陆续出台,行业领先的企业开展数据资产入表案例的引领作用以及数据要素市场的助推下,千行百业的数据资产化更将百花齐放。商业银行数据资产体系白皮书 7 第第2 2章章 数据资产化是企业数据治理向上演进数据资产化是企业数据治理向上演进的必经之路的必经之路
35、 “健全数据治理体系。制定大数据发展战略。确立企业级的数据管理部门,发挥数据治理体系建设组织推动和管理协调作用。完善数据治理制度,运用科技手段推动数据治理系统化、自动化和智能化。完善考核评价机制,强化数据治理检查、监督与问责。加强业务条线数据团队建设。”“增强数据管理能力。构建覆盖全生命周期的数据资产管理体系,优化数据架构,加强数据资产积累。建立企业级大数据平台,全面整合内外部数据,实现全域数据的统一管理、集中开发和融合共享。加强数据权限管控,完善数据权限审核规则和机制。”-中国银行保险业监督管理委员会 关于银行业保险业数字化转型的指导意见,2022 年 1 月 https:/ 商业银行数据资
36、产体系白皮书 8 2.12.1 先行开展数据治理的企业,数据治理工作步入深水区先行开展数据治理的企业,数据治理工作步入深水区 伴随着企业信息化和数字化的进程,对“数据治理”的探索由来已久。从早期探索到广泛应用,可以分为三个阶段。第一阶段为早期探索,早在 1988 年由麻省理工学院的两位教授启动了全面数据质量管理计划(TDQM),可以认为是数据治理最初的雏形,同年,DAMA(国际数据管理组织协会)成立。时间一直走到 2002 年,数据治理概念首次出现在学术界,美国两位学者发表题为数据仓库治理的研究探讨了Blue Cross 和 Blue Shield of North Carolina 两家公司
37、的最佳实践,由此拉开了“数据治理”在企业管理中的大幕。第二阶段为理论研究,在美国学者发表数据仓库治理的第二年,2003 年 DGI(国际数据治理研究所)成立,研究数据治理理论框架,与 ISO 国际标准化组织对数据管理与数据治理进行定义。直到 2009年,国际数据管理协会 DAMA 国际发布数据管理知识体系指南(简称“DMBOK”),至此数据治理的理论框架基本固定。第三阶段为广泛接受与应用,伴随着数据仓库的建设,主数据管理与商务智能平台的实施,国内也逐步开始接受并利用数据治理的概念进行推广实践。我国数据治理之路在 DMBOK 基础上不断延伸和扩展,里程碑事件为在 2015 年提出了数据治理白皮书
38、国际标准研究报告。在总结数据治理中国实践的基础上,2018 年由国家标准化管理委员形成并发布了数据管理国家标准数据管理能力成熟度评估模型(GB/T 36073-2018),进一步明确并建立了数据管理相关的 8 个领域,5 个等级的能力模型。为指导企业开展能力自我评估和第三方独立评估,2022 年发布了国家标准数据管理能力成熟度评估方法(GB/T 42129-2022),并于 2023 年 7 月 1 日起正式实施。2018 年,当时的银行业监督管理委员发布了银行业金融机构数据治理指引(以下简称数据治理指引),这是首个以行业监管指引的方式明确提出的全行业覆盖的数据治理规范,标志着数据治理在银行业
39、的全面实施。各家银行数据治理起步工作可能稍有前后,但以数据治理指引的发布为标志,数据治理工作进入深水区。银行业作为全面实施数据治理工作的行业,监管指引的发布使得数据治理成为银行业的刚需。数据治理的复杂性日益提升,主要体现在以下几个方面:一、数据治理与银行数字化转型战略紧密结合,数据治理的自我驱动力增加一、数据治理与银行数字化转型战略紧密结合,数据治理的自我驱动力增加 在银行业数字化转型的浪潮下,银行的资产规模虽然仍然很重要,但已经不足以成为银行成功的必要因素;另一方面,数据规模和质量方面的竞争对于维持竞争优势将更为重要。同时,银行主营业务收入将不只是依赖传统、标准化的产品服务,而是来自高度定制
40、化的产品和通过数据驱动的智能化决策所实现的个性化互动。银行通过数字化手段创建连接客户、产业链、供应商、合作伙伴的能力,该能力带来的数据资源的飞速增长,如果未能通过有效的数据治理,将数据资源转化高度契合业务决策和洞察力所需要的匹商业银行数据资产体系白皮书 9 配链接能力,银行终将失去领先于同业的差异化竞争优势。因此,银行由自身数字化转型实现差异化竞争,而产生的数据治理内生驱动力,对数据基础和应用能力提出了更高、更迫切的要求。二、数据治理由面向数据对象转化为面向数据应用,数据治理的复杂度提升二、数据治理由面向数据对象转化为面向数据应用,数据治理的复杂度提升 大部分银行的数据管理起始工作,是从建立基
41、础数据以及指标数据的数据标准开始的,以数据对象的业务属性、技术属性和管理属性的规范定义为目标,形成企业级数据标准,并开展数据质量的检查、分析、改进和控制,提升局部的数据质量。数据管理工作多数是围绕数据对象展开,并且以存量数据为主,是对存量数据的规范性进行修复。面向数据应用的数据治理,以数据应用成效为目标,着力提升数据分析和应用的核心能力,数据治理需要覆盖数据应用以及生成该应用的一系列数据资源,包括源头数据、加工过程中的数据模型、逻辑规则、分析算法、数据服务提供模式、以及为保障端到端数据质量的数据标准、数据质量规则以及元数据等。在数据应用投入运营后,数据管理还需要对增量数据,甚至实时数据进行持续
42、监控,不断收集应用效果的反馈,优化分析规则和算法模型,从而保障数据应用成效可以达成预期的应用目标,包括对过去业务经营情况的准确反映,以及对未来业务趋势的准确预测。三、三、数据治理广度和深度增加,需要更加自动化和智能化的工具支持数据治理广度和深度增加,需要更加自动化和智能化的工具支持 数据治理的对象日益复杂,数据应用需求琐碎多样,数据加工链路多时序并存,生产数据的源头系统变更无法及时感知等,通过手工方式无法实现复杂的数据管理要求,需要借助自动化和智能化工具,在日渐智能化的数据应用研发过程中,数据管理的方法和工具需要与时俱进。结合当前技术的成熟情况,我们总结了以下数据管理自动化与智能化的应用场景。
43、功能描述 技术应用 数据资源盘点 将企业所有的元数据进行自动采集,形成完整的数据资源清单、分布以及关联关系,建立企业数据资源的知识图谱。元数据采集技术,知识图谱,自然语言处理技术、血缘分析等。数据资源信息补齐 在数据字典缺失的情况下,借助预训练大语言模型,根据表和数据字段名自动生成中文字段名称和字段含义,并自动匹配数据标准。自然语言处理语义理解、相似度计算等。数据模型校准 建立企业级数据模型库,在信息系统和数据应用的研发全过程,使用数据模型进行业务需求分析和系统设计,运用数据模型和数据标准对表结构进行一致性比对,识别系统实现态的数据与模型规范及设计态的偏离。元数据分析技术,数据模型分析、相似度
44、计算等。数据变更协同 数据链路上的任何一点发生数据结构的变化,自动评估对下游数据链路的影响,并通知受到影响的相关岗位。元数据动态捕获,消息队列,血缘分析等。数据自动分级分类 根据数据分级分类标准和历史数据分级分类结果,借助预训练大语言模型,自动对存量或增加的数据资源标注分级分类标签。深度学习、自然语言处理等。商业银行数据资产体系白皮书 10 数据需求智能匹配 对文字描述的数据需求进行语义解析,提取数据需求列表,并与已实现的数据产品进行匹配,以减少数据需求的重复开发。自然语言处理语义理解,相似度计算等。图 2 数据管理自动化与智能化应用场景 四、四、数据安全在数据治理中的比重增加数据安全在数据治
45、理中的比重增加 数据安全一直是数据治理体系中的组成部分,数据安全管理与防护措施,用以确保数据的完整性、机密性和可用性。近几年,随着网络安全法、数据安全法和个人信息保护法等上位法的发布,以及中国人民银行陆续发布的行业数据安全规范,包括金融数据安全 数据安全分级指南(JR/T 0197 2020)、金融数据安全 数据生命周期安全规范(JR/T 0223 2021)以及业务领域数据安全管理办法(征求意见稿)等,数据安全在数据治理领域的重要性突显,数据合规不仅是保护企业自身数据权益,也是满足法律法规要求的必要条件。在银行实践来看,数据安全侧重于数据加工全链路中的数据对象安全,面向业务应用的数据服务安全
46、,以及面向数据内外部流通的数据共享安全。通过对全链路数据对象的分级分类,形成等级完整的数据保护机制,将数据安全管理流程与数据保护技术相融合,主要包括数据脱敏、加密解密、数据防泄漏、身份认证、数据权限、数据库审计等,同时依托网络、主机、操作系统等基础设施层级的信息安全保护机制,形成专业分工、守护底线、服务应用的平衡型数据安全体系。数据合规还需要关注个人信息保护与数据应用权属之间的平衡,这也是数据治理中的一个难题。以银行为例,在零售金融业务活动中,个人用户在享受便捷的金融服务同时,也将部分个人数据、家庭数据、消费数据、账户资金数据等沉淀在银行。银行在数据安全体系下,通过脱敏、加密、标签化等技术手段
47、,形成数据应用,并在营销、风控等场景中发挥作用并产生收益,这个过程中需要做到个人信息保护的底线未被突破,又需要在明确权属的情况下鼓励对数据的创造性加工。目前我国尚未发布个人信息保护法的具体实施细则,也未有数据应用权属的明确立法,在数据治理实际工作中,需要坚决守住红线,加强对个人信息的技术防护,在内部应用场景中也需要限制对个人信息的接触范围,及时跟进法律法规进展和相关判例,在合规的框架下更有信心地开发有创新性的数据产品。2.22.2 当前数据治理工作的局限与困境当前数据治理工作的局限与困境 如何做到“神形兼备”如何做到“神形兼备”无论是国际数据管理协会引入的 DMBOK,还是数据管理能力成熟度的
48、国家标准,亦或是银行业的数据治理指引,企业开展数据治理有章可循,有据可依。通过开展一系列“规定动作”,企业初步成立了数据治理的组织架构,明确了数据管理职责,建设了数据管理的制度及流程,抓住“数据标准”、“数据质量”和“元数据”三项数据管理核心工作,开展重要的数据标准定义和数据质量提升等工作。更进一步,一些先行开展数据治理的企业还积极推进主数据管理,或是以关键业务系统如核心系统、信贷系统、中间商业银行数据资产体系白皮书 11 业务系统等的重构为契机,落地数据标准,进一步从数据源头强化数据标准落地和数据质量控制。还有一些企业,通过数据仓库、湖仓一体等数据平台建设,以规范入仓入湖的数据标准化为抓手,
49、通过唯一性整合、编码映射、重分类、清理异常值等方式实现数据标准落地,支撑日常统计、多维度经营分析、场景营销、风险管控等各类数据分析应用。这些工作的引入和运作,初步搭建起企业数据治理的骨架,数据治理的“形”有但更需“神”在。数据治理的“神”在于将数据管理活动贯穿于数据应用开发的全流程中,建立起从数据源头到数据应用空间链路,数据从生成到销毁全生命周期的时间链路的伴随式数据管理机制,数据在时空链路上的流动变换,数据治理中的需求分析、模型设计、标准建设、质量监控、血缘追溯、安全管理等各项具体工作依次展开,如图 3 所示。数据治理与数据应用的融合,并不是在时空各环节依次叠加数据管理的各项工作,而是分析拆
50、解数据应用的需求,提取需求中基础数据和数据加工的共性部分,以数据模型为核心,以数据血缘关系为连接,整合数据标准和数据质量检核规则,在数据应用开发过程中,保障时空链路中的数据规范有序,加工逻辑准确无偏,及时识别数据质量问题并有效纠偏。数据应用上线运行后,数据治理持续守护数据时空链路中的增量内容,第一时间感知源头数据库表结构变化或业务变化带来的数据偏离,监控数据链路中数据各层级接口、数据订正、数据加工调度、维度数据变化导致的数据质量异常,阻断脏数据通过时空链路向数据应用的蔓延。图 3 时空全域数据治理 打通数据管理与数据研发流程,将规范的数据模型与数据标准伴随数据研发全过程,研发人员在编写代码的环