1、数据管理、数据治理、数据资产管理,到 底有何不同? 数据治理、数据管理、数据资产管理,有什么不同?这 是一个我被问的最多的问题。 如果要用一张图来描述它们三者之间的关系,你跟赞成 以下两幅图的哪个? 图1:数据治理、数据管理、数据资产管理的关系©谈数据 数据资源在一定程度上有“量大”的内涵,例如:我们经 常听新闻说XX地,矿产资源丰富,一定是说这个地方 有大量矿产,而不是只有一块矿石。如果只有一块铁矿 石,即使你懂冶金,能够对其进行炼化和提纯,那它产 生的价值也是有限的。 同样,一条数据也
2、不能称为数据资源,数据资源必须有 一定的量。例如:如果T宝、拼夕夕等电商平台只对你 的一次购物记录进行分析的话,其实意义并不大,但如 果把你每次的购物数据都被汇聚起来,进行融合性分 析,就能轻松知道你的购物偏好,然后给你进行产品推 荐,以实现他们所谓的“精准营销”。 3、数据资产数据资产的概念我们在之前文章中屡次提到过:数据资 产的是由企业合法拥有或控制并且能够给企业带来经 济效益和社会效益的数据资源。 关于数据资产的定义,请参考《企业数据资产管理的参考框架和方法》 数据生产要素 图:从数据到数据资产©谈笠数据资产管理研究的就是如何将数据资源转化为数据 资产的过程。 那么,数据资
3、产之后呢,数据又将转化成什么? 数据资产管理促进了数据的交易和流通,当数据交易和流通所需要市场环境、技术环境、法律环境都相应成熟 的时候,数据资产就会转为为企业的资本——数据资 本。 — 03 —从数据管理到数据资产管理 下面的这幅图是我在厦门大学大数据百家讲坛数据治 理公益提供课中用的一张图,它其实反响了从数据资源 到数据资产转化的过程。 数据分析 数据资产管理 (价值驱动) 数据交易 数据治理 管理;舌动 企业数据资源 OO 兀数据 全 首先,数据资源化。通过数据管理对企业各个数据源进 行采集、汇聚和处理,形成企业的统一数据资源库。企 业管理数据资源的目的
4、在于数据应用,但在使用数据资 源的时候,经常会发现有的数据业务无法识别,有的数 据存在大量的质量问题,导致业务无法有效使用。这个 时候就需要对数据进行治理。因此,数据治理是为了解决企业数据的质量问题而生! 其次,数据资产化。由于数据从创立到消亡的整个生命 周期中,从业务到技术,从管理到使用,每个环节都可 能发生数据质量的问题。所以,数据治理就不再是简单 的技术问题了。也因此,数据治理更加注重对数据资源 的整体规划和与之相适应的保障体系的建设,例如数据 战略、数据架构、管理组织、管理流程、管理制度等。 通过数据治理,打通数据孤岛、提升数据质量,实现了 数据为业务赋能,满足了企业内部使用。这个
5、时候企业 的数据资源在一定程度上勉强可以称为企业的资产了。 最后,数据资本化。严格来讲,数据资产的价值是应该 具备可衡量性的,而满足企业内部使用虽然表达了它的 使用价值,但这个价值并不好衡量。因此,数据资产管 理在数据治理和数据管理的基础上进行了扩展,以价值 为驱动,通过对数据资产进行有效管理和估值,促进数 据资产交易和流通。 — 04 — 数据管理、数据治理、数据资产管理,到底有何不同? 业内的相关数据管理体系中,无论是数据管理,还是数 据治理,亦或是数据资源管理、数据资产管理,基本都 包含了元数据管理、数据标准管理、数据质量管理、数 据平安管理等内容。 所以很多人都很疑惑,那这三
6、个数据管理的相关概念到 底有什么不同? 其实,在上文中基本也都交代了,如果您还觉得没说清 楚,我们再总结一下,笔者认为:从技术的角度,这几 个概念之间差异不大,主要的区别在于它们管理数据的 目的和驱动力上。 数据管理是日常的数据管理相关操作和行为,为的就是 把数据管起来,让企业知道有哪些数据并确保数据不丧失, 至于对如何使用这些数据,目的和需求似乎不是特别强烈。 例如:有些大型企业很早设置的DBA岗位,而DBA的职责 更多是管理系统的数据库,如数据备份、还原等,还有就是 数据集成。 数据资源管理与数据管理比拟相似,但数据资源管理的 目的性很强,它是应用驱动的,更加贴近业务。数据资源管
7、 理以业务的视角,对不同结构、不同类型、不同来源的数据 进行归纳、整合和管理,让业务人员也能容易识别和找到想 要数据。 数据治理更多的是问题驱动的,根本目的就是为了提升 数据质量和控制数据平安,侧重于标准规范和保障体系的建 设,促进企业内部的数据利用和交换共享。 数据资产管理是价值驱动,在数据管理、数据治理的基 础之上,更多的关注数据确实权问题、估值问题以及交易和 流通问题。 以上就是笔者对数据管理、数据治理以及数据资产管理三个 概念的一些浅薄理解。有不正确的地方,欢迎各位大佬批评 指正。也有一些读者经常问我,数据目录和数据资产目录是 一回事吗?这个问题非常好,数据目录和数据
8、资产目录刚好 是分别数据管理和数据资产管理的“长得非常相似”的具 象化应用。理解了这两个目录有啥区别,很大程度上能够帮 助们理解数据管理和数据资产管理的不同。但由于怕您读得 太累,文章不易写得太长。关于这个问题,我们就放在下篇 文章中解读把。 不过,您认为数据目录和数据资产目录有什么不同?可以从 管理目标、技术实现、使用范围等多个角度来聊聊,欢迎留 言区给我留言。 图1:数据治理包含数据管理,数据治理提出了数据管理 的目标、架构和蓝图,数据管理是数据治理的技术实现, 而数据资产管理是面向数据应用和数据价值的数据管理, 属于数据管理的一局部。 图2:数据资产管理的范畴更大,数据资产管理是
9、数据管 理的延伸,而数据治理是确保数据能够被管好的策略。 你认为这两幅图,哪个描述三者关系更准确呢? 如果三个不好比拟,那我们把它拆开,两两比拟,看一看数 据治理、数据管理、数据资产管理,到底有何不同? — 01 —数据治理VS数据管理 1、观点一:数据管理包含数据治理 业内主流观点认为数据管理包含数据治理。以DAMA 为代表,在DAMA-DMB0K2的数据管理框架(车轮图) 中,数据治理只是数据管理11个知识领域中的其中之 数据架构 数据平安 治理 元数据管理 主数据管理 ‘数据仓库 和商务智能 参考 数据和 数据存储 和操作 数据集成 *口互操作 数据建模
10、和设计 文件和内容 I管理 来源:DAMA-DMB0K2 DAMA关于数据管理和数据治理的定义如下: 数据管理(Data Management)是为了交付、控制、保 护并提升数据和信息资产的价值,在其整个生命周期中 制订计划、制度、规程和实践活动,并执行和监督的过 程。 数据治理(Data Governance, DG)是指对数据资产管理行 使权力和控制的活动集合(规划、监督和执行)。 DAMA认为数据管理是管理从数据的获取到数据的消 除整个生命周期过程,而数据治理是为了确保组织对数 据作出合理、一致的决策,也就是说数据治理是为了更 好的管理数据,是数据管理的策略、规程或标
11、准。 2、观点二:数据治理包含数据管理 另一种不同的观点那么是认为数据治理包含数据管理。数 据治理是为了实现数据资产价值最大化所开展的一系 列持续工作过程,而数据管理是为了实现这一目标而开 展的具体技术和业务活动。 数据治理为数据管理指明方向,指导、评估和监督数据 管理的有效性;数据管理那么通过计划、建设、运营、监 督来反响管理的成效和问题。 3、笔者的观点 如果我们用简单的包含和被包含关系来理解数据治理 和数据管理,确实会有一些争议。笔者更喜欢用一个“金 字塔”结构来理解它们: 数据治理 指 尊 数据战略、组织模式、 标准规范… 元
12、数据管理、主数据管理、数据标准管 理、数据质量管理、数据平安部、数 据服务管理… 图:数据治理与数据管理的关系©谈数据金字塔顶层的应该是数据治理。与“治理”相关,我们还 会经常看到、听到国家治理、公司治理的概念,从某种 意义上讲,治理是一种自顶向下的策略或活动。如果我 们将国家治理说成国家管理,把公司治理说成公司管控 是不是有点怪怪的?因此,数据治理应该是顶层设计、 战略规划方面的内容,是数据管理活动的总纲和指导, 指明数据管理过程中哪些决策要被制定,以及由“谁” 来负责,更强调数据战略、组织模式、职责分工和标准 规范。 数据管理是实现数据治理提出的决策,并给予反响,强 调管理流程和
13、机制。数据管理涵盖不同的领域,诸如: 元数据管理、主数据管理、数据标准管理、数据质量管 理、数据平安管理、数据服务管理等。数据管理是确保 数据被管理和监控,从而让数据得到更好的利用。 因此,数据治理强调顶层的策略,管理是侧重于流程和 执行,两种相互作用、相辅相成的。而如今,我们听到 的更多的“数据治理”这个词,似乎只要涉及与数据管理 相关的,都在说自己在搞数据治理。出现这个问题,主 要是企业越来越意识到传统IT驱动或者说技术驱动的 专项数据管理工程,在实施过程中很难推进、困难重重, 并且很难解决业务和管理上的用数难的问题。而从战 略、组织入手的数据治理顶层设计,更有利于推动数据 管理目标的实
14、现。 注:相关观点收录在《一本书讲透数据治理:战略、方法、工具与实践》 一书中,点击链接可直接购买。 — 02 — 数据、数据资源、数据资产 如果我们想更加深刻的理解数据资产管理与数据治理 到底有啥不同,就必须先拎清楚“数据、数据资源、数 据资产”的概念。 v / r.>14 w/, trn1、先说说数据 注意,这里的数据是指“原始数据”,即:记录事实的结 果,用来描述事实的未经加工的素材。 数据有两个特征:一是可以描述事实,二是未经加工。 例如:开车时,车速传感器记录下来的你的车速;监控 摄像头录下的一段视频;气温计显示的温度;企业ERP 系统的销售订单记录等等,都属于数据。
15、 有人说:“未经加工的原始数据没有任何意义”。这点我 是不认同的,我认为原始数据并不是没有意义,而是原 始数据能发挥出价值是有限的(起码它能够描述事实)。 但由于原始数据可能存在不能被人所识别,不能被计算 机所保存,或者数据本身有质量缺陷等问题,因此,要 让数据产生更大的价值,就需要对其进行加工处理,形 成更高价值的“信息”。 就像铁矿石一一它是有价值吧,但如果你不懂冶炼,不对它 进行炼化和提纯,那么从价值的角度,铁矿石和普通的石头 也没有太大差异。 2、数据资源 大数据领域首次提出了“数据资源”的概念,但是“数据 资源”这个词在很多材料中并没有一个标准的定义。我 理解的“数据资源”就是指数据本身,只不过这个数据是 按照一定的目标,经过了一定的规划设计,对数据进行 采集、汇聚、存储或处理后,形成了能够被再次利用的 数据。 例如:企业建设一个信息系统,需要设计系统的数据模 型、结构、类型、存储方式等,然后通过人们对系统的 流程表单或页面的各种操作,数据就被记录和保存到了 信息系统的数据库中,成为了企业的数据资源。从这个 层面讲,企业过去的几十年的所有“信息化”工作,都只 是在做一件事情——实现数据“资源化”。






