资源描述
数据仓库简明教程导读:数据仓库是商业和数据科学中最热门的话题之一。但是,如果你是该领域的新手,你 可能想知道:
数据仓库是什么?
数据仓库有什么作用?
数据仓库是怎么运行的?
编辑:Mika 来源:CDA数据分析师
与以下事实有关,数据仓库也包含历史数据。
S TIME-VARIANTHISTORICAL DATA
HISTORICAL DATA
REPORT FROM
365•/Data Science
如前所述,我们主要使用数据仓库进行分析和报告。这意味着我们需要知道五到十年前发生|
永久性S NONVOLATILE
S NONVOLATILE
X CAN'T BE CHANGED
X CAN'T BE DELHED
365VDataScience
意味着数据仅按原样录入数据仓库。一旦存入,就无法更改或删除。
归纳性S SUMMARIZED
AGGREGATED OR SEGMENTED
FOR ANALYSIS AND REPORTING
365VDataScience这里再次涉及到将数据用于数据分析这一事实。通常,它会以某种方式进行汇总或细分,为 了便于分析和报告。
oo&WHY ^HOW
别担忧,因为在接下来的4分钟你将知晓这所有问题的答案。
点击下方视频,先睹为快,时长03:31
好的,首先让我们看到定义。
单一数据源是什么意思。
在信息系统理论中,单一数据源是在一个地方构造全部最正确质量数据的实践。
STRUCTURING ALL THE BEST QUALIH DATA
让我们看到一个简单的例子。
你肯定遇到过这种情况,当你在处理文件,并且创立不同的版本,这时你怎么给文件命名?
当你完成后,你通常会在结尾加上〃最终版〃。这导致一堆带有扩展名的文件,比方,〃最终.
最终 最终.最终.最终”,或者是我的最爱一一〃真正最终版最终版〃final
final
final, final
final, final,
really tint
final
final如果你是这样,那你不是一个人。
看来即使是公司,也可能永远都不知道最新或最合适的文件在哪里。
但是如果你知道有个地方,会始终拥有单一的数据源,这就太有帮助了,不是么?
数据仓库就可以满足这种需求。
01数据仓库是什么?
那么到底什么是数据仓库呢?
指的就是公司存储其珍贵数据资产的地方。当中包括客户数据、销售数据、员工数据等。
WHERE VALUABLE DATA ASSETS ARE STORED
归纳性
DEFINING FEATURES OF A DA]让我们快速地分别看看。
面向对象性
例如,竞争对手的数据不需要出现在数据仓库中。但是,自己的销售数据肯定会在。
集成性对应于开头的例子,在命名方面,每个数据库、每个团队,甚至每个人都有自己的偏好。
I这就是为什么要开发通用标准,以确保数据仓库在任何方面都能选择最正确质量的数据。这与时变性
展开阅读全文