收藏 分销(赏)

数据仓库维度建模.pdf

上传人:曲**** 文档编号:254754 上传时间:2023-05-19 格式:PDF 页数:22 大小:1.11MB
下载 相关 举报
数据仓库维度建模.pdf_第1页
第1页 / 共22页
数据仓库维度建模.pdf_第2页
第2页 / 共22页
数据仓库维度建模.pdf_第3页
第3页 / 共22页
数据仓库维度建模.pdf_第4页
第4页 / 共22页
数据仓库维度建模.pdf_第5页
第5页 / 共22页
点击查看更多>>
资源描述

1、数据仓库维度建模学习目的在课程结束后应该知道:数据仓库维度建模分哪几个步骤?每个步骤都有哪些原则,和哪些误区?掌握维度建模方法?维度表属性在维度模型中起到什么样的作用?Kimball极力反对哪些建模方法?一个比喻 _ ESENSOFT比喻:如果将数据仓库建设看作是一个高楼大厦建造过程的 话 数据仓库维度建模就是大厦的框架建设工作 数据仓库ETL过程,就是为大厦添砖加瓦的过程 优秀数据访问工具则是大厦整体装修的最佳工具:框架的重要性 地基打多深决定大厦能做多高。钢筋混凝土结构还是刚结构决定了大厦的稳定性 维度建模是数据仓库框架建设的重要技术维度建模四步曲 ESENSOFT:四步维度建模步骤:1.

2、选取要建模的业务流程 2.定义业务流程中的数据粒度 3.选定用于每个事实表行的维度 4.确定用于形成每个事实表行的数字型事实四步曲一 1.选取业务流程 ESENSOFT:误区:不针对业务流程而针对业务部门进行维度建模 将注意力放在业务部门身上,而不关注业务流程 为某个部门建立单独的维度模型:原则:针对业务流程进行维度建模 确保某个业务流程中的核心数据只被抽取一次 保证数据仓库中业务数据一致性四步曲一2.定义粒度(1):粒度的解释:粒度传递了同事实表度量值相联系的细节所达到的程 度方面的信息。简单的说,反映了事实表的明细程度:粒度举例:超市小票上的购物清单 医生的处方药品清单 仓库每种产品库存值

3、的月快照:误区:数据仓库团队经常绕过这个看似不必要的步骤一个不合适的粒度定义将会使维度建模感觉无从下手四步曲一2.定义粒度(2):原则:优先考虑具有原子粒度的业务信息,这些数据不能再 做进一步的细分 数据仓库中存储汇总的、概要性的数据主要是基于数 据库性能上的考虑 汇总数据不能成为最底层细节数据的替代品四步曲一3.选定维度 ESENSOFT:误区:没有定义粒度就开始选定维度:原则:在粒度确认后,选取能从各个角度,充分描述问题的 维度为每个维度添加丰富的维度属性示例:常见维度包括日期、产品、顾客、事务类型和状态四步曲一4.确定事实:误区:没有第2步的粒度确认,就开始确定事实将含有不同粒度的事实放

4、在了同一个事实表中:原则:确定用于形成每个事实表行的数字可加型事实 在需求调研时我们可以通过提出“您需要对哪些指标 进行统计?”这样的问题来确定事实。具有不同粒度的事实必须放在不同的事实表中 事实一般在各维度上都有良好的可加性四步曲一总结:维度建模总原则:数据驱动和需求驱动相结合零售业案例背景:背景:设想一下在一家大型杂货连锁店,其业务覆盖分布在 美国5个州范围内的100多家杂货店。每个商店都有完整的配套部门,包括各类人员,并有 大致60000多个品种的产品放在货架上。各杂货店的POS系统记录了每位顾客交易详的细信息 定价与促销是管理层重要决策之一 如何使各种形式的促销活动所产生的效能清晰可见

5、?实例一 1.选取业务流程 ESENSOFT:选取业务流程:你能列出该连锁店急待解决的问题吗?是否有系统能提供解决问题所需要的数据?该系统对应的业务流程你清楚吗?:注意:建立的第一个维度模型应该是一个最有影响的模型,即它应该能对最紧迫的业务问题做出正面回答,并且 要保证有足够的操作型数据源的支持。实例一 2.定义粒度:定义粒度:你还记得刚才的粒度定义原则吗?在这个连锁店我们应该使用什么样的粒度?即事实表 要详细到什么程度?实例一 3.选定维度.ESENSOFT:选定维度:如何得出基本维度?什么是附加维度?通过粒度的判断我们可以得出事实表的基本维度为:日期、产品、商店与促销实例一4.确定事实:确

6、定事实:是否还记得确定事实的基本原则?按照基本原则你认为事实表中应该包含哪些事实?-是否应该在事实表中存放计算列?实例中事实应包括销售量、销售额与成本价,当然也可以包括毛 利润维度表属性:添加维度表属性 这是维度建模的最后修补工作 增加的维度属性会为用户带来更多的查询条件 丰富的维度属性将使查询变得更加灵活维度表属性一日期维度 ESENSOFT:日期维度属性是否还可以列出其它属性日期维度日期关键字(PK)日期 星期日历周结束日期 日历月日历年月 日历季度 日历年季度 日历半年度 节假日指示符 O O o及其匕维度表属性一产品维度 ESENSOFT:产品维度属性是否还可以列出其它属性产品维度产品关键字(PK)产品描述 SKU编号 商标描述 子类描述 分类描述 部门描述 包装类型 包装尺寸 含脂量O O o及其匕维度表属性一商场维度 ESENSOFT:商场维度属性是否还可以列出其它属性商场维度商场关键字(PK)商场名称 商场编号商场所在行政区 商场所在地区 首次开业日 最后重修日O o o及其匕维度表属性一促销维度 ESENSOFT:促销维度属性是否还可以列出其它属性促销维度促销关键字(PK)促销名称 促销媒体类型 促销开始日期 促销结束日期 O O o及其匕Kimbal极力反对的做法 esensoft:极力反对的做法维度模型的规范化处理(雪花模型)事实表拥有太多的维度谢谢大家!

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 社科论文

移动网页_全站_页脚广告1

关于我们      联系我们       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号  |  icp.png浙ICP备2021020529号-1 浙B2-2024(办理中)  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服