1、PUBS数据仓库设计实验1精选课件ppt设计要求n以SQL Server 2000提供的pubs示例数据库作为OLTP源系统。nPubs是一个图书出版公司的数据库,记录图书出版及销售等各方面信息。n该公司销售部门的决策者急于使用数据仓库以及OLAP来为他们的销售策略作辅助支持,为销售部门设计一个数据集市。2精选课件ppt数据介绍3精选课件ppt数据介绍序号数据表名称作用1publishers出版社表记录出版社的基本信息2Pub_info出版社信息表记录出版社的标志和其他信息3employee雇员表记录雇员的基本信息4jobs工作表记录工作的基本信息5roysched版税表记录图书版税情况6ti
2、tles图书表记录图书的基本信息7titleauthor图书作者表记录图书和作者间的关系8authors作者表记录作者基本信息9sales销售表记录图书在各书店的销售信息10stores书店表记录书店的基本信息11discounts折扣表记录书店的打折信息4精选课件ppt分析需求n希望针对每个出版社作图书销售业绩分析n希望针对每个国家的出版社作图书销售业绩分析n希望针对每个州的出版社作图书销售业绩分析n希望针对每个城市的出版社作图书销售业绩分析n希望针对每本图书作图书销售业绩分析n希望针对每类图书作图书销售业绩分析n希望针对每年出版的图书作图书销售业绩分析n希望针对每位作者所编写的图书作图书销
3、售业绩分析n希望针对每个书店作图书销售业绩分析n希望针对每个州的书店作图书销售业绩分析n希望针对每个城市的书店作图书销售业绩分析n希望针对年、季、月作销售业绩分析5精选课件ppt设计分析n分析角度包括:出版社、图书、作者、书店和时间5类;n分析主题:销售;6精选课件ppt设计分析n出版社:单个出版社 国别 州 城市n图书:单个图书 图书类别 图书销售日期n书店:单一书店 州 城市n时间:年、季、月7精选课件ppt数据筛选nPublishers:出版社的名称和地理位置信息都需要做销售分析,因此publishers表中的所有字段都应当加入到数据仓库中;nPub_info:不需要参考出版社的详细信息
4、,排除;nEmployee、job:同样处理;nRoysched:多维分析不会对图书的缴税情况以及税种感兴趣,因此排除;涉及到的其他字段royalty也同样处理;nTitle:预付款、年销售量、出版日期、摘要说明等信息也不必考虑;nAuthor:只关心有哪些作者、不关心作者的电话号码、住址、所在州和城市。nDiscounts:折扣信息暂时不考虑;8精选课件ppt识别事实数据与维度数据事实数据维度数据规模几百万笔/上亿笔数据远比事实数据少数据标识拥有多个外键只有单一主键数据类型数值数据字符数据数据性质不会改变经常改变9精选课件ppt识别事实数据与维度数据n四个步骤n搜索最基本业务,他们极可能是事
5、实数据;n搜索每一个事实数据的关键码,他们极可能是维度数据;n检验每一个可能是事实数据的字段,确定它不是嵌入在事实数据中的维度数据;n检验每一个可能是维度的字段,确定它不是嵌入在维度数据中的事实数据;10精选课件ppt识别事实数据与维度数据n首先将维度数据区分为如下5项:n出版社维度n作者维度n图书维度n书店维度n时间维度11精选课件ppt识别事实数据与维度数据nPublishiers(pub_id,pub_name,city,state,country)都属于维度数据而且,属于出版社维度,其中city,state,country具有层次结构;nTitle(title_id,title,typ
6、e,price,pub_id),其中price属于事实数据,以图书单价来分析数据;其余字段属于图书维度;nAuthors 表中的3个字段都是维度数据,属于图书维度;nSotre 表中的5个字段属于维度数据,并且属于书店维度,其中city,state具有层次结构;nSale表中ord_date,store_id,title_id都属于维度数据,分别属于时间维度、书店维度、图书维度。qty 字段是由业务行为生成的属于事实数据。12精选课件ppt识别事实数据与维度数据n事实表:sales pub_id char(4)publishers 表 出版社编号 stor_id char(4)stores表
7、书店编号 title_id varchar(6)titles 表 图书编号 ord_date datetime(8)sales表 订购日期 qty smallint(2)sales 表 订购数量 uniprice money(8)titles表的price字段 单价 total money(8)计算生成(qty*unitprice)总价 13精选课件ppt识别事实数据与维度数据nPublishers维度表,完全来自于publishers:pub_id,pub_name,city,state,countrynBook维度表,来自于title表:title_id,book_name,type,pu
8、bdatenStores维度表,来自stores表:stor_id,stor_name,stor_city,stor_statenAuthors维度表,不直接与事实表关联,与book表关联:title_id,au_id,au_name(au_fname+aulname)14精选课件ppt识别事实数据与维度数据15精选课件ppt利用DTS实现数据仓库数据的加载16精选课件ppt利用DTS实现数据仓库数据的加载17精选课件ppt利用DTS实现数据仓库数据的加载18精选课件ppt利用DTS实现数据仓库数据的加载19精选课件ppt包的保存n保存到sql servern保存到 meta data ser
9、vicesn保存到一个结构化存储文件中n保存到一个visiual basic 文件中20精选课件ppt包的保存n保存到一个结构化存储文件中21精选课件ppt包的保存n打开一个结构化存储文件中的包22精选课件ppt包的保存n打开一个结构化存储文件中的包23精选课件ppt包的保存n打开一个结构化存储文件中的包24精选课件pptn在运行窗口输入regedit,打开注册表编辑器,在HKEY_LOCAL_MACHINESYSTEMControlSet001ControlSession Manager中找到PendingFileRenameOperations,删除该键值(这个键值是安装程序暂挂项目,只要找到对应的应用程序清除掉就行了),关闭注册表编辑器。重新安装SQL Server 2000即可。25精选课件ppt