1、 Harbin Institute of Technology1第第6 6讲讲 电子商务电子商务中的商务智能(2 2学时)学时)哈尔滨工业大学管理学院哈尔滨工业大学管理学院哈尔滨工业大学管理学院哈尔滨工业大学管理学院王泽彬王泽彬王泽彬王泽彬WW 第第1 15 5章章 电子商务电子商务中的商务智能 Harbin Institute of Technology31 15 5.1.1 商务智能的概念商务智能的概念1 15 5.2.2 数据仓库数据仓库1 15 5.3.3 OLTP/OLAPOLTP/OLAP1 15 5.4.4 数据挖掘数据挖掘1 15 5.5.5 商务智能的架构商务智能的架构1 1
2、5 5.1.1 商务智能的概念商务智能的概念 Harbin Institute of Technology5 Harbin Institute of Technology6商务智能的提出商务智能的提出九十年代末,美国九十年代末,美国商务智能的含义商务智能的含义 商务智能(Business Intelligence,缩写为BI)指利用计算机及计算机网络,从商业数据存储中提取与分析企业关注信息的智能化的数据分析处理系统。商务智能的核心技术商务智能的核心技术 数据仓库DW,在线分析处理 OLAP,数据挖掘DM Harbin Institute of Technology7商务智能,简称BI,指通过对
3、数据的收集、管理、分析以及转化,使数据成为可用的信息,从而获得必要的洞察力和理解力,更好地辅助决策和指导行动的过程。商务智能系统商务智能系统 指利用计算机技术及信息技术,从商业数据中提取出与企业决策相关的信息的智能化的数据分析处理系统。商务智能系统是一种为决策制定者提供决策支持的信息系统.商务智能系统从基于计算机技术的决策支持技术发展而来 Harbin Institute of Technology8国内学术界的观点BI实际上是帮助企业提高决策能力和运营能力的概实际上是帮助企业提高决策能力和运营能力的概念、方法、过程以及软件的集合,其主要目标是念、方法、过程以及软件的集合,其主要目标是将企业所
4、掌握的信息转换成竞争优势,提高企业将企业所掌握的信息转换成竞争优势,提高企业决策能力、决策效率、决策准确性。决策能力、决策效率、决策准确性。Harbin Institute of Technology9国内产业界的观点商务智能是指一种能力:通过智能地使用企商务智能是指一种能力:通过智能地使用企业的数据财产来制定更好的商务决策。业的数据财产来制定更好的商务决策。它的意思是说各种企业的决策人员以企业中的数它的意思是说各种企业的决策人员以企业中的数据仓库据仓库(Data Warehouse)为本,经由各式各样为本,经由各式各样的查询分析工具的查询分析工具(Query/Report Tools)、联机
5、分、联机分析处理析处理(OLAP)工具、或是数据挖掘工具、或是数据挖掘(Data Mining)工具加上决策规划人员的行业知识工具加上决策规划人员的行业知识(Industry Knowledge),从数据仓库中获得有利,从数据仓库中获得有利的信息,进而帮助企业提高获利,增加生产力与的信息,进而帮助企业提高获利,增加生产力与竞争力。竞争力。Harbin Institute of Technology10与BI相关的几个重要概念BI(Business Intelligence,商务智能),商务智能)DW(Data Warehouse,数据仓库),数据仓库)OLTP(Online Transacti
6、on Process)OLAP(Online Analysis Process)DM(Data Mining,数据挖掘),数据挖掘)1 15 5.2.2 数据仓库数据仓库 Harbin Institute of Technology12数据仓库(数据仓库(Data Warehouse Data Warehouse 简称简称DWDW)“A data warehouse is a subject-oriented,integrated,time-variant,and nonvolatile collection of data in support of managements decision
7、-making process.”W.H.Inman 数据仓库是实现商务智能的基础平台数据仓库是实现商务智能的基础平台 Harbin Institute of Technology13数据仓库数据仓库 为为 满满 足足 管管 理理 决决 策策 中中 的的 数数 据据 需需 求求,W.H.Inmon,在在1992最最先先提提出出了了数数据据仓仓库库的的概概念念。按按照照Inmon的的定定义义,数数据据仓仓库库是是面面向向主主题题的的、集集成成的的、稳稳定定的的、不不同同时时间间的的数数据据集集合合,用用于于支支持持经经营营管管理理的的决决策策制制定定过过程程。目目前前已已经经成成为为企企业业级级
8、决决策策系系统统的的重要组成部分。重要组成部分。Harbin Institute of Technology14数据仓库VS 数据库数据库系统(生产系统):面向应用、事务驱动的 实时性高 数据检索量少 只存当前数据数据仓库系统(决策系统):面向主题、分析和决策 实时性要求不是特别高 数据检索量大 存储大量的历史数据和当前数据 以银行为例储蓄 对公信用卡其他 数 据 仓 库客户产品渠道交易机构1 15 5.3.3 OLTP/OLAPOLTP/OLAP Harbin Institute of Technology16OLTP&OLAPOLTPOLTP(Online Transaction Proc
9、essOnline Transaction Process)联机联机事务事务处理,是公司日常运营的基础,处理,是公司日常运营的基础,是业务流程信息化的关键,基于日常数据库。是业务流程信息化的关键,基于日常数据库。例例 :Harbin Institute of Technology17OLAP为满足基于大型数据库的复杂为满足基于大型数据库的复杂查询、决策分析等需求,弥补查询、决策分析等需求,弥补OLTP(On-Line Transaction Processing,在线事务处理)在功在线事务处理)在功能上的不足,能上的不足,90年代初出现了年代初出现了OLAP技术(技术(E.F.Codd,199
10、3),),目前目前OLAP 已经成为大部分数据仓已经成为大部分数据仓库的重要分析工具。库的重要分析工具。Harbin Institute of Technology18OLTP&OLAPOLAPOLAP(Online Online AnalysisAnalysis ProcessProcess)联机联机分析分析处理,基于数据仓库的数据分析,以处理,基于数据仓库的数据分析,以供决策所需,面向管理层,面向未来。供决策所需,面向管理层,面向未来。l满足决策支持或多维环境特定的查询和报表需求,它的技术核心是“维”这个概念,因此OLAP也可以说是多维资料分析工具的集合。Harbin Institute
11、of Technology19A Sample Data Cube哈尔滨销售哈尔滨销售电视机的总量电视机的总量日期日期产品产品商店商店sumsum 电视机冰箱计算机1Qtr2Qtr3Qtr4Qtr哈尔滨南京北京上海 Harbin Institute of Technology20OLAP多维分析方法n上卷(roll-up)n下钻(drill-down)n切片(dice)n切块(slice)n旋转(rotate),旋轴(pivot)Harbin Institute of Technology21The MOLAP CubeFact table view:Multi-dimensional cub
12、e:dimensions=2 Harbin Institute of Technology223-D 立方体dimensions=3Multi-dimensional cube:Fact table view:day 2day 1 Harbin Institute of Technology23 下钻上钻上钻、下钻day 2day 1129.Example:computing sums Harbin Institute of Technology24切块切片day 2day 1TIME=day 11 15 5.4.4 数据挖掘数据挖掘 Harbin Institute of Technolog
13、y26DM(Data Mining)Data mining(knowledge discovery from data)Extraction of interesting(non-trivial,implicit,previously unknown and potentially useful)patterns or knowledge from huge amount of dataFayyad,Piatetsky-Shapiro,Smyth,96 Harbin Institute of Technology27DM(Data Mining)数据挖掘数据挖掘(Data Mining)就是从
14、大量的、不就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们取隐含在其中的、人们事先不知道的事先不知道的、但又是、但又是潜潜在有用在有用的信息和知识的过程的信息和知识的过程 Harbin Institute of Technology28Why Data Mining?数据库技术的发展数据库技术的发展lTo collect a large amount of data primitive file processinglTo store and query data efficiently DBMS新的挑战新的挑战:huge
15、 amount of data,how to analyze and understand?lData mining Harbin Institute of Technology29数据挖掘VS 数据仓库数据挖掘(数据挖掘(Data MiningData Mining)与与数据仓库数据仓库(Data WarehouseData Warehouse)没有直接的联系没有直接的联系在大部分情况下,数据挖掘都要把数据从数在大部分情况下,数据挖掘都要把数据从数据仓库中拿到数据挖掘库或数据集市中据仓库中拿到数据挖掘库或数据集市中为了数据挖掘你也不必非得建立一个数据仓为了数据挖掘你也不必非得建立一个数据仓库
16、,数据仓库不是必须的库,数据仓库不是必须的 Harbin Institute of Technology30Data Mining Application商业商业:贷款:贷款.网上购物:购买书籍网上购物:购买书籍.Web:Google政府政府:毒品交易,反恐怖 医疗保险医疗保险病人.Harbin Institute of Technology31Problems Suitable for Data-Mining 基于知识的决策基于知识的决策具有变化的外部环境具有变化的外部环境具有可以使用的、充分的相关数据具有可以使用的、充分的相关数据正确的决策具有高的回报率正确的决策具有高的回报率 Harbi
17、n Institute of Technology32DM(数据挖掘)VS OLAPOLAP分析过程的本质是一个演绎推理演绎推理的过程的过程 OLAP分析先建立一系列的假设,然后通过OLAP来证实或推翻这些假设来最终得到自己的结论 Harbin Institute of Technology33DM(数据挖掘)VS OLAPDM(Data Mining)和OLAP是完全不同DM本质上是一个归纳归纳的过程的过程 不是用于验证某个假定的模型的正确性,而是在数据库中自己寻找模型 数据挖掘和OLAP具有一定的互补性 Harbin Institute of Technology34 问题描述:预测信用水
18、平是好还是差,银行据此决定是问题描述:预测信用水平是好还是差,银行据此决定是 否向客户发放贷款,发放多少否向客户发放贷款,发放多少 结果描述结果描述收入大于5万元/年是否有无储蓄帐户是否房主是是否否批准不批准批准An Example Harbin Institute of Technology35数据挖掘的典型结果数据挖掘的典型结果电信电信问题描述:根据客户信息,预测客户流失可能性问题描述:根据客户信息,预测客户流失可能性 结果描述结果描述:(神经网络)神经网络)输 入流失概率(0.87)输 出男293000元/月神州行130元/月An Example1 15 5.5.5 商务智能的架构商务智
19、能的架构 Harbin Institute of Technology37BI平台基本架构数据仓库数据仓库数据仓库数据仓库引擎引擎引擎引擎数据集成引擎数据集成引擎OLAP引擎引擎挖掘引擎(挖掘引擎(DM)业务数据库(业务数据库(OLTP)ETLDWArchitecture of Business Intelligence System(Won Kim,1998 2nd Worldwide Computing and its Applications)数据数据信息信息知识知识利润利润 Harbin Institute of Technology38 Harbin Institute of Tec
20、hnology39案例:商务智能模型AD方法库MD模型库异构数据采集程序采集接口1采集接口2采集接口n数据修正筛选程序数据仓库系统OLAP数据挖掘系统表示与发布系统管理驾驶舱系统智能报表系统WEB发布系统诊断发布系统WEB数据采集接口WEB智能表单统计平台第一部分第二部分第三部分第四部分 Harbin Institute of Technology40应用实例:航天科技风华电子预算分析及数据挖掘平台哈药集团医药物流数据挖掘系统酒店行业数据挖掘的实际应用 Harbin Institute of Technology41数据挖掘系统全面预算管理系统异构系统数据采集系统Web数据采集整合系统全面预算
21、处理数据挖掘处理管理驾驶舱系统 MC表示层处理层采集层航天科技风华电子预算分析及数据挖掘平台总体目标航天科技风华电子预算分析及数据挖掘平台 Harbin Institute of Technology42 数据挖掘系统(用户化的模型库、方法库)哈药集团商务智能系统的分析方法哈药集团商务智能系统 Harbin Institute of Technology43 Harbin Institute of Technology44 北京保利大厦 酒店行业数据挖掘的实际应用酒店行业数据挖掘的实际应用时序模型应用举例:VIP会员消费时间序列记录应用效果:掌握时间规律后,可以在其消费高峰到来之前,实施针对的促销手段,使其高峰提前到来。在其消费高峰消失前,通过促销手段延迟其结束。Harbin Institute of Technology45关联模型应用举例:某一类客人与某一种促销活动的关系 某一类客人与某些事件的关系应用效果:掌握某一类客人与某一事件的关联关系后,待有同类事件发 生时,将该信息通知该类客户,促成潜在消费机会的发生。