1、 决策支持系统 课前导入 第一章 决策支持系统概述 第一节 决策支持系统的形成和发展 决策支持系统(DSS)是20世纪70年代初由美国的Scott Morton在《管理决策系统》中首先提出,于20世纪80年代迅速发展起来。 l 管理信息系统 l 管理科学/运筹学 l 决策支持系统 管理科学与运筹学是运用模型辅助决策,体现在单模型辅助决策上,这样以来,对于多模型辅助决策问题,在决策支持系统出现之前要靠人来实现模型间的联合和协调。决策支持系统的出现要解决由计算机自动组织和协调多模型的运行以及数据库中大量数据的存取及处理,达到更高层次的辅助决策能力。 决策支持系统具有
2、以下6个特性: ①用定量方式辅助决策,而不是代替决策 ②使用大量的数据和多个模型 ③支持决策制定过程 ④为多个管理层次上的用户提供决策支持 ⑤能支持相互独立的决策和相互依赖的决策 ⑥用于半结构化决策领域 l 专家系统 专家系统也是一种很有效的辅助决策系统。它是利用专家的知识,特别是经验知识经过推理得出辅助决策结论,专家系统辅助决策的方式属于定性分析。 l 智能决策支持系统 智能决策支持系统是以决策支持系统为主体,结合人工智能技术形成的系统。除专家系统这种典型的人工智能技术以外,还有神经网络、机器学习、遗传算法以及自然语言理解等多种人工智能技术。 l 经理信息系统 l 决
3、策支持系统的发展 决策支持系统的技术进步经历以下四个阶段: ①单模型辅助决策 ②交互建模的DSS ③组合模型的DSS ④智能的DSS 第二节 决策支持系统概念 R.H.Spraque和E.D.Carlson对DSS的定义: n 决策支持系统具有交互式计算机系统的特征,帮助决策者利用数据和模型去解决半结构化问题。 S.S.Mittra对DSS的定义: n 决策支持系统是从数据库中找出必要的数据,并利用数学模型的功能,为用户产生所需要的信息。 DSS是在MIS的基础上发展起来的,都是以数据库系统为基础,都需要进行数据处理,也都能在不同程度上为用户提供辅助决策信息。
4、第三节 新决策支持系统与综合决策支持系统 n 20世纪90年代中期,兴起了数据仓库、联机分析处理和数据挖掘三项新技术,这三项新技术的结合为决策支持系统开辟了新方向,形成了基于数据仓库的新决策支持系统。 n 数据仓库中存储着大量辅助决策的数据,它为不同的用户随时提供各种辅助决策的随机查询、综合数据或趋势分析信息。联机分析处理提供了多维数据分析、进行切片、切块、钻取等多种分析手段。数据挖掘是挖掘数据中隐含的信息和知识,让用户在进行决策中使用。 n 以数据仓库为基础结合联机分析处理和数据挖掘形成了基于数据仓库的新决策支持系统。 新决策支持系统与传统决策支持系统具有以下关系: ①新决策支
5、持系统中数据挖掘获取的知识与传统决策支持系统的知识推理中的知识是不相同的。 ②新决策支持系统中没有充分利用模型和模型组合来辅助决策。 ③决策支持系统的技术还没有完全成熟。 把数据仓库、联机分析处理、数据挖掘、模型库、数据库、知识库结合起来形成的综合决策支持系统是更高级形式的决策支持系统。 决策支持系统的综合部件是由网络上的客户机来完成,即在客户机上编制DSS控制程序,由它来调用或者组合模型服务器上的模型并完成模型计算,调用知识服务器上的知识,完成知识推理以及实现数据仓库的综合信息查询,或用历史数据进行预测。这样,就形成了网络环境的综合决策支持系统。 第二
6、章 决策支持 课前复习 第一节 决策与决策支持 决策 决策自古有之,从宏观讲,决策就是制定政策,从微观讲,决策就是做出决定。 决策是指个人或集体为了达到或实现某一目标,借助一定的科学手段和方法,从若干备选方案中选择或综合成一个满意合理的方案,并付诸实施的过程。 决策过程与决策技术 著名的学者H.A.西蒙认为决策过程由四大步骤组成: (1)确定决策目标; (2)拟定各种被选方案; (3)从各种被选方案中进行选择; (4)执行方案。 决策过程八个阶段 决策过程中四大步骤可以分成更详细的八个步骤: 提出问题;确定目标;价值准则;拟定方案
7、 分析评估;选定方案;实验验证;普遍实施。 决策体系与决策信息 决策体系是指决策整个过程中的各个层次、各个部门在决策活动中的决策权限、组织形式、机构设置、调节机制、监督方法的整个体系。 决策体系由决策系统、参谋(智囊)系统、信息系统、执行系统与监督系统这五大部分组成一个统一整体。 决策支持的概念 在DSS发展历史中,决策支持是一个先导概念,决策支持的概念形成若干年后,才出现决策支持系统。 Keen和Morton认为,决策支持是指用计算机来达到如下的目的: 帮助经理在非结构化任务中作出决策; 支持而不是代替经理的判断能力; 改进决策
8、的效能(Effectiveness),而不是提高决策的效率(Efficiency)。 第二节 模型的决策支持 模型及分类 模型反映了实际问题最本质的特征和量的规律,描述了现实世界中有显著影响的因素和相互关系。 按模型的表现可以分为物理模型、数学模型、结构模型和仿真模型 数学模型及建模 数学模型分类: (1)原理性模型 自然科学中所有定理,公式都是这类模型。 (2)系统学模型 系统学是研究系统结构与功能的一般规律的科学。 按系统的复杂程度把系统分为简单系统和巨系统。 简单系统是指组成系统的元素比较少,它们之间的关系又比较简单的系统。巨系统
9、是指组成系统元素的数目非常庞大的系统。 系统学的模型有:系统动力学、大系统理论、灰色系统、系统辨识、系统控制、最优控制和创造工程学等。 优化模型的决策支持(线性规划实例) 第三节 决策方案的决策支持 决策方案及生成 设计的方案要有明确的、清晰的和简洁的表述。决策方案尽量计算机语言描述。并在计算机上通过计算得出方案的结果,以便决策者参考。 管理科学与运筹学所研究的大量数学模型,均是解决实际决策问题时进行抽象、总结的结晶。 我们可以在管理科学/运筹学中的大量数学模型的基础上,设计解决当前的决策问题的决策方案。 模型并行组合方案的决策支持 在对一个实际决策问题做方案
10、时,往往会采用对同一问题的多个不同模型进行计算,然后对这些模型的计算结果进行选择或者进行综合,得到一个比较合理的结果。这是一种采用多模型并行组合的决策方案。下面通过一个实例进行说明。 模型串行组合方案的决策支持 第三章 决策支持系统 课前复习 第一节 决策支持系统结构的分析 决策支持系统的结构形式 三部件结构、三系统结构、三库结构、四库结构 决策支持系统的结构比较 决策支持系统有多种结构形式,但主要是两种基本结构形式: (1)以“对话(人机交互)、模型、数据”三部件组成DSS。 (2)以“语言系统(LS)、问题处理系统(PPS)、知识系统(KS)”三系统
11、组成DSS。 “对话、模型、数据”三部件结构的优点 : ①明确了三部件之间关系 明确它们之间的接口关系和集成关系,便于决策支持系统的设计和关键技术的解决。 ②便于和其他系统的区别 它和“管理信息系统(MIS)”的区别在于DSS多了模型部件。它和“专家系统(ES)”的区别在于DSS中是以“模型、数据”部件进行数值计算为主体的系统,而ES是以定性知识进行推理为主体的系统。 “LS、PPS、KS”三系统结构的优点: ①突出了问题处理系统(PPS)的重要性。 在设计和开发DSS时,应该重点考虑决策问题的处理。 ②明确
12、了语言系统(LS)在人机交互中的作用。 人机交互是要通过语言系统来完成的。决策问题的形式化也要用LS来描述。 ③统一了知识的看法。 将数据、模型、规则看成是知识的不同表现形式。 决策支持系统的统一结构形式 三部件结构中的最大弱点,在于“人机交互”部件太简化。该部件应该是三系统中问题处理系统和语言系统、人机交互系统的综合部件。 把“人机交互部件”改为 “综合部件”更合适一些。 它具有对决策问题综合“多模型组合运行,大量数据库的存取,人机交互”为一个整体,形成实际决策支持系统。 “人机交互与问题综合系统(综合部件)”可理解为对实
13、际决策问题的集成处理与人机交互的综合作用。它包含的功能有: l 人机交互 l 控制模型的运行 l 多模型的组合运行 l 数值计算 l 数据处理 决策支持系统的语言系统的功能要求比较高,即它应具有:调用模型运行能力、数据库存取能力、数值运算能力、数据处理能力、人机交互能力等五种综合能力,我们称它为决策支持系统语言(DSS语言)。 DSS语言应是两类语言(数值计算语言和数据库语言)的综合。 第二节 数据库系统 数据管理技术的发展 l 人工管理(50年代中期) 数据不保存 没有数据管理软件 l 文件系统(60年代中期) 数据管理软件——文件管理系统
14、 面向单个应用,冗余度大、独立性差 l 数据库系统(60年代后期开始) 数据管理软件——数据库管理系统 面向组织,冗余度小、独立性好 1、数据库系统的组成、数据库管理系统 数据库系统一般由四部分组成: -数据库 -数据库管理系统 -数据库管理员 -用户和应用程序 数据库管理系统有四项主要功能: 1、描述数据库 描述数据的逻辑结构、存储结构等。 2、管理数据库 (1)控制整个数据库系统的运行; (2)进行数据检索、插入、删除和修改操作; (3)控制用户的并发访问; (4)检
15、验数据的安全、保密与完整性; 3、维护数据库 (1)控制初始数据的装入; (2)修改、更新、重组数据库; (3)恢复出现故障的数据库; 4、数据通信 组织数据的传输 2、数据库应用系统的设计和开发步骤 数据库应用系统的设计过程主要是: (1)系统需求分析 (2)概念结构设计 (3)逻辑结构设计 (4)物理结构设计 3、数据库应用 4、数据库系统在决策支持系统中的作用 第三节 人机交互与问题综合系统 人机交互系统 人机交互的三个元素: l 交互设备 计算机系统的输入输出设备 l
16、 交互软件 展示各种交互功能的核心 l 人的因素 用户操作模型 问题综合系统 问题综合系统在决策支持系统的统一结构形式中和人机交互系统结合在一起形成综合部件。 人机交互系统主要实现人机对话和对DSS的控制。 问题综合系统完成的任务是:在决策问题用DSS语言描述(形式化)后,完成对DSS问题的分析和求解。 决策支持系统的综合部件 (1)决策支持系统语言 决策支持系统既要达到综合模型部件和数据部件的作用,又要起到人机交互对话作用,是需要利用功能很强的语言来完成。 (2)综合部件功能 l 控制模型的运行 l 多模型的组合运行 l
17、 人机交互 l 数值计算和数据处理 第四节 模型库系统 模型库 模型库的概念 l 模型库的由来(模型应用水平的不断提高) 模型程序:即用即编;谁用谁编 模型程序包:结构简单;相互独立;数据不共享 模型库:共享;可重用;可管理;相关 l 模型库——具有一定组织结构的模型集合 由模型库管理系统进行管理 每个模型都具有辅助决策能力 多个模型能有效地组织成系统 多个模型的连接需要利用共享的数据库 模型库的组织和存储 模型库的存储需求 1个模型对应2~4个文件: 源程序文件 目标程序文件 模型说明文件 数据描述文件 模型库管理系统 模型的存储管理 (1)
18、模型的表示(文件形式) 程序文件(数学模型、数据处理模型) 数据文件(图形、图像等) (2)模型存储的组织结构 模型字典库 模型文件库 (3)模型的查询和维护 查询、增加、删除、修改需要: 模型字典库和文件库同时进行 基本概念 模型库管理系统的功能 模型库管理系统的语言体系 1. 模型管理语言MML (1)模型的存储管理-同时完成字典库和文件库的管理 (2)模型的查询和维护 2. 模型运行语言MRL (1)单模型的调用、运行-用命令语言完成 (2)模型的组合运行-用集成语言编制程序控制运行 3.数据接口语言DIL 模型程序通过接
19、口操作数据库 第五节 组合模型的决策支持系统 l 组合模型辅助决策是决策支持系统研究的内容。 l 它需要模型库提供共享模型和数据库提供共享数据。 l 其基础是多模型辅助决策系统。 多模型辅助决策系统 区域发展规划系统:区域发展规划问题是典型的多模型辅助决策系统。 l 区域:社会、经济、文化、生态环境的地域空间,如县、市、国家等都是区域。 l 规划:制定未来一定时期的目标、任务及实现方案。 l 区域发展规划:分析自身的优、劣势,对比其他区域状况,制定快速发展的目标和措施。 模型组合技术 模型的组合有多种方式,用逻辑形式表示有: l 模型间的关系为“与”(a
20、nd)关系 例如“模型1 and模型2” l 模型间的关系为“或”(or)关系 例如“模型3 or 模型4” l 模型间的关系为组合“闭包”(and|or)+ 关系 例如“模型1 and模型2”or“模型3 and 模型4”…… 模型组合的程序设计 决策支持系统程序与一般系统程序的比较 1、相同处 DSS的控制程序对模型的调用与一般系统主程序对子程序的调用在程序结构上是相似的。 2、不同处: (1)DSS中的“模型”是共享资源,同一模型可以被不同DSS程序所调用。 一般系统程序中的子程序(模块)只能被该系统主程序
21、调用,并隶属于它。它不能被别的系统主程序所调用。 (2)DSS中模型程序所使用的语言可以不同于DSS的控制程序。 一般系统的子程序(模块)和主程序的语言是一致的。 结论:DSS程序是利用模型程序和数据两个共享资源组建的。在本质上,DSS程序与一般系统程序是不一样的。 决策支持系统的决策支持 由多个模型组合而成的决策支持系统,在模型组合中,可以选择不同的模型、相同的数据构成不同的决策支持系统方案; DSS也可以选择相同模型、不同的数据构成不同的决策支持系统方案; DSS还可以选择不同的模型和不同的数据构成不同的决策支持系统方案。 决策支持系统要修改方案,只需修改综合部
22、件中控制的模型名以及该模型发送控制信息的程序地址。 决策支持系统的决策支持作用很容易在模型组合的控制程序中实现。 第四章 智能决策支持系统和智能技术的决策支持 第一节 智能决策支持系统概述 智能决策支持系统的概念 智能决策支持系统(Intelligent Decision Support Systems , IDSS)是:决策支持系统(DSS)与人工智能(Artificial Intelligent , AI)技术相结合的系统。 智能决策支持系统的结构 1、人工智能的决策支持技术 智能决策支持系统中包含了人工智能技术,与决策支持有关的人工智能技术主要有:专家系
23、统、神经网络、遗传算法、机器学习、自然语言理解等。 2.智能决策支持系统结构形式 1)基本结构 智能决策支持系统(IDSS)=决策支持系统(DSS)+人工智能(AI)技术 人工智能技术可以概括为:推理机+知识库 第二节 人工智能基本原理 逻辑推理-形式逻辑 形式逻辑是研究人的思维形式及其规律的科学。它是属“符号处理”范畴。 形式逻辑主要研究:形成概念、作出判断、进行推理。 1)概念:概念是反映事物的特有属性和它的取值。 2)判断:判断是对概念的肯定或否定。 3)推理:推理是从一个或几个判断推出一个新判断的
24、思维过程。 知识表示与知识推理 命题逻辑 举例: 1)如果a是偶数,那么a2是偶数 2)“人不犯我,我不犯人;人若犯我,我必犯人” 归结原理使用反证法来证明语句。即归结是从结论的非,导出已知语句的矛盾。 利用命题逻辑公式和谓词逻辑公式,把逻辑表达式化成合取范式、前束范式,再化成子句。一子句定义为由文字的析取组成的公式。 逆向推理是从目标开始,寻找以此目标为结论的规则,并对该规则的前提进行判断,若该规则的前提中某个子项是另一规则的结论时,再找以此结论的规则。 重复以上过程,直到对某个规则的前提能够进行判断。按此规则前提判断(“是”或“否”)得出结论的判断,由此回溯到上一
25、个 规则的推理,一直回溯到目标的判断。 搜索技术 搜索技术是人工智能的一个重要研究内容。智能技术体现在减少搜索树中的盲目搜索。 1.执行时间与n,n2,n3等成正比的算法,称为按多项式时间执行。 2.执行时间与2n,n!和nn等成正比的算法,称为按指数时间执行。 按多项式时间执行的算法,计算机是可以实现的。按指数时间执行的算法,计算机是不可能实现的。 1、基本搜索法 对搜索树的基本搜索法有两种思想,一是按广度优先展开搜索树的搜索方法,叫广度优先搜索法;一是按深度优先展开搜索树的搜索方法,叫深度优先搜索法。 (1)广度优先搜索法。 (2)深度优先搜索法。 2、生成测试法。
26、 3、爬山法。 4、启发式搜索。 5、博弈算法。 第三节 专家系统与智能决策支持系统 专家系统原理 专家系统是具有大量专门知识, 并能运用这些知识解决特定领域中实际问题的计算机程序系统。 专家系统是利用大量的专家知识,运用知识推理的方法来解决各特定领域中的实际问题。计算机专家系统这样的软件能够达到人类专家解决问题的水平。 产生式规则专家系统 产生式规则的推理机=搜索+匹配(假言推理) 在推理过程中,是一边搜索一边匹配。匹配需要找事实。 这个事实一是来自于规则库中别的规则,一是来自向用户提问。 在匹配时会出现成功或不成功,对于不成功的将引起搜索中的回溯和由一个分枝向另一个
27、分枝的转移,可见在搜索过程中包含了回溯。 专家系统与决策支持系统的集成 智能决策支持系统IDSS充分发挥了专家系统以知识推理形式解决定性分析问题的特点,又发挥了决策支持系统以模型计算为核心的解决定量分析问题的特点,充分做到定性分析和定量分析的有机结合。 IDSS中DSS和ES的结合主要体现在三个方面: 1. DSS和ES的总体结合。由集成系统把DSS和ES有机结合起来(即将两者一体化)。 2. KB和MB的结合。模型库中的数学模型和数据处理模型作为知识的一种形式,即过程性知识,加入到知识推理过程中去。 3. DB和动态DB的结合。DSS中的DB可以看成是相对静态的数据库,它
28、为ES中的动态数据库提供初始数据,ES推理结束后,动态DB中的结果再送回到DSS中的DB中去。 建模专家系统 智能决策支持系统实例 第四节 神经网络的决策支持 神经网络原理 神经元的学习规则是Hebb规则。 Hebb学习规则:若i与j两种神经元之间同时处于兴奋状态,则它们间的连接应加强,即: △Wij=aSiSj (a>0) 这一规则与“条件反射”学说一致,并得到神经细胞学说的证实。 设α=1,当Si=Sj=1时,△Wij=1, 在Si,Sj中有一个为0时,△Wij=0。 反向传播模型 神经网络专家系统及实
29、例 神经网络专家系统特点: 1. 神经元网络知识库体现在神经元之间的连接强度(权值)上。它是分布式存贮的,适合于并行处理。 2. 推理机是基于神经元的信息处理过程。它是以MP模型为基础的,采用数值计算方法。 3. 神经元网络有成熟的学习算法。感知机采用delta规则。反向传播模型采用误差沿梯度方向下降以及隐节点的误差由输出结点误差反向传播的思想进行的。 4. 容错性好。由于信息是分布式存贮,在个别单元上即使出错或丢失,所有单元的总体计算结果,可能并不改变。 确定系统框架-完成对神经元网络的拓朴结构设计: (1)神经元个数 (2)神经元网络层次 (3)网络单元的连接 确定神经
30、元的作用函数和阈值-作用函数用得较多的有两种: (1)阶梯函数 (2)S型函数 阈值的选取可为定值如qi=0或qi=0.5,或者进行迭代计算。 神经网络的容错性 第五节 遗传算法的决策支持 遗传算法(Genetic Algorithm,GA)是模拟生物进化的自然选择和遗传机制的一种寻优算法。它模拟了生物的繁殖、交配和变异现象,从任意一初始种群出发,产生一群新的更适应环境的后代。 这样一代一代不断繁殖、进化,最后收敛到一个最适应环境的个体上。 遗传算法对于复杂的优化问题无需建模和进行复杂运算,只需要利用遗传算法的算子就能寻找到问题的最优解或满意解。 遗传算法原理 1. 群
31、体中个体的编码 如何将问题描述成位串的形式,即问题编码。一般将问题的参数用二进制位(基因)编码构成子串,再将子串拼接起来构成“染色体”位串。 2. 适应值函数的确定 适应值函数(即评价函数)是根据目标函数确定的。适应值总是非负的,任何情况下总是希望越大越好。如果目标函数不是取最大值时,需要将它映射成适应值函数。 优化模型的遗传算法求解 优化模型的计算是遗传算法最基本的也是最重要的研究和应用领域之一。一般说来,优化计算问题通常带有大量的局部极值点,往往是不可微的、不连续的、多维的、有约束条件的、高度非线性的NP完全问题。 精确地求解优化问题的全局最优解一般是不可能的。 获取知识的
32、遗传算法
l 1980年,Smith采用遗传算法研制了一种分类器系统,这是遗传算法在机器学习中的重要应用系统。他使用单个字符串来表示一条规则。
l 分类器系统的规则形式如下:
l IF
33、的适应度低。 l 通过遗传规划算子对群体空间进行操作,通过选择算子,变异算子,交换算子等选择适应度高的个体进入下一代遗传, l 最终按照终止原则,输出算法计算的结果,即发现的公式。 第六节 机器学习的决策支持 机器学习概述 学习和解决问题是人类最重要的两个智能行为。 机器学习是让计算机模拟和实现人类的学习,获取知识。机器学习也是计算机具有智能的重要标志。 (1)R . S . Michalski认为:学习是构造或修改所经历的事物的表示。该观点强调知识的表示。 (2)学习是知识的获取。该观点强调知识获取。 (3)H . A . Simon认为:学习是系统在相似的任务中
34、做一些适应性变化,使得在下一次类似的任务中,做得更好。该观点强调学习的效果。 机器学习分类 学习过程的本质是学生(学习系统)把教师或环境(如书本)提供的信息转换成能够理解的形式记忆下来, 以便将来使用。 当前,国际上流行的机器学习分类方法主要有: 按应用领域分类(专家系统、问题求解、认知模拟);按获取知识的表示分类(逻辑表达式、产生式规则、决策树、框架、神经网络);按推理策略分类(演绎推理和归纳推理);按系统性分类(历史渊源、知识表示、推理策略、应用领域)。 建立模型的发现学习 BACON系统的思想是利用一些算子反复构造一些新的项,当这些项中有一
35、个是常数时,就得到概念:“项=常数”。 第五章 数据仓库与数据挖掘的决策支持 第一节 数据仓库、数据仓库系统及应用 1.数据仓库的基本原理 数据仓库的概念、结构,数据集市,元数据 数据仓库是面向主题的、集成的、稳定的,不同时间的数据集合,用于支持经营管理中决策制定过程。 近期基本数据:是最近时期的业务数据,是数据仓库用户最感兴趣的部分,数据量大。 历史基本数据:近期基本数据随时间的推移,由数据仓库的时间控制机制转为历史基本数据。 轻度综合数据:是从近期基本数据中提取出的,这层数据是按时间段选取,或者按数据属性(attributes)和内容(contents)进行综合。
36、 高度综合数据层:这一层的数据是在轻度综合数据基础上的再一次综合,是一种准决策数据。 n 数据仓库工作范围和成本常常是巨大的。开发数据库是代价很高、时间较长的大项目。 n 提供更紧密集成的数据集市就应运产生。 n 目前,全世界对数据仓库总投资的一半以上均集中在数据集市上。 n 数据集市(Data Marts)是一种更小、更集中的数据仓库,为公司提供分析商业数据的一条廉价途径。 n Data Marts是指具有特定应用的数据仓库,主要针对某个应用或者具体部门级的应用,支持用户获得竞争优势或者找到进入新市场的具体解决方案。 元数据是数据仓库的重要组成部分。 元数据描述了数据仓
37、库的数据和环境,即关于数据的数据(meta data) 元数据包括四种元数据。 2、数据仓库系统 数据仓库系统结构、数据仓库的存储 数据仓库应用是一个典型的客户/服务器(C/S)结构形式。 数据仓库采用服务器结构,客户端所做的工作有:客户交互、格式化查询、结果显示、报表生成等。 服务器端完成各种辅助决策的SQL查询、复杂的计算和各类综合功能等。 现在,越来越普通的一种形式是三层C/S结构形式,即在客户与数据仓库服务器之间增加一个多维数据分析(OLAP)服务器。 数据仓库存储采用多维数据模型。 3、简单阐述一下数据仓库在决策支持中的应用
38、 第二节 数据挖掘及其应用 1、数据挖掘的概念 知识发现(KDD):从数据中发现有用知识的整个过程。 数据挖掘(DM):KDD过程中的一个特定步骤,它用专门算法从数据中抽取模式(patterns)。 KDD过程定义:从大量数据中提取出可信的、新颖的、有用的并能被人理解的模式的高级处理过程。 “模式”可以看成是“知识”的雏形,经过验证、完善后形成知识。 2、数据挖掘的方法和技术 (一)归纳学习方法 分为两大类:信息论方法(决策树方法)和集合论方法。 1、信息论方法(决策树方法) 利用信息论的原理建立决策树或者是决策规则树。
39、 (1)ID3方法:Quiulan研制的ID3方法是利用信息论中互信息建立决策树。 (2)IBLE方法:是利用信息论中信道容量,寻找数据库中信息量大的多个字段的取值建立决策 2、集合论方法 (1)粗糙集(Rough Set)方法 对数据库中的条件属性集与决策属性集建立上下近似关系,对下近似集合建立确定性规则,对上近似集合建立不确定性规则(含可信度)。 (2)关联规则挖掘 在交易事务数据库中,挖掘出不同商品集的关联关系,即发现哪些商品频繁地被顾客同时购买。 (3)覆盖正例排斥反例方法 它是利用覆盖所有正例,排斥所有反例的思想来寻找规
40、则。 比较典型的有AQ11方法,AQ15方法以及AE5方法。 (二)仿生物技术 仿生物技术典型的方法是神经网络方法和遗传算法。 1、神经网络方法:包括:前馈式网络、反馈式网络、自组织网络等多个神经网络方法。 2、遗传算法:这是模拟生物进化过程的算法。 它由三个基本算子组成: 繁殖(选择)、交叉(重组)、变异(突变) 遗传算法起到产生优良后代的作用,经过若干代的遗传,将得到满足要求的后代(问题的解)。 (三)公式发现 在工程和科学数据库中对若干数据项(变量) 进行一定的数学运算,求得相应的数学公式。 1
41、.物理定律发现系统BACON BACON发现系统完成了物理学中大量定律的重新发现。 2.经验公式发现系统FDD 我们研制了FDD发现系统,寻找由数据项的初等函数或复合函数组合成的经验公式。 (四)统计分析方法 利用统计学原理通过对总体中的样本数据进行分析得出描述和推断该总体信息和知识的方法。 (五)模糊数学方法 利用模糊集合理论进行数据挖掘,如模糊聚类、模糊分类等。 (六)可视化技术 利用可视化技术分析数据库,找到潜在的有用信息。 3、数据挖掘的知识表示 主要有四种:规则、决策树、浓缩数据、公式。 规则知识由前提
42、条件和结论两部分组成,前提条件由字段项(属性)的取值的合取(与Ù)和析取(或Ú)组合而成。结论为决策字段项(属性)的取值或者类别组成。 4、数据挖掘在决策支持中的应用 数据挖掘的决策支持分类有: 关联分析、时序模式、聚类、分类、偏差检测、预测。 关联分析: 若两个或多个数据项的取值之间重复出现且概率很高时,它就存在某种关联,可以建立起这些数据项的关联规则。 时序模式: 通过时间序列搜索出重复发生概率较高的模式。这里强调时间序列的影响。 聚类:在数据库中找出一系列有意义的子集,即类。 分类:对数据库中的类,找出该
43、类别的概念描述规则。 偏差检测: 在数据库中找出异常数据。 预测:利用历史数据找出变化规律的模型,并用此模型预测未来。 第六章 综合决策支持系统 1.传统决策支持系统的概念 l 1980年Sprague提出了决策支持系统三部件结构; l 1981年Bonczak等提出了决策支持系统三系统结构; l 根据以上两种结构的优缺点建立起来的统一的DSS结构; l 20世纪90年代初,决策支持系统与专家系统结合起来,形成了智能决策支持系统(IDSS)。 DSS的关键技术: (1)模型库系统的设计和实现。 (2)部件接口。部件接口包括对数据部件的数据的存取,对
44、模型部件的模型的调用和运行,以及对知识部件的知识完成推理。 (3)系统综合集成。通过集成语言完成对各部件的有机综合,形成一个完整的系统。 2.数据仓库与新决策支持系统 数据仓库技术 管理大量数据 数据仓库中的数据量是10GB或100GB级的,数据仓库开发需要满足处理大量数据的需求。 数据的高效装入和数据压缩 装入数据:装入的数据量很大,同时也要装入高效的索引。(2)数据压缩:DW数据量大需要进行数据的压缩。 存储介质的管理 数据仓库中的数据量是10GB或100GB级的,数据仓库开发需要满足处理大量数据存储介质的需求。 元数据管
45、理:没有一个好的元数据来运作的话,DSS分析员的工作就非常困难。 数据仓库语言 数据仓库语言可有效管理数据仓库中的数据和快速、高效地访问数据仓库中的数据。 高效索引 数据仓库不仅能够方便地支持新索引的创建和装入,而且要能够高效地访问这些索引。 数据仓库的特殊管理 (1)复合键码:能够支持复合键码。 (2)变长数据:有效管理变长数据的能力。 (3)快速恢复:快速地恢复数据仓库表。 多维DBMS和数据仓库 多维数据库管理系统(多维DBMS)提供了用多种方法对数据进行切片、分割,动态地考查汇总数据和细节数据的关系,
46、非常适合DSS环境。 数据仓库中的细节数据为多维DBSM提供了数据源,数据要定期从数据仓库中导入到多维DBMS中去,为DSS用户服务。 3.传统决策支持系统与新决策支持系统的比较 传统决策支持系统的特点 (1)用模型和模型的组合来辅助决策 多模型的组合扩大了模型辅助决策的能力。多模型的组合的实现是靠数据或数据处理来完成模型间的连接。 多模型的组合使模型的范围由数学模型扩展为数据处理模型等。 人机交互的手段丰富了多模型组合辅助决策的效果,也为人控制多模型的组合提供了支持手段。 (2)用知识推理进行定性分析 知识推理的专家系统
47、主要是进行定性分析。它结合到决策支持系统中形成智能决策支持系统。 实质上完成了定量分析和定性分析相结合的辅助决策方式。 新决策支持系统的特点: (1)数据仓库和联机分析处理的数据组织方式是多维数据数据仓库的数据组织为空间的多维结构形式。 (2)数据仓库是为决策分析服务的数据仓库可以提供综合信息和时间趋势信息等辅助决策信息。 (3)联机分析处理提供多维分析手段 (4)数据挖掘是从数据中挖掘出隐藏知识 4.综合决策支持系统结构和原理 数据仓库(DW)实现对决策主题数据的存储和综合。 联机分析处理(OLAP)实现多维数据分析。 数据挖掘(DM)能挖掘数据仓库中的知识。
48、 DW+OLAP+DM形成的新决策支持系统是利用数据资源辅助决策的。 新决策支持系统主要针对商场、银行、顾客、销售等获取企业外部社会上的信息。 传统决策支持系统是以模型库(MB)和知识库(KB)为基础的。 数学模型的优化模型辅助决策的效果很明显。知识推理具有较强的智能性。 传统决策支持系统充分发挥模型资源的辅助决策作用和知识资源辅助决策作用。 两个决策支持系统是完全不同的辅助决策方式,两者不能相互代替,应该是相互结合。 通过两个决策支持系统的结合能充分发挥数据、模型、知识这三种不同的决策资源,获取企业或组织的内部和外部相互补充的信息和知识,才能为决策者提供更全面,更广泛和更有效的辅
49、助决策信息和知识。 把数据仓库(DW)、联机分析处理(OLAP)、数据挖掘(DM)、模型库(MB)、数据库(DB)、知识库(KB)结合起来形成的决策支持系统: 将传统决策支持系统和新决策支持系统结合起来的决策支持系统是更高级形式的决策支持系统,称为综合决策支持系统(Synthetic Decision Support System, SDSS)。 综合决策支持系统体系结构包括三个主体: 第一个主体是模型库系统和数据库系统的结合,它是决策支持的基础,它为决策问题提供定量分析(模型计算)的辅助决策信息。 第二个主体是数据仓库和OLAP的结合,它从数据仓库中提取综合数据和信息,这些数据和
50、信息反映了大量数据的内在本质。 第三个主体是知识库与推理机和数据挖掘的结合。 5.网络环境下的综合决策支持系统体系 客户/服务器结构与数据库服务器 计算机联网可以使得某些服务在服务器系统上执行,而另一些任务在客户机系统上执行,这种工作任务的划分,形成了客户机/服务器系统。 客户机/服务器(Client/Server, C/S),由服务器提供应用服务,多台客户机进行连接。 当前的实际应用中多数服务器就是一台数据库服务器而客户端就是编写的客户软件,通过ODBC或ADO同数据库服务器通信。组成一个应用系统。 在当前Internet/Intranet领






