人工智能期末考试复习提纲(工硕).doc

资源描述

1、人工智能期末考试复习范围第1部分绪论1-1. 什么是人工智能？试从学科和能力两方面加以说明.答：从学科方面定义：人工智能是计算机科学中涉及研究、设计和应用智能机器的一个分支。它的近期目标在于研究用机器来模拟和执行人脑的某些智力功能，并开发相关理论和技术从能力方面定义：人工智能是智能机器所执行的通常与人类智能有关的智能行为，如判断、推理、证明、识别、感知、理解、通信、设计、思考、规划、学习和问题求解等思维活动。1-2. 在人工智能的发展过程中，有哪些思想和思潮起了重要作用？答：1）数理逻辑和关于计算本质的新思想,提供了形式推理概念与即将发明的计算机之间的联系;2） 1956年第一次人工

2、智能研讨会召开，标志着人工智能学科的诞生；3）控制论思想把神经系统的工作原理与信息理论、控制理论、逻辑以及计算联系起来，影响了许多早期人工智能工作者，并成为他们的指导思想；4）计算机的发明与发展；5）专家系统与知识工程；6）机器学习、计算智能、人工神经网络和行为主义研究,推动人工智能研究的近一步发展。1-3. 为什么能够用机器（计算机）模仿人的智能?答:物理符号系统的假设：任何一个系统，如果它能够表现出智能,那么它就必定能执行输入符号、输出符号、存储符号、复制符号、建立符号结构、条件迁移6种功能.反之，任何系统如果具有这6种功能，那么它就能够表现出智能（人类所具有的智能)。物理符号系统

3、的假设伴随有3个推论。推论一：既然人具有智能，那么他（她)就一定是各物理符号系统；推论二：既然计算机是一个物理符号系统,它就一定能够表现出智能;推论三：既然人是一个物理符号系统，计算机也是一个物理符号系统,那么我们就能够用计算机来模拟人的活动。1-4. 人工智能的主要研究内容和应用领域是什么?其中,哪些是新的研究热点？答：研究和应用领域：问题求解（下棋程序），逻辑推理与定理证明（四色定理证明），自然语言理解,自动程序设计,专家系统，机器学习,神经网络,机器人学（星际探索机器人），模式识别（手写识别,汽车牌照识别,指纹识别）,机器视觉(机器装配，卫星图像处理)，智能控制,智能检索，智能调度与指挥

4、（汽车运输高度，列车编组指挥),系统与语言工具。新的研究热点：概率图模型(隐马尔可夫模型、贝叶斯网络）,统计学习理论（）&支持向量机（）,数据挖掘与知识发现（超市市场商品数据分析），人工生命。1-5. 人工智能的发展对人类有哪些方面的影响?试结合自己了解的情况和理解，从经济、社会和文化等方面加以说明？答：1、人工智能对经济的影响.人工智能系统的开发和应用，已为人类创造出可观的经济效益，专家系统就是一个例子。随着计算机系统价格的继续下降，人工智能技术必将得到更大的推广，产生更大的经济效益。2、人工智能对社会的影响。劳务就业问题；社会结构变化；思维方式与观念的变化；心理上的威胁；技术失控的危险.3

5、、人工智能对文化的影响.改善人类知识；改善人类语言;改善文化生活；1-6. 试评述人工智能的未来发展。答：人工智能的未来发展主要可以概括为更新的理论框架，更好的技术集成，更成熟的应用方法。而在具体的应用方面，我认为主要有以下两个发展方向: 1、计算机能直接而人类大脑实现人机交流.借助以上技术，人类可以用思维控制自己想看到的，想听到的,使媒体技术中的感官媒体更真实化，对虚拟的事物不仅可以看见听见,更可以摸得，闻得着。同时电脑可以进一步辅助人类做出一定的判断，储存大量信息,甚至可以以身体为媒介,执行电脑程序，是人类更快的学会各种技巧,掌握更多知识。同时，提高了生物验证的渠道，比如利用DNA染色体作

6、为密码的载体，相信是很难伪造的。2、电脑拥有机器思维:机器学会人类的思维方式，帮助人更好的思考问题。第2部分知识表示2-1. 什么是知识？知识的要素有哪些？知识的表示方法有哪些？答:知识是经过消减、塑造、解释和转换的信息。简单地说,知识是经过加工的信息.知识是由特定领域的描述、关系和过程组成的。知识是事实、信念和启发式规则.从知识库的观点看，知识是某领域中所涉及的各有关方面的一种符号表示。知识的要素:事实、规则、控制和元知识。知识的表示方法有：状态空间法、问题归纳法、谓词逻辑法、语义网路法和框架表示法2-2. 谓词逻辑法、产生式表示法、框架表示法和语义网络表示法的要点是什么？它们有何本质上的

7、联系及异同点? 答:谓语逻辑法是采用谓词合式公式和一阶谓词演算把要解决的问题变为一个有待证明的问题，然后采用消解定理和消解反演来证明一个新语句是从已知的正确语句导出的，从而证明这个新语句也是正确的状态空间法是基于解答空间的问题表示和求解方法，是以状态和操作符为基础的。问题归约法是从目标（要解决的问题）出发逆向推理，建立子问题以及子问题的子问题,直至最后把初始问题归约为一个平凡的本原问题集合。谓语逻辑法是采用谓词合式公式和一阶谓词演算把要解决的问题变为一个有待证明的问题，然后采用消解定理和消解反演来证明一个新语句是从已知的正确语句导出的,从而证明这个新语句也是正确的语义网络法是用“节点”代替概

8、念,用节点间的“连接弧”代替概念之间的关系.语义网络表示法的优点：结构性、联想性、自然性。2-3. 如何用谓词逻辑法表示知识？（见课本例题)例题：所有学生都穿彩色制服.任何整数或者为正数或者为负数。自然数都是大于零的整数。解：首先定义谓词如下： Student（x)：x是学生 Uniform（x，y)：x穿yN(x）：x是自然数I(x）:x是整数P（x）:x是正数Q(x)：x是负数L(x)：x大于零用谓词公式分别表示如下： (x）（Student(x)Uniform(x，color）) (x）(I(x)P(x)VQ(x）) （x）(N(x)-L（x）I（x)2-4. 什么是产生式规则？

9、产生式系统由哪些部分组成?说明各部分的功能.答:产生式规则：1 确定性和不确定性规则知识的产生式表示确定性规则知识表示方法用产生式的基本形式PQ 或 IF P THEN Q不确定性规则知识表示方法用PQ (可信度）或者 IF P THEN Q (可信度)2 确定性和不确定性事实性知识的产生式表示确定性事实性知识表示方法一般用三元组（对象,属性，值）或（关系,对象1，对象2）来表示不确定性事实性知识表示方法一般用四元组(对象，属性,值，不确定度量值) 或（关系，对象1，对象2，不确定度量值）产生式系统组成：产生式系统通常由规则库、数据库和推理机三个基本部分组成。推理机数据库规则库规则库用于

10、描述某领域内知识的产生式集合，其中规则是以产生式表示,库中包含着将问题从初始状态转换成解状态的变换规则。规则库是专家系统的核心。数据库又称为事实库，用来存放输入事实、外部数据库输入的事实以及中间结果和最后结果，数据库中的内容是动态变化的。推理机又称控制系统，由一组程序组成，用来控制协调规则库与数据库的运行，包含推理方式与控制策略。控制策略作用是确定选用什么规划或如何运用规则。从选择规则到执行操作要分三步完成：匹配、冲突解决和操作2-5. 说明产生式系统推理机的推理方式及推理过程。答:产生式系统推理机的推理方式有正向推理、反向推理和双向推理三种正向推理是从已知事实出发，通过规则求得结论，也称数据

11、驱动方式或自底向上的方式，过程如下:1 规则集中的规则与数据库中的事实进行匹配，得到匹配的规则集合。2 使用冲突解决算法，从匹配规则集合中选择一条规则作为启用规则。3 执行启用规则的后件,将该启用规则的后件送入数据库。重复这个过程直至达到目标.反向推理是从目标（作为假设）出发,反向使用规则，求得已知事实,也称目标驱动方式或称自顶向下的方式，过程如下：1. 规则库中的规则后件与目标事实进行匹配，得到匹配的规则集合。2. 使用解决算法，从匹配规则集合中选择一条规则作为启用规则.3. 将启用规则的前件作为子目标。重复这个过程直至各子目标均为已知事实成功结束。双向推理是一种既自顶向下、又自底向上的推理

12、方式，推理从两个方向同时进行，直至某个中间界面上两方向结果相符便成功结束。2-6. 如何用框架表示法表示知识?如何用语义网络法表示知识？（见课本例题）框架表示法表示知识举例：描述“教师”的框架框架名：教师类属：工作:范围（教学，科研）默认：教学性别：(男，女）学历：（中专,大专) 类别：（，中学教师，大学教师）语义网络法表示知识举例：IS A PART OF有ISA计算机人我PC/PIV机PC机计算机硬盘显示器CPU内存ISAISAISA第3部分经典逻辑推理3-1. 什么是推理？推理的任务是什么？可分为哪几类(按推理的逻辑基础划分、所利用的知识划分、推出的结论的单调性划分)？答：推

13、理：按某种策略由已知判断推出另一判断的思维过程推理的任务：从一种判断推出另一种判断按判断推出的途径（逻辑基础)来划分：演绎推理、归结推理、默认推理按所利用的知识划分：确定性推理、不确定性推理按推出的结论的单调性划分：单调推理、非单调推理3-2. 什么是置换？什么是合一?什么是归结？答：置换是形如的有限集合。其中是项，是变元；表示用替换，不允许与相同，也不允许变元循环出现在另一个中。合一：设有公式集，若存在一个代换，使得则称为公式集 F 的一个合一，且称是可合一的。归结：设与是子句集中的任意两个子句，如果中的文字与中的文字互补，那么从和中分别消去和

14、，并将二个子句中余下的部分析取，构成一个新子句，则称这一过程为归结，称为和的归结式，称和为的亲本子句。 3-3. 什么是子句?把谓词公式化为子句集有哪些步骤? 答：任何文字的析取式称为子句。谓词公式化为子句集共有9个步骤1)消去蕴涵符号;2）减少否定符号的辖域；3)对变量标准化；4)消去存在量词5)化为前束形6）把母式化为合取范式7)消去全称量词8）消去连词符号9）更换变量名称3-4. 掌握把谓词公式化为子句集的方法。如把下列句子变换成子句形式：（x)P（x)( y）p(y)p(f(x，y)）( y)Q(x，y）P(y）答：3-5. 简述用归结法证明定理的过程（消解反演求解过

15、程）。（见课本例题)P94 17 20 答：归结法证明定理的过程： 1）否定结论G，得到G; 2）将前提条件AAAn和G化为子句集S； 3）应用归结原理，反复对子句集S进行归结，若能归结出空子句，则证明子句集S的不可满足性，从而证明了公式AAAn G为真。 P95第17题：证明：先将问题用谓词描述如下：（x）（Pass(x，computer） Win(x，prize）) Happy（x)）（x) (y）(Study（x）Lucky（x) Pass（x,y）Study(zhang) Lucky（zhang）（x)（ Lucky（x） Win（x,prize）)结论“张是快乐的”的否定 Happ

16、y(zhang）（3分)将上述公式转化为子句集如下：（1）Pass（x，computer) Win(x,prize) Happy（x）(2) Study（y) Pass(y，z）(3) Lucky（u） Pass（u，v）(4） Study(zhang）(5） Lucky（zhang)(6） Lucky（w) Win(w,prize)zhqang/u,computer/vzhqang/xW/xPass(x,computer) Win(x,prize) Happy(x)Lucky(w) Win(w,prize)Pass(w,computer) Happy(w) Lucky(w)Happy(zha

17、ng)Pass(zhang,computer) Lucky(zhang)Lucky(zhang)Pass(zhang,computer)Lucky(u) Pass(u,v)Lucky(zhang)Lucky(zhang)NIL（7) Happy（zhang) (3分）P95第20题：设已知：(1) 能阅读的人是识字的；(2）海豚不识字；(3) 有些海豚是很聪明的. 证明：有些很聪明的人并不识解：第一步,先定义谓词，设R（x)表示x 是能阅读的；K（y)表示y 是识字的；W(z）表示z 是很聪明的；第二步，将已知事实和目标用谓词公式表示出来能阅读的人是识字的：（ x）(R(x)K(x)海豚

18、不识字：( y）(K (y）有些海豚是很聪明的:( z)W(z）有些很聪明的人并不识字：( x）（W(z）K(x)）第三步,将上述已知事实和目标的否定化成子句集:R(x）K（x)K （y）W(z)(4分)W（z)K(x）第四步,用归结演绎推理进行证明3-6. 如何通过归结法求取问题的答案? P95 18 19 答：归结法求取问题的步骤如下：1）把已知前提条件用谓词公式表示出来，并且化为子句集S；2）把待求解的问题用谓词公式表示出来，然后将其否定，并与谓词公式ANSWER构成析取式，ANSWER是一个为了求解问题而专设的谓词，并且其変元必须与谓词公式中的変元一致；3）将2）中的析取式化为子

19、句集，并且将该子句集并入到子句集S中。得到子句集S；4）对子句集S应用归结原理进行归结。P95第18题：定义谓词： p （ x ）： x 作案。由五个侦察员的话为真,有 P （ z ） p （ q ）（ 1 ) P ( q ） p （ s ）( 2 ） P （ s ） p ( l ）（ 3 ） p （ z ）p （ s ）（ 4 ） p （ q ）p （ l ）（ 5 ）把结论的否定加入结论的否定的否定的子句中去，得： p （ x ) P （ x )（ 6 ) 因为这些全都是子句,所以化为子句集的步骤可以省略了. （ 1 )，( 4 ）归结得： p ( q ) p （ s ）( 7 )

20、（ 2 ）,（ 7 )归结得： p ( q ） ( 8 ) 即：钱是盗窃犯。（ 5 )，( 8 ）归结得：p （ l ）( 9 ）李不是盗窃犯。（ 3 )，（ 9 )归结得： p(s) （10）孙是盗窃犯。( 4 ),（ 10 ）归结得：p （ z ）赵不是盗窃犯。所以，钱和孙是盗窃犯。 P95第19题：看附件3-7. 与/或形演绎推理有哪几种推理方式? 简述推理过程（见课本例题）P95 21 22答：与/或形演绎推理分为正向演绎、逆向演绎和双向演绎推理。与/或正向演绎推理过程如下：1）用与/或树将已知事实表示出来;2）用F规则的左部和与/或树的叶结点进行匹配，并将匹配成功的

21、F规则加入大与/或树中；3）重复步骤2），直至产生一个含有目标结点的一致解图。与/或逆向演绎推理过程如下：1）用与/或树将求解目标表示出来；2）用B规则的右部和与/或树的叶结点进行匹配，并将匹配成功的B规则加入大与/或树中;重复步骤2）,直至产生一个含有已知事实结点的一致解图。P95第21题：看附件第4部分不确定推理4-1. 研究不确定性推理有何意义？有哪几种不确定性？答：不确定性推理是一种建立在非经典逻辑基础上的基于不确定性知识的推理,它从不确定性的初始证据出发，通过运用不确定性知识，推出具有一定程度的不确定性的和合理的或近乎合理的结论. 研究的意义是：为了处理不确定性信息，人们发展

22、了各种数学工具和方法。如模糊集理论,贝叶斯信念网络，DS证据理论和粗集理论。这些理论和方法均是为了处理特定的不确定性信息而发展起来的。它们还为当前数据挖掘和知识发现提供了强有力的支持. 不确定性推理大类别上分为模型方法和控制方法.模型方法下有数值方法和非数值方法；数值方法包括概率统计方法、模糊推理方法、粗糙集方法；概率统计方法下细分为绝对概率方法、贝叶斯方法、证据理论方法、HMM方法、可信度方法；非数值方法下又包括发生率计算。控制方法下有：相关性制导回溯、机缘控制、启发式搜索等4-2. 在什么情况下需要采用不确定推理 ?答：一般推理方法在许多情况下，往往无法解决面临的现实问题，因而需要应用不确

23、定性推理等高级知识推理方法，包括非单调推理、时序推理和不确定性推理等.4-3. 简述概率推理方法和主观Bayes推理方法。会运用概率方法和主观贝叶斯方法推理（见4.3节和4。4节的例题) 答：概率推理方法设有如下产生式规则: IF E THEN H 其中,E为前提条件，H为结论，具有随机性。根据概率论中条件概率的含义，我们可以用条件概率P(H|E）表示上述产生式规则的不确定性程度，即表示为在证据E出现的条件下,结论H 成立的确定性程度. 对于复合条件 E = E1 AND E2 AND AND En 可以用条件概率P(H|E1,E2，En)作为在证据出现时结论的确定程度。主观Bayes推

24、理方法：在主观Bayes方法中，知识是用产生式规则表示的，具体形式为 IF E THEN (LS，LN） H (P（H)其中（1）E 是该知识的前提条件。它既可以是一个简单条件,也可以是复合条件。（2）H 是结论。P(H）是 H 的先验概率，它指出在没有任何证据情况下的结论 H 为真的概率，即 H 的一般可能性。其值由领域专家根据以往的实践及经验给出。（3）（LS，LN）为规则强度。其值由领域专家给出。LS，LN相当于知识的静态强度.LS=P（E|H)P（EH) LN=P（E|H）P（E|H）4-4. 在主观Bayes方法中，请说明LS和LN的意义。答：LN表示必要性因子，它表示E 对的支持程

25、度.LS表示充分性因子，它表示E 对H 的支持程度。4-5. P126 设计题 1， 2设计题第一题请参照课本P102103页例4。3.1与例4.3.2设计题第二题可参照以下例题或课本P108页例4。4。1：设有如下推理规则 r1： IF E1 THEN (100， 0.1) H1 r2: IF E2 THEN (50, 0.5） H2 r3： IF E3 THEN （5, 0.05） H3且已知P(H1）=0.02, P(H2）=0。2, P（H3)=0.4，请计算当证据E1,E2,E3存在或不存在时P(Hi | Ei）或P(Hi Ei）的值各是多少（i=1， 2， 3）？解：(1）当

26、E1、E2、E3肯定存在时，根据r1、r2、r3有P（H1 | E1) = （LS1 P（H1）) / （LS11） P(H1)+1） = （100 0.02） / (（100 1） 0。02 +1) =0。671P(H2 | E2) = (LS2 P(H2) / （(LS2-1） P（H2）+1) = （50 0.2） / （50 1) 0。2 +1） =0。9921P（H3 E3) = (LS3 P（H3) / (LS31) P（H3)+1） = (5 0。4) / (（5 -1) 0。4 +1) =0.769 (2）当E1、E2、E3肯定不存在时，根据r1、r2、r3有P（H1 | E

27、1) = (LN1 P（H1） / （LN11） P(H1)+1） = (0.1 0。02) / (0.1 1） 0.02 +1） =0。002P(H2 | E2) = (LN2 P（H2)） / (LN21) P（H2）+1) = （0。5 0。2） / (（0。5 1) 0。2 +1) =0。111P（H3 | E3) = (LN3 P(H3)） / (（LN3-1) P（H3)+1) = （0。05 0.4） / （0。05 1) 0。4 +1) =0.032第5部分搜索问题求解5-1 说明用状态空间法求解问题的过程，基本的求解方法有哪些？答:求解问题过程:1)将所要求的问题表示成状态

28、空间，问题的解就在状态空间中2)根据给定的条件，在状态空间中搜索出目标状态，从而求得问题的解基本的求解方法有： 1)状态空间的穷搜索法a，广度优先搜索算法 b,深度优先搜索算法。 2)启发式搜索法a,图启发式搜索算法A、b，图启发式搜索算法A5-2什么是盲目搜索?启发式搜索法的基本思想是什么?评估函数如何定义？评估函数的作用是什么？答：盲目搜索：指从当前状态到目标状态需要走多少步，或者每条路径的花费并不知道，所能做的只是可以区分出哪个是目标状态.因此它一般是按预定的搜索策略进行搜索，没有考虑到问题本身的特性,所以具有很大的盲目性,效率不高，不便于复杂问题的求解。启发式搜索法的基本思想:是在搜

29、索过程中加入了与被解问题有关的启发性信息(特征)，用于指导搜索朝着有希望至达目标结点的的方向前进，加速问题的求解并找到最优解.只要知道问题的部分状态空间就可以求解，效率高。评估函数定义：f(n)=g(n)+h(n）这里个g(n）表示迄今为止搜索已产生的从初始结点S到结点n的实际代价，h(n)表示从结点n到目标结点的估计代价，h（n）称为启发函数，它体现了搜索的启发信息。评估函数的作用: 估计待扩展各结点在问题求解中的价值。5-3 什么是问题归约法？与或图的作用是什么？为什么应用问题规约得到的状态空间可表示为与或图?答：问题归约法把复杂的问题变换为若干需要同时处理的较为简单的子问题后再加以分

30、别求解:只有当这些子问题全部解决时，问题才算解决,问题的解答由子问题的解答联合构成。与或图的作用是可以方便地把问题归约为子问题替换集合。5-4 说明博弈树搜索的极大极小过程、a-b过程？P150 6 答：参照以下例题：设有如图所示的博弈树，其中最下面的数字是假设的估值,请对该博弈树作如下工作:(1）计算各节点的倒推值；(2) 利用-剪枝技术剪去不必要的分枝。博弈树305-336-2354-3068-3369S0ABCDEFGHIJKLNM 解：各节点的倒推值和剪枝情况如下图所示：倒推值和剪枝情况305-336-2354-3068-336000-39334444-366S0ABCDEFGHI

31、JKMNL第6部分机器学习6-1 什么是学习和机器学习？为什么要研究机器学习?答：1)机器学习是研究如何使用机器来模拟人类学习活动的一门学科。即：机器学习是一门研究机器获取新知识和新技能,并识别现有知识的学问。2）机器学习是人工智能的主要核心研究领域之一, 也是现代智能系统的关键环节和瓶颈。研究机器学习的原因:1) 一个没有学习功能的系统能被称具有智能的系统.2)来自生物、金融与网络等各领域的数据,迫切需要分析或建立模型。6-2 试述机器学习系统的基本结构，并说明各部分的作用。答:机器学习系统的基本结构：环境学习知识库执行环境向系统的学习部分提供某些信息，学习部分利用这些信息修改知识库，以增

32、进系统执行部分完成任务的效能，执行部分根据知识库完成任务,同时把获得的信息反馈给学习部分。6-3 试说明归纳学习的模式和学习方法。答：归纳学习的一般模式为：给定:1）观察陈述（事实）F,用以表示有关某些对象、状态、过程等的的顶知识；2）假定的初始归纳断言（可能为空）;3)背景知识,用于定义有关观察陈述、候选纳断言以及任何相关问题领域知识、假设和约束，其中包括能够刻画所求归纳断言的性质的优先准则.求：归纳断言（假设）H,能重言蕴涵或弱蕴涵观察陈述，并满足背景知识。假设H永真蕴涵事实F,说明F是H的逻辑推理，则有: H IF（读作H特殊化为F)或者F IH(读作F一般化或消解为H）这里，从H推导到

33、F时演绎推理，因此是保真的；而从事实F推导出假设H是归纳推理，因此不是保真的,而是保假的。6-4 简述概念学习的基本过程，请结合例子说明之。P181 设计题 2这题还未找到相应答案，知道答案的请公布出来，谢谢！6-5 简述决策树表示方法及其使场合；在构造决策树的过程中，测试属性的选取采用什么原则？如何实现? P181 设计题 1答:决策树表示方法：1)通过把实例从根节点排列到某个叶子节点来分类实例。2）叶子节点即为实例所属的分类3）树上每个节点说明了对实例的某个属性的测试4)节点的每个后继分支对应于该属性的一个可能值决策树学习的适用问题: 1)适用问题的特征a）实例由“属性值”对表示b)目标函

34、数具有离散的输出值c)可能需要析取的描述d）训练数据可以包含错误e）训练数据可以包含缺少属性值的实例 2)问题举例a）根据疾病分类患者b）根据起因分类设备故障c)根据拖欠支付的可能性分类贷款申请 3）分类问题a)核心任务是把样例分类到各可能的离散值对应的类别测试属性的选取采用原则： 1）信息增益a)用来衡量给定的属性区分训练样例的能力b）ID3算法在增长树的每一步使用信息增益从候选属性中选择属性 2）用熵度量样例的均一性熵刻画了任意样例集的纯度P181 设计题 1请参照课本P164-165课件上的例题如下：第7部分数据挖掘7-1. 什么是知识发现？说明知识发现、数据挖掘的联系与区别。数据挖掘

35、的定义，什么是知识发现？说明知识发现、数据挖掘的联系与区别.答：知识发现是用数据库管理系统来存储数据,用机器学习的方法来分析数据，挖掘大量数据背后隐藏的知识，称为数据库中的知识发现. 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程.与之相似的概念称为知识发现. 联系与区别是：1）知识发现被看成数据挖掘的一个特例； 2）数据挖掘是知识发现过程的一个步骤; 3）知识发现与数据挖掘含义相同。7-2. 数据挖掘的主要任务是什么?数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析，等等

36、7-3. 数据挖掘运用了哪些理论与技术？答：理论：模式发现架构、规则发现架构、基于概率和统计理论、微观经济学观点、基于数据压缩理论、基于归纳数据库理论.技术：分类和预测：决策树、AQ算法、Bayes方法、神经网络、粗糙集、聚类分析：划分方法、层次方法、基于密度方法、基于网格方法、基于模型方法。7-4. 数据挖掘包含哪些主要功能？有哪些主要算法？答：数据挖掘通过预测未来趋势及行为，做出前摄的、基于知识的决策。主要包含以下五类功能：1）自动预测趋势和行为；2)关联分析;3)聚类;4）概念描述；5）偏差检测主要算法有：1）决策树；2）关联规则；3）聚类；4）神经网络和支持向量机；4）粗糙集;6）

37、回归分析；7）模糊集。7-5. 说明数据挖掘的流程.答：（1)定义商业问题（2）建立数据挖掘库（3）分析数据(4）准备数据（5）建立模型（6）评价和解释（7）实施7-6. 什么是数据挖掘的分类?说明数据挖掘分类的两步过程。首先从数据中选出已经分好类的训练集，在该训练集上运用数据挖掘分类的技术，建立分类模型，对于没有分类的数据进行分类.7-7. 什么是数据挖掘的预测？预测是通过分类或估值起作用的，也就是说,通过分类或估值得出模型，该模型用于对未知变量的预言。从这种意义上说，预言其实没有必要分为一个单独的类。预言其目的是对未来未知变量的预测，这种预测是需要时间来验证的,即必须经过一定时间后，才知道

38、预言准确性是多少.7-8. 什么是聚类分析？聚类方法产生的簇有哪两个特点？聚类(Clustering）是对物理的或抽象的对象集合分组的过程. 聚类生成的组称为簇（Cluster），簇是数据对象的集合。簇内部的任意两个对象之间具有较高的相似度，而属于不同簇的两个对象间具有较高的相异度。相异度可以根据描述对象的属性值计算，对象间的距离是最常采用的度量指标。7-9. 关联规则挖掘算法的基本思想是什么？有什么优点？有什么缺点?答：关联规则挖掘算法的基本思想是:1）找出所有支持度大于最小支持度的频繁项集,即频集；2)使用第一步找到的频集产生期望的规则.其核心方法是基于频集理论的递推方法。优点是：1）可以产生清晰有用的结果; 2)支持间接数据挖掘; 3）可以处理变长的数据 4)它的计算消耗量是可以预见的缺点是：1）当问题变大时，计算量增长得厉害; 2）难以决定正确的数据； 3）容易忽略稀有的数据

展开阅读全文