1、第1章 数据结构与算法经过对部分考生的调查以及对近年真题的总结分析,笔试部分经常考查的是算法复杂度、数据结构的概念、栈、二叉树的遍历、二分法查找,读者应对此部分进行重点学习。1.1算法考点1 算法的基本概念计算机解题的过程实际上是在实施某种算法,这种算法称为计算机算法。1算法的基本特征:可行性、确定性、有穷性、拥有足够的情报。2算法的基本要素:(1)算法中对数据的运算和操作一个算法由两种基本要素组成:一是对数据对象的运算和操作;二是算法的控制结构。在一般的计算机系统中,基本的运算和操作有以下4类:算术运算、逻辑运算、关系运算和数据传输。(2)算法的控制结构:算法中各操作之间的执行顺序称为算法的
2、控制结构。描述算法的工具通常有传统流程图、N-S结构化流程图、算法描述语言等。一个算法一般都可以用顺序、选择、循环3种基本控制结构组合而成。n 仅有顺序、选择(分支)和重复(循环)结构构成的程序是结构化程序。考点2 算法复杂度1.算法的时间复杂度算法的时间复杂度是指执行算法所需要的计算工作量。算法的工作量用算法所执行的基本运算次数来计算同一个算法用不同的语言实现,或者用不同的编译程序进行编译,或者在不同的计算机上运行,效率均不同。这表明使用绝对的时间单位衡量算法的效率是不合适的。撇开这些与计算机硬件、软件有关的因素,可以认为一个特定算法运行工作量的大小,只依赖于问题的规模(通常用整数n表示),
3、它是问题规模的函数。即算法的工作量=f(n)2.算法的空间复杂度算法的空间复杂度是指执行这个算法所需要的内存空间。1.2数据结构的基本概念考点3 数据结构的定义数据结构作为计算机的一门学科,主要研究和讨论以下三个方面:(1)数据集合中个数据元素之间所固有的逻辑关系,即数据的逻辑结构;(2)在对数据元素进行处理时,各数据元素在计算机中的存储关系,即数据的存储结构;(3)对各种数据结构进行的运算。数据:是对客观事物的符号表示,在计算机科学中是指所有能输入到计算机中并被计算机程序处理的符号的总称。数据元素:是数据的基本单位,在计算机程序中通常作为一个整体进行考虑和处理。数据对象:是性质相同的数据元素
4、的集合,是数据的一个子集。数据的逻辑结构是对数据元素之间的逻辑关系的描述,它可以用一个数据元素的集合和定义在此集合中的若干关系来表示。数据的逻辑结构有两个要素:一是数据元素的集合,通常记为D;二是D上的关系,它反映了数据元素之间的前后件关系,通常记为R。一个数据结构可以表示成B=(D,R)其中B表示数据结构。为了反映D中各数据元素之间的前后件关系,一般用二元组来表示。数据的逻辑结构在计算机存储空间中的存放形式称为数据的存储结构(也称数据的物理结构)。由于数据元素在计算机存储空间中的位置关系可能与逻辑关系不同,因此,为了表示存放在计算机存储空间中的各数据元素之间的逻辑关系(即前后件关系),在数据
5、的存储结构中,不仅要存放各数据元素的信息,还需要存放各数据元素之间的前后件关系的信息。一种数据的逻辑结构根据需要可以表示成多种存储结构,常用的存储结构有顺序、链接、索引等存储结构。而采用不同的存储结构,其数据处理的效率是不同的。因此,在进行数据处理时,选择合适的存储结构是很重要的。考点4 线性结构与非线性结构根据数据结构中各数据元素之间前后件关系的复杂程度,一般将数据结构分为两大类型:线性结构与非线性结构。如果一个非空的数据结构满足下列两个条件:(1)有且只有一个根结点;(2)每一个结点最多有一个前件,也最多有一个后件。则称该数据结构为线性结构。线性结构又称线性表。在一个线性结构中插入或删除任
6、何一个结点后还应是线性结构。如果一个数据结构不是线性结构,则称之为非线性结构。 疑难解答:空的数据结构是线性结构还是非线性结构?一个空的数据结构究竟是属于线性结构还是属于非线性结构,这要根据具体情况来确定。如果对该数据结构的算法是按线性结构的规则来处理的,则属于线性结构;否则属于非线性结构。1.3栈及线性链表考点5 栈及其基本运算1栈的基本概念栈是限定只在一端进行插入与删除的线性表,通常称插入、删除的这一端为栈顶,另一端为栈底。当表中没有元素时称为空栈。栈顶元素总是后被插入的元素,从而也是最先被删除的元素;栈底元素总是最先被插入的元素,从而也是最后才能被删除的元素。栈是按照先进后出或后进先出的
7、原则组织数据的。2栈的顺序存储及其运算用一维数组S(1m)作为栈的顺序存储空间,其中m为最大容量。在栈的顺序存储空间S(1m)中,S(bottom)为栈底元素,S(top)为栈顶元素。top=0表示栈空;top=m表示栈满。栈的基本运算有三种:入栈、退栈与读栈顶元素。(1)入栈运算:入栈运算是指在栈顶位置插入一个新元素。首先将栈顶指针加一(即top加1),然后将新元素插入到栈顶指针指向的位置。当栈顶指针已经指向存储空间的最后一个位置时,说明栈空间已满,不可能再进行入栈操作。这种情况称为栈上溢错误。(2)退栈运算:退栈是指取出栈顶元素并赋给一个指定的变量。首先将栈顶元素(栈顶指针指向的元素)赋给
8、一个指定的变量,然后将栈顶指针减一(即top减1)。当栈顶指针为0时,说明栈空,不可进行退栈操作。这种情况称为栈的下溢错误。(3)读栈顶元素:读栈顶元素是指将栈顶元素赋给一个指定的变量。这个运算不删除栈顶元素,只是将它赋给一个变量,因此栈顶指针不会改变。当栈顶指针为0时,说明栈空,读不到栈顶元素。 小技巧:栈是按照先进后出或后进先出的原则组织数据,但是出栈方式有多种选择,在考题中经常考查各种不同的出栈方式。n 在栈中,栈底指针不变,栈中元素随栈顶指针的变化而动态变化。n 队列是指允许在一端进行插入,而在另一端进行删除的线性表,允许插入的一端称为队尾,允许删除的一端称为对头。“先进先出”或“后进
9、后出”。n 队列是一种特殊的线性表,循环队列是队列的顺序存储结构。n 在循环队列中,用队尾指针rear指向队列中的队尾元素,用排头指针front指向排头元素的第一个位置,因此,从排头指针front指向的后一个位置直至队尾指针rear指向的位置之间所有的元素均为队列中的元素。考点6 线性链表的基本概念考试链接:考点6在笔试考试中出现的几率为30%,主要是以选择的形式出现,分值为2分,此考点为识记内容。重点识记结点的组成。在链式存储方式中,要求每个结点由两部分组成:一部分用于存放数据元素值,称为数据域,另一部分用于存放指针,称为指针域。其中指针用于指向该结点的前一个或后一个结点(即前件或后件)。链
10、式存储方式既可用于表示线性结构,也可用于表示非线性结构。(1)线性链表线性表的链式存储结构称为线性链表。在某些应用中,对线性链表中的每个结点设置两个指针,一个称为左指针,用以指向其前件结点;另一个称为右指针,用以指向其后件结点。这样的表称为双向链表。(2)带链的栈栈也是线性表,也可以采用链式存储结构。带链的栈可以用来收集计算机存储空间中所有空闲的存储结点,这种带链的栈称为可利用栈。 疑难解答:在链式结构中,存储空间位置关系与逻辑关系是什么?在链式存储结构中,存储数据结构的存储空间可以不连续,各数据结点的存储顺序与数据元素之间的逻辑关系可以不一致,而数据元素之间的逻辑关系是由指针域来确定的。n
11、线性表的链式存储结构所需的存储空间一般要多于顺序存储结构。【例4】链表不具备的特点是_。(考点6)A)可随机访问任意一个结点B)插入和删除不需要移动任何元素C)不必事先估计存储空间D)所需空间与其长度成正比解析:顺序表可以随机访问任意一个结点,而链表必须从第一个数据结点出发,逐一查找每个结点。所以答案为A)。1.4树与二叉树考点7 树与二叉树及其基本性质误区警示:满二叉树也是完全二叉树,而完全二叉树一般不是满二叉树。应该注意二者的区别。1、树的基本概念 树(tree)是一种简单的非线性结构。在树结构中,每一个结点只有一个前件,称为父结点,没有前件的结点只有一个,称为树的根结点。每一个结点可以有
12、多个后件,它们称为该结点的子结点。没有后件的结点称为叶子结点。在树结构中,一个结点所拥有的后件个数称为该结点的度。叶子结点的度为0。在树中,所有结点中的最大的度称为树的度。n 支持子程序调用的数据结构是树【例3】设树的度为,其中度为、和的结点的个数分别为、,则中叶子结点的个数为_。解析:根据树的性质:树的结点数等于所有结点的度与对应的结点个数乘积之和加。因此树的结点数为16。叶子结点数目等于树结点总数减去度不为的结点数之和,即16()。2、二叉树及其基本性质(1)二叉树的定义 二叉树是一种很有用的非线性结构,具有以下两个特点:非空二叉树只有一个根结点;每一个结点最多有两棵子树,且分别称为该结点
13、的左子树和右子树。由以上特点可以看出,在二叉树中,每一个结点的度最大为2,即所有子树(左子树或右子树)也均为二叉树,而树结构中的每一个结点的度可以是任意的。另外,二叉树中的每个结点的子树被明显地分为左子树和右子树。在二叉树中,一个结点可以只有左子树而没有右子树,也可以只有右子树而没有左子树。当一个结点既没有左子树也没有右子树时,该结点即为叶子结点。(2)二叉树的基本性质二叉树具有以下几个性质:性质1:在二叉树的第k层上,最多有2k-1(k1)个结点;性质2:深度为m的二叉树最多有2m-1个结点;性质3:在任意一棵二叉树中,度为0的结点(即叶子结点)总是比度为2的结点多一个。性质4:具有n个结点
14、的二叉树,其深度至少为log2n+1,其中log2n表示取log2n的整数部分。小技巧:在二叉树的遍历中,无论是前序遍历,中序遍历还是后序遍历,二叉树的叶子结点的先后顺序都是不变的。3、满二叉树与完全二叉树满二叉树是指这样的一种二叉树:除最后一层外,每一层上的所有结点都有两个子结点。在满二叉树中,每一层上的结点数都达到最大值,即在满二叉树的第k层上有2k-1个结点,且深度为m的满二叉树有2m1个结点。完全二叉树是指这样的二叉树:除最后一层外,每一层上的结点数均达到最大值;在最后一层上只缺少右边的若干结点。对于完全二叉树来说,叶子结点只可能在层次最大的两层上出现:对于任何一个结点,若其右分支下的
15、子孙结点的最大层次为p,则其左分支下的子孙结点的最大层次或为p,或为p+1。完全二叉树具有以下两个性质:性质5:具有n个结点的完全二叉树的深度为log2n+1。性质6:设完全二叉树共有n个结点。如果从根结点开始,按层次(每一层从左到右)用自然数1,2,n给结点进行编号,则对于编号为k(k=1,2,n)的结点有以下结论:若k=1,则该结点为根结点,它没有父结点;若k1,则该结点的父结点编号为INT(k/2)。若2kn,则编号为k的结点的左子结点编号为2k;否则该结点无左子结点(显然也没有右子结点)。若2k+1n,则编号为k的结点的右子结点编号为2k+1;否则该结点无右子结点。考点8 二叉树的遍历
16、在遍历二叉树的过程中,一般先遍历左子树,再遍历右子树。在先左后右的原则下,根据访问根结点的次序,二叉树的遍历分为三类:前序遍历、中序遍历和后序遍历。(1)前序遍历:先访问根结点、然后遍历左子树,最后遍历右子树;并且,在遍历左、右子树时,仍然先访问根结点,然后遍历左子树,最后遍历右子树。(2)中序遍历:先遍历左子树、然后访问根结点,最后遍历右子树;并且,在遍历左、右子树时,仍然先遍历左子树,然后访问根结点,最后遍历右子树。(3)后序遍历:先遍历左子树、然后遍历右子树,最后访问根结点;并且,在遍历左、右子树时,仍然先遍历左子树,然后遍历右子树,最后访问根结点。 疑难解答:树与二叉树的不同之处是什么
17、?在二叉树中,每一个结点的度最大为2,即所有子树(左子树或右子树)也均为二叉树,而树结构中的每一个结点的度可以是任意的。1.5查找技术考点9 顺序查找查找是指在一个给定的数据结构中查找某个指定的元素。从线性表的第一个元素开始,依次将线性表中的元素与被查找的元素相比较,若相等则表示查找成功;若线性表中所有的元素都与被查找元素进行了比较但都不相等,则表示查找失败。在下列两种情况下也只能采用顺序查找:(1)如果线性表为无序表,则不管是顺序存储结构还是链式存储结构,只能用顺序查找。(2)即使是有序线性表,如果采用链式存储结构,也只能用顺序查找。n 对长度为n的线性表进行顺序查找,在最坏情况下需要比较n
18、次。考点10 二分法查找二分法只适用于顺序存储的,按非递减(即从小到大,但允许相邻元素值相等)排列的有序表,其方法如下:设有序线性表的长度为n,被查找的元素为i,(1)将i与线性表的中间项进行比较;(2)若i与中间项的值相等,则查找成功;(3)若i小于中间项,则在线性表的前半部分以相同的方法查找;(4)若i大于中间项,则在线性表的后半部分以相同的方法查找。这个过程一直进行到查找成功或子表长度为0为止。对于长度为n的有序线性表,在最坏情况下,二分查找需要比较log2n次。1.6排序技术考点11 交换类排序法冒泡排序法和快速排序法都属于交换类排序法。(1)冒泡排序法首先,从表头开始往后扫描线性表,
19、逐次比较相邻两个元素的大小,若前面的元素大于后面的元素,则将它们互换,不断地将两个相邻元素中的大者往后移动,最后最大者到了线性表的最后。然后,从后到前扫描剩下的线性表,逐次比较相邻两个元素的大小,若后面的元素小于前面的元素,则将它们互换,不断地将两个相邻元素中的小者往前移动,最后最小者到了线性表的最前面。对剩下的线性表重复上述过程,直到剩下的线性表变空为止,此时已经排好序。在最坏的情况下,冒泡排序需要比较次数为n(n1)/2。(2)快速排序法它的基本思想是:任取待排序序列中的某个元素作为基准(一般取第一个元素),通过一趟排序,将待排元素分为左右两个子序列,左子序列元素的排序码均小于或等于基准元
20、素的排序码,右子序列的排序码则大于基准元素的排序码,然后分别对两个子序列继续进行排序,直至整个序列有序。 疑难解答:冒泡排序和快速排序的平均执行时间分别是多少?冒泡排序法的平均执行时间是O(n2),而快速排序法的平均执行时间是O(nlog2n)。第2章 程序设计基础2.1结构化程序设计考点1 结构化程序设计的原则20世纪70年代提出了结构化程序设计的思想和方法。结构化程序设计方法引入了工程化思想和结构化思想,使大型软件的开发和编程得到了极大的改善。结构化程序设计方法的主要原则为:自顶向下、逐步求精、模块化和限制使用goto语句。2.2面向对象的程序设计考点2 面向对象方法的基本概念误区警示:当
21、使用对象这个术语时,既可以指一个具体的对象,也可以泛指一般的对象,但是当使用实例这个术语时,必须是指一个具体的对象。面向对象方法涵盖对象及对象属性与方法、类、继承、多态性几个基本要素。(1)对象 通常把对对象的操作也称为方法或服务。属性即对象所包含的信息,它在设计对象时确定,一般只能通过执行对象的操作来改变。属性值应该指的是纯粹的数据值,而不能指对象。 操作描述了对象执行的功能,若通过信息的传递,还可以为其他对象使用。对象具有如下特征:标识惟一性、分类性、多态性、封装性、模块独立性。(2)类和实例 类是具有共同属性、共同方法的对象的集合。它描述了属于该对象类型的所有对象的性质,而一个对象则是其
22、对应类的一个实例。面向对象的开发方法中,类与对象的关系是抽象与具体类是关于对象性质的描述,它同对象一样,包括一组数据属性和在数据上的一组合法操作。(3)消息 消息是实例之间传递的信息,它请求对象执行某一处理或回答某一要求的信息,它统一了数据流和控制流。一个消息由三部分组成:接收消息的对象的名称、消息标识符(消息名)和零个或多个参数。(4)继承 广义地说,继承是指能够直接获得已有的性质和特征,而不必重复定义它们。在面向对象方法中,使用已经存在的类定义作为基础建立新的类定义,这样的技术叫做_继承_继承分为单继承与多重继承。单继承是指,一个类只允许有一个父类,即类等级为树形结构。多重继承是指,一个类
23、允许有多个父类。(5)多态性 对象根据所接收的消息而做出动作,同样的消息被不同的对象接收时可导致完全不同的行动,该现象称为多态性。 疑难解答:能举一下现实中的对象及其属性和操作吗?一辆汽车是一个对象,它包含了汽车的属性(如颜色、型号等)及其操作(如启动、刹车等)。一个窗口是对象,它包含了窗口的属性(如大小、颜色等)及其操作(如打开、关闭等)。第3章 软件工程基础3.1软件工程基本概念考点1 软件定义与软件特点软件指的是计算机系统中与硬件相互依存的另一部分,包括程序、数据和相关文档的完整集合。程序是软件开发人员根据用户需求开发的、用程序设计语言描述的、适合计算机执行的指令序列。数据是使程序能正常
24、操纵信息的数据结构。文档是与程序的开发、维护和使用有关的图文资料。可见,软件由两部分组成:(1)机器可执行的程序和数据;(2)机器不可执行的,与软件开发、运行、维护、使用等有关的文档。软件的特点:(1)软件是逻辑实体,而不是物理实体,具有抽象性;(2)没有明显的制作过程,可进行大量的复制;(3)使用期间不存在磨损、老化问题;(4)软件的开发、运行对计算机系统具有依赖性;(5)软件复杂性高,成本昂贵;(6)软件开发涉及诸多社会因素。根据应用目标的不同,软件可分应用软件、系统软件和支撑软件(或工具软件)。 小提示:应用软件是为解决特定领域的应用而开发的软件;系统软件是计算机管理自身资源,提高计算机
25、使用效率并为计算机用户提供各种服务的软件;支撑软件是介于两者之间,协助用户开发软件的工具性软件。考点2 软件工程过程与软件生命周期软件工程包括3个要素,即方法、工具和过程。方法是完成软件工程项目的技术手段;工具支持软件的开发、管理、文档生成;过程支持软件开发的各个环节的控制、管理。软件产品从提出、实现、使用维护到停止使用退役的过程称为软件生命周期。一般包括可行性分析研究与需求分析、(设计、实现、测试、)交付使用以及维护等活动。还可以将软件生命周期分为如上图所示的软件定义、软件开发和软件运行维护3个阶段。生命周期的主要活动阶段是:可行性研究与计划制定、需求分析、软件设计、软件实施、软件测试及运行
26、与维护。n 软件需求规格说明书应具有完整性、无歧义性、正确性、可验证性、可修改性,最重要的是无歧义性。3.2结构化设计方法考点3 软件设计的基本概念1 软件设计的基础软件设计是软件工程的重要阶段,是一个把软件需求转换为软件表示的过程。从技术观点上看,软件设计包括软件结构设计、数据设计、接口设计、过程设计。(1)结构设计定义软件系统各主要部件之间的关系;(2)数据设计将分析时创建的模型转化为数据结构的定义;(3)接口设计是描述软件内部、软件和协作系统之间以及软件与人之间如何通信;(4)过程设计则是把系统结构部件转换为软件的过程性描述。从工程管理角度来看,软件设计分两步完成:概要设计和详细设计。(
27、1)概要设计将软件需求转化为软件体系结构、确定系统级接口、全局数据结构或数据库模式;(2)详细设计确立每个模块的实现算法和局部数据结构,用适当方法表示算法和数据结构的细节。2软件设计的基本原理(1)抽象:软件设计中考虑模块化解决方案时,可以定出多个抽象级别。抽象的层次从概要设计到详细设计逐步降低。(2)模块化:模块是指把一个待开发的软件分解成若干小的简单的部分。模块化是指解决一个复杂问题时自顶向下逐层把软件系统划分成若干模块的过程。(3)信息隐蔽:信息隐蔽是指在一个模块内包含的信息(过程或数据),对于不需要这些信息的其他模块来说是不能访问的。(4)模块独立性:模块独立性是指每个模块只完成系统要
28、求的独立的子功能,并且与其他模块的联系最少且接口简单。模块的独立程度是评价设计好坏的重要度量标准。衡量软件的模块独立性使用耦合性和内聚性两个定性的度量标准。内聚性是信息隐蔽和局部化概念的自然扩展。一个模块的内聚性越强则该模块的模块独立性越强。一个模块与其他模块的耦合性越强则该模块的模块独立性越弱。内聚性是度量一个模块功能强度的一个相对指标。内聚是从功能角度来衡量模块的联系,它描述的是模块内的功能联系。内聚有如下种类,它们之间的内聚度由弱到强排列:偶然内聚、逻辑内聚、时间内聚、过程内聚、通信内聚、顺序内聚、功能内聚。耦合性是模块之间互相连接的紧密程度的度量。耦合性取决于各个模块之间接口的复杂度、
29、调用方式以及哪些信息通过接口。耦合可以分为下列几种,它们之间的耦合度由高到低排列:内容耦合、公共耦合、外部耦合、控制耦合、标记耦合、数据耦合、非直接耦合。在程序结构中,各模块的内聚性越强,则耦合性越弱。一般较优秀的软件设计,应尽量做到高内聚,低耦合,即减弱模块之间的耦合性和提高模块内的内聚性,有利于提高模块的独立性。考点4 详细设计详细设计的任务是为软件结构图中的每个模块确定实现算法和局部数据结构,用某种选定的表达表示工具算法和数据结构的细节。 详细过程设计的常用工具有:(1)图形工具:程序流程图,N-S,PAD,HIPO。(2)表格工具:判定表。(3)语言工具:PDL(伪码)。程序流程图的5
30、种控制结构:顺序型、选择型、先判断重复型、后判断重复型和多分支选择型。 方框图中仅含5种基本的控制结构,即顺序型、选择型、多分支选择型、WHILE重复型和UNTIL重复型。PAD图表示5种基本控制结构,即顺序型、选择型、多分支选择型、WHILE重复型和UNTIL重复型。过程设计语言(PDL)也称为结构化的语言和伪码,它是一种混合语言,采用英语的词汇和结构化程序设计语言,类似编程语言。PDL可以由编程语言转换得到,也可以是专门为过程描述而设计的。数据流图(DFD)可以表达软件系统的数据存储、数据源点和终点、数据流向和数据加工。其中,用箭头表示数据流向,用圆或者椭圆表示数据加工,用双杠表示数据存储
31、,用方框来表示数据源点和终点。 疑难解答:程序流程图,N-S图,PAD图的控制结构的异同点是什么?相同点是三种图都有顺序结构,选择结构和多分支选择,并且N-S图和PAD图还有相同的WHILE重复型、UNTIL重复型;不同点是程序流程图没有WHILE重复型、UNTIL重复型而有后判断重复型和先判断重复型。n 在结构化设计分析使用的数据流图中,利用数据字典对其中的图形元素进行确切解释。n 对某应用系统经过需求分析生成数据流图(DFD),则应采用结构化方法。n 结构化分析就是使用数据流图(DFD)、数据字典(DD)、结构化英语、判定表和判定树等工具,来建立一种新的、称为结构化规格说明的目标文档。3.
32、3软件测试考点5 软件测试的目的软件测试是在软件投入运行前对软件需求、设计、编码的最后审核。其工作量、成本占总工作量、总成本的40%以上,而且具有较高的组织管理和技术难度。(1)软件测试是为了发现错误而执行程序的过程;(2)一个好的测试用例是能够发现至今尚未发现的错误的用例;(3)一个成功的测试是发现了至今尚未发现的错误的测试。考点6 软件测试的实施软件测试过程分4个步骤,即单元测试、集成测试、验收测试和系统测试。单元测试是对软件设计的最小单位-模块(程序单元)进行正确性检验测试。单元测试的技术可以采用静态分析和动态测试。集成测试是测试和组装软件的过程,主要目的是发现与接口有关的错误,主要依据
33、是概要设计说明书。集成测试所设计的内容包括:软件单元的接口测试、全局数据结构测试、边界条件和非法输入的测试等。集成测试时将模块组装成程序,通常采用两种方式:非增量方式组装和增量方式组装。确认测试的任务是验证软件的功能和性能,以及其他特性是否满足了需求规格说明中确定的各种需求,包括软件配置是否完全、正确。确认测试的实施首先运用黑盒测试(主要包括等价类划分法、边界值分析法、错误推测法、因果法)方法,对软件进行有效性测试,即验证被测软件是否满足需求规格说明确认的标准。n 白盒测试的原则之一是保证所测模块中每一个独立路径至少要执行一次。系统测试是通过测试确认软件,作为整个基于计算机系统的一个元素,与计
34、算机硬件、外设、支撑软件、数据和人员等其他系统元素组合在一起,在实际运行(使用)环境下对计算机系统进行一系列的集成测试和确认测试。系统测试的具体实施一般包括:功能测试、性能测试、操作测试、配置测试、外部接口测试、安全性测试等。3.4软件的调试考点7 软件调试的基本概念:程序经调试改错后还应进行再测试,因为经调试后有可能产生新的错误,而且测试是贯穿生命周期的整个过程。在对程序进行了成功的测试之后将进入程序调试(通常称Debug,即排错)。程序的调试任务是诊断和改正程序中的错误。调试主要在开发阶段进行。程序调试活动由两部分组成,一是根据错误的迹象确定程序中错误的确切性质、原因和位置;二是对程序进行
35、修改,排除这个错误。程序调试的基本步骤:(1)错误定位。从错误的外部表现形式入手,研究有关部分的程序,确定程序中出错位置,找出错误的内在原因;(2)修改设计和代码,以排除错误;(3)进行回归测试,防止引进新的错误。调试原则可以从以下两个方面考虑:(1)确定错误的性质和位置时的注意事项分析思考与错误征兆有关的信息;避开死胡同;只把调试工具当作辅助手段来使用;避免用试探法,最多只能把它当作最后手段。(2)修改错误原则在出现错误的地方,很可能有别的错误;修改错误的一个常见失误是只修改了这个错误的征兆或这个错误的表现,而没有修改错误本身;注意修正一个错误的同时有可能会引入新的错误;修改错误的过程将迫使
36、人们暂时回到程序设计阶段;修改源代码程序,不要改变目标代码。 疑难解答:软件测试与软件调试有何不同?软件测试是尽可能多地发现软件中的错误,而软件调试的任务是诊断和改正程序中的错误。软件测试贯穿整个软件生命周期,调试主要在开发阶段。第4章 数据库设计基础4.1数据库系统的基本概念考点1 数据、数据库、数据库管理系统数据是数据库中存储的基本对象,描述事物的符号记录。数据库是长期储存在计算机内、有组织的、可共享的大量数据的集合,它具有统一的结构形式并存放于统一的存储介质内,是多种应用数据的集成,并可被各个应用程序所共享。数据库的根本目标是解决数据的共享问题。数据库管理系统(DBMS,Database
37、 Management System)是数据库的机构,它是一种系统软件,负责数据库中的数据组织、数据操作、数据维护、控制及保护和数据服务等。数据库管理系统是数据系统的核心,主要有如下功能:数据模式定义、数据存取的物理构建、数据操纵、数据的完整性、安全性定义和检查、数据库的并发控制与故障恢复、数据的服务。为完成数据库管理系统的功能,数据库管理系统提供相应的数据语言:数据定义语言、数据操纵语言、数据控制语言。数据操纵语言负责数据的操纵,包括查询及增、删、改等操作。数据库管理员的主要工作如下:数据库设计、数据库维护、改善系统性能,提高系统效率。考点2 数据库系统的发展数据管理技术的发展经历了3个阶段
38、,见表4-1:表4-1 各阶段特点的详细说明考点3 数据库系统的基本特点数据独立性是数据与程序间的互不依赖性,即数据库中的数据独立于应用程序而不依赖于应用程序。数据的独立性一般分为物理独立性与逻辑独立性两种。数据库的物理结构不一定与逻辑结果一致。(1)物理独立性:指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。当数据的物理结构(包括存储结构、存取方式等)改变时,如存储设备的更换、物理存储的更换、存取方式改变等,应用程序都不用改变。(2)逻辑独立性:指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变了,如修改数据模式、增加新的数据类型、改变数据间联系等,用户程序都可以不
39、变。数据统一管理与控制主要包括以下3个方面:数据的完整性检查、数据的安全性保护和并发控制。考点4 数据库系统的内部结构体系误区警示:一个数据库只有一个概念模式。一个概念模式可以有若干个外模式。三级模式都有几种名称,读者应该熟记每个模式的另一些名称。1数据统系统的3级模式(1)概念模式,也称逻辑模式,是对数据库系统中全局数据逻辑结构的描述,是全体用户(应用)公共数据视图。一个数据库只有一个概念模式。(2)外模式,外模式也称子模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,它是由概念模式推导而出来的,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。一个概念模式可以有若
40、干个外模式。(3)内模式,内模式又称物理模式,它给出了数据库物理存储结构与物理存取方法。内模式处于最底层,它反映了数据在计算机物理结构中的实际存储形式,概念模式处于中间层,它反映了设计者的数据全局逻辑要求,而外模式处于最外层,它反映了用户对数据的要求。2数据库系统的两级映射两级映射保证了数据库系统中数据的独立性。(1)概念模式到内模式的映射。该映射给出了概念模式中数据的全局逻辑结构到数据的物理存储结构间的对应关系;(2)外模式到概念模式的映射。概念模式是一个全局模式而外模式是用户的局部模式。一个概念模式中可以定义多个外模式,而每个外模式是概念模式的一个基本视图。 疑难解答:数据库应用系统的结构
41、是什么样的?数据库应用系统的7个部分以一定的逻辑层次结构方式组成一个有机的整体,它们的结构关系是:应用系统工、应用开发工具软件、数据库管理系统、操作系统、硬件。4.2数据模型考点5 数据模型的基本概念数据模型用来抽象、表示和处理现实世界中的数据和信息。分为两个阶段:把现实世界中的客观对象抽象为概念模型;把概念模型转换为某一DBMS支持的数据模型。数据模型所描述的内容有3个部分,它们是数据结构、数据操作与数据约束。n 层次型、网状型和关系型数据库划分原则是数据之间的联系方式。考点6 E-R模型1E-R模型的基本概念(1)实体:现实世界中的事物可以抽象成为实体,实体是概念世界中的基本单位,它们是客
42、观存在的且又能相互区别的事物。(2)属性:现实世界中事物均有一些特性,这些特性可以用属性来表示。(3)码:唯一标识实体的属性集称为码。(4)域:属性的取值范围称为该属性的域。(5)联系:在现实世界中事物间的关联称为联系。两个实体集间的联系实际上是实体集间的函数关系,这种函数关系可以有下面几种:一对一的联系、一对多或多对一联系、多对多。2E-R模型的图示法(1)实体表示法:在E-R图中用矩形表示实体集,在矩形内写上该实体集的名字。(2)属性表示法:在E-R图中用椭圆形表示属性,在椭圆形内写上该属性的名称。(3)联系表示法:在E-R图中用菱形表示联系,菱形内写上联系名。n 数据库设计中,用E-R图
43、来描述信息结构但不涉及信息在计算机中的表示,它属于数据库设计的概念设计阶段。考点7 层次模型满足下面两个条件的基本层次联系的集合为层次模型。(1)有且只有一个结点没有双亲结点,这个结点称为根结点;(2)除根结点以外的其他结点有且仅有一个双亲结点。考点8 关系模型关系模型采用二维表来表示,二维表一般满足下面7个性质:(1)二维表中元组个数是有限的-元组个数有限性;(2)二维表中元组均不相同-元组的唯一性;(3)二维表中元组的次序可以任意交换-元组的次序无关性;(4)二维表中元组的分量是不可分割的基本数据项-元组分量的原子性;(5)二维表中属性名各不相同-属性名唯一性;(6)二维表中属性与次序无关
44、,可任意交换-属性的次序无关性;(7)二维表属性的分量具有与该属性相同的值域-分量值域的统一性。在二维表中惟一标识元组的最小属性值称为该表的键或码。二维表中可能有若干个健,它们称为表的侯选码或侯选健。从二维表的所有侯选键选取一个作为用户使用的键称为主键或主码。表A中的某属性集是某表B的键,则称该属性值为A的外键或外码。关系操纵:数据查询、数据删除、数据插入、数据修改。关系模型允许定义三类数据约束,它们是实体完整性约束、参照完整性约束以及用户定义的完整性约束。 小提示:为了建立一个关系,首先要指定关系的属性;一个关系的属性名表称为关系模式。关系模式采用二维表来表示,一个关系对应一张二维表。可以这
45、么说,一个关系就是一个二维表,但是一个二维表不一定是一个关系。在关系数据模型中,二维表的列称为属性,二维表的行称为元组/记录 疑难解答:E-R图是如何向关系模式转换的?从E-R图到关系模式的转换是比较直接的,实体与联系都可以表示成关系,E-R图中属性也可以转换成关系的属性。实体集也可以转换成关系。4.3关系代数考点9 关系代数1关系模型的基本操作 关系模型的基本操作:插入、删除、修改和查询。其中查询包含如下运算:投影运算。从R中选择出若干属性列组成新的关系。选择运算。选择运算是一个一元运算,关系R通过选择运算(并由该运算给出所选择的逻辑条件)后仍为一个关系。设关系的逻辑条件为F,则R满足F的选
46、择运算可写成:F(R)笛卡尔积运算。设有n元关系R及m元关系S,它们分别有p、q个元组,则关系R与S经笛卡尔积记为RS,该关系是一个n+m元关系,元组个数是pq,由R与S的有序组组合而成。 小提示:当关系模式进行笛卡尔积运算时,读者应该注意运算后的结果是n+m元关系,元组个数是pq,这是经常混淆的。2关系代数中的扩充运算(1)交运算:关系R与S经交运算后所得到的关系是由那些既在R内又在S内的有序组所组成,记为RS。(2)除运算如果将笛卡尔积运算看作乘运算的话,除运算就是它的逆运算。当关系T=RS时,则可将除运算写成:TR=S或T/R=SS称为T除以R的商。除法运算不是基本运算,它可以由基本运算
47、推导而出。(3)连接与自然连接运算连接运算又可称为运算,这是一种二元运算,通过它可以将两个关系合并成一个大关系。设有关系R、S以及比较式ij,其中i为R中的域,j为S中的域,含义同前。则可以将R、S在域i,j上的连接记为:R | Sij在连接中如果为=,就称此连接为等值连接,否则称为不等值连接;如为时称为大于连接。自然连接(natural join)是一种特殊的等值连接,它满足下面的条件:两关系间有公共域;通过公共域的等值进行连接。设有关系R、S,R有域A1,A2,An,S有域B1,B2,Bm,并且,Ai1,Ai2,Aij,与B1,B2,Bj分别为相同域,此时它们自然连接可记为:R|S 自然连接的含义可用下式表示:R|S=A1,A2