1、全国计算机二级考试重点公共基础知识.txt37真诚是美酒,年份越久越醇香浓烈;真诚是焰火,在高处绽放才愈显美丽;真诚是鲜花,送之于人,手有余香。 本文由小风HCF奉献 doc文档也许在WAP端浏览体验不佳。建议您优先选择TXT,或下载源文献到本机查看。 天骄现代考前冲刺资料 公共基础知识 第一章 数据结构与算法 1.1 算法 算法:是指解题方案的准确而完整的描述。 算法 :是指解题方案的准确而完整的描述。 算法不等于程序,也不等计算机方法,程序的 编制不也许优于算法的设计。 算法的基本特性: 是一组严谨地定义运算顺序 的规则,每一个规则都是有效的,是明确的, 此顺序将在有限的次数下终止。特性涉
2、及: (1)可行性; (2)拟定性,算法中每一环节都必须有明确 定义,不充许有模棱两可的解释,不允许有多 义性; (3)有穷性,算法必须能在有限的时间内做 完,即能在执行有限个环节后终止,涉及合理 的执行时间的含义; (4)拥有足够的情报。 算法的基本要素: 一是对数据对象的运算和操 一是对数据对象的运算和操 二是算法的控制结构。 作;二是算法的控制结构。 指令系统: 一个计算机系统能执行的所有指令 的集合。 算术运算、 基本运算涉及:算术运算、逻辑运算、关系运 算术运算 逻辑运算、 数据传输。 算、数据传输。 算法的控制结构:顺序结构、选择结构、 算法的控制结构:顺序结构、选择结构、循环 结
3、构。 结构 。 算法基本设计方法:列举法、归纳法、递推、 递归、减斗递推技术、回溯法。 算法复杂度: 算法时间复杂度和 算法复杂度 : 算法时间复杂度 和 算法空间复 杂度。 杂度 。 算法时间复杂度是指执行算法所需要的 计算工作量。 计算工作量。 算法空间复杂度是指执行这个算 法所需要的内存空间。 法所需要的内存空间。 1.2 数据结构的基本基本概念 数据结构研究的三个方面: 数据结构研究的三个方面: (1)数据集合中各数据元素之间所固有的逻 辑关系,即数据的逻辑结构; 数据的逻辑结构; 数据的逻辑结构 (2)在对数据进行解决时,各数据元素在计 算机中的存储关系,即数据的存储结构; 数据的存
4、储结构; 数据的存储结构 (3)对各种数据结构进行的运算。 对各种数据结构进行的运算。 对各种数据结构进行的运算 数据结构是指互相有关联的数据元素的集合。 数据结构是指互相有关联的数据元素的集合。 数据的逻辑结构包含: (1)表达数据元素的信息; (2)表达各数据元素之间的前后件关系。 数据的存储结构有顺序、链接、索引等。 线性结构条件: 线性结构条件: (2) (1)有且只有一个根结点; )每一个结点 )有且只有一个根结点; ( 1 最多有一个前件,也最多有一个后件。 最多有一个前件, 也最多有一个后件。 非线性结构: 非线性结构 : 不满足线性结构条件的数据结 构。 13 线性表及其顺序存
5、储结构 线性表是由一组数据元素构成 数据元素的位 素构成, 线性表 是由一组数据元素构成, 置只取决于自己的序号, 置只取决于自己的序号, 元素之间的相对位置 是线性的。 是线性的。 在复杂线性表中, 由若干项数据元素组成的数 据元素称为记录 而由多个记录构成的线性表 记录, 记录 又称为文献 文献。 文献 非空线性表的结构特性: (1)且只有一个根结点 a1,它无前件; (2)有且只有一个终端结点 an,它无后件; (3)除根结点与终端结点外,其他所有结点 有且只有一个前件,也有且只有一个后件。结 点个数 n 称为线性表的长度 线性表的长度,当 n=0 时,称 线性表的长度 为空表 空表。
6、空表 线性表的顺序存储结构具有以下两个基本特 点: (1)线性表中所有元素的所占的存储空间是 ) 连续的; 连续的; (2)线性表中各数据元素在存储空间中是按 )线性表中各数据元素在存储空间中是按 逻辑顺序依次存放的。 逻辑顺序依次存放的。 ai 的存储地址为: ADR(ai)=ADR(a1)+(i-1)k, , ADR(a1) 为 第一个元素的地址,k 代表每个元素占的字节 数。 顺序表的运算:插入、删除。 14 栈和队列 是限定在一端进行插入与删除的线性表, 栈 是限定在一端进行插入与删除的线性表, 允 许插入与删除的一端称为栈顶, 许插入与删除的一端称为栈顶, 不允许插入与 删除的另一端
7、称为栈底。 删除的另一端称为栈底。 栈按照“先进后出 先进后出”( 后进先出” 栈按照 先进后出 ( FILO)或 “后进先出 ) 后进先出 组织数据, 栈具有记忆作用。 用 (LIFO) ) 组织数据, 栈具有记忆作用。 top 表达栈顶位置,用 bottom 表达栈底。 栈的基本运算: (1)插入元素称为入栈运算; (2)删除元素称为退栈运算; (3)读栈顶元 素是将栈顶元素赋给一个指定的变量, 此时指 针无变化。 队列是指允许在一端 队尾)进入插入, 是指允许在一端( 队列 是指允许在一端(队尾)进入插入,而在 另一端(队头)进行删除的线性表。 另一端(队头)进行删除的线性表。Rear
8、指 针指向队尾, 指针指向队头。 针指向队尾,front 指针指向队头。 队列是“先进行出 先进行出”( 后进后出” 队列是 先进行出 ( FIFO)或 “后进后出 ) 后进后出 (LILO)的线性表。 )的线性表。 队列运算涉及(1)入队运算:从队尾插入一 个元素; (2) 退队运算: 从队头删除一个元素。 天骄现代考前冲刺资料 循 环 队 列 : s=0 表 示 队 列 空 , s=1 且 front=rear 表达队列满 15 线性链表 数据结构中的每一个结点相应于一个存储单 这种存储单元称为存储结点,简称结点 结点。 元,这种存储单元称为存储结点,简称 结点 。 结点由两部分组成: 1
9、) ( 用于存储数据元素值, 称为数据域 (2)用于存放指针,称为指针 数据域; 数据域 指针 域 ,用于指向前一个或后一个结点。 在链式存储结构中, 存储数据结构的存储空间 可以不连续, 各数据结点的存储顺序与数据元 素之间的逻辑关系可以不一致, 而数据元素之 间的逻辑关系是由指针域来拟定的。 链式存储方式即可用于表达线性结构, 链式存储方式即可用于表达线性结构, 也可用 于表达非线性结构。 于表达非线性结构。 线性链表, HEAD 称为头指针, HEAD=NULL (或 0)称为空表 空表,假如是两指针:左指针 空表 左指针 (Llink)指向前件结点,右指针 右指针(Rlink)指 右指
10、针 向后件结点。 线性链表的基本运算:查找、插入、删除。 16 树与二叉树 树是一种简朴的非线性结构, 树是一种简朴的非线性结构 所有元素之间具 有明显的层次特性。 在树结构中,每一个结点只有一个前件,称为 父结点,没有前件的结点只有一个,称为树的 树的 根结点,简称树的根。每一个结点可以有多个 根结点 子结点。 后件,称为该结点的子结点。没有后件的结点 子结点 称为叶子结点。 称为叶子结点。 在树结构中, 在树结构中, 一个结点所拥有的后件的个数称 为该结点的度, 为该结点的度, 所有结点中最大的度称为树的 树的最大层次称为树的深度。 度。树的最大层次称为树的深度。 的特点: (1)非空二叉
11、 二 叉树 的特点: )非空二叉 树只有一个根 ( 结点; (2)每一个结点最多有两棵子树, 结点 ; ) 每一个结点最多有两棵子树 ,且 ( 分别称为该结点的左子树与右子树。 分别称为该结点的左子树与右子树。 树的基本性质 基本性质: 二叉树的基本性质: (1)在二叉树的第 k 层上,最多有 2k-1(k1)个结点; 个结点; 个结点 的二叉 (2)深度为 m 的二叉树最多有 2m-1 个结 ) 点; (3)度为 0 的结点(即叶子结点)总是比度 为 2 的结点多一个; (4)具有 n 个结点的二叉树,其深度至少为 log2n+1,其中log2n表达取 log2n 的整 数部分; (5)具有
12、 n 个结点的完全二叉树的深度为 log2n+1; (6)设完全二叉树共有 n 个结点。假如从根 2 结点开始,按层序(每一层从左到右)用自然 数 1, .n 给结点进行编号 2, (k=1,2.n) , 有以下结论: 若 k=1,则该结点为根结点,它没有父结 点 ; 若 k1 , 则 该 结 点 的 父 结 点 编 号 为 INT(k/2); 若 2kn, 则编号为 k 的结点的左子结点编 号为 2k;否则该结点无左、右子结点; 若 2k+1n,则编号为 k 的结点的右子结 点编号为 2k+1;否则该结点无右子结点。 满二叉 是指除最后一层外, 满二叉树 是指除最后一层外, 每一层上的所有
13、结点有两个子结点, 结点有两个子结点,则 k 层上有 2k-1 个结 的满二叉 个结点。 点深度为 m 的满二叉树有 2m-1 个结点。 完全二叉树 是指除最后一层外, 完全二叉 是指除最后一层外, 每一层上的结 点数均达成最大值, 点数均达成最大值, 在最后一层上只缺少右边 的若干结点。 的若干结点。 树存储结构采用链式存储结构 链式存储结构, 二叉树存储结构采用 链式存储结构 对于满二 叉树与完全二叉树可以按层序进行顺序存储。 树的遍历: 二叉树的遍历: ,一方面访问根结点 (1) 前序遍历 (DLR) 一方面访问根结点, ) 前序遍历( ) 一方面访问根结点, , 然后遍历左子树,最后遍
14、历右子树; 然后遍历左子树,最后遍历右子树; ,一方面遍历左子树 ) 一方面遍历左子树, , (2) 中序遍历 (LDR) 一方面遍历左子树, ) 中序遍历( 然后访问根结点,最后遍历右子树; 然后访问根结点,最后遍历右子树; (3)后序遍历(LRD)一方面遍历左子树,然 )后序遍历( )一方面遍历左子树, 后访问遍历右子树,最后访问根结点。 后访问遍历右子树,最后访问根结点。 17 查找技术 顺序查找的使用情况: 线性表为无序表;表采用链式存储结构。 二分法查找只合用于顺序存储的有序表 顺序存储的有序表, 二分法查找只合用于 顺序存储的有序表 对于 长度为 n 的有序线性表,最坏情况只需比较
15、 log2n 次。 18 排序技术 排序是指将一个无序序列整理成按值非递减 顺序排列的有序序列。 互换类排序法: (1)冒泡排序法,需要比较的 次数为 n(n-1)/2; (2)快速排序法。 插入类排序法: (1)简朴插入排序法,最坏情 况需要 n(n-1)/2 次比较; (2) 希尔排序法, 1.5 最坏情况需要 O(n )次比较。 选择类排序法: (1)简朴选择排序法, 最坏情 况需要 n(n-1)/2 次比较; (2)堆排序法, 最坏情况需要 O(nlog2n)次比较。 第二章程序设计基础 21 程序设计设计方法和风格 如何形成良好的程序设计风格 1、源程序文档化; 2、数据说明的方法;
16、 天骄现代考前冲刺资料 3、语句的结构; 4、输入和输出。 序言性注释和 功能性注释, 注释分 序言性注释 和 功能性注释 , 语句结构 清楚第一、效率第二。 清楚第一、效率第二 22 结构化程序设计 结构化程序设计方法的四条原则是: 结构化程序设计方法的四条原则是:1. 自顶 向下; 逐步求精; 模块化 模块化; 限制使用 向下 ;2. 逐步求精 ;3.模块化 ;4.限制使用 goto 语句 。 语句。 结构化程序的基本结构和特点: 结构化程序的基本结构 (1)顺序结构 顺序结构:一种简朴的程序设计,最基 顺序结构 本、最常用的结构; (2)选择结构 选择结构:又称分支结构,涉及简朴选 选择
17、结构 择和多分支选择结构,可根据条件,判断应当 选择哪一条分支来执行相应的语句序列; (3)循环结构 循环结构:可根据给定条件,判断是否 循环结构 需要反复执行某一相同程序段。 23 面向对象的程序设计 面向对象的程序设计:以 60 年代末挪威奥斯 陆大学和挪威计算机中心研制的 SIMULA 语 言为标志。 面向对象方法的优点: (1)与人类习惯的思维方法一致; (2)稳定 性好; (3)可重用性好; (4)易于开发大型 软件产品; (5)可维护性好。 对象是面向对象方法中最基本的概念, 可以用 对象 来表达客观世界中的任何实体, 对象是实体的 抽象。 面向对象的程序设计方法中的对象是系统中
18、用来描述客观事物的一个实体, 是构成系统的 一个基本单位, 由一组表达其静态特性的属性 和它可执行的一组操作组成。 属性即对象所包含的信息, 操作描述了对象执 属性 行的功能,操作也称为 方法 或 服务 。 方法或 操作也称为方法 服务。 对象的基本特点: 对象的基本特点: (1)标记惟一性; )标记惟一性; (2)分类性;)分类性; (3)多态性; )多态性; (4)封装性; )封装性; (5)模块独立性好。 )模块独立性好。 是指具有共同属性、 类 是指具有共同属性、共同方法的对象的集 合。所以类是对象的抽象,对象是相应类的一 所以类是对象的抽象, 个实例。 个实例。 消息 是一个实例与另
19、一个实例之间传递的信 息。 消息的组成涉及(1)接受消息的对象的名称; (2)消息标记符,也称消息名; (3)零个或 多个参数。 3 继承是指可以直接获得已有的性质和特性, 继承 是指可以直接获得已有的性质和特性, 是指可以直接获得已有的性质和特性 而 不必反复定义他们。 不必反复定义他们。 继承分单继承和多重继承。 继承分单继承和多重继承。 单继承指一个类只 允许有一个父类, 允许有一个父类, 多重继承指一个类允许有多 个父类。 个父类。 多态性是指同 是指同样的消息被不同的对象接受时 多态性 是指同 样的消息被不同的对象接受时 可导致完全不同的行动的现象 第三章软件工程基础 31 软件工程
20、基本概念 计算机软件是涉及程序 数据及 相关文档的 程序、 计算机软件是涉及 程序 、 数据 及 相关文档 的 完整集合。 完整集合。 软件的特点涉及: (1)软件是一种逻辑实体; (2)软件的生产与硬件不同,它没有明显的 制作过程; (3)软件在运营、使用期间不存在磨损、老 化问题; (4)软件的开发、运营对计算机系统具有依 赖性,受计算机系统的限制,这导致了软件移 植的问题; (5)软件复杂性高,成本昂贵; (6)软件开发涉及诸多的社会因素。 软件按功能分为应用软件、系统软件、 软件按功能分为应用软件、系统软件、支撑软 或工具软件) 件(或工具软件) 。 软件危机重要表现在成本、质量、生产
21、率等问 题。 软件工程是应用于计算机软件的定义 开发和 是应用于计算机软件的定义、 软件工程 是应用于计算机软件的定义、 维护的一整套方法、工具、文档、 维护的一整套方法、工具、文档、实践标准和 工序。 工序。 软件工程涉及 3 个要素:方法、工具和过程。 个要素:方法、工具和 过程。 软件工程过程是把软件转化为输出的一组彼 此相关的资源和活动,包含 4 种基本活动: (1)P软件规格说明; (2)D软件开发; (3)C软件确认; (4)A软件演进。 软件周期:软件产品从提出、实现、 软件周期 :软件产品从提出、实现、使用维护 到停止使用退役的过程。 到停止使用退役的过程。 软件生命周期三个阶
22、段:软件定义 软件开发 、 软件定义、 软件开发、 软件生命周期三个阶段 软件定义 、 运营维护,重要活动阶段是: 运营维护 ,重要活动阶段是: (1)可行性研究与计划制定; (2)需求分析; (3)软件设计; (4)软件实现; (5)软件测 试; (6)运营和维护。 软件工程的目的和与原则: 目的:在给定成本、进度的前提下,开发出具 有有效性、可靠性、可理解性、可维护性、可 天骄现代考前冲刺资料 重用性、可适应性、可移植性、可追踪性和可 互操作性且满足用户需求的产品。 基本目的:付出较低的开发成本;达成规定的 软件功能;取得较好的软件性能;开发软件易 于移植;需要较低的费用;能准时完毕开发,
23、 及时交付使用。 基本原则: 抽象、 信息隐蔽、 模块化、 局部化、 基本原则: 抽象、 信息隐蔽、 模块化、局部化、 拟定性、一致性、完备性和可验证性。 拟定性、一致性、完备性和可验证性。 软件工程的理论和技术性研究的内容重要包 软件工程的理论和技术性研 究的内容重要包 软件开发技术和软件工程管理。 括: 软件开发技术 和 软件工程管理 。 软件开发技术涉及: 软件开发方法学、 软件开发技术涉及 : 软件开发方法学 、 开发 过程、 开发工具和 软件工程环境。 过程 、 开发工具 和 软件工程环境 。 软件工程管理涉及: 软件管理学、 软件工程管理涉及 : 软件管理学 、 软件工程 经济学、
24、软件心理学等内容。 经济学 、 软件心理学等内容 。 软件管理学涉及人员组织、进度安排、 软件管理学涉及人员组织、进度安排、质量保 配置管理、项目计划等。 证、配置管理、项目计划等。 软件工程原则涉及抽象、信息隐蔽、模块化、 软件工程原则涉及抽象、信息隐蔽、模块化、 局部化、 拟定性、 一致性、 完备性和可验证性。 局部化、 拟定性、 一致性、 完备性和可验证性。 32 结构化分析方法 结构化方法的核心和基础是结构化程序设计 结构化方法的核心和基础是 结构化程序设计 理论。 理论 。 需求分析方法有( ) 结构化需求分析方法; 需求分析方法有(1)结构化需求分析方法 ; (2)面向对象的分析的
25、方法 。 ) 面向对象的分析的方法。 从需求分析建立的模型的特性来分: 从需求分析建立的模型的特性来分: 静态分析 动态分析。 和 动态分析 。 结构化分析方法的实质:着眼于数据流, 结构化分析方法的实质:着眼于数据流,自顶 向下,逐层分解,建立系统的解决流程, 向下,逐层分解,建立系统的解决流程,以数 据流图和数据字典为重要工具,建立系统的逻 据流图和数据字典为重要工具 建立系统的逻 辑模型。 辑模型。 结构化分析的常用工具 ( 1) 数据流图 ; ( 2) 数据字典 ; ( 3) ) 数据流图; ) 数据字典; ) 鉴定树; 鉴定树 ; (4)鉴定表 。 ) 鉴定表。 数据流图: 数据流图
26、:描述数据解决过程的工具,是需求 理解的逻辑模型的图形表达, 它直接支持系统 功能建模。 数据字典: 数据字典 对所有与系统相关的数据元素的一 个有组织的列表,以及精确的、严格的定义, 使得用户和系统分析员对于输入、输出、存储 成分和中间计算结果有共同的理解。 鉴定树: 从问题定义的文字描述中分清哪些是 鉴定的条件,哪些是鉴定的结论,根据描述材 料中的连接词找出鉴定条件之间的从属关系、 并列关系、选择关系,根据它们构造鉴定树。 鉴定表:与鉴定树相似,当数据流图中的加工 要依赖于多个逻辑条件的取值, 即完毕该加工 4 的一组动作是由于某一组条件取值的组合而 引发的,使用鉴定表描述比较适宜。 数据
27、字典是结构化分析的核心 是结构化分析的核心。 数据字典 是结构化分析的核心。 软件需求规格说明书的特点: (1)对的性; (2)无岐义性; (3)完整性; (4)可验证性; (5)一致性; (6)可理解性; (7)可追踪性。 33 结构化设计方法 软件设计的基本目的是用比较抽象概括的方 式拟定目的系统如何完毕预定的任务, 软件设 计是拟定系统的物理模型。 计是拟定系统的物理模型 。 软件设计是开发阶段最重要的环节 是将需求 是开发阶段最重要的环节, 软件设计 是开发阶段最重要的环节, 准确地转化为完整的软件产品或系统的唯一 途径。 途径。 从技术观点来看,软件设计涉及软件 结构设 软件设计涉及
28、软件 数据设计、接口设计、过程设计。 计 、 数据设计 、 接口设计 、 过程设计 。 结构设计: 定义软件系统各重要部件之间的关 系。 数据设计: 将分析时创建的模型转化为数据结 构的定义。 接口设计:描述软件内部、软件和协作系统之 间以及软件与人之间如何通信。 过程设计: 把系统结构部件转换成软件的过程 描述。 从工程管理角度来看:概要设计和具体设计。 从工程管理角度来看: 概要设计 和 具体设计 。 软件设计的一般过程: 软件设计是一个迭代的 过程;先进行高层次的结构设计;后进行低层 次的过程设计;穿插进行数据设计和接口设 计。 衡量软件模块独立性使用耦合性 内聚性两 耦合性和 衡量软件
29、模块独立性使用 耦合性 和 内聚性 两 个定性的度量标准。 个定性的度量标准。 在程序结构中各模块的内聚性越强, 在程序结构中各模块的内聚性越强, 则耦合性 越弱。优秀软件应高内聚,低耦合。 越弱。优秀软件应高内聚,低耦合。 软件概要设计的基本任务是: (1)设计软件系统结构; (2)数据结构及 数据库设计; (3)编写概要设计文档; (4) 概要设计文档评审。 模块用一个矩形表达, 箭头表达模块间的 调用关系。 在结构图中还可以用带注释的箭头表达 模块调用过程中来回传递的信息。 还可用带实 心圆的箭头表达传递的是控制信息, 空心圆箭 心表达传递的是数据。 结构图的基本形式:基本形式、顺序形式
30、、 结构图的基本形式:基本形式、顺序形式、重 复形式、选择形式。 复形式、选择形式。 结构图有四种模块类型: 传入模块、 传出模块、 结构图有四种模块类型: 传入模块、 传出模块、 天骄现代考前冲刺资料 变换模块和协调模块。 变换模块和协调模块。 典型的数据流类型有两种:变换型和 事务型。 典型的数据流类型有两种: 变换型 和 事务型 。 变换型系统结构图由输入、中心变换、 变换型系统结构图由输入、中心变换、输出三 部分组成。 部分组成。 事务型数据流的特点是:接受一项事务, 根据事务解决的特点和性质, 选择分派一个适 当的解决单元,然后给出结果。 具体设计: 是为软件结构图中的每一个模 块拟
31、定实现算法和局部数据结构, 用某种选定 的表达工具表达算法和数据结构的细节。 常见的过程设计工具有:图形工具( 常见的过程设计工具有:图形工具(程序流程 、表格工具 、语言工具 图) 表格工具(鉴定表) 语言工具(PDL) 、表格工具(鉴定表) 语言工具( 、 ) 。 34 软件测试 软件测试定义: 软件测试定义 使用人工或自动手段来运营或 测定某个系统的过程, 其目的在于检查它是否 满足规定的需求或是弄清预期结果与实际结 果之间的差别。 软件测试的目的: 软件测试的目的 : 发现错误而执行程序的过 程。 软件测试方法:静态测试和动态测试。 软件测试方法: 静态测试 和 动态测试 。 静态测试
32、涉及代码检查、静态结构分析、 静态测试涉及代码检查、静态结构分析、代码 质量度量。 质量度量。不实际运营软件,通过人工进行。 动态测试: 动态测试:是基本计算机的测试,重要涉及白 盒测试方法和黑盒测试方法。 白盒测试:在程序内部进行,重要用于完毕软 白盒测试 件内部 CAO 作的验证。 重要方法有逻辑覆盖、 基本基途径测试。 黑盒测试:重要诊断功能不对或漏掉、界面错 黑盒测试 误、数据结构或外部数据库访问错误、性能错 误、初始化和终止条件错,用于软件确认。主 要方法有等价类划分法、边界值分析法、错误 推测法、因果图等。 个环节进行: 软件测试过程一般按 4 个环节进行:单元测 集成测试、验收测
33、试(确认测试) 试、集成测试、验收测试(确认测试)和系统 测试。 测试。 35 程序的调试 程序调试的任务是诊断和改正程序中的错误, 程序调试的任务是诊断和改正程序中的错误, 重要在开发阶段进行。 重要在开发阶段进行。 程序调试的基本环节: (1)错误定位; (2)修改设计和代码,以排除错误; (3)进行回归测试,防止引进新的错误。 软件调试可分表静态调试和动态调试。 软件调试可分表静态调试和动态调试。 静态调 试重要是指通过人的思维来分析源程序代码 和排错,是重要的设计手段, 和排错,是重要的设计手段,而动态调试是辅 助静态调试。 助静态调试。重要调试方法有: 5 (1)强行排错法; (2)
34、回溯法; (3)因素排除法。 第四章 数据库设计基础 41 数据库系统的基本概念 数据: 数据:事实上就是描述事物的符号记录。 数据的特点:有一定的结构,有型与值之分, 数据的特点:有一定的结构,有型与值之分, 如整型、实型、字符型等。 如整型、实型、字符型等。而数据的值给出了 符合定型的值,如整型值 15。 数据库: 是数据的集合, 数据库 :是数据的集合, 具有统一的结构形式 并存放于统一的存储介质内, 并存放于统一的存储介质内, 是多种应用数据 的集成,并可被各个应用程序共享 各个应用程序共享。 的集成,并可被各个应用程序共享。 数据库存放数据是按数据所提供的数据模式 存放的,具有集成与
35、共享的特点。 数据库管理系统:一种系统软件,负责数据库 数据库管理系统 中的数据组织、数据操纵、数据维护、控制及 保护和数据服务等,是数据库的核心 是数据库的核心。 是数据库的核心 数据库管理系统功能: (1)数据模式定义:即为数据库构建其数据 框架; (2)数据存取的物理构建:为数据模式 的物理存取与构建提供有效的存取方法与手 段; (3)数据操纵:为用户使用数据库的数据提 供方便,如查询、插入、修改、删除等以及简 单的算术运算及记录; (4)数据的完整性、安生性定义与检查; (5)数据库的并发控制与故障恢复; (6)数据的服务:如拷贝、转存、重组、性 能监测、分析等。 为完毕以上六个功能,
36、 数据库管理系统提供以 下的数据语言: 下的数据语言: (1)数据定义语言 数据定义语言:负责数据的模式定义与 数据定义语言 数据的物理存取构建; (2)数据操纵语言:负责数据的操纵,如查 数据操纵语言 数据 询与增、删、改等; (3)数据控制语言 数据控制语言:负责数据完整性、安全 数据控制语言 性的定义与检查以及并发控制、故障恢复等。 数据语言按其使用方式具有两种结构形式: 交 互式命令(又称自含型或自主型语言 又称自含型或自主型语言)宿主型 互式命令 又称自含型或自主型语言 宿主型 语言(一般可嵌入某些宿主语言中) 语言(一般可嵌入某些宿主语言中) 。 数据库管理员:对数据库进行规划、设
37、计、维 数据库管理员 护、监视等的专业管理人员。 数据库系统:由数据库(数据) 、数据库管理 数据库系统 :由数据库(数据) 数据库管理 、 系统(软件) 数据库管理员(人员) 、数据库管理员 、硬件平 系统(软件) 数据库管理员(人员) 硬件平 、 、 硬件) 软件平台(软件) 、软件平台 台(硬件) 软件平台(软件)五个部分构成 、 的运营实体。 的运营实体。 数据库应用系统:由数据库系统、应用软件及 数据库应用系统 天骄现代考前冲刺资料 应用界面三者组成。 文献系统阶段: 提供了简朴的数据共享与数据 管理能力,但是它无法提供完整的、统一的、 管理和数据共享的能力。 层次数据库与网状数据库
38、系统阶段 :为统一 与共享数据提供了有力支撑。 关系数据库系统阶段 数据库系统的基本特点:数据的集成性 、数 据的高共享性与低冗余性 、数据独立性(物 理独立性与逻辑独立性) 、数据统一管理与控 制。 数据库系统的三级模式: 数据库系统的三级模式: 概念模式:数据库系统中全局数据逻辑 (1)概念模式 概念模式 结构的描述,全体用户公共数据视图; (2)外模式 外模式:也称子模式与用户模式。是用 外模式 户的数据视图,也就是用户所见到的数据模 式; (3)内模式 内模式:又称物理模式,它给出了数据 内模式 库物理存储结构与物理存取方法。 数据库系统的两级映射: 数据库系统的两级映射: (1)概念
39、模式到内模式的映射; )概念模式到内模式的映射; (2)外模式到概念模式的映射。 )外模式到概念模式的映射。 4.2 数据模型 数据模型的概念:是数据特性的抽象,从抽象 数据模型 层次上描述了系统的静态特性、 动态行为和约 束条件, 为数据库系统的信息表与操作提供一 个抽象的框架。描述了数据结构、数据操作及 数据约束。 E-R 模型的基本概念 (1)实体 实体:现实世界中的事物; 实体 (2)属性 属性:事物的特性; 属性 (3)联系 联系:现实世界中事物间的关系。实体 联系 集的关系有一对一、一对多、多对多的联系。 E-R 模型三个基本概念之间的联接关系:实 模型三个基本概念之间的联接关系:
40、 体是概念世界中的基本单位,属性有属性域, 体是概念世界中的基本单位,属性有属性域, 每个实体可取属性域内的值。 每个实体可取属性域内的值。 一个实体的所有 属性值叫元组。 属性值叫元组。 E-R 模型的图示法: ) 模型的图示法: 实体集表达法; 2) (1) ( 实体集表达法; ) ( 属性表法; 属性表法; (3)联系表达法。 )联系表达法。 层次模型的基本结构是树形结构, 具有以下特 点: (1)每棵树有且仅有一个无双亲结点,称为 根; (2) 树中除根外所有结点有且仅有一个双亲 有且仅有一个双亲。 有且仅有一个双亲 从图论上看, 网状模型是一个不加任何条件限 制的无向图。 制的无向图
41、。 6 关系模型采用二维表来表达,简称表 ,由表框 表 架及表的元组组成。 一个二维表就是一个关 系。 在二维表中凡能唯一标记元组的最小属性称 键或码。 为键或码 从所有侯选健中选取一个作为用户 键或码 使用的键称主键 主键。表 A 中的某属性是某表 B 主键 的键,则称该属性集为 A 的外键或外码 外键或外码。 外键或外码 关系中的数据约束: (1)实体完整性约束 实体完整性约束:约束关系的主键中属 实体完整性约束 性值不能为空值; (2)参照完全性约束:是关系之间的基本约 参照完全性约束: 参照完全性约束 束; 用户定义的完整性约束:它反映了具体 (3)用户定义的完整性约束 用户定义的完整
42、性约束 应用中数据的语义规定。 4.3 关系代数 关系数据库系统的特点之一是它建立在数据 关系数据库系统的特点之一 理论的基础之上, 有很多数据理论可以表达关 系模型的数据操作, 其中最为著名的是关系代 数与关系演算。 关系模型的基本运算: 关系模型的基本运算: (1)插入 (2)删除 (3)修改 (4)查询 ) ) 修改 ) 涉及投影、选择、笛卡尔积运算) (涉及投影、选择、笛卡尔积运算) 4.4 数据库设计与管理 数据库设计是数据应用的核心。 数据库设计是数据应用的核心 。 数据库设计的两种方法: 数据库设计的两种方法 1.面向数据 以信息需求为主, 面向数据: 兼顾解决需求; 面向数据
43、面向过程: 兼顾信息需求。 2.面向过程 以解决需求为主, 面向过程 数据库的生命周期: 需求分析阶段、 数据库的生命周期 :需求分析阶段、 概念设计 阶段、逻辑设计阶段、物理设计阶段、 阶段、逻辑设计阶段、物理设计阶段、编码阶 测试阶段、运营阶段、进一步修改阶段。 段、测试阶段、运营阶段、进一步修改阶段。 需求分析常用结构析方法和面向对象的方法。 需求分析常用结构析方法和面向对象的方法 。 结构化分析(简称 SA)方法用自顶向下、逐 层分解的方式分析系统。 用数据流图表达数据 和解决过程的关系。对数据库设计来讲,数据 字典是进行具体的数据收集和数据分析所获 得的重要结果。 数据字典是各类数据
44、描述的集合 是各类数据描述的集合, 数据字典 是各类数据描述的集合,涉及 5 个 部分:数据项、数据结构、数据流( 部分:数据项、数据结构、数据流(可以是数 据项,也可以是数据结构) 数据存储、 、数据存储 据项,也可以是数据结构) 数据存储、解决 、 过程。 过程。 数据库概念设计的目的是分析数据内在语义 关系。 关系 。设计的方法有两种 (1)集中式模式设计法(合用于小型或并不 )集中式模式设计法( 复杂的单位或部门) 复杂的单位或部门) ; 集成设计法。 (2)视图集成设计法。 )视图集成设计法 天骄现代考前冲刺资料 设计方法:E-R 模型与视图集成。 设计方法: 模型与视图集成。 视图
45、设计一般有三种设计顺序:自顶向下、 视图设计一般有三种设计顺序:自顶向下、由 底向上、由内向外。 底向上、由内向外。 视图集成的几种冲突:命名冲突、概念冲突、 视图集成的几种冲突:命名冲突、概念冲突、 域冲突、约束冲突。 域冲突、约束冲突。 关系视图设计: 关系视图设计: 关系视图的设计又称外模式设 计。 关系视图的重要作用: (1)提供数据逻辑独立性; (2)能适应用户对数据的不同需求; (3)有一定数据保密功能。 数据库的物理设计重要目的是对数据内部物 数据库的物理设计重要目的是 理结构作调整并选择合理的存取途径, 以提高 数据库访问速度有效运用存储空间。一般 RDBMS 中留给用户参与物理设计的内容大 致有索引设计、集成簇设计和分区设计。 71