资源描述
更多优质自考资料尽在百度贴吧自考乐园俱乐部
(
自考互联网数据库串讲资料
第一章 绪 论
【学习要求】
通过本章的学习,考生首先应该了解数据管理发展的历程,并理解数据模型的三要素及常用的三种数据模型,并在此基础上,掌握数据库系统的三级模式结构和数据的两层映像,理解数据库管理系统的组成和功能。
【重点、难点】
(一)数据管理技术发展的三个阶段
(二)数据模型的概念和分类,尤其是关系数据模型
(三)数据库系统的三级模式结构
(四)数据库管理系统的整体概念。
【考核知识点】
(一)数据库技术是随着数据管理的需要而产生的。数据处理的的核心是数据管理。数据管理指的是对数据的分类、组织、编码、储存、检索和维护。
(二)数据管理技术共经历了三个阶段:
人工管理阶段、文件系统阶段、数据库系统阶段
(三)人工管理阶段:
数据不保存、数据需要由应用程序自己进行管理、基本上没有文件概念、数据不共享。
(四)文件系统阶段:
数据可以长期保存、文件系统管理数据、文件已经多样化、数据的存取基本上以记录为单位。
缺点有:数据共享性差,数据冗余度大;数据和程序缺乏独立性
(五)数据库管理阶段:
1、数据结构化。
2、数据共享性高、冗余度小、易扩充。
3、数据独立性高。
4、统一的数据管理和控制:数据的安全性保护、数据的完整性控制、数据库恢复和并发控制。
5、数据的最小存取单位是数据项。
DB:数据库(Database),DB是统一管理的相关数据的集合。
DBMS:数据库管理系统(Database Management System),DBMS是位于用户与操作系统之间的一层数据管理软件,为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型、面向对象型DBMS。
DBS:数据库系统(Database System),DBS是实现有组织地、动态地存储大量关联数据,方便多用户访问的计算机软件、硬件和数据资源组成的系统,即采用了数据库技术的计算机系统。
数据库技术:是一门研究数据库结构、存储、管理和使用的软件学科。
第一代数据库系统,即层次数据库系统和网状数据库系统
第二代数据库系统,即关系数据库系统
第三代数据库系统,即面向对象数据库系统
数据库学科的研究范围:数据库管理系统软件的研制; 数据库设计; 数据库理论。
(六)数据模型是现实世界数据特征的抽象。是数据库系统的核心和基础。
(七)数据模型应满足三方面要求:一是能比较真实地模拟现实世界;二是容易为人所理解;三是便于在计算机上实现。
(八)根据模型应用目的分为:⑴概念模型,也称信息模型,它是按用户的观点对数据和信息建模。⑵数据模型,主要包括层次模型、网状模型、关系模型和面向对象数据模型,它是按计算机系统的观点对数据建模。
(九)数据模型三个要素:
1、数据结构 描述系统的静态特性
2、数据操作 描述系统的动态特性
3、数据的约束条件 是一组完整性规则的集合
(十)概念模型
数据描述的三个领域:现实世界、信息世界和机器世界
(十一)数据描述的两种形式:物理描述和逻辑描述。前者是指数据在存储设备上的存取方式,后者是指程序员或用户以用以操作的数据形式。
(十二)两个实体型之间的联系可以分为三类:
一对一联系(1∶1);一对多联系(1∶n);多对多联系(m∶n);E-R图提供了表示实体型、属性和联系的方法。实体-联系方法(E-R方法)是抽象和描述现实世界的有力工具。
实体型:用矩形表示,矩形框内写明实体名。
属性:用椭圆形表示,并用无向边将其与相应的实体连接起来。
联系:用菱形表示,菱形框内写明联系名,并用无向边分别志有关实体连接起来,同时在无向边旁标上联系的类型(1∶1,1∶n或m∶n)。
(十三)数据模型
数据模型:层次模型、网状模型、关系模型和面向对象数据模型。其中层次模型和网状模型统称为非关系模型。
层次模型:用树型结构表示实体间联系的数据模型,它有以下两个限制:
⑴只有一个结点没有双亲结点,称之为根结点;
⑵根以外的其他结点有且只有一个双亲结点。
层次数据模型可以直接表示一对多(包括一对一)的联系;层次模型表示多对多联系,必须首先将其分解成一对多联系。分解方法有两种:冗余结点法和虚拟结点法。
网状模型:用有向图结构表示实体类型及实体间联系的数据模型。
(1)允许一个以上的结点无双亲;(2)一个结点可以有多于一个的双亲。
关系模型:是由若干个关系模式组成的集合,其主要特征是用二维表格结构表达实体集,用外鍵表示实体间联系。
关系模型要求关系必须是规范化的,即要求关系模式必须满足一定的规范条件,这些规范条件中最基本的一条就是,关系的每一个分量必须是一个不可分的数据项,也就是说,不允许表中还有表。
(十四)数据系统的三级模式结构:外模式(物理模式)、模式(逻辑模式)和内模式。
(十五)两级映象:
外模式/模式映象,一般在外模式中描述。
模式/内模式映象,一般在内模式中描述。
两层映象保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。
(十六)数据库管理系统的功能:
⑴数据定义
⑵数据操纵
⑶数据库运行管理
⑷数据组织、存储和管理
⑸数据库的建立和维护
⑹数据通信接口
(十七)数据库管理系统组成:
⑴数据定义语言及其翻译处理程序
⑵数据操纵语言及其编译(或解释)程序
⑶数据库运行控制程序
⑷实用程序
(十八)一个设计优良的DBMS:
⑴友好的用户界面
⑵比较完备的功能
⑶较高的运行效率
⑷清晰的系统结构和开放性
第二章 关系数据库简介
【学习要求】
通过本章的学习,考生应了解关系模型的概念,掌握关系模型的构成,理解关系代数的两类运算以及关系演算的两类演算语言。
【重点、难点】
(一)关系数据结构和关系完整性
(二)集合运算
(三)关系演算语言
【考核知识点】
(一)关系数据库系统与非关系数据库系统的区别是:关系系统只有"表"这一种数据结构;而非关系数据库系统还有其他数据结构,对这些数据结构有其他的操作。
(二)关系模型的组成:关系数据结构、关系操作集合、关系完整性约束、关系数据语言。
(三)关系的三类完整性约束:实体完整性、参照完整性和用户定义的完整性。
实体完整性规则:要求关系中组成主键的属性上不能有空值。
参照完整性规则:要求不引用不存在的实体。
用户定义完整性规则:由具体应用环境决定,系统提供定义和检验这类完整性的机制。
(四)关系数据语言的共同特点是:语言具有完备的表达能力,是非过程化的集合操作语言,功能强,能够嵌入高级语言中使用。
基本关系具有以下六条性质:
① 列是同质的(Homogeneous),即每一列中的分量同一类型的数据,来自同一个域。
② 不同的列可出自同一个域,称其中的每列为一个属性,不同的属性要给予不同的属性名。
③列的顺序无所谓,即列的次序可以任意交换。
④任意两个元组不能完全相同。
⑤行的顺序无所谓,即行的次序可以任意交换。
⑥分量必须取原子值,即每一个分量都必须是不可分的数据项。
关系模型要求关系必须是规范化的,即要求关系模式必须满足一定的规范条件。这些规范条件中最基本的一条就是,关系的每一个分量必须是一个不可分的数据项。
(五)关系是关系模式在某一个时刻的状态或内容。关系模式是静态的,稳定的,而关系是动态的、随时间不断变化的,因为关系操作在不断地更新着数据库中的数据。但在实际当中,人们常常把关系模式和关系都称为关系。
实体完整性规则说明如下:
(1)实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界的一个实体集。例如学生关系对应于学生的集合。
(2)现实世界中的实体是可区分的,即它们具有某种唯一性标识。
(3)相应地,关系模型中以主码作为唯一性标识。
(4)主码中的属性即主属性不能取空值。所谓空值就是"不知道"或"无意义"的值。
关系可以有三种类型:基本关系(通常又称为基本表或基表)、查询表和视图表。
(六)元组变量主要有两方面的用途:
①简化关系名。
②操作条件中使用量词时必须用元组变量
(七)关系代数和关系演算
关系式一种抽象的查询语言,是关系数据操纵语言的一种传统表达方式,它是用对关系的运算来表达查询的。
任何一种运算都是将一定的运算符作用于一定的运算对象上,得到预期的运算结果。所以运算对象、运算符、运算结果是运算的三大要素。
关系代数的运算对象是关系,运算结果也为关系。
(八)元祖关系演算和域关系演算
元祖关系演算以元祖变量作为谓词变元的基本对象。
域关系演算以元祖变量的分量即域变量作为谓词变元的基本对象。
(九)域关系演算语言
数关系演算的另一种形式是域关系演算。域关系演算以元祖变量的分量即域变量作为谓词变元的基本对象。1975年由IBM公司的M.Zloof提出的QBE(Query By Example)就是一个很有特色的域关系演算语言,该语言于1978年在IBM370上得以实现。QBE也指此关系数据库管理系统。
QBE是通过例子进行查询的简称,其罪突出的特点是它的操作方式。它是一种高度非过程化的基于屏幕表格的查询语言,用户通过终端屏幕编辑程序以填写表格的方式构造查询要求,而查询结果也是以表格形式显示,因此非常直观,易学易用。QBE中用示例元素来表示查询结果可能的例子,示例元素实质上就是域变量。
(1) 检索操作
QBE的检索操作分为简单查询、条件查询和使用集函数。
(2) 更新操作
QBE是更新操作包括修改操作、插入操作和删除操作。
第三章 关系数据库标准语言SQL
【学习要求】
通过本章的学习,考生应了解SQL语言的主要特点,掌握SQL语言的数据定义功能和数据操纵功能,理解视图的定义和优点,了解数据控制的功能,了解嵌入式SQL语句的一般形式及其分类。
【重点、难点】
一、 SQL语言的产生及其主要特点
二、 SQL语言的检索功能
三、 数据控制的概念
【考核知识点】
(一)SQL语言的主要特点【简答】
SQL语言集数据查询、数据操纵、数据定义和数据控制功能于一体。
特点包括:①综合统一、②高度非过程化、③面向集合的操作方式、④以同一种语法结构提供两种使用方式、⑤语言简洁,易学易用。
(二)定义基本表
建立数据库最重要的一部就是定义一些基本表。SQL语言使用CREATE TABLE 语句定义基本表,其一般格式如下:
CREATE TABLE<表名>(<列名><数据类型>[列级完整性约束条件]
[,<列名><数据类型>[列级弯成型约束条件]…]
[,<表级完整性约束条件>]
其中<表名>是所要定义的基本表的名字,它可以由一个或多个属性(列)组成。建表的同时通常还可以定义与该表有关的完整性约束条件,这些完整次那个约束条件呗存入系统的数据字典中,当用户操作表中数据时由DBMS自动检查该数据是否违背这些完整性约束条件。如果完整性约束条件涉及到该表的多个属性,则必须定义在表级上,否则既可以定义在列级,也可以定义在表级。
定义表的各个属性时需要指明其数据类型及长度。不同的数据库系统支持的数据类型不完全相同。具体的数据类型定义参照相应的数据库管理系统说明。
(三)简单查询、连接查询、嵌套查询、集合查询
数据库查询时数据库的核心。
(1)简单查询:简单查询仅涉及数据库中的一个表。
①查询表中的若干列
②取消取值重复的行
③条件查询
④对查询结果排序
⑤使用集函数
⑥对查询结果分组,如GROUP BY子句将查询结果表按某一列或多列值分组,值相等的为一组。
(2)连接查询
若查询同时涉及两个以上的表,则称之为连接查询。连接查询时关系数据库最主要的查询,包括等值连接、自然连接、非等值连接、自身连接、外连接和复合条件连接查询。
(3)嵌套查询
嵌套查询亦称为子查询,嵌套查询时指一个SE-LECT FROM WHERE查询块可以嵌入另一个查询块之中。
(四)修改、删除
1、修改(UPDATE)(亦称为更新)
修改操作语句的一般格式为:
UPDATE<表名>
SET<列名>=<表达式>[,<列名>=<表达式>]…
[WHERE谓词]
2、删除(DELETE)
删除语句的一般格式为:
DELETE
FROM表名
[WHERE谓词]
(五)视图的定义
试图是从一个或几个基本表(或视图)导出的表,它与基本表不同,是一个虚表。数据库中只存放视图的定义,而不存放视图对应的数据,这些数据仍存放在原来的基本表中。
(六)查询视图、更新视图
查询视图:视图定义后每用户就可以像对基本表进行查询一样对视图进行查询了,对基本的各种查询操作一般都可以作用于视图。
更新视图:更新视图包括插入(INSERT)、删除(DELETE)和修改(UPDATE)三类操作。
由于视图时不实际存储数据的虚表,因此对视图的更新,最终要转换为对基本表的更新。
为防止用户通过视图对数据进行增、删、改时,无意或故意造作不属于视图范围内的基本表数据,可在定义视图时加上WITH CHECK OPTION子句,这样在视图上增、删、改数据时,DBMS会进一步检查视图定义中的条件,若不满足条件,则拒绝执行该操作。
(七)定义和合理地使用视图能带来的好处为:【简答】
⑴、视图能够简化用户的操作
⑵、视图使用户能以多种角度看待同一数据
⑶、视图对重构数据库提供了一定程度的逻辑独立性
⑷、视图能够对机密数据提供安全保护
(八)视图更新操作规则的限制:
如果视图是从多个基本表使用联接操作导出的,则不允许更新。
如果导出的视图使用了分组和聚合操作,也不允许更新。
如果视图是从单个基本表使用选择和投影操作导出的,并且包括了基本表的主键或某个候选键,则可以执行操作。
(九)SQL中数据控制功能包括事务管理功能和数据保护功能,即数据库的恢复、并发控制;数据库的安全性和完整性。(填空、选择)
第四章 关系数据库设计理论
【学习要求】
通过本章的学习,考生应了解数据依赖的定义及两种重要的类型,理解各类范式的概念及涵义,并掌握相关概念及关系模式规范化的步骤。
【重点、难点】
(一)数据依赖的两种类型
(二)各类范式的概念及含义
(三)关系模式的分解及判断与远关系模式等价的三个标准
【考核知识点】
(一)数据依赖的含义
数据依赖是通过一个关系中属性间值的相等与否体现出来的数据间的相互关系,是现实世界属性间相互联系的抽象,是数据内在的性质,是语义的体现。现在人们已经提出了许多种类型的数据依赖,其中最重要的是函数依赖和多值依赖。
(二)相关概念
1、函数依赖
设R(U)是一个关系模式,U是R的属性集合,X和Y式U的子集。对于R(U)的任意一个可能的关系,如果r中不存在两个元祖,它们在X上的属性值相同,而在Y上的属性值不同,则称“X函数确定Y”或“Y函数依赖于X”,记作X-Y。
2、平凡函数依赖于非平凡函数依赖
在关系模式R(U)中,对于U的子集X和Y,如果X→Y,但YX,则X→Y是非平凡函数依赖,若YX,则称X→Y为平凡函数依赖。
3、传递函数依赖
在关系函数R(U)中,如果X→Y,Y→Z,且YX,Y→X,则称Z传递函数依赖于X。
(三)关系模式规范化时一般应遵循以下原则:
(1)关系模式进行无损连接分解。
(2)合理选择规范化程度。
(3)正确性与可实现性原则。
(四)关系模式规范化的基本步骤如图所示。
①对1NF关系进行投影,消除原关系中非主属性对码的函数依赖,将1NF关系转换为若干个2NF关系。
②对2NF关系进行投影,消除原关系中非主属性对码的传递函数依赖,从而产生一组3NF关系。
③对3NF关系进行投影,消除原关系中主属性对码的部分函数依赖和传递函数依赖(也就是说,使决定属性都成为投影的候选码),得到一组BCNF关系。
消除决定属性集非码的非平凡函数依赖
1NF
消除非主属性对码的部分函数依赖
2NF
消除非主属性对码的传递函数依赖
3NF
消除主属性对码的部分和传递函数依赖
BCNF
消除非平凡且非函数依赖的多值依赖
4NF 消除不是由候选码所蕴含的连接依赖
5NF
以上三步也可以合并为一步:对原关系进行投影,消除决定属性不是候选码的任何函数依赖。
④对BCNF关系进行投影,消除原关系中非平凡且非函数依赖的多值依赖,从而产生一组4NF关系。
⑤对4NF关系进行投影,消除原关系中不是由候选码所蕴含的连接依赖,即可得到一组5NF关系。5NF是最终范式。
1NF/2NF/3NF存在的问题: ①插入异常 ②删除异常 ③数据冗余度大 ④修改复杂。
BCNF问题:①数据冗余度大 ②增加操作复杂 ③删除操作复杂 ④修改操作复杂。
(五)关系模式分解的三个定义(判断对关系模式的一个分解是否与原关系模式等价可以有三种不同的标准):(填空、选择)
(1)分解具有"无损连接性"。
(2)分解要"保持函数依赖"。
(3)分解既要"保持函数依赖",又要具有"无损连接性"。
(六)规范化理论提供了一套完整的模式分解算法,按照这套算法可以做到:
①若要求分解具有无损连接性,那么模式分解一定能够达到4NF。
②若要求分解保持函数依赖,那么模式分解一定能够达到3NF,但不一定能够达到BCNF。
③若要求分解既具有无损连接性,又保持函数依赖,则模式分解一定能够达到3NF,但不一定能够达到BCNF。
(七)BCNF的关系模式都具有如下3个性质:
①所有非主属性都完全函数依赖于每个候选码。
②所有主属性都完全函数依赖于每个不包含它的候选码。
③没有任何属性完全函数依赖于非码的任何一组属性。
(八)分解具有无损连接性和分解保持函数依赖是两个互相独立的标准。(选择)
第五章 数据库保护
【学习要求】
通过本章的学习,考生应了解数据库安全性控制的措施,理解完整性约束条件和控制机制,理解并发控制的原则和方法,了解恢复的原理及实现技术。
【重点、难点】
(一)数据库安全性控制的一般方法
(二)数据库完整性约束条件的分类
(三)并发控制的两类锁协议
(四)数据库运行故障恢复的原理和策略
【考核知识点】
(一)数据库的被破坏主要有以下几个方面:
(1)系统的软、硬件故障,造成数据被破坏。
(2)数据库的并发操作引起数据的不一致性。
(3)自然的或人为的破坏。
(4)对数据库数据的更新操作有误。
针对上述问题,数据库管理系统提供相应的功能:
(1)数据库恢复:在系统失效后的数据库恢复,配合定时备份数据库,使数据库不丢失数据。
(2)并发控制:保证多用户能共享数据库,并维护数据的一致性。
(3)安全性保护:防止对数据库的非法使用,以避免数据的泄露、纂改或破坏。
(4)完整性保护:保证数据的正确性和一致性。
(二)数据库安全控制的一般方法:
①用户标识和鉴定;②存取控制;③定义视图;④审计;⑤数据加密。
(三)数据的安全性、完整性
数据库的安全性主要是指保护数据库,防止由于非法使用数据库造成数据泄露、更改或破坏。(填空、选择)
数据库的完整性:数据的正确性、一致性和相容性。(填空、选择)
数据的完整性与安全性是数据库保护的两个不同的方面。安全性是防止用户非法使用数据库。完整性则是防止合法用户使用数据库时向数据库中加入不合语义的数据。也就是说,安全性措施的防范对象是非法用户和非法操作,完整性措施的防范对象是不合语义的数据。(简答)
(四)完整性约束条件
完整性约束条件作用的对象可以有列级、元组级和关系级三种粒度。(填空、选择)
1、静态列级约束。是对一个列的取值域的说明,包括以下几个方面
2、静态元组约束。一个元组是由若干个列值组成的,静态元组约束就是规定组成的一个元组的各个列之间的约束关系。
3、静态关系约束。在一个关系的各个元组之间或者若干关系之间常常存在各种联系或约束。
4、动态列级约束。动态列级约束是修改列定义或列植时应满足的约束条件。
5、动态元组约束。动态元组约束是指修改某个元组的值时需要参照其旧值,并且新旧值之间需要满足某种约束条件。
6、动态关系约束。动态关系约束是加在关系变化前后状态上的限制条件,例如,事务一致性,原子性等约束条件。
(五)DBMS的完整性控制机制应具有三个方面功能(简答)
(1)定义功能,即提供定义完整性约束条件的机制。
(2)检查功能,即检查用户发出的操作请求是否违背了完整性约束条件。
(3)如果发现了用户的操作请求使数据违背了完整性的约束条件,则采取一定的动作来保证数据的完整性。
(六)在实现参照完整性时需要考虑以下几方面:
(1)外码是否可以接受空值
(2)在被参照关系中删除元组时的考虑
(3)修改被参照关系中主码时的考虑
(七)事物的概念和特征
事务:并发控制的单位,是用户定义的一组数据库操作序列。
特征:原子性、一致性、隔离性、持久性。(简答)
(八)并发控制的主要技术是采用封锁机制。(选择)
(九)封锁
封锁就是事务T可以向系统发出请求,对某个数据对象(最常用的是记录)加锁。于是事务T对这个数据对象就有一定的控制。基本的封锁类型有两种:排它锁(X锁)和共享锁(S锁)。
(十)活锁和死锁
和操作系统一样,封锁的方法可能引起活锁和死锁。
活锁是指当若干事务要对同一数据项加锁时,造成一些事务的永远等待,得不到控制权的现象;死锁是指两个以上事务集合中的每个事务都在等待加锁当前已被另一事务加锁的数据项,从而造成相互等待的现象。
(十一)数据库中解决死锁的常用方法有:
⑴要求每个事务一次就将所有要使用的数据全部加锁,否则就不能执行。
⑵采用按序加锁法。
⑶不采取任何措施来预防死锁的发生,而是周期性的检查系统中是否有死锁。
(十二)可串行性
可串行化的调度:如果几个事务并行(交错)执行的结果和按次序串行执行的结果相同,则称该并行执行结果是正确的。这样的调度称为可串行化的调度。
两段锁协议是指所有事务必须分两个阶段对数据库项加锁和解锁。
(十三)两段锁协议规定所有的事务应遵守下列规则:
⑴、在对任何数据进行读、写操作之前,事务首先要获得对该数据的封锁。
⑵、在释放一个封锁之后,事务再获得任何其他封锁。
(十四)“两段”锁的含义
所谓“两段”锁含义是:事务分为两个阶段。第一阶段是获得封锁,也称为扩展阶段。在该阶段,事务可以申请获得任何数据项上的任何类型的锁,但是不能释放任何锁。第二阶段是释放封锁,也称为收缩阶段。在该阶段,事务可以释放任何数据项上的任何类型的锁,但是不能再申请任何锁。
(十五)故障的种类(简答)
数据库系统故障可分为:
(1)事务内部的故障:事务内部的故障有的是可以通过事务程序本身发现的,有的是非预期的,不能由事物程序处理的。这类恢复操作称为事务撤销。
(2)系统故障:系统故障是指造成系统停止运转的任何事件,使得系统要重新启动。
(3)介质故障:系统故障常称为软故障,介质故障称为硬故障。硬故障指外存故障,如磁盘的磁头碰撞,瞬时的强磁场干扰。
(4)计算机病毒。计算机病毒是一种认为的故障或破坏,是一些恶作剧者研制的一种计算机程序。
(十六)数据转储
转储:静态转储(转储期间不允许对数据库进行任何存取、修改活动)
动态转储(转储期间允许对数据进行存取或修改)
海量转储(每次转储全部数据库)
增量转储(每次只转储上次转储后更新过的数据)
(十七)日志文件
日志文件是用来记录对数据库每一次更新活动的文件。在转储中必须建立日志文件,后援副本和日志文件综合起来才能有效地恢复数据库。
利用日志文件恢复事务的过程:
①从头扫描日志文件,找出哪些事务在故障发生时已经结束,哪些事务尚未结束;
②对尚未结束的事务进行撤销处理,对已经结束的事务进行重做处理。
(十八)利用转储和日志文件可以有效地恢复数据库
①硬件故障;病毒破坏:当数据库本身被破坏时,可重装转储数据库的后备副本,然后运行日志文件,执行事务恢复,这样就可以重建数据库。
②发生事务故障;系统故障:当数据库本身没被破坏,但内容已经不可靠时,可利用日志文件恢复事务,从而使数据库回到某一正确状态,这时不必重装后备副本。
第六章 数据库设计
【学习要求】
通过本章的学习,考生应了解数据库设计的步骤,理解并掌握需求分析、概念结构设计、逻辑结构设计、数据库物理设计以及数据库实施的方法,了解数据库运行与维护的内容。
【重点、难点】
(一)数据库的设计方法
(二)需求分析的步骤
(三)概念设计的几种步骤
【考核知识点】
(一)数据库和信息系统(简答)
信息系统是提供信息、辅助人们对环境进行控制和进行决策的系统。数据库是信息系统的核心和基础。它把信息系统中大量的数据按一定的模型组织起来,提供存储、维护、检索数据的功能,使信息系统可以方便、及时、准确地从数据库中获得所需的信息。
(二)数据库设计内容:结构(数据)设计;行为(处理)设计。
(三)数据库设计的基本步骤
数据库设计分为以下六个阶段:①需求分析阶段、②概念结构设计阶段、③逻辑结构设计阶段、④数据库物理设计阶段、⑤数据库实施阶段、⑥数据库运行和维护阶段。
(四)数据库设计过程中注意的问题:
(1)数据库设计过程中要充分调动用户的积极性。
(2)应用环境的改变、新技术的出现等都会导致应用需求的变化,因此在设计数据库时必须充分考虑到系统的可扩性。
(3)在设计数据库应用的过程中,必须充分考虑到已有应用,尽量使用户能够平稳地从旧系统迁移到新系统。
(五)调查的重点是"数据"和"处理",通过调查、收集与分析,获得用户对数据库的要求:
(1)信息要求。指用户需要从数据库中获得信息的内容与性质。由信息要求可以导出数据要求,即在数据库中需要存储哪些数据。
(2)处理要求。指用户要完成什么处理功能,对处理的响应时间有什么要求,处理方式是批处理还是联机处理。
(3)安全性与完整性要求。
(六)在需求分析阶段需要注意的是:
(1)需求分析阶段的一个重要而困难的任务是收集将来应用所涉及的数据,设计人员应充分考虑到可能的扩充和改变,使设计易于更改,系统易于扩充,这是第一点。
(2)必须强调用户的参与,这是数据库应用系统设计的特点。数据库应用系统和广泛的用户有密切的联系。因此用户的参与是数据库设计不可分割的一部分。在数据分析阶段,任何调查研究没有用户的积极参加是寸步难行的。设计人员应该和用户取得共同的语言,帮助不熟悉计算机的用户建立数据库环境下的共同概念,并对设计工作的最后结果承担共同的责任。
(七)常用的调查方法有(简答)
(1)跟班作业;(2)开调查会;(3)请专人介绍;(4)询问;(5)设计调查表请用户填写;(6)查阅记录。
(八)数据字典
数据字典:是系统中各类数据描述的集合,是进行详细的数据收集和数据分析所获得的主要成果。
数据字典包括:数据项、数据结构、数据流、数据存储、处理过程。
数据项是数据的最小组成单位,若干个数据项可以组成一个数据结构,数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。
(九) 概念结构的主要特点(简答)
(1)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理要求。是对现实世界的一个真实模型。
(2)易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库的设计成功的关键。
(3)易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充。
(4)易于向关系、网状、层次等各种数据模型转换。
(十)设计概念结构通常有四类方法(简答、选择)
(1)自顶向下。即首先定义全局概念结构的框架,然后逐步细化。
(2)自底向上。即首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念结构。
(3)逐步扩张。首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构。
(4)混合策略。即将自顶向下和自顶向上相结合,用自顶向下策略设计一个全局概念结构的框架,以它为骨架集成由自顶底向上策略中涉及的各局部概念结构。
(十一)数据抽象与局部视图设计
一般有三种抽象:
(1)分类。定义某一类概念作为现实世界种一组对象的类型。这些对象具有某些共同的特性和行为。
(2)聚集。定义某一类型的组成成分,它抽象了对象内部类型和成分之间的语义。
(3)概括。定义类型之间的一种子集联系。
概念结构设计的第一步就是利用抽象机制对需求分析阶段收集到的数据进行分类、组织(聚集)、形成实体、实体的属性,标识实体的码,确定实体之间的联系类型,设计分E-R图,具体做法是:
(1) 选择局部应用。
(2) 逐一设计分E-R图。
(十二)视图的集成
各分E-R图之间的冲突主要有三类:属性冲突、命名冲突和结构冲突。(填空)
(十三)设逻辑结构时一般要分三步进行
(1) 将概念结构转化为一般的关系、网状、层次模型。
(2) 将转化来的关系、网状、层次模型向特定DBMS支持下的数据模型转换。
(3) 对数据模型进行优化。
(十四)关系数据模型的优化通常以规范化理论为指导,方法如下。
①确定数据依赖。
②对于各个关系模式之间的数据依赖进行极小化处理,消除冗余的联系。
③按照数据依赖的理论对关系模式逐一进行分析,考查是否存在部分函数依赖、传递函数依赖、多值依赖等,确定各关系模式分别属于第几范式。
④按照需求分析阶段得到的各种应用对数据处理的要求,分析对于这样的应用环境这些模式是否合适,确定是否要对它们进行合并或分解。
⑤对关系模式进行必要的分解或合并,提高数据操作的效率和存储空间的利用率。
(十五)确定数据库的物理结构
数据库的物理结构依赖于所选用的DBMS,依赖于计算机硬件环境,设计人
员进行设计时主要需要考虑以下几个方面:
确定数据的存储结构、设计数据的存取路径、确定数据的存放位置、确定系统配置。
(十六)数据库实施主要包括以下工作:(简答)
①、定义数据库结构
②、数据装载
③、编制与调试应用程序
④、数据库试运行
(十七)人工完成数据的入库(简答)
数据库结构建立好后,就可以向数据库中装载数据了。对于数据量不是很大的小型系统,可以用人工方法完成数据的入库,其步骤:
(1) 筛选数据
(2) 转换数据格式
(3) 输入数据
(4) 校验数据
对于中大型系统,应该设计一个数据输入子系统,由计算机辅助数据的入库
工作。其步骤如下:
(1) 筛选数据
(2) 输入数据
(3) 校验数据
(4) 转换数据
(5) 综合数据
(十八)在数据库运行阶段,对数据库经常性的维护工作主要由DBA完成的,它包括以下内容:(简答)
(1) 数据库的转储和恢复
(2) 数据库的安全性、完整性控制
(3) 数据库性能的监督、分析和改进
(4) 数据库的重组织和重构造
第七章 基于WEB数据库技术概述
【学习要求】
通过本章的学习,考生应了解Web数据库相关技术;超文本传输协议、公共网关接口、服务器API、Java数据库连接及Microsoft Activex平台。
【重点、难点】
(一)HTIP协议的基本概念
(二)CGI的基本概念
(三)服务器API
(四)Java数据库连接的基本知识
(五)Microsoft ActiveX平台的基本概念
【考核知识点】
(一)URL组成(选择)
检索协议、Internet节点、为HTTP客户服务的资源文件名。
(二)CGI的一般概念
CGI是外部应用程序(CGI程序)与Web服务器之间的接口标准,是在CGI程序和Web服务器之间传递信息的规程。CGI规范允许Web服务器执行外部程序,并将它们的输出发送给Web浏览器。CGI将Web的一组简单的静态超媒体文档变成一个完整的新的交互式媒体。
(三)CGI程序调用方式(简答)
①通过交互式主页里的表单栏(FORM)调用CG1程序,用户在填完一张表单后,按确认按钮就启动了CGI程序。
②通过URL直接调用CGI程序。
(四)CGI的特点
CGI的主要优点是它的简单、语言无关性、Web服务器无关性以及它广泛的可接受性。(选择、填空)
虽然CGI提供了一种与数据库连接的简单方法,但它也存在一些局限性。
⑴瓶颈问题,客户机和数据库服务器之间的通信必须通过Web服务器,当有大量的用户访问时,Web服务器会"超载"。
⑵缺乏效率和事务支持,CGI应用程序不能由多个客户机请求共享,降低了性能,增加了等待时间。
⑶CGI应用程序不持久,服务器必须为每次访问CGI程序建立新的进程或线程,每次请求时数据库连接都必须重新打开,开销很大。
⑷CGI程序安全性问题
(五)ASP文件组成部分:(简答)
(1)文本;
(2)HTML标记,可单独使用或嵌入在各个ASP脚本单元中,以" <和>"为定界符;
(3)VBb(或Jb)语句,可单独使用或嵌入在各个ASP脚本单元中,以(b和/b)为定界符,通过对"RUN AT"属性的设置来决定是否在服务器端运行;
(4)ASP脚本命令:可单独使用或包含在此和〈/html〉内,以"〈%"和"%〉"为定界符。
(六)API是驻留在Web服务器上的程序代码,它扩展了服务器的性能,其方式类似于CGI。
ActiveX是Microsoft提出的一种标准,AcitveX也是Microsoft一组软件技术的统称,包括控件、文档、脚本三种最常用的技术,以及Microsoft的许多其他技术。
Active Server Pages(ASP)是 Microsoft基于服务器的、建立动态和交互式 Web页面的技术,它是建立在ISAPI技术基础上的,并克服了CGI存在的缺点。
(七)JDBC
JDBC是一个SQL层的API,允许将SQL语句作为参数据嵌入到JDBC接口中。JDBC通过一组Java接口实现其目标,每一个接口均由独立的数据库厂家不同地实现。
展开阅读全文