1、(完整word版)数据库系统原理复习资料_清晰版数据库原理及应用复习重点第一章 数据库系统基本概念要求、目标:了解和掌握数据管理技术的发展阶段,数据描述的术语,数据抽象的四个级别,数据库管理系统的功能,数据库系统的组成。一、 数据管理技术的发展1 分为四个阶段:人工管理阶段、文件系统阶段、数据库阶段和高级数据库阶段。2 数据库阶段数据管理的特点:1) 采用数据模型表示复杂的数据结构。2) 有较高的数据独立性。3) 数据库系统为用户提供了方便的用户接口。4) 提供四方面的数据控制功能:数据库的恢复、数据库的并发控制、数据的完整性、数据安全性。5) 增加了系统的灵活性。3 数据库(DB):是长期存
2、储在计算机内、有组织的、统一管理的相关数据的集合。4 数据库管理系统(DBMS):是位于用户与操作系统之间的一层数据管理软件,它为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。5 数据库系统(DBS):是实现有组织地、动态地存储大量关联数据、方便多用户访问的计算机硬件、软件和数据资源组成的系统,即它是采用数据库技术的计算机系统。二、 数据描述1 分为三个阶段:概念设计、逻辑设计和物理设计。2 概念设计中的术语:1) 实体:客观存在,可以相互区别的事物称为实体。2) 实体集:性质相同的同类实体的集合。3) 属性:实体有很多特性,每一个特性称为属性。4) 实体标识符(
3、关键码或键):能惟一标识实体的属性或属性集。以上概念均有类型和值之分。3 逻辑设计中的术语:1) 字段(数据项):标记实体属性的命名单位称为字段或数据项。2) 记录:字段的有序集合。3) 文件:同一类记录的集合。4) 关键码:能惟一标识文件中每个记录的字段或字段集。以上概念均有类型和值之分。4 概念设计和逻辑设计中术语的对应关系:概念设计 逻辑设计 实体 记录属性 字段(数据项)实体集 文件实体标识符 关键码5 实体之间联系的元数:与一个联系有关的实体集个数。常用二元联系。二元联系的类型有三种:一对一联系、一对多联系、多对多联系。6 一对一联系:如果实体集E1中每个实体至多和实体集E2中的一个
4、实体有联系,反之亦然,那么实体集E1和E2的联系称为“一对一联系”,记为“1:1”。7 一对多联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体间有联系,而E2中每个实体至多和E1中一个实体有联系,那么称E1对E2的联系是“一对多联系”,记为“1:N”。8 多对多联系:如果实体集E1中每个实体可以与实体集E2中任意个(零个或多个)实体间有联系,反之亦然,那么称E1和E2的联系是“多对多联系”,记为“M:N”。三、 数据抽象的级别1 数据模型:描述数据库的结构和定义,对现实世界的数据进行抽象。2 从现实世界的信息到数据库存储的数据以及用户使用的数据是一个逐步抽象过程,根据数据抽
5、象的级别定义了四种模型:概念模型、逻辑模型、外部模型和内部模型。3 概念模型:表达用户需求观点的数据全局逻辑结构的模型。4 逻辑模型:表达计算机实现观点的DB全局逻辑结构的模型。5 外部模型:表达用户使用观点的DB局部逻辑结构的模型。6 内部模型:表达DB物理结构的模型。7 数据抽象的过程、即数据库设计的过程具体步骤:1) 根据用户需求,设计数据库的概念模型;2) 根据转换规则,把概念模型转换成数据库的逻辑模型;3) 根据用户的业务特点,设计不同的外部模型,给程序员使用;4) 数据库实现时,要根据逻辑模型设计其内部模型。通常分为概念设计、逻辑设计(2和3步)和物理设计三个阶段。8 常用的概念模
6、型是实体联系(ER)模型,ER模型主要用ER图来表示。9 逻辑模型的分类:层次模型、网状模型、关系模型等。10 层次模型:用树型(层次)结构表示实体及实体间联系的数据模型。11 1969年,美国IBM公司的IMS系统是典型的层次模型系统。12 网状模型:用有向图结构表示实体及实体间联系的数据模型。13 1969年,CODASYL组织提出DBTG报告中的数据模型是网状模型的主要代表。14 关系模型:是由若干个关系模式组成的集合。关系模式即记录类型,它的实例称为关系,每个关系实际上是一张二维表格。15 1970年,美国IBM公司的E.F.Codd连续发表论文,提出关系模型,奠定了关系数据库的理论基
7、础。关系数据库是目前的主流数据库。16 外部模型中的模式称为视图。17 三级模式:从用户(或应用程序)到数据库之间,DB的数据结构描述有三个层次:1)外模式:用户与数据库系统的接口,是用户用到的那部分数据的描述。外模式由若干个记录类型组成。2)逻辑模式:是数据库中全部数据的整体逻辑结构的描述。3)内模式:是数据库在物理存储方面的描述。注意:外模式是逻辑模式的子集。18 两级映像:1)外模式/逻辑模式映像:存在于外模式和逻辑模式之间,用于定义外模式和逻辑模式之间的对应性。2)逻辑模式/内模式映像:存在于逻辑模式和内模式之间,用于定义逻辑模式和内模式之间的对应性。19 数据库系统的三级模式、两级映
8、像结构使数据库系统达到了高度的数据独立性。20 数据独立性:是指应用程序与数据库的数据结构之间相互独立,在修改数据结构时,尽可能不修改应用程序。分为逻辑数据独立性和物理数据独立性。21 逻辑数据独立性:如果数据库的逻辑模式要修改,那么只要对外模式/逻辑模式映像作相应的修改,可以使外模式和应用程序尽可能保持不变。这样就认为数据库达到了逻辑数据独立性。22 物理数据独立性:如果数据库的内模式要修改,即数据库的物理结构有所变化,那么只要对逻辑模式/内模式映像作相应的修改,可以使逻辑模式尽可能保持不变。也就是对内模式的修改尽量不影响逻辑模式,当然对外模式和应用程序的影响更小,这样就认为数据库达到了物理
9、数据独立性。四、 数据库管理系统(DBMS)1DBMS的主要功能:数据库的定义功能(DBMS提供DDL定义数据库的三级模式、两级映像等)、数据库的操纵功能(DBMS提供DML实现对数据的操作,基本的数据操作有检索和更新两类)、数据库的保护功能、数据库的维护功能、数据字典。五、 数据库系统(DBS)1DBS的组成:是数据库、硬件、软件和数据库管理员的集合体。2软件包括DBMS、OS、各种主语言和应用开发支撑软件等程序。其中,DBMS是DBS的核心软件,要在OS支持下才能工作。3数据库管理员(DBA):是控制数据整体结构的一组人员,负责DBS的正常运行,承担创建、监控和维护数据库结构的责任。第一章
10、 复习题一、单项选择题1在数据库系统中,当数据库的内模式发生改变时,应用程序也可以不变。这是( A )A) 物理数据独立性 B)逻辑数据独立性C) 位置数据独立性 D)存储数据独立性2在下面列出的数据模型中,哪一个是概念数据模型( D )A)关系模型 B) 层次模型 C) 网状模型 D) 实体-联系模型3. 下面列出的数据管理技术发展阶段中,哪个(些)阶段数据不能保存在计算机中?( A ).人工管理阶段.文件系统阶段.数据库阶段A) 只有 B) 只有 C) 和 D) 和4. 用二维表结构表示实体以及实体间联系的数据模型称为( C )A) 网状模型 B) 层次模型 C) 关系模型 D) 实体-联
11、系模型5. 下面列出的条目中,哪些是数据库技术的主要特点( A ).数据共享度高.数据的冗余小.较高的数据独立性.程序的标准化A) 、和 B) 和 C) 、和 D) 都是6. 数据库管理系统DBMS中用来定义逻辑模式、内模式和外模式的语言是( C )A) DML B)C C)DDL D)Basic7. 层次模型的典型代表是( A )数据库管理系统。A) IMS B)IBM C)DBTG D)ATM8. 负责数据库系统的正常运行,承担创建、监控和维护数据库结构责任的是( C )A) 应用程序员 B)终端用户 C)数据库管理员 D)数据库管理系统的软件设计员9. 在以下各条叙述中,正确的叙述有几条
12、( B )1) 数据库避免了一切数据重复2) 数据库减少了数据冗余3) 数据库中,如果逻辑模式改变,则需将与其有关的外模式做相应改变,否则应用程序需改写4) 数据库中的内模式如有改变,逻辑模式可以不变A) 1 B)2 C)3 D)410. 在三级模式之间引入两级映像,其主要功能之一是( A )A) 使数据与程序具有较高的独立性B) 使系统具有较高的通道能力C) 保持数据与程序的一致性D)提高存储空间的利用率11. 视图对应于数据库系统三级模式结构中的( A )A) 外模式 B)逻辑模式 C)内模式D)都不对应12. 对数据库中数据可以进行查询、插入、删除、修改,这是因为数据库管理系统提供了(
13、B )A) 数据库定义功能 B)数据库操纵功能C)数据库维护功能 D)数据库控制功能13. 1970年,美国IBM公司研究员E.F.Codd提出了数据库的( C )A) 层次模型 B)网状模型 C)关系模型 D)实体联系模型14. 具有数据冗余度小、数据共享、以及较高数据独立性等特征的系统是( B )A) 文件系统 B)数据库系统 C)管理系统 D)高级程序15. 在概念设计中的事物称为( A )A) 实体 B)记录 C)对象 D)结点16. 层次模型表达实体及实体之间联系用的数据结构是( D )A) 网状 B)表 C)有向图 D)树型17. DB是( A )A) 数据库 B)数据库管理系统
14、C)数据处理系统 D)数据库系统18. DBMS是( B )A) 数据库 B)数据库管理系统 C)数据处理系统 D)数据库系统19. 已知在一个工厂中有多个车间,每一个车间有多名职工,工厂的产品要经过多个车间的多道工序加工。具体来说,一个产品要经过多个工人加工,一位工人要加工多个产品。问:工厂与车间之间属于( A )联系,车间与工人之间属于( A )联系,工人与产品之间属于( D )联系。A) 一对多 B)一对一 C)未知 D)多对多20. ( D )是存储在计算机内的有结构的数据集合。A) 网络系统 B)数据库系统 C)操作系统 D)数据库21. 数据库系统的核心是( D )A) 编译系统
15、B)数据库 C)操作系统 D)数据库管理系统22. 数据库(DB)、数据库系统(DBS)和数据库管理系统(DBMS)三者之间的关系是( A )A) DBS包括DB和DBMS B)DBMS包括DB和DBSC)DB包括DBS和DBMS D)DBS就是DB,也就是DBMS23. 数据库管理系统(DBMS)是( B )A) 一组硬件 B)一组软件 C)既有硬件,也有软件24. 在DBS中,DBMS和OS之间关系是( B )A) 相互调用 B)DBMS调用OSC)OS调用DBMS D)并发运行25. 数据库系统是在( A )的基础上发展起来的。A) 文件系统 B)应用程序系统C)数据库管理系统 D)编译
16、系统26. 三级模式间存在两种映射,它们是( A )A) 逻辑模式与外模式间,逻辑模式与内模式间B) 外模式与内模式间,外模式与逻辑模式间C) 内模式与外模式间,内模式与逻辑模式间27. 表达用户使用观点的数据库局部逻辑结构的模型是( C )A) 概念模型 B)逻辑模型C)外部模型 D)内部模型二、填空题1数据管理技术的发展经历了如下四个阶段:人工管理阶段、文件系统阶段、数据库阶段和高级数据库阶段。2用二维表结构表示的实体及实体间联系的数据模型称为关系模型。3两个实体集之间的联系有三种,分别是一对一联系,一对多联系和多对多联系。4如果实体集E1中每个实体至多和实体集E2中的一个实体有联系,反之
17、亦然,那么实体集E1和E2的联系称为一对一联系。5数据库系统的三级模式、两级映像结构使数据库系统达到了高度的数据独立性。第二章 数据库设计和ER模型要求、目标:了解和掌握数据库应用系统设计的全过程,掌握ER模型和关系模型的基本概念,掌握概念设计中ER模型的设计方法,掌握逻辑设计中ER模型向关系模型转换的方法。一、数据库系统生存期1数据库系统生存期:数据库应用系统从开始规划、设计、实现、维护到最后被新的系统取代而停止使用的整个期间。2数据库系统生存期分七个阶段:规划、需求分析、概念设计、逻辑设计、物理设计、实现、运行维护。3规划阶段三个步骤:系统调查、可行性分析、确定数据库系统总目标。4需求分析
18、阶段:主要任务是系统分析员和用户双方共同收集数据库系统所需要的信息内容和用户对处理的需求,并以需求说明书的形式确定下来。5概念设计阶段:产生反映用户单位信息需求的概念模型。与硬件和DBMS无关。6逻辑设计阶段:将概念模型转换成DBMS能处理的逻辑模型。外模型也将在此阶段完成。7物理设计阶段:对于给定的基本数据模型选取一个最适合应用环境的物理结构的过程。数据库的物理结构主要指数据库的存储记录格式、存储记录安排和存取方法。8数据库的实现:包括定义数据库结构、数据装载、编制与调试应用程序、数据库试运行。二、ER模型的基本概念1 ER模型的基本元素是:实体、联系和属性。2 实体:是一个数据对象,指应用
19、中可以区别的客观存在的事物。实体集:是指同一类实体构成的集合。实体类型:是对实体集中实体的定义。一般将实体、实体集、实体类型统称为实体。3 联系:表示一个或多个实体之间的关联关系。联系集:是指同一类联系构成的集合。联系类型:是对联系集中联系的定义。一般将联系、联系集、联系类型统称为联系。4 同一个实体集内部实体之间的联系,称为一元联系;两个不同实体集实体之间的联系,称为二元联系,以此类推。5 属性:实体的某一特性称为属性。在一个实体中,能够惟一标识实体的属性或属性集称为实体标识符。6 ER模型中,方框表示实体、菱形框表示联系、椭圆形框表示属性、实体与联系、实体与其属性、联系与其属性之间用直线连
20、接。实体标识符下画横线。联系的类型要在直线上标注。注意:联系也有可能存在属性,但联系本身没有标识符。例:假设一个学生可选多门课程,而一门课程又有多个学生选修,一个教师可讲多门课程,一门课程至多只有一个教师讲授。ER图如下:7 概念设计三个步骤:设计局部ER模型、设计全局ER模型和全局ER模型的优化。三、关系模型的基本概念1关系模型的定义:用二维表格表示实体集,用关键码表示实体之间联系的数据模型。2在关系模型中,字段称为属性,字段值称为属性值,记录类型称为关系模式。记录称为元组,元组的集合称为关系或实例。有时习惯称关系为表或表格,元组为行,属性为列。关系中属性个数称为元数,元组个数称为基数。3关
21、键码或者关键字(简称键):由一个或多个属性组成。4超键:在关系中能惟一标识元组的属性集称为关系模式的超键。5候选键:不含有多余属性的超键。6主键:用户选作元组标识的候选键。一般如不加说明,键是指主键。7外键:如果模式R中属性集K是其他模式的主键,那么K在模式R中称为外键。8值域:关系中每一个属性都有一个取值范围,称为属性的值域。每一个属性对应一个值域,不同的属性可对应于同一值域。9关系的定义:关系是一个属性数目相同的元组的集合。10关系的性质:关系是一种规范化了的二维表格。1)关系中每一个属性值都是不可分解的;2)关系中不允许出现重复元组;3)关系没有行序;4)元组中的属性在理论上也是无序的,
22、但使用时按习惯考虑列的顺序。11关系数据库中的数据与更新操作必须遵循三类完整性规则:实体完整性规则、参照完整性规则、用户定义的完整性规则。12实体完整性规则:要求关系中元组在组成主键的属性上不能有空值。13参照完整性规则:如果属性集K是关系模式R1的主键,K也是关系模式R2的外键,那么在R2关系中,K的取值只允许两种可能,或者为空值,或者等于R1关系中某个主键值。这条规则的实质是“不允许引用不存在的实体”。其中,R1称为参照关系;R2称为依赖关系。注意:这条规则在具体使用时,有三点变通:1)外键和相应的主键可以不同名,只要定义在相同值域上即可;2)R1和R2可以是同一个关系模式,此时表示了同一
23、个关系中不同元组之间的联系;3)外键值是否允许空,应视具体问题而定。14用户定义的完整性规则:用户针对具体的数据约束,设置的完整性规则,由系统来检验实施。四、ER模型到关系模型的转换1ER图转换成关系模式集的算法:1)实体类型的转换:将每个实体类型转换成一个关系模式,实体的属性即为关系模式的属性,实体标识符即为关系模式的键。2)联系类型的转换:主要掌握二元联系类型的转换。a) 若实体间联系是1:1,可以在两个实体类型转换成的关系模式中任意一个关系模式的属性中加入另一个关系模式的键(作为外键)和联系类型的属性。b) 若实体间联系是1:N,则在N端实体类型转换成的关系模式中加入1端实体类型的键(作
24、为外键)和联系类型的属性。c) 若实体间联系是M:N,则将联系类型也转换成关系模式,其属性为两端实体类型的键(作为外键)加上联系类型的属性,而键为两端实体键的组合。例:下面是教学管理的一个可能的ER图。图中,有三个实体类型:系、教师和课程;有四个联系类型:主管、聘用、开设和任教。根据转换算法,把该图转换成关系模式集的步骤如下:MN1111系系编号系名电话主管开设聘用教师课程任教学分姓名性别教工号职称教材课程号课程名NN教学管理的ER图聘期第一步:把三个实体类型转换成三个关系模式(注意关系模式的表示方法):系(系编号,系名,电话)教师(教工号,姓名,性别,职称)课程(课程号,课程名,学分)第二步
25、:对于1:1联系,可以在“系”模式中加入教工号(教工号为外键)。对于1:N联系“聘用”,可以在“教师”模式中加入系编号和聘期两个属性(系编号为外键);对于1:N联系“开设”,可以在“课程”模式中加入系编号(系编号为外键)。这样第一步得到的三个模式改变成如下形式(注意:外键通常使用波浪线表示):系(系编号,系名,电话,主管人的教工号)教师(教工号,姓名,性别,职称,系编号,聘期)课程(课程号,课程名,学分,系编号)第三步:对于M:N联系“任教”,则生成一个新的关系模式:任教(教工号,课程号,教材)这样,转换成的四个关系模式如下:系(系编号,系名,电话,主管人的教工号)教师(教工号,姓名,性别,职
26、称,系编号,聘期)课程(课程号,课程名,学分,系编号)任教(教工号,课程号,教材)2采用ER模型的逻辑设计步骤1)导出初始关系模式集:把概念设计的结果(即全局ER模型)转换成初始关系模式集。2)规范化处理3)模式评价4)模式修正5)设计外模式第二章 复习题一、单项选择题1下面对于关系的叙述中,哪个是不正确的?( C )A)关系中的每个属性是不可分解的B) 在关系中元组的顺序是无关紧要的C) 任意的一个二维表都是一个关系D)每一个关系只有一种记录类型2设属性A是关系R的主键,则属性A不能取空值。这是( A )A)实体完整性规则 B) 参照完整性规则C)用户定义完整性规则 D) 域完整性规则3对关
27、系数据库来讲,下面( C )说法是错误的A)外键和相应的主键可以不同名,只要定义在相同值域上即可B)不同的属性可对应于同一值域C)行的顺序可以任意交换,但列的顺序不能任意交换D) 关系中的任意两个元组不能完全相同4数据库的物理设计是为一个给定的逻辑结构选取一个适合应用环境的( B )的过程,包括确定数据库在物理设备上的存储结构和存取方法。A) 逻辑结构 B)物理结构 C)概念结构 D)层次结构5在关系中,能惟一标识元组的属性集称为( B )。A)外键 B)超键 C)域 D)元组6在数据库逻辑设计中,当将E-R图转换为关系模式时,下面的做法( B )是不正确的A)一个实体类型转换为一个关系模式B
28、)一个联系类型转换为一个关系模式C)由实体类型转换成的关系模式的主键是该实体类型的主键7数据库设计的概念设计阶段,表示概念结构的常用方法和描述工具是( D )A)层次分析法和层次结构图B)数据流程分析法和数据流程C)结构分析法和模块结构图D)实体联系方法和ER图8关系数据库中,实现表与表之间的联系是通过( B )A) 实体完整性规则 B)参照完整性规则C)用户定义的完整性 D)值域9有两个实体集,并且它们之间存在着一个M:N联系,那么按照ER模型转换成关系数据库的规则,这个ER结构转换成表的个数为( C )A) 1 B)2 C)3 D)410把E-R图转换为关系模型的过程,属于数据库设计的(
29、B )A) 概念设计 B)逻辑设计 C)需求分析 D)物理设计11在数据库设计的( D )阶段,进行应用程序的编制和调试。A) 概念设计 B)逻辑设计 C)物理设计 D)实现12 EMP 雇员号雇员名部门号工资001张山022000010王宏达011200056马林生021000101赵敏041500DEPT部门号部门名地址01业务部1号楼02销售部2号楼03服务部3号楼04财务部4号楼在雇员信息表关系EMP中,哪个属性是外键?( C )A) 雇员号 B) 雇员名 C) 部门号 D) 工资二、填空题1表示实体及其联系的方法为ER图,基本图素包括方框、菱形框和椭圆形框。习惯上实体用方框表示,实体
30、的属性用椭圆形框表示,联系用菱形框表示。2在关系模型中,二维表的列称为属性,二维表的行称为元组。3假设班级和班长之间的联系是一对一联系,则班级和学生之间是一对多联系;另外,学生和课程之间的联系是多对多联系。4关系模型的三种完整性规则是实体完整性规则、参照完整性规则和用户定义的完整性规则。5已知系(系编号,系名称,系主任,电话,地点)和学生(学号,姓名,性别,入学日期,专业,系编号)两个关系,系关系的主键是系编号,学生关系的主键是学号,外键是系编号。6数据库系统生存期分七个阶段:规划、需求分析、概念设计、逻辑设计、物理设计、实现、运行维护。7关系中属性个数称为元数,元组个数称为基数。三、综合题1
31、设某商业集团数据库中有三个实体集。一是“商店”实体集,属性有商店编号、商店名、地址等;二是“商品”实体集,属性有商品号、商品名、规格、单价等;三是“职工”实体集,属性有职工编号、姓名、性别、业绩等。商店与商品间存在“销售”联系,每个商店可销售多种商品,每种商品也可放在多个商店销售,每个商店每销售一种商品,有月销售量;商店与职工间存在着“聘用”联系,每个商店有许多职工,每个职工只能在一个商店工作,商店聘用职工有聘期和月薪。试画出ER图,并在图上注明属性、联系的类型。再转换成关系模式集,并指出每个关系模式的主键和外键。1NMN商店商品职工姓名职工编号聘期性别业绩月销售量商店名地址商店编号单价商品名
32、规格商品号销售聘用月薪关系模式集:商店(商店编号,商店名,地址)商品(商品号,商品名,规格,单价)职工(职工编号,姓名,性别,业绩,商店编号,月薪,聘期)销售(商店编号,商品编号,月销售量)2设某商业集团数据库中有三个实体集。一是“公司”实体集,属性有公司编号、公司名、地址等;二是“仓库”实体集,属性有仓库编号、仓库名、地址等;三是“职工”实体集,属性有职工编号、姓名、性别等。公司与仓库间存在“隶属”联系,每个公司管辖若干仓库,每个仓库只能属于一个公司管辖;仓库与职工间存在“聘用”联系,每个仓库可聘用多个职工,每个职工只能在一个仓库工作,仓库聘用职工有聘期和工资。试画出ER图,并在图上注明属性
33、、联系的类型。再转换成关系模式集,并指出每个关系模式的主键和外键。1NN1仓库公司职工姓名职工编号聘期性别仓库名地址仓库编号公司名地址公司编号隶属聘用工资关系模式集:公司(公司编号,公司名,地址)仓库(仓库编号,仓库名,地址,公司编号)职工(职工编号,姓名,性别,仓库编号,聘期,工资)3设某商业集团数据库中有三个实体集。一是“商品”实体集,属性有商品号、商品名、规格、单价等;二是“商店”实体集,属性有商店编号、商店名、地址等;三是“供应商”实体集,属性有供应商编号、供应商名、地址等。供应商与商品间存在“供应”联系,每个供应商可供应多种商品,每种商品可向多个供应商订购,供应商供应商品有月供应量;
34、商店与商品间存在“销售”联系,每个商店可销售多种商品,每种商品可在多个商店销售,商店销售商品有月计划数。试画出ER图,并在图上注明属性、联系的类型。再转换成关系模式集,并指出每个关系模式的主键和外键。MNNM商店供应商商品商品名商品号月计划数规格单价月供应量供应商名地址供应商编号商店名地址商店编号供应销售关系模式集:供应商(供应商编号,供应商名,地址)商店(商店编号,商店名,地址)商品(商品号,商品名,规格,单价)供应(供应商编号,商店编号,月供应量)销售(商店编号,商品号,月计划数)第三章 关系模式设计理论要求、目标:了解关系数据库规范化理论及其在数据库设计中的作用,重点是函数依赖和范式,要
35、求掌握这些概念并能运用它们来进行模式分解。一、关系模式的设计准则1数据冗余:同一个数据在系统中多次重复出现。2关系模式设计不当引起的异常问题:数据冗余、操作异常(包括修改异常、插入异常和删除异常)3关系模式的非形式化设计准则1)关系模式的设计应尽可能只包含有直接联系的属性,不要包含有间接联系的属性。也就是,每个关系模式应只对应于一个实体类型或一个联系类型。2)关系模式的设计应尽可能使得相应关系中不出现插入异常、删除和修改等操作异常现象。3)关系模式的设计应尽可能使得相应关系中避免放置经常为空值的属性。4)关系模式的设计应尽可能使得关系的等值连接在主键和外键的属性上进行,并且保证以后不会生成额外
36、的元组。4习惯使用的一些符号:1)英文字母表首部的大写字母“A,B,C,”表示单个的属性。2)英文字母表尾部的大写字母“,U,V,W,X,Y,Z”表示属性集。3)大写字母R表示关系模式,小写字母r表示其关系。4)关系模式的简化表示方法:R(A,B,C,)或R(ABC)5)属性集X和Y的并集简写为XY。二、函数依赖1函数依赖(FD)的定义:设有关系模式R(U),X和Y是属性集U的子集,函数依赖是形成XY的一个命题,只要r是R的当前关系,对r中任意两个元组t和s,都有tX=sX蕴涵tY=sY,那么称FD XY在关系模式R(U)中成立。说明: 1)tX表示元组t在属性集X上的值,其余类同。 2)XY
37、读作“X函数决定Y”或“Y函数依赖于X”。 3)FD是对关系模式R的一切可能的关系r定义的。对于当前关系r的任意两个元组,如果X值相同,则要求Y值也相同,即有一个X值就有一个Y值与之对应,或者说Y值由X值决定。例:设关系模式R(ABCD),在R的关系中,属性值间有这样的联系:A值与B值有一对多联系;C值与D值之间有一对一联系。试根据这些规则写出相应的函数依赖。BA CD DC2如果XY和YX同时成立,则可记为:XY3FD的逻辑蕴涵:设F是在关系模式R上成立的函数依赖的集合,XY是一个函数依赖。如果对于R的每个满足F的关系r也满足XY,那么称F逻辑蕴涵XY,记为F|=XY。4设F是函数依赖集,被
38、F逻辑蕴涵的函数依赖全体构成的集合,称为函数依赖集F的闭包,记为F+。即F+=XY | F|=XY 5FD的推理规则(Armstrong公理)设U是关系模式R的属性集,F是R上成立的只涉及到U中属性的函数依赖集。1) 自反性:若YXU,则XY在R上成立。2) 增广性:若XY在R上成立,且ZU,则XZYZ在R上成立。3) 传递性:若XY和YZ在R上成立,则XZ在R上成立。6FD的其他五条推理规则:1)合并性:XY,XZ |= XYZ2)分解性:XY,ZY |= XZ3)伪传递性:XY,WYZ |= WXZ4)复合性:XY,WZ |= WXYZ5)XY,WZ |= X(W-Y)YZ7对于FD XY
39、,如果YX,那么称XY是一个“平凡的FD”,否则称为“非平凡的FD”。通常研究非平凡FD。例:XX,X, ,XYX都是平凡函数依赖;XXY则是非平凡函数依赖。8函数依赖是关键码概念的推广。设关系模式R的属性集是U,X是U的一个子集。如果XU在R上成立,那么称X是R的一个超键。如果XU在R上成立,但对于R的任一真子集X1都有X1U不成立,那么称X是R的一个候选键。在关系模式设计理论中,键通常是指候选键。9属性集的闭包10设F是属性集U上的FD集,X上U的子集,那么(相对于)属性集X的闭包用X+表示,它是一个从F集使用FD推理规则推出的所有满足XA的属性A的集合:X+=属性A | F|=XA11X
40、Y能用FD推理规则推出的充分必要条件是Y X+,从而避开求F+,使问题得到简化。12求属性集X相对于FD集F的闭包X+的算法:X+=X;do oldX+:=X+; for F中每个FD YZ do if Y X+ then X+:=X+Z;while(X+!=oldX+);例:属性集U为ABCD,FD集为AB,BC,DB。求A+、(AD)+和(BD)+A+=ABC(AD)+=ABCD(BD)+=BCD13如果关系模式R(U)上的两个函数依赖集F和G,有F+=G+,则称F和G是等价的函数依赖集。三、关系模式的分解特性1关系模式的分解:设有关系模式R(U),属性集为U,而R1,R2,Rk都是U的子
41、集,并且有R1R2Rk=U。关系模式R1,R2,Rk的集合用表示,=R1,R2,Rk。用代替R的过程称为关系模式的分解。这里称为R的一个分解,也称为数据库模式。一般把上述的R称为泛关系模式,R对应的当前值称为泛关系。数据库模式对应的当前值称为数据库实例,它由数据库模式中的每一个关系模式的当前值组成。我们用=表示。因此,在计算机中数据并不是存储在泛关系r中,而是存储在数据库中。2和r是否等价,即是否表示同样的数据。这个问题用“无损分解”特性表示。在模式R上有一个FD集F,在的每一个模式Ri上有一个FD集Fi,那么F1,F2,Fk与F是否等价。这个问题用“保持依赖”特性表示。四、范式1范式:衡量关
42、系模式好坏的标准。2数据库设计中最常用的是3NF和BCNF。3第一范式(1NF):如果关系模式R的每个关系r的属性值都是不可分的原子值,那么称R是第一范式的模式。满足1NF的关系称为规范化的关系,否则称为非规范化的关系。1NF是关系模式应具备的最起码的条件。4局部依赖和完全依赖:对于FD WA,如果存在XW有XA成立,那么称WA是局部依赖(A局部依赖于W);否则称WA是完全依赖。5主属性和非主属性:如果A是关系模式R的候选键中的属性,那么称A是R的主属性;否则称A是R的非主属性。6第二范式(2NF):如果关系模式是1NF,且每个非主属性完全函数依赖于候选键,那么称R是第二范式(2NF)的模式。
43、7分解成2NF模式集的算法:设关系模式R(U),主键是W,R上还存在FD XZ,并且Z是非主属性和XW,那么WZ就是一个局部依赖。此时应把R分解成两个模式:R1(XZ),主键是X;R2(Y),其中Y=U-Z,主键仍是W,外键是X(参照R1)。如果R1和R2还不是2NF,则重复上述过程,一直到数据库模式中的每一个关系模式都是2NF为止。8如果XY,YA,且YX和AY,那么称XA是传递依赖(A传递依赖于X)。9第三范式(3NF):如果关系模式R是2NF,且每个非主属性都不传递依赖于R的候选键,那么称R是第三范式(3NF)的模式。10分解成3NF模式集的算法:设关系模式R(U),主键是W,R上还存在
44、FD XZ。并且Z是非主属性,ZX,X不是候选键,这样WZ就是一个传递依赖。此时应把R分解成两个模式:R1(XZ),主键是X;R2(Y),其中Y=U-Z,主键仍是W,外键是X(参照R1)。如果R1和R2还不是3NF,则重复上述过程,一直到数据库模式中的每一个关系模式都是3NF为止。11如果R是3NF模式,那么R也是2NF模式。如果R是2NF模式,那么R也是1NF模式。12BC范式(BCNF):如果关系模式R是1NF,且每个属性都不传递依赖于R的候选键,那么称R是BCNF的模式。13如果R是BCNF模式,那么R也是3NF模式。14分解成BCNF模式集的算法能保持无损分解,但不一定能保持FD集。而分解成3NF模式集的算法既能保持无损分解,又能保持FD集。15关系模式由1NF分解为2NF,消除了非主属性对键的局部函数依赖;由2NF分解为3NF,消除了非主