收藏 分销(赏)

第3章关系数据库规范化理论1xt.ppt

上传人:pc****0 文档编号:13063754 上传时间:2026-01-12 格式:PPT 页数:50 大小:378.50KB 下载积分:10 金币
下载 相关 举报
第3章关系数据库规范化理论1xt.ppt_第1页
第1页 / 共50页
第3章关系数据库规范化理论1xt.ppt_第2页
第2页 / 共50页


点击查看更多>>
资源描述
,单击此处编辑母版标题样式,*,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,数据库技术及应用,第三章关系数据库的规范化理论,1,3.1,关系模式的冗余和异常问题,范式(,Normal Form,):,是指规范化的关系模式。,第一范式(,1NF,):,由满足最基本规范化的关系模式。,第一范式的关系模式再满足另外一些约束条件就产生了第二范式、第三范式、,BC,范式等等。,一个低一级的关系范式通过模式分解可以转换成若干高一级范式的关系模式的集合,这种过程叫关系模式的规范化(,Normalization,)。,2,二、,关系模式规范化的必要性,关系模式应满足的基本要求,1),元组的每个分量必须是不可分的数据项。,2),数据库中的数据冗余应尽可能少。,数据量巨增,系统负担过重,浪费存储空间,造成数据的不完整。,3),关系数据库不能因为数据更新操作而引起数据不一致问题。,(数据冗余),4),当执行数据插入操作时,数据库中的数据不能产生插入异常现象。,数据库中的数据因不能满足某种完整性要求而不能正常地插入到数据库中。,5),数据库中的数据不能在执行删除操作时产生删除异常问题。,删除某种信息的同时,把其他信息也删除了。多种信息捆绑在一起。,3,关系中每一个分量都必须是不可分的数据项。,判断是否为关系的标准,关系的一切数学理论都是基于关系服从,1NF,。,姓名,所在系,成绩,C,数据库,李明,计算机,65,78,姓名,所在系,C,成绩,数据库成绩,李明,计算机,65,78,修改后的数据结构:,将大大增加关系操作的表达、优化及执行的复杂度。,4,6),数据库设计应考虑,查询要求,,数据组织应合理。,在,数据库设计时,不仅要考虑到自身结构的完整性,还要考虑到数据的使用要求。,为了使数据查询方便、数据处理简便,有必要通过,视图、索引和适当增加数据冗余,的方法。,5,2.,关系中异常和冗余问题,数据冗余大;插入异常;删除异常;更新异常。,dwbm,dwmc,Wzbm,Wzmc,Rq,Jldw,Price,Qls,sfs,0101,一分厂一车间,020101,25,铜管材,2002/12/01,根,90,5,5,0101,一分厂一车间,010401,锆美合金,2002/12/01,Kg,1200,10,8,0101,一分厂一车间,010101,铍铜合金,2002/12/02,Kg,800,20,20,0101,一分厂一车间,020102,20,铜管材,2002/12/02,根,80,5,5,0101,一分厂一车间,020101,25,铜管材,2002/12/02,根,90,10,10,0102,一分厂二车间,010301,铅锑,合金,2002/12/02,Kg,1000,8,8,0102,一分厂二车间,020101,25,铜管材,2002/12/02,根,90,3,3,0221,二分厂生产科,020101,25,铝管材,2002/12/02,根,70,20,15,6,3.,模式分解是关系规范化的主要方法,按,“一事一地”,的原则分解成“单位”、“物资”和“领料”三个关系,其关系模式为:,单位(,单位编码,,单位名称,),物资(,物资编码,,物资名称,计量单位,价格,),领料(,单位编码,物资编码,领料时间,,请领量,实发量,),关系模式,:,物资领料,(,单位编码,,单位名称,,物资编码,,物资名称,,领料时间,,计量单位,价格,请领量,实发量)。,7,学号,姓名,年龄,性别,系名,系主任,课程名,成绩,98001,李华,20,男,计算机系,王民,程序设计,88,98001,李华,20,男,计算机系,王民,数据结构,74,98001,李华,20,男,计算机系,王民,数据库,82,98001,李华,20,男,计算机系,王民,电路,65,98002,张平,21,女,计算机系,王民,程序设计,92,98002,张平,21,女,计算机系,王民,数据结构,82,98002,张平,21,女,计算机系,王民,数据库,78,98002,张平,21,女,计算机系,王民,电路,83,98003,陈兵,20,男,数学系,赵敏,高等数学,72,98003,陈兵,20,男,数学系,赵敏,数据结构,94,98003,陈兵,20,男,数学系,赵敏,数据库,83,98003,陈兵,20,男,数学系,赵敏,离散数学,87,学生,(,学号,姓名,年龄,性别,系名称,),;教学系,(,系名,系主任,),;选课,(,学号,课程名,成绩,).,8,3.2,函数依赖,关系模式的简化表示法,关系模式的完整表示是一个五元组:,R(U,,,D,,,Dom,,,F).,其中:,R,为关系名;,U,为关系的属性集合;,D,为属性集,U,中属性的数据域;,Dom,为属性到域的映射,;,F,为属性集,U,的,数据依赖集,。,关系模式可以用三元组来为:,R(U,,,F),数据依赖集,函数依赖,(,(,Functional Dependency,),),多值依赖(,Multivalued,Dependency,),连接依赖,(Join Dependency),9,2.,函数依赖的概念,设,R,(,U,),是属性集,U,上的关系模式,,X,、,Y,是,U,的子集。若对于,R,(,U,),的任意一个可能的关系,r,,,r,中的任一元组,在,X,中的属性值确定后,,则在,Y,中的属性值,也必确定。则称,X,函数决定,Y,,或,Y,函数依赖于,X,,记作,XY,。,XY,,但,Y,X,,,则称,XY,是,非平凡的函数依赖,。,若不特别声明,总是讨论非平凡的函数依赖。,XY,,但,Y,X,,,则称,XY,是平凡的函数依赖。,若,XY,,则,X,叫做,决定因素,(,Determinant,),,Y,叫做依赖因素(,Dependent,)。,若,XY,,,YX,,,则记作,XY,。,若,Y,不函数依赖于,X,,,则记作,X,Y,。,函数依赖是数据依赖的一种,实际上它,描述的是,同一,关系中属性间的联系。,10,例,3,,对于教学关系模式:教学(,U,,,F,);,U=,学号,姓名,年龄,性别,系名,系主任,课程名,成绩,;,例,1,:物资(,物资编码,,物资名称,计量单位,价格,),属性“,物资编码”和“物资名称”间有函数依赖关系,物资编码的值确定,物资名称的值也惟一确定。,称“物资编码”,函数决定,“物资名称”或,“物资名称”,函数依赖于,“物资编码”。,例,2,:领料(,单位编码,物资编码,领料时间,,请领量,实发量,),F=,学号姓名,学号年龄,学号性别,学号系名,系名系主任,,(,学号,课程名,),成绩,.,“物资编码”与“请领量”间没有函数依赖关系。但,11,注意:,函数依赖是,语义范畴,的概念,我们只能根据数据的语义来确定函数依赖。例如,,“姓名所在系”,这个函数依赖只有在没有同名人的条件下成立。如果有相同名字的人,则“所在系”就不再函数依赖于“姓名”了。,12,完全函数依赖、传递函数依赖,在,R,(,U,),中,如果,XY,,,并且对于,X,的任何一个真子集,X,,,都有,X Y,,,则称,Y,对,X,完全函数依赖,,记作:,XY,;若,XY,,但,Y,不完全函数依赖于,X,,,则称,Y,对,X,部分函数依赖,,记作:,XY,。,例,:,在教学关系模式:,(,学号,课程名,),成绩,,(,学号,课程名,),姓名,.,在,R,(,U),中,如果,XY,,,(Y X),,,Y X,,,YZ,,,则称,Z,对,X,传递函数依赖。传递函数依赖记作,X Z,。,例如,,在教学模式中,因为:学号系名,系名系主任;所以:学号 系主任。,P,f,f,P,传递,传递,13,码,定义,:,设,K,为关系模式,R(U),中的属性或属性组合,若,K,U,,,则称,K,为,R,的一个,候选码,。若关系模式有多个候选码,则选定其中的一个做为主码(,primary key,)。,主属性,:包含在任何一个关键字中的属性。,非主属性,:不包含在任何候选码中的属性。,在最简单的情况下,候选码只包含一个属性。在最极端的情况下,关系模式的所有属性组是这个关系模式的候选码,称为,全码,。,14,3.3,范式和规范化方法,数据依赖引起的主要问题是插入、删除及更新异常等,解决的办法是进行,关系模式的合理分解,,也就是对关系模式规范化。,范式是符合某一种级别的关系模式的集合。,满足最低要求的叫第一范式,简称为,1NF,。,在第一范式基础上进一步满足一些要求的为第二范式,简称为,2NF,。,其余以此类推。显然各种范式之间存在联系。,通常把某一关系模式,R,为第,n,范式简记为,R,nNF,。,小知识:从,1971,年起,,E,。,F,。,Codd,相继提出了第一范式、第二范式,第三范式,,Codd,与,Boyce,合作提出了,Boyce,Codd,范,式,到目前为止,已提出了第五范式。,15,如果关系模式,R,,,其所有的属性均为简单属性,即每个属性都是不可再分的,则称,R,属于第一范式,记作,R,1NF,。,它不,允许属性值为元组、数组或某种复合数据等。,一、,1NF,的定义,仅满足第一范式是不够的,仍然存在异常和冗余问题,需对关系模式继续规范,使之服从更高的范式,才能得到性能较高的关系模式。,16,二、,2NF,若关系模式,R,lNF,,,并且每一个,非主属性都完全函数依赖于,R,的码,,则,R,2NF,。,2NF,就是不允许关系模式的非主属性对码的部分依赖。即:,X,Y,,,其中,X,是码的真子集,,Y,是非主属性。,显然,码只包含一个属性的关系模式如果属于,1NF,,,那么它一定属于,2NF,。,17,例,1,:分析关系模式,R,(,dwbm,,,wzbm,,,rq,,,dwmc,,,zgld,,,zgdz,,,qls,,,sfs,),中的函数依赖:,rq,dwbm,wzbm,qls,sfs,zgld,dwmc,zgdz,图,3.2,R,中的函数依赖,18,如对关系模式,R,分解为两个关系模式:,R,1,(,dwbm,,,wzbm,,,rq,,,qls,,,sfs,),R,2,(,dwbm,,,dwmc,,,zgld,,,zgdz,),rq,dwbm,wzbm,rq,rq,图,3.3,R1,中的函数依赖,dwbm,zgld,dwmc,zgdz,图,3.4,R2,中的函数依赖,关系分解实际上是把联系不紧密的属性尽量分开,。,19,在教学模式中,:,属性集,=,学号,姓名,年龄,系名,系主任,课程名,成绩,.,函数依赖集,=,学号姓名,学号年龄,学号性别,学号系名,,系名系主任,,(,学号,课程名,),成绩,.,主码,=(,学号,课程名,).,非主属性,=(,姓名,年龄,系名,系主任,成绩,),。,(,学号,课程名,),姓名,,(,学号,课程名,),年龄,,(,学号,课程号,),性别,,(,学号,课程名,),系名,,(,学号,课程名,),系主任;,(,学号,课程名,),成绩,.,显然,教学模式不服从,2NF,,,即:教学,2NF,。,P,P,P,P,P,非主属性对码的函数依赖:,20,根据,2NF,的定义,将教学关系模式分解:,学生系(学号,姓名,性别,年龄,系名,系主任)。,选课(学号,课程名,成绩),问题:,满足,2NF,的关系模式是否还存在异常和冗余问题?,21,三,.3NF,关系模式,RU,,,F,中若不存在这样的码,X,、,属性组,Y,及非主属性,Z(Z Y),使得,XY,、,Y X,、,YZ,成立,则称,R,(,U,,,F,),3NF,。,可以证明,若,R,3NF,,,则,每一个非主属性既不部分函数依赖于码,也不传递函数依赖于码。,分析下面关系模式的范式:,R,1,(,dwbm,,,wzbm,,,rq,,,qls,,,sfs,),R,2,(,dwbm,,,dwmc,,,zgld,,,zgdz,),R1,3NF,,,R,2,3NF,,对,R,2,分解:,R,21,(,dwbm,,,dwmc,,,zgld,),R,22,(,zgld,,,zgdz,),22,例,2,:学生,_,系,(学号,姓名,性别,年龄,系名,系主任)。,学号,系名,系名,系主任。则:,传递,学号,系主任,如果分解为:学生,(,学号,姓名,年龄,性别,系名,),;教学系,(,系名,系主任,).,显然分解后的各子模式均属于,3NF,。,学生,_,系,3NF,。,23,说明:,1,、,3NF,范式是,一个可用的关系模式应满足的,最低范式,。,2,、把关系模式分解到第三范式,可以在相当程度上减轻原关系中的异常和信息冗余,但也不能保证完全消除关系模式中的各种异常和信息冗余。要想使数据库性能得到进一步的改善,就要把关系模式进一步规范化。,24,四,.BCNF,(,Boyce,Codd,Normal Form,),关系模式,R,(,U,,,F,),1NF,。若,XY,(,Y,X,)时,X,必含有码,则,R,(,U,,,F,),BCNF,。,即:关系模式,RU,,,F,中,若,每一个决定因素都包含码,,则,RU,,,F,BCNF,。,一个满足,BCNF,的关系模式有:,1),所有,非主属性,对每一个码都是完全函数依赖。,2),所有的,主属性,对每一个不包含它的码,也是完全依赖。,3),没有任何属性完全函数依赖于,非码,的任何一组属性。,25,例,1,:分析下面的关系是否满足,BC,范式?,S,11,(,学号,姓名,所在系,),S12(,所在系,系主任姓名,),S2(,学号,课程名,成绩,),答:,均满足,BCNF,范式,26,例,2,:关系模式,SPC(S,,,C,,,P),中,,S,是学生,,C,表示课程,,P,表示名次。,语义:,每一个学生选修每门课程的成绩有一定的名次,每门课程中每一名次只有一个学生,(,即没有并列名次,),。由语义可得到下面的函数依赖:,(,S,,,C,),P,;,(C,,,P),S,候选码:,(S,,,C),与,(C,,,P),。,SPC,3NF,,,而且除,(S,,,C),与,(C,,,P),以外没有其它决定因素,所以,SPC,BCNF,27,例,3,:关系模式,STJ(S,,,T,,,J),中,,S,表示学生,,T,表示教师,,J,表示课程。,语义为:每一教师只能讲授一门课程,每门课程由若干教师讲授;每个学生选修某门课程就对应一个固定的教师。,由语义可以得到,STJ,模式的函数依赖为:,F=(S,,,J)T,,,TJ,显然:,(S,,,J),和,(T,,,S),都是关系的码;,关系的主属性集为,S,,,T,,,J,,,非主属性为,(空集)。,P,由于,STJ,模式中,无非主属性,所以它属于,3NF,;,但因为存在,TJ,,,由于,T,不是码,故,STJ,BCNF,。,28,五、,BCNF,和,3NF,的比较,1)BCNF,不仅强调,非主属性,对码的完全的直接的依赖,而且强调,主属性,对码的完全的直接的依赖,故,R,BCNF,,,R,一定属于,3NF,。,2)3NF,只强调,非主属性,对码的完全直接依赖,这样就可能出现,主属性对码的部分依赖和传递依赖,。,29,1NF,2NF,3NF,BCNF,削除,非,主属性对码的,部分,函数依赖,削除,非,主属性对码的,传递,函数依赖,削除,主属性,对码的,部分,和,传递,函数依赖,图,1,各种范式规范化过程,30,规范化小结:,1,、在关系数据库中,对关系模式的基本要求是满足第一范式。这样的关系模式就是合法的、允许的。但是,人们发现有些关系模式存在,插入、删除异常、修改复杂、数据冗余,等毛病。人们寻求解决问题的方法,这就是规范化的目的。,2,、规范化的基本思想是逐步,消除数据依赖,中不合适的部分,使模式中的各,关系模式达到某种程度的“分离,”,,即“一事一地”的模式设计原则。让,一个关系描述一个概念、一个实体或者实体间的一种联系,。若多于一个概念就把它“分离”出去。因此所谓规范化实质上是,概念的单一化,。,31,3,、,实际上,在对模式进行分解时,除考虑,数据等价和依赖等价,以外,还要考虑,效率,。,当我们对数据库的操作主要是查询而更新较少时,为了提高查询效率,可能宁愿,保留适当的数据冗余,,让关系模式中的属性多些,而不愿把模式分解得太小,否则为了查询一些数据,常常要做大量的连接运算,把多个关系模式连在一起才能从中找到相关的数据。,在实际应用中,对模式分解的要求并不一定要达到,BC,范式或更高的范式,有时达到,第三范式,就足够了,。,32,关系规范化理论研究:,函数依赖理论的研究,(,1,)关系模式上的所有依赖通过一些公理系统(,Armstrong,),而获得关系模式上的所有依赖。基本的由语义获取,其他部分由公理系统推出。,(,2,)最小函数依赖集,:,等价的函数依赖集中最小者。,模式分解的研究,(,1,),无损连接(,反映了模式分解的数据等价原则。,),当对关系模式,R,进行分解时,,R,的元组将分别在相应属性集进行投影而产生新的关系。,如果对新的关系进行自然连接得到的元组的集合与原关系完全一致,则称为无损连接,。,(,2,)保持依赖,当对关系模式,R,进行分解时,,R,的函数依赖集也将按相应的模式进行分解。如果分解后总的函数依赖集与原函数依赖集保持一致,则称为保持依赖。,33,F1=,AB,,,B C,,,A C,与,F2=,AB,,,B C,,,ABC,F3=,AB,,,B C,是否等价?,34,3.4,关系模式的分解算法 一、,关系模式分解的算法基础,函数依赖的逻辑蕴含,设,F,是模式,RU,的函数依赖集,,X,和,Y,是属性集,U,的子集。如果从,F,中的函数依赖能推出,XY,,,则称,F,逻辑蕴含,XY,,,或称,XY,是,F,的逻辑蕴含。,如:,F,AB,,,B C,,问,A C,是否成立?,这就需要函数依赖的逻辑隐含知识,用函数依赖的公理系统推出。,35,2.Armstrong,公理系统,(1)Armstrong,公理系统,设,U,为属性集,,F,是,U,上的函数依赖集,于是有关系模式,RU,,,F,。对,R,(,U,,,F,),来说,有以下的推理规则:,1),自反律,:若,Y,X,U,,则,XY,为,F,所蕴含。,2),增广律,:若,XY,为,F,所蕴含,且,Z,U,,则,XZYZ,为,F,所蕴含。,3),传递律,:若,XY,及,YZ,为,F,所蕴含,则,XZ,为,F,所蕴含。,(2)Armstrong,公理的三个推理,1),合并规则,:由,XY,,,XZ,,有,XYZ,。,2),伪传递规则,:由,XY,,,WYZ,,有,XWZ,。,3),分解规则,:由,XY,及,Z,Y,,有,XZ,。,由,合并规则和分解规则,容易知,:,X,A,1,A,2,A,k,成立的充分必要条件为,X A,i,成立。,(,i=1,2,k,),36,2,、指出下列关系属于第几范式?并说明理由。,(,1,),R(X,Y,Z)F=XYZ,解:,R,的候选码为,XY,,而,R,中决定因素只有,XY,,,决定因素包含了码。,RBCNF,。,(,2,),R(X,Y,Z)F=YZ,,,XZY,解:,R,的候选码为,XY,或,XZ,,,不存在,非主属性,对码的部分或传递函数依赖,R3NF,。,37,(,3,),R(X,Y,Z)F=YZ,,,YX,,,XYZ,,,解:,R,的候选码为,X,和,Y,(,单个属性,),,XYZ,等价于:,XY,,,XZ,,故,X,Y,,,不存在,非主属性,Z,对码的传递函数依赖。又决定因素都是码,,RBCNF,。,(,4,),R(X,Y,Z)F=XY,,,XZ,解:,R,的候选码为,X,(,单个属性,),又每一个函数依赖的左部都是码,,RBCNF,。,38,(,5,),R(X,Y,Z)F=XYZ,解:,R,的候选码为,XY,,,又每一个函数依赖的左部都是码,,RBCNF,。,(,6,),R(W,,,X,Y,Z)F=XZ,,,WXY,解:,R,的候选码为,WX,,,存在非主属性对码的部分函数依赖。,R1NF,。,39,3.,函数依赖集闭包,F,+,和属性集闭包,X,F,+,(1),函数依赖集闭包,F,+,和属性集闭包,X,F,+,的定义,在关系模式,R,(,U,,,F,),中,为,F,所逻辑蕴含的,函数依赖的全体,叫做,F,的闭包,记作,F,+,。,设有关系模式,R,(,U,,,F,),,X,是,U,的子集,称所有从,F,推出的函数依赖集,XA,i,中,A,i,的属性集为,X,的属性闭包,,记作,X,F,+,。,即:,X,F,+,=A,i,|A,i,U,,,XA,i,F,+,(2),属性集闭包,X,F,+,的求法,1),选,X,作为闭包,X,F,+,的初值,X,F,(0),。,2)X,F,(i+1),是由,X,F,(i),并上集合,A,所组成,其中,A,为,F,中存在的函数依赖,YZ,,而,A,Z,,,Y,X,F,(i),。,3),重复步骤,2),。一旦发现,X,F,(i),=X,F,(i+1),,则,X,F,(i),为所求,X,F,+,。,40,【,例,1】,已知关系,RU,,,F,,,其中,U=A,,,B,,,C,,,D,,,E,,,F=ABC,,,BD,,,CE,,,ECB,,,ACB,,,求,(AB),F,+,。设,X=AB X,F,(0),=AB,:,AB,为闭包初值,为本身。,X,F,(1),=ABCD,:由,ABC,,,B D,可得,CD,在闭包中。由,X,F,(2),=ABCDE,:由,C E,,知,E,在闭包中。,X,F,(3),=X,F,(2),=ABCDE (AB),F,+,=ABCDE=A,,,B,,,C,,,D,,,E,41,4.,函数依赖集的最小化,最小函数依赖集的定义,如果函数依赖集,F,满足下列条件,,则称,F,为一个极小函数依赖集。亦称为,最小依赖集,或,最小覆盖,。,1)F,中任一函数依赖的右部仅含有一个属性。,2)F,中不存在这样的函数依赖,XA,,,使得,F,与,F,XA,等价。,(,不含冗余函数依赖。,),3)F,中不存在这样的函数依赖,XA,,,X,有真子集,Z,使得,F-XAZ-A,与,F,等价。,(,决定因素不含冗余属性。,),如,F=,AB,,,B C,,,A C,不是最小函数依赖集。,42,(2),最小函数依赖集的求法,1),逐一检查,F,中各函数依赖,XY,,若,Y=A,1,A,2,A,k,,,k2,,,则用,XA,j,|j,=1,,,2,,,k,来取代,XY,。,(,右边的属性单值化,),2),逐一检查,F,中各函数依赖,XA,,令,G=F,XA,,若,AX,G,+,,,则从,F,中去掉此函数依赖。,(,去掉冗余函数依赖,),3),逐一取出,F,中各函数依赖,XA,,设,X=B,1,B,2,B,m,,,逐一检查,B,i,(,i=1,,,2,,,,,m,),,如果,A(X-B,i,),F,+,,,则以,X,B,i,取代,X,。,(,左边的属性单值化,),43,【,例,4-2】,设,F=ABC,,,BAC,,,CA,,对,F,进行极小化处理。,解:,1),根据分解规则把,F,中的函数依赖转换成右部都是单属性的函数依赖集合,分解后的函数依赖集仍用,F,表示。,F=AB,,,AC,,,BA,,,BC,,,CA2),去掉,F,中冗余的函数依赖。判断,AB,。,设:,G,1,=AC,,,BA,,,BC,,,CA,,,得:,A,G1,+,=AC B,A,G1,+,AB,不冗余判断,AC,。,设:,G,2,=AB,,,BA,,,BC,,,CA,,,得:,A,G2,+,=ABC C,A,G2,+,AC,冗余,判断,BA,。,设:,G,3,=AB,,,BC,,,CA,,(,去掉,AC,冗余后,),得:,B,G3,+,=BCA A,B,G3,+,BA,冗余,判断,BC,。,设:,G,4,=AB,,,CA,,,得:,B,G4,+,=B C,B,G4,+,BC,不冗余判断,CA,。,设:,G,5,=AB,,,BC,,,得:,C,G5,+,=C A,C,G5,+,CA,不冗余,F,m,=AB,,,BC,,,CA,44,【,例,4-3】,求,F=ABC,,,AB,,,BA,的最小函数依赖集,F,m,。,解:,(1),去掉,F,中冗余的函数依赖。判断,ABC,是否冗余。设,:,G,1,=AB,,,BA,,,得:,(AB),G1,+,=AB C,(AB),G1,+,ABC,不冗余判断,AB,是否冗余。设:,G,2,=ABC,,,BA,,,得:,A,G2,+,=A B,AB,G2,+,AB,不冗余判断,BA,是否冗余。设:,G,3,=ABC,,,AB,,,得:,B,G3,+,=B A,B,G3,+,BA,不冗余经过检验后的函数依赖集仍然为,F=ABC,,,AB,,,BA,。,(2),去掉各函数依赖,左部冗余的属性,。本题只需考虑,ABC,的情况。方法,1,:在决定因素中去掉,B,,若,C,A,F,+,,,则以,AC,代替,ABC,。,求得:,A,F,+,=ABC C,A,F,+,以,AC,代替,ABC,故:,F,m,=AC,,,AB,,,BA,方法,2,:在决定因素中去掉,A,,若,C,B,F,+,,,则以,BC,代替,ABC,。,求得:,B,F,+,=ABC C,B,F,+,以,BC,代替,ABC,故:,F,m,=BC,,,AB,,,BA,45,3.4.2,判定分解服从规范的方法,1.,关系分解的无损连接性,设关系模式,R,,,如果把它分解为两个(或多个)子模式,R,1,和,R,2,,,相应一个,R,关系中的数据就要被分成,R,1,、,R,2,两个(或多个)子表。,假如将这些子表自然连接,即进行,R,1,R,2,操作,得到的结果与原来关系中的数据一致,信息并没有丢失,则称该分解具有无损连接性,否则如果,RR,1,R,2,,,则称该分解不具有无损连接性。,2.,判断分解成两个关系具有,无损连接性,的方法,定理:,RU,,,F,的一个分解,=R,1,(U,1,,,F,1,),,,R,2,(U,2,,,F,2,),具有无损连接性的充分必要条件是:,(U,1,U,2),(U,1,-U,2,F,+,).,或,U,1,U,2,U,2,-U,1,F,+,.,3.,判断分解保持函数依赖的方法,设,U,,,F,的分解,=R,1,U,1,,,F,1,,,R,1,U,2,,,F,2,,,R,k,U,K,,,F,K,,若,F,+,=(,F,i,),+,,,则称分解,保持函数依赖。,46,【,例,-5】,关系模式,R=CITY,,,ST,,,ZIP,,,其中,CITY,为城市,,ST,为街道,,ZIP,为邮政编码,,F=(CITY,,,ST)ZIP,,,ZIPCITY,。,如果将,R,分解成,R,1,和,R,2,,,R,1,=ST,,,ZIP,,,R,2,=CITY,,,ZIP,,,检查分解是否具有无损连接和保持函数依赖。解:,1),检查无损连接性。求得:,R,1,R,2,=ZIP,;,R,2,-R,1,=CITY.(ZIPCITY)F,+,.,分解具有无损连接性,2),检查分解是否保持函数依赖求得:,R,1,(F)=,;,R,2,(F)=ZIPCITY.R,1,(F)R,2,(F)=ZIPCITYF,+,.,该分解不保持函数依赖。,47,3.4.3,关系模式的分解方法,1),对,R,(,U,,,F,),中的,F,进行极小化处理。处理后的函数依赖集仍用,F,表示。,2),找出不再在,F,中出现的属性,(极小化后),,这样的属性构成一个关系模式,并把这些属性从,U,中去掉。,3),如果,F,中有一个函数依赖涉及,R,的全部属性,则,R,不能再分解。,4),如果,F,中含有,XA,,,则分解应包含模式,XA,,,如果,XA,1,,,XA,2,,,XAn,均属于,F,,,则分解应包含模式,XA,1,A,2,A,n,。,【,例,4-6】,设关系模式,RU,,,F,,,U=C,,,T,,,H,,,R,,,S,,,G,,,X,,,Y,,,Z,,,F=,CT,,,CSG,,,HRC,,,HSR,,,THR,,,CX,,将,R,分解为,3NF,,,且保持函数依赖。解:设该函数依赖集已经是最小化的,则分解,为:,=YZ,,,CTX,,,CSG,,,HRC,,,HSR,,,THR,.,一、将关系模式转化为,3NF,的,保持函数依赖,的分解,48,2.,将关系转化为,3NF,、,且既具有无损连接性又能保持函数依赖的分解,分解算法为:,1),设,X,是,R,(,U,,,F,),的码,,RU,,,F,先进行保持函数依赖的分解,结果为,=R,1,(,U,1,,,F,1,),,R,2,U,2,,,F,2,,,,,R,k,U,k,,,F,k,,令,=,R,*,(,X,,,F,x,),。,2),若有某个,U,i,,,X,U,i,,将,R,*,X,,,F,x,从,中去掉,,就是所求的分解,。,【,例,3-7】,有关系模式,RU,,,F,,,U=C,,,T,,,H,,,R,,,S,,,G,,,F=CT,,,CSG,,,HRC,,,HSR,,,THR,,将,R,分解为,3NF,,,且既具有无损连接性又能保持函数依赖。解:求得关系模式,R,的码为,HS,,,它的一个保持函数依赖的,3NF,为:,=CT,,,CSG,,,HRC,,,HSR,,,THR.HS,HSR =,=CT,,,CSG,,,HRC,,,HSR,,,THR,为满足要求的分解。,49,本章结束,谢谢,50,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 行业资料 > 医学/心理学

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服