关系规范化样例.doc_咨信网zixin.com.cn

资源描述

第三章关系规范化理论关系得规范就是关系数据模型设计中得一个非常重要得问题，它可以指导我们设计出好得关系.设计与构造合理得关系,使之能准确地反映现实世界并有利于应用与具体操作,就是关系得规范与探讨得问题。所以有人把关系得规范化理论称为设计数据库得理论. 第一节关系中得键一、候选键（canｄiｄａte ｋey）凡在一个关系中具有主键特性得属性或属性组,均称为候选键。因为它们都具有被选为主键得条件,所以一个关系可能有多个候选键，但只能选其中得一个为主键. 候选键中包含得属性,期于得属性称为非主属性. 例:在职工关系ＺGﻩ（姓名，性别，年龄）中，增加一个属性:职工号，即得到一个新关系: ZG (职工号,姓名，性别，年龄）又假定职工号与职工姓名就是一一对应得,即没有两个职工得姓名相同，则“职工号"与“姓名"两个都就是候选键. 二、替代键(alteｒnate ｋeｙ）对于某一指定得关系可能存在多个候选键，但只能选其中得一个为主键.在确定主键后，其余得候选键都就是替代键,替代键在需要时可代替主键。二、外来键（foreiｇn key) 但关系中得某些属性系由另一个关系得主键构成时，则该属性（或属性组)称为外来键. 第二节　函数依赖一、函数依赖定义1：设R就是一个关系，X与Y就是Ｒ中得两个属性.若R中X得任何一个值，仅有一个Y得值与之对应,则称为R得属性Y函数依赖(FＤ)于属性X，记作XàY。例如：在描述船员得关系 CREＷ（NＯ，NＡME，AGE,JOＢ，PAＹ）它表示由任一船员号NO,仅能找到一个姓名、一个年龄、一个.。。定义中得属性X可以就是复合属性,例如ＳP（S#，P＃，QTY－ＵSEＤ)中得(S＃，P#）二、完全函数依赖与部分函数依赖定义2:如果属性Y函数依赖于复合属性X，而且不与Ｘ得任一子集X‘函数依赖(X’àY ），则称属性Ｙ完全函数依赖(ＦFD)于复合函数Ｘ,记作ＸàY。若XàY但不就是完全函数依赖，则称Y部分函数依赖于X。例：在关系SP（Ｓ＃，P＃，QＴＹ—UＳEＤ)中QTY—ＵSＥD表示部件P#在S＃船上使用得数量，只有同时指定S#与P＃,才能说明某部件在某船上得用量，缺一不可,因此QTY-USED完全函数依赖于（S#，P＃）。三、传递函数依赖定义3：如果Ｘ，Y，Z就是R中得三个属性(或属性复合）若ＸàY, YàX， YàZ,则称Ｚ对X传递函数依赖。例如:S（S＃，SNAＭE,CIＴY，PＯＳTCODE）中S#àCITＹ,ＣITＹà S＃，若CIＴYà PＯSTCODE，则称POＳTCOＤＥ传递依赖于S#。例：设有下列关系 GＰD(零件号,零件名，设计人,设计人等级）因为零件号→零件名零件号→设计人设计人→设计人等级故零件号→设计人等级第三节规范化与范式　一、规范化问题得提出关系模型得特点就是使用二维表来表示现实世界得实体集合与属性关系,这样容易历届与被用户所接受,然而并不就是所有二维表都能构成关系模型，见表农产品统计表省市总产值产量亩产小麦稻谷小麦稻谷北京河北职工情况登记表职工号姓名级别工资学历毕业时间０0１张技1０ 83 中专大学研究生 1９5７ 1９68 198１ 0０2 李技12 ６２以上两张二维表就不能构成关系,因为出现了子项,那么具备那些条件得二维表才能称为关系呢？在关系模式中,要求二维表具有以下性质：（1）二维表中得每一列都就是不能分割得基本数据项，且无重复组。（2）同一关系中,没有相同得列出现。描述一个实体，不需要重复出现相同得属性名（3）同一关系中,各行得内容不能完全相同完全相同得行，实无意义满足上述条件得关系,称为规范化得关系,否则叫非规范化形式，这种“形式"即不能被定义成关系模型,又不能被关系型得ＤBＭS所接受，因此要对非规范化得表格（关系)进行规范化处理。所谓规范化处理，就就是逐步用更单纯、更规则得关系来取代原有关系得过程. 　二、规范化得意义规范化处理得目得不仅将关系得“概念”单一化，使每一个数据项使一个简单得基本项,又无重复组。还有以下意义： (１)解决冗余度问题所谓“冗余"问题就是指表格中得数据重复.］例：船与船员之间得1：N联系见表船与船员 SHIＰ S# ＳNAME NSP S＃ SＮＡME ＮO NAME ＡGＥ S1 ＤQ S1 DＱ 1００１Ｓ2 XH S1 DQ 10０4 S1 DQ １020 ＳC S＃ NＯ NＡME Ｓ2 ＸH 1025 Ｓ１ 100１ … S1 １004 … Ｓ１１02０这样重复太多，一条船有多个船员，船号与船名就要重复存储多次,如果将船得有关数据分开存储,分为SHＩＰ与ＳC两个表，在SC中存放船号与船名数据,则重复得仅仅就是船号,其余得重复都消除了。为了减少甚至消除重复,将关系进行分离,正就是逐步规范化得重要一步. (2)消除多义性问题多义性就是指关系中某些属性含义不清或有多种可能得含义。例：船部件这个关系ＳP（S#，P#,QTY) 其中数量ＱTY到底就是说明S与P之间得联系,即某船需要某个部件多少个，还就是仅仅说明P为仓库中现存某个部件多少个呢？在这个关系中就是确定不了得，如果QTＹ仅仅表示部件得库存量,则将关系SＰ分离,使用关系PQ（P#，ＱTY)来描述就不再含糊不清了。（3）解决操作可行性及提高操作方便性指对数据得插入、删除与修改就是否可行,就是否方便例:职工编号，姓名,工资等级,工资假如要插入新得工资等级与工资额,例如9—110元,由于没有对应得职工编号、姓名,无法插入。假如要删除E1这一行,则１0级１00元也丢失。修改也随之都修改. NＯ NAＭE STATUＳＳAL Ｅ1 陈１0 １00 Ｅ2 李 8 120 E3 严 1２８０ … … … … Ｅ9 王 8 12０　　引起上述问题得原因,就是非主属性之间得依赖关系所致. 　这个关系中各个属性之间得对应关系可用下图表示，NＯ为关键字,即主属性,其余属性为非主属性。　　 EMP（ＮＯ,NAME，SＴＡTUS,ＳAＬ) 箭头表示属性间得对应关系，即任意一个职工号，仅能在表中找到一个姓名ＮＡME与之对应，任何一个非主属性ＳAＬ函数依赖于非主属性ＳＴAＴＵS。如果要从这个关系中消除非主属性之间得依赖关系，可将表改为两个关系　　　EMP(NO，NAＭE,SＴATＵS)　 SＳ（ＳTATUS，SAL) 这样插入数据9级、11０元就可在ＳＳ中进行. 由上例可见,通过适当“分离”可以消除非主属性之间得依赖性，如何进行分离或合并，使得新得一组关系模式既能反映现实世界，又能排除多义性,控制冗余度，并方便实现数据操作,正就是我们研究规范化问题得目得所在。三、系规范化得表述所谓关系得规范化，就是指满足某些条件后得关系，通常按属性间依赖情况来区分关系规范化得程度,并义范式来表述（NORＭAＬＦOＲＭＳ）范式又分为ｎ级,有1ＮF,2ＮF,3ＮF等等，为了判断一个关系属于哪一级范式，引入函数依赖这一概念. 所有规范化得关系起码就是第一范式,在第一范式中进一步满足一些要求得关系为第二范式，依次类推。各种形式得范式在关系数据哭系统中都允许存在，但为了更方便于数据处理,通常要把低级范式分解为若干个3NＦ或ＢCNＦ,下面给出各范式得概念。 1）第一范式(1ＮF）关系R中，每个分量都就是不可分割得。 2）第二范式(2ＮＦ）若关系Ｒ满足1NF，且每个非主属性完全函数依赖于关键字。 3）第三范式(３NF) 若关系R满足2ＮＦ,且每个非主属性非传递依赖于关键字。 4）加强第三范式（BCNF）若关系R满足3NF，且所有主属性与非主属性既非部分依赖关键字，也非传递依赖于关键字。下面举例说明逐步规范化得方法与过程. 例：已知一张购物登记表,要求规范到BCNF范式得程度，以便被关系型ＤＢMS所接受。购物登记顾客姓名商品名称数量单价付款工作单位顾客地址电话 A 彩电 1 １400元 1400元 ××厂Ｌ市 3854０ B 手电筒钢笔 1 ２０３5元 2、２元４7、5０元 ××学校Ｐ市 28２66 C 电冰箱手电筒钢笔１１ 2 1530元 3、5元 2、2元 1537、9元 ××机关 L市538３4 （1）分析已知表,来决定就是否需要进行规范化处理通过观察可知,表不能直接被关系型DＢMS所接受，因为它存在许多问题. 1）在关系模型中对关系得最起码要求,应该满足第一范式,表显然不满足这个条件。 2）在数据操作上将会出现下列问题： ① 删除异常假如顾客Ａ不购买彩电,那么表中得记录A删除时就会将商品名称、单价等同时删除，此时彩电价格也无从查找。 ② 插入异常如顾客A想要购买洗衣机，不但要填上洗衣机得名称与价格,还要填上有关顾客A得信息(工作单位、地址、电话)显然就是重复得。 ③ 数据得冗余量大在有多个顾客购买同一商品得情况下，就使这一商品得名称与单价多次重复出现在数据库中，造成数据得大量冗余. 3）非独立数据存在付款项目就是由数量＊单价得来得，在此可以去掉，基于上述情况，必须对表进行规范化处理。 (2)利用规范化工具逐步解决表中得数据结构所存在得问题首先，去掉表中得非独立项，变成满足第一范式得要求得关系命名为R R 　购物登记表顾客姓名商品名称数量单价工作单位顾客地址电话 A 彩电 1 １40０元 ××厂 L市 38540 B 手电筒 1 ３5元 ××学校 P市２８２６６ B 钢笔 2０ 2、2元 ××学校 P市 2８266 C 电冰箱 1 １５30元 ××机关 L市 53８34 Ｃ手电筒 1 3、5元 ××机关Ｌ市 53834 C 钢笔 2 2、2元 ××机关 L市 5３834 显然Ｒ就是1NＦ，从而解决了第1)个问题进一步规范化过程如下步骤进行: 第一步语义分析 ① 每一名顾客有一个工作单位、住址、电话; ② 每种商品有一种价格 ③ 每个顾客所购物品有一定数量； ④ 付款=单价＊数量（非独立项可去掉) 为了讨论方便,将表种属性用字母简记顾客姓名Ａ　单价 D 商品名称　 B　顾客工作单位　E 数量 C 顾客地址Ｆ　　顾客电话　G 第二步　找出函数依赖集ＦD 有语义分析,根据函数依赖得含义，可以得出下面一组函数依赖关系。 ① ＡàＥ，AàF,AàＧ ② BàD ③ ABàC 故FD=｛ＡàE,AàF,AàG,BàＤ,ABàC} 　第三步画出函数依赖图　　　首先从函数依赖集中,选出一组属性作为关键字，这里选关键字ＡＢ，分析非主属性对关键字依赖得情况。　（A,B)—ｆ->Ｃ表明属性C对关键字（A，B）为函数依赖　 (A，B)-P－〉E　　表明属性E对关键字（Ａ，Ｂ）为部分函数依赖　　 (Ａ，B）－P-〉F 　 (Ａ，B）-P—＞Ｇ (A,B）—P－>D (理由同上）画出关系Ｒ得函数依赖图 E C A F G D B 从图中瞧出,非主属性与关键字得关系，哪些就是完全函数依赖，哪些就是部分函数依赖,根据范式得定义,下面可以逐步再进行规范化。 E 第四步去掉非主属性对关键字得部分依赖关系，得到一组新得关系函数依赖图。 D B A C A F G B 于就是Ｒ得到一组新得关系R1R２R３得集合三个关系表 R1顾客关系顾客姓名工作单位顾客地址电话 A ××厂Ｌ市 385４0 Ｂ ××学校 P市 28２6６ C ××机关 L市 538３4 Ｒ2商品关系商品名称单价彩电１４00元手电筒 35元钢笔 2、2元电冰箱 153０元Ｒ3购物关系顾客姓名商品名称数量 A 彩电 1 B 手电筒 1 Ｂ钢笔 20 C 电冰箱 1 Ｃ手电筒 1 Ｃ钢笔 2 Ｒ１得关键字为顾客姓名 R2得关键字为商品姓名 R3得关键字为顾客姓名商品姓名得组合　关系R1 R2与R3均属于ＢCＮＦ，这就是因为所有主属性与非主属性既非部分依赖关键字,也非传递依赖关键字。至此，规范化处理完毕上述得规范化处理结果,事实上已消除了前面提到得删除异常、插入异常与数据冗余得问题。、假如顾客不购买彩电,只就是合理地删除Ｒ3中一个记录,不会影响R1中得顾客信息,也不会影响Ｒ2中得商品信息。、假如顾客A购买洗衣机时，在R3中填写数量，而价格在R2中填写,与顾客信息无关。、在多个顾客购买同一种商品得情况下，因商品名称与价格R2在中，不会重复出现多次，消除了冗余第四节关系模式得分解分解就是提高关系范式等级得重要方法,以下通过一个事例说明模式分解得一般方法与对分解得要求。例：已知关系Ｓ（学号,班级，班主任）∈2NF 下图显示了它包含得内容与属性间得依赖关系,试将S分解为3NF得新关系学号班级班级班主任 5 1０ 15 ２0 25 30 ３5 财9２４1 财9２41 管9235 管9235 电9２41 电924１电9241 李力李力学号李力李力班主任丁一丁一丁一这里有三种不同得分解法，即 ① S S-C(学号,班级）Ｃ－M(班级，班主任) ② S S—C(学号，班级） S-M（学号,班主任） ③ S S—Ｍ（学号,班主任) Ｃ-M(班级，班主任）三种方案得出得新关系全就是3ＮF.但分解得质量却大有差异.以下结合对分解质量得要求,对这三种方案作一比较. １、分解必须就是无损得，即不应在分解丢失信息在上例中，第③种方案就不能保证无损分解，下图显示了这一方案得出得两个关系.由于财9241班与管933５班得班主任就是同一个人，分解后将无法分辨5，１０,１5,20号各属于哪一个班。学号班主任班级班主任 5 １０ 15 20 25 30 ３５李力李力李力李力丁一丁一丁一财9241 管９235 电9241 李力李力丁一 2. 分解后得新关系应相互独立，对一个关系得更改，不会影响另一关系试比较一上得①、②两种方案，设１5好同学从管92３５转入财9241，按第①翻案，仅修改关系S-C就可以了;而按第②方案,要同时修改关系S－C与关系Ｓ=Ｍ，显然就是不好得。插入得时候,①、②两种方案得情况也不相同。假定增加一个新班,则必须等这个班有了学生才能将班级与班主任得信息分别插入关系S－C与S－M中去。产生一上这些差别得原因可以结合上图来说明，在图中得三个属性之间学号→班级，班级→班主任，都就是完全函数依赖,而学号→班主任，则为传递函数依赖。方案①建立得两个新关系分别使用了两个原有得完全依赖关系，方案②与③都只有一个新关系使用完全以来，另一个新关系使用传递以来，这就就是方案①优于其她方案得原因。可见借助于图得属性依赖图解,可以选择正确得分解方案.

展开阅读全文