1、单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第6章 数据的组织与管理,6.1 概述,6.2 数据的描述与组织,6.3 数据库管理技术,6.4 数据模型,6.5 数据库设计,1,6.1 概述,数据库与管理信息系统的关系,数据库技术的发展,第一代:网状、层次数据库系统,第二代:关系数据库系统,第三代:面向对象数据库系统,数据的存储与管理是管理信息系统设计的重要课题,管理信息系统离不开数据库的支持,数据库技术是实现信息系统基本基础,2,6.2 数据的描述与组织,三个世界,现实世界,信息世界,计算机世界,是大脑以外的客观世界。,研究的对象是“事物”,即一个可以触及的对象。,是现实世
2、界在人们头脑中的反映,是对客观事务及其联系的一种抽象描述。,研究对象是“实体”。实体有若干个属性的属性值所组成。属性是事物某一方面特征的反映。,信息世界的信息经过加工、编码,以数据形式存入计算机中,成为计算机世界中的数据记录。,计算机世界研究的对象是“记录”,它由相关的数据项(字段)所组成。数据项值的集合为一个记录,同类记录值的集合组成文件,相关文件的集合构成一个数据库。,3,客观事物抽象为数据过程的三个阶段,反映(抽象),作用、指导,分类组织存储检索编码好,构成,数据模型,现实世界,信息世界,数据世界,客观存在,规范信息,客观事物及事 物间联系,数据化,信息化,指导、决策依据,反映,信息模型
3、信息,数据,4,三个世界的对应术语,现实世界,信息世界,计算机世界,事物,事物特征,特征值,区别事物的特征,具体的事物,同类事物,同类事物的集合,系统涉及的全部事物,实体,属性,属性值,标识属性,实体记录,实体模型,实体集,相关的实体集,记录,数据项,数据项的值,标识码,记录值,记录类型,文件,数据库,5,数据组织的层次,为了实现对数据的有效处理,需要将数据有序地组织起来,数据的逻辑组织一般有四个逻辑元素组成:数据项、记录、文件、数据库,事物集合,事物,性质,实体集合,属性,实体,数据项,记录,文件,三个世界中数据组织的层次结构,6,数据组织的层次与关系,数据库,文件2,文件,n-1,文件,
4、n,记录1,文件1,数据项,n-1,数据项,n,记录,n-1,记录,n,数据项1,数据项2,记录2,姓名、性别等,若干职工,职工文件,职工数据库,7,产品销售文件,产品代号,单位,销售产量,金额,A001,508.00,3,1524.00,B025,120.00,10,1200.00,B031,112.00,5,560.00,C002,300.00,2,600.00,C005,350.00,2,700.00,C025,220.00,8,1760.00,数据项,1,数据项,4,8,数据项、记录、文件、数据库,1,.,数据项,是组成数据系统的有意义的最小基本单位,作用:描述一个数据处理对象的某些属
5、性,数据项有名称和值,如学生:学号、姓名、性别等,2,.,记录,是与数据处理的某一对象有关的所有数据项构成,是文件中可存取的最小单位。一个记录对应一个实体,3,.,文件,同类记录的集合称为文件,文件的建立与维护,是计算机处理系统的重要工作之一,4,.,数据库,按一定方式组织起来的逻辑相关的文件集合形成数据库,9,6.3 数据管理技术,6.3.1,数据管理的发展,1,.,人工管理阶段,数据管理的特点:,(1)数据不能保存,(2)数据管理软件尚不存在,(3)只有程序,没有文件的概念,(4)数据面向应用,(5)对数据的存取以记录为单位,灵活性差,应用程序2,数据组2,应用程序1,数据组1,数据组,n
6、应用程序,n,.,10,2,.,文件系统阶段,数据管理的特点:,(1)数据可以保存,(2)数据的物理结构与逻辑结构有了区别,(3)文件的形式多样化,(4)数据不属于某个特定的程序,(5)对数据的存取基本上还是以记录为单位,6.3.1,数据管理的发展,11,应用程序1,应用程序2,应用程序,n,文件,n,文件2,文件1,文件,系统,.,缺陷:,(1)数据冗余大,(2)缺乏数据的独立性,(3)数据不能集中管理,6.3.1,数据管理的发展,12,3,.,数据库系统阶段,数据管理的特点:,(1)实现数据共享,减少数据冗余,(2)采用特定的数据模型,(3)较高的数据独立性,(4)统一的数据控制功能:,
7、数据库并发控制功能,数据库的安全性控制功能,数据库的完整性控制功能,数据库的恢复功能,6.3.1,数据管理的发展,13,应用程序1,应用程序,n,应用程序2,数据库管理系统(,DBMS),数据库,6.3.1,数据管理的发展,14,6.3.2 数据库系统的体系结构,外部结构:,集中式、分布式、客户机/服务器、并行结构,内部结构:,三级体系结构,三级模式:,内部级(,internal),概念级(,conceptual),外部级(,external),15,映射,映射,映射,映射,映射,映射,用户1,概念层,外部层1,外部层1,用户3,用户2,内部层,数据库系统的三级体系结构,16,6.3.3数据库
8、管理系统(,DBMS),是指对数据进行管理的软件系统,它是数据库系统的核心,它与数据库系统中的各个部分有着密切的联系。,1,数据库系统(,DBS,),数据库系统是指在计算机系统中引入数据库后的系统,这类系统由五部分组成:,硬件系统,数据库集合,数据库管理系统(,DBMS,),相关软件,数据库管理员(,Data Base Administrator,,,DBA),用户,17,2,数据库管理系统(,DBMS,),数据库管理系统,DBMS,保证了数据和应用程序之间的物理独立性和逻辑独立性。所谓数据的,物理独立性,是指当数据的存储结构改变时,由系统提供数据的物理结构与逻辑结构之间的映像或转换功能,保持
9、数据的逻辑结构不变,从而应用程序不需要修改。数据的,逻辑独立性,是指由系统提供数据的整体逻辑结构和面向某个具体应用的局部逻辑结构之间的映像或转换功能,当数据整体逻辑结构改变时,通过映像保持局部逻辑结构不变,从而应用程序也不需要修改。,DBMS,是数据库系统的核心,,是位于用户和操作系统之间的一个数据管理软件,6.3.3数据库管理系统(,DBMS),18,6.4 数据模型,模型,是对现实世界的抽象。,根据模型应用的不同目的,可以将模型分为两类或者说两个层次:,概念模型,(也称信息模型),是按用户的观点来对数据和信息建模,,数据模型,是按计算机系统的观点对数据建模。,概念模型用于信息世界的建模,强
10、调语义的表达能力,要能够较方便、直接地表达应用各种语义知识。这类模型应当概念简单、清晰,,易于用户理解,,因为它是现实世界到信息世界的第一层抽象,是用户和数据库设计人员之间进行交流的语言。,数据模型用于机器世界,它通常需要有严格的形式化定义,而且常常会加上一些限制或规定,以,便于机器上的实现,。这类模型通常有一组严格定义了语法和语义的语言,人们可以使用它来定义、操纵数据库中的数据。,19,概念模型是现实世界到机器世界的中间层次,是独立于计算机系统,完全不涉及信息在计算机系统中的表示,只是描述信息结构,反映信息世界中实体之间的联系。,信息结构就是实体型集合及其联系的整体结构。,描述方法,E-R,
11、图(,Entity Relation Approach),1976,陈平山,6.4.1,信息模型(概念数据模型),20,1,信息模型的要素,(,1,)实体(,Entity,),(,2,)实体集(,Entity set,),(,3,)属性(,Attribute,),(,4,)联系(,Relationship,),(,5,)键(,Key,),(,6,)域(,Domain,),21,2,两个实体集之间联系的分类,(,1,)一对一联系,(,2,)一对多联系,(,3,)多对多联系,22,(,c)m:n,联系,(,b)1:n,联系,(,a)1:1,联系,n,m,n,1,1,1,车间,车间,车间,车间主任,
12、职工,零部件,管理,工作,加工,两实体集联系的,ER,图,23,厂长号,姓名,年龄,地点,厂名,厂号,厂长,工厂,管理,例如:,1,1,“1-1”联系,24,仓库号,地点,面积,价格,品名,货号,仓库,产品,存放,1,n,“,l-n,”,联系,例如:,25,学号,助学金,性别,姓名,学分,课程名,课程号,学生,课程,选修,m,n,“,m-n,”,联系,例如:,26,6.4.2 数据模型,虽然,E-R,模型是一个很好的描述实体间联系的方法,但现有的数据库系统不能直接接受。,E-R,模型只能说明实体间语义的联系,不能说明详细的数据结构,数据模型,是直接面向数据库中数据逻辑结构的,如关系、网状、层次
13、面向对象等模型,它涉及数据在计算机系统中的表示,被称为“基本数据模型”或“结构数据模型”。,数据模型:就是数据库中数据的整体逻辑结构,由三部分组成:,模型结构、数据操作和完整性规则,27,模型结构:是数据模型的基本部分,它将确定数据库的逻辑结构,是对系统静态特性的描述,数据操作:提供对数据库的操作手段,主要有检索更新两大类操作。是对系统动态性的描述。,完整性规则:是对数据库有效状态的描述,基本数据模型有,层次模型:用图实现,网状模型:用图实现,关系模型:用表实现,面向对象模型:用对象方法实现,6.4.2 数据模型,28,用树型结构来描述实体之间的联系。实体用记录来表示 。记录之间的联系用链接
14、指针实现。主要用于描述“一对多”的关系。,如某大学的人员按行政级别来组织就是一个树型结构:,R,1,R,2,R,3,R,4,R,5,树结构特点:,(1)有且仅有一个最高级的结点,称“根”,(2)其它结点有且仅有一个父结点,1,.,层次模型,29,层次模型的典型代表是:,IBM,公司的大型数据库管理系统,IMS(Information Management System),层次模型的缺点,(1)处理个别记录效率低,尤其是处理最低的个别记录,(2)数据库维护麻烦,(3)不能直接表示,m:n,的联系,需要转换成多个1:,m,的联系,1,.,层次模型,30,用网状结构表示实体及实体之间联系的模型称为网
15、状模型,是层次模型演变过来的。有多个节点没有父节点,至少有一个节点有多于一个父节点。主要用于描述“多对多”关系。如学生与课程之间的关系,2、网状模型,L,1,L,2,R,1,R,2,R,3,31,网状结构特点:(1)可以有多个结点没有父结点(2)允许有多个结点有多个父结点,缺点:,(1)数据检索必须考虑存取路径,效率低,(2)数据更新、扩充麻烦(涉及链接指针调整),(3)复杂网状结构难于实现(需要转换成简单网状或层次结构),32,是,用二维表来描述实体及其之间的联系的数据模型,层次、网状模型都要求数据库的记录之间具备明确的关系或链接。,以学生登记表为例,介绍关系模型中的主要术语,3、关系模型,
16、33,关系:一个关系对应于我们平常讲的一张表;,元组:表中的一行称为一个元组;,属性:表中的一列称为属性,给每一列起的一个名称即属性名;,主码:表中的某个属性组,它们的值唯一地标识一个元组;,域:属性的取值范围;,分量:元组中的一个属性值;,关系模式:对关系的描述,用关系名(属性,1,,属性,2,,属性,n,),来表示。,关系模型中的主要术语,34,由,E-R,图向关系模型转换的三条规则,:,(1),一个实体型转换为一个关系,实体的属性就是该关系的属性,实体的码就是该关系的码。,(2),一个联系也可以转换为一个关系,与该联系相连的各实体的码以及联系的属性可转换为关系的属性:,若联系为1:1,则
17、所连接的各实体的码均是该关 系的码。,若联系为1:,N,,关系的码为,N,端实体的码。,若联系为,M:N,,则关系的码为所连接的各实体码的组合。,(3),码相同的关系可以合并,6.4.3 E-R,图向关系模型转换,35,6.4.4 关系的规范化,1,第一范式(,1,NF,),2,第二范式(,2,NF,),3,第三范式(,3,NF,),36,6.5 数据库设计,数据库设计步骤:,(,1,)需求分析;,(,2,)概念结构设计;,(,3,)逻辑结构设计;,(4)数据库物理设计;,(5)数据库实施;,(,6,)数据库运用和维护,37,需求收集和分析,使用、维护数据,设计概念结构,设计逻辑结构,数据模型优化,设计物理结构,设计评价、性能预测,物理实现,试运行,不满意,不满意,不满意,需求分析阶段,概念结构设计阶段,逻辑结构设计阶段,物理结构设计阶段,数据库实施阶段,数据库运行维护、阶段,数据库设计步骤,38,
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4009-655-100 投诉/维权电话:18658249818