1、第2章 数据模型与数据库结构o2.1 数据和数据模型o2.2 概念层数据模型o2.3 组织层数据模型o2.4 面向对象数据模型o2.5 数据库结构2024/5/21 周二2.1 数据和数据模型o现实世界的数据是散乱无章的,散乱的数据不利于人们对其进行有效的管理和处理。o因此,必须把现实世界的数据按照一定的格式组织起来,以方便对其进行操作和使用。o在用数据库技术管理数据时,数据被按照一定的格式组织起来,比如二维表结构,以使数据能够被更高效地管理和处理。2024/5/21 周二22.1.1 数据与信息o描述事物的符号记录称为数据。o将从数据中获得的有意义的内容称为信息。o数据有一定的格式,这些格式
2、的规定是数据的语法,而数据的含义是数据的语义。o数据是信息存在的一种形式,只有通过解释或处理才能成为有用的信息。2024/5/21 周二3示例o数据:n(张三,9912101,男,1981,计算机系,应用软件)o解释:n张三是9912101班的男生,1981年出生,计算机系应用软件专业。2024/5/21 周二4数据信息解释数据的静态特征o数据的基本结构n学生的学号、姓名、性别、出生日期o数据间的联系n学生选课中的学号与学生基本信息中的学号o数据取值范围约束n考试成绩在0100分之间2024/5/21 周二5动态特征o指对数据可以进行的操作以及操作规则。o对数据库数据的操作主要有n查询数据n更
3、改数据:插入、删除和更新o一般将对数据的静态特征和动态特征的描述称为数据模型三要素2024/5/21 周二62.1.2 数据模型o对于模型,人们并不陌生。n建筑模型 飞机模型o计算机中的模型是对事物、对象、过程等客观系统中感兴趣的内容的模拟和抽象表达,是理解系统的思维工具o数据模型(data model)也是一种模型,它是对现实世界数据特征的抽象。2024/5/21 周二7数据模型(续)o数据库管理系统是基于某种数据模型对数据进行组织的,因此,了解数据模型的基本概念是学习数据库知识的基础。o在数据库领域中,数据模型用于表达现实世界中的对象,即将现实世界中杂乱的信息用一种规范的、形象化的方式表达
4、出来。2024/5/21 周二8数据模型(续)o数据模型即要面向现实世界,又要面向机器世界,因此需满足三个要求:n能够真实地模拟现实世界;n容易被人们理解;n能够方便地在计算机上实现。2024/5/21 周二9数据模型(续)o数据模型实际上是模型化数据和信息的工具。根据模型应用的不同目的,可以将模型分为两大类:o概念层数据模型(概念模型),从数据的语义视角来抽取模型,是按用户的观点来对数据和信息进行建模。o组织层数据模型(组织模型)。从数据的组织层次来描述数据。2024/5/21 周二10概念层数据模型o从数据的应用语义视角来抽取现实世界中有价值的数据并按用户的观点对数据进行建模。o主要用在数
5、据库的设计阶段,o与具体的数据库管理系统无关,o与具体的实现方式无关。2024/5/21 周二11组织层数据模型o从数据的组织方式来描述数据。主要有:n层次模型n网状模型n关系模型n对象-关系模型o是从计算机系统的观点对数据进行建模,o与所使用的数据库管理系统有关。2024/5/21 周二12从现实世界到机器世界的过程2024/5/21 周二132.2 概念层数据模型o基本概念o实体-联系模型2024/5/21 周二14基本概念o概念层数据模型是指抽象现实系统中有应用价值的元素及其关联关系,反映现实系统中有应用价值的信息结构,并且不依赖于数据的组织层数据模型。o用于对信息世界建模,是现实世界到
6、信息世界的第一层抽象,是数据库设计人员进行数据库设计的工具,也是数据库设计人员和业务领域的用户之间进行交流的工具。2024/5/21 周二15基本概念(续)o概念层数据模型应该:n具有较强的语义表达能力;n能够方便、直接地表达应用中的各种语义知识n简单、清晰,易于被用户理解。o是面向用户、面向现实世界的数据模型,与具体的DBMS无关。o常用概念模型:实体-联系模型、语义对象模型2024/5/21 周二16实体-联系模型o由P.P.S.Chen 于1976年提出,即通常所说的E-R方法。o这种方法由于简单、实用,因此得到了广泛的应用,也是目前描述信息结构最常用的方法。o实体-联系方法使用的工具称
7、为E-R图o也把这种描述结果称为E-R模型。2024/5/21 周二17实体-联系模型o实体 o属性 o联系2024/5/21 周二18实体o具有公共性质的可相互区分的现实世界对象的集合。例如:n学生、课程、职工o在E-R图中用矩形框表示具体的实体,把实体名写在框内。学生2024/5/21 周二19实体与实例o实体中每个具体的记录值(一行数据),称为实体的一个实例。o有些书也将实体称为实体集或实体类型,而将每行具体的记录称为实体。2024/5/21 周二20实体实例属性o描述实体或者联系的性质或特征的数据项。学号姓名性别年龄2024/5/21 周二21标识属性o能够唯一标识实体的一个属性或最小
8、的一组属性(称为属性集或属性组)称为实体的标识属性,o称为实体的码。o例如,“学号”就是学生实体的码。2024/5/21 周二22属性的表示方式o用圆角矩形或椭圆框表示,框内写上属性名,并用连线连到相应实体。学生学生学号学号姓名姓名性别性别2024/5/21 周二23联系 o联系是数据之间的关联集合,是客观存在的应用语义链。o实体内部的联系:一个实体内属性之间的联系。n职工中的职工号和此职工的部门经理号o实体之间的联系:不同实体之间的联系。n课程和学生实体之间存在选课联系。2024/5/21 周二24联系的表示方式 实体之间的联系用菱形框表示,框内写上联系名,并用连线与有关的实体相连。联系名实
9、体1实体22024/5/21 周二联系的种类一对一联系(1:1)一对多联系(1:n)多对多联系(m:n)2024/5/21 周二 如果实体A中的每个实例在实体B中至多有一个(也可以没有)实例与之关联,反之亦然,则称实体A与实体B具有一对一联系,记作:1:1 一对一联系(1:1)2024/5/21 周二27一对一联系的例子部门和正经理(假设一个部门只有一个正经理,一个人只当一个部门的经理)、系和正系主任(假设一个系只有一个正主任,一个人只当一个系的主任)都是一对一联系。管理经理部门112024/5/21 周二28一对多的联系 如果实体A与实体B之间存在联系,并且对于实体A中的一个实例,实体B中有
10、多个实例与之对应;而对实体B中的任意一个实例,在实体A中都只有一个实例与之对应,则称实体A到实体B的联系是一对多的,记为1:n 2024/5/21 周二 有部门和职工两个实体,并且有语义:一个部门可以有多名职工,但是一个职工只在一个部门工作。则部门和职工之间的联系是一对多的,我们把这种联系命名为工作。一对多联系的例子工作部门职工1n2024/5/21 周二多对多的联系 如果实体A与实体B之间存在联系,并且对于实体A中的一个实例,实体B中有多个实例与之对应;而对实体B中的一个实例,在实体A中也有多个实例与之对应,则称实体A到实体B的联系是多对多的,记为m:n。2024/5/21 周二多对多联系的
11、例子 有学生和课程两个实体,并有语义:一个学生可以修多门课程,一门课程可以被多个学生修。那么学生和课程之间的联系就是多对多的,我们把这种联系命名为选课。学生课程选课mn2024/5/21 周二联系说明o一对一联系是一对多联系的特例,而一对多联系又是多对多联系的特例。o实体之间联系的种类与语义直接相关。o例如,部门和经理:n如果一个部门只有一个经理,一个人只担任一个部门的经理,则部门和经理之间是一对一联系。n如果一个部门可以有多个经理,而一个人只担任一个部门的经理,则部门和经理之间就是一对多联系。n如果一个部门可以有多个经理,而且一个人也可以担任多个部门的经理,则部门和经理之间就是多对多联系。2
12、024/5/21 周二33关联多个实体的联系o顾客购买商品:n每个顾客可以从多个售货员那里购买商品,并且可以购买多种商品;n每个售货员可以向多名顾客销售商品,并且可以销售多种商品;n每种商品可由多个售货员销售,并且可以销售给多名顾客。m mn np p顾客顾客商品商品售货员售货员销售销售2024/5/21 周二34两个图不等价2024/5/21 周二35m mn np p顾客顾客商品商品售货员售货员销售销售2.3 组织层数据模型o2.3.1 层次数据模型o2.3.2 网状数据模型o2.3.3 关系数据模型2024/5/21 周二36概述o组织层数据模型是从数据的组织形式的角度来描述信息。o在数
13、据库技术的发展过程中用到的组织层数据模型主要有:n层次模型(Hierarchical Model)n网状模型(Network Model)n关系模型(Relational Model)n面向对象模型(Object Oriented Model)2024/5/21 周二372.3.1 层次数据模型o是数据库管理系统中最早出现的数据模型。o层次数据库管理系统采用层次模型作为数据的组织方式。o层次数据库管理系统的典型代表是IBM公司的IMS,是IBM1968年推出的第一个大型商用数据库管理系统。2024/5/21 周二38层次数据模型o用树形结构表示实体和实体之间的联系。o现实世界中许多实体之间的联
14、系本身就呈现出一种自然的层次关系,如:n行政机构n家族关系2024/5/21 周二39层次数据模型o构成层次模型的树由结点和连线组成n结点表示实体,结点中的项表示实体的属性n连线表示相连的两个实体间的联系,这种联系是一对多的。o通常把表示“一”的实体放在上方,称为父结点;o把表示“多”的实体放在下方,称为子结点。o将不包含任何子结点的结点称为叶结点。2024/5/21 周二40层次模型示意图2024/5/21 周二41层次模型的限制o可以方便的表示一对多的联系。但有以下两点限制:n有且仅有一个结点无父结点,这个结点即为树的根;n其他结点有且仅有一个父结点。2024/5/21 周二422024/
15、5/21 周二43层次模型基本特点o任何一个给定的记录值只有从层次模型的根部开始按路径查看时,才能明确其含义,任何子结点都不能脱离父结点而存在。2024/5/21 周二44层次数据模型的一个值2024/5/21 周二45层次模型局限性o只能表示一对多的联系,不能直接表示多对多联系。o如果把多对多联系转换为一对多联系,会出现一个子结点有多个父结点的情况。2024/5/21 周二46解决办法o把一个层次模型分解为两个层次模型2024/5/21 周二472.3.2网状数据模型o如果去掉层次模型中的两点限制,即n允许一个以上的结点无父结点,n每个结点可以有多个父结点,o便构成了网状模型。o用图形结构表
16、示实体和实体之间的联系。2024/5/21 周二48网状模型示例2024/5/21 周二49网状模型限制o网状数据模型可以直接表示多对多联系。但实现起来太复杂。o因此一些支持网状模型的数据库管理系统,对多对多联系还是进行了限制o例如,网状模型的典型代表CODASYL就只支持一对多联系。2024/5/21 周二50网状模型示意图2024/5/21 周二512.3.3关系数据模型o关系数据模型是目前最重要的一种数据模型,o关系数据库就是采用关系数据模型作为数据的组织方式。o关系数据模型源于数学,它把数据看成是二维表中的元素,而这个二维表在关系数据库中就称为关系。2024/5/21 周二52关系数据
17、模型的数据结构o用关系(表格数据)表示实体和实体之间的联系的模型就称为关系数据模型。o在关系数据模型中,实体本身以及实体和实体之间的联系都用关系来表示,实体之间的联系不再通过指针来实现。2024/5/21 周二53关系模型示例o学生表2024/5/21 周二54学学 号号姓姓 名名年年 龄龄性性 别别所所 在在 系系0611101李勇李勇21男男计算机系算机系0611102刘晨刘晨20男男计算机系算机系0611103王敏王敏20女女计算机系算机系0621101张立立20男男信息管理系信息管理系0621102吴吴宾19女女信息管理系信息管理系o在关系数据库中,记录值仅仅构成关系,关系之间的联系是
18、靠语义相同的字段(称为连接字段)值表达的。o例如,要查询“刘晨”的考试成绩,首先要在“学生”关系中得到“刘晨”的学号值,然后根据这个学号值再在“选课”关系中找出该学生的所有考试记录值。2024/5/21 周二55示例2024/5/21 周二56学学 号号姓姓 名名0611101李勇李勇0611102刘晨刘晨0611103王敏王敏学学 号号课 程号程号成成 绩绩0611101C001960611101C002800611101C003840611101C005620611102C001920611102C002900611102C004840621102C001760621102C00485学生
19、选课0611102刘晨刘晨0611102C001920611102C002900611102C00484关系模型好处o关系数据模型易于设计、实现、维护和使用,o它与层次数据模型和网状数据模型的最根本区别是,关系数据模型不依赖于导航式的数据访问系统,数据结构的变化不会影响对数据的访问。2024/5/21 周二572.4 面向对象数据模型o面向对象数据模型是捕获在面向对象程序设计中所支持的对象语义的逻辑数据模型,是持久的和共享的对象集合,具有模拟整个解决方案的能力。o面向对象数据模型把实体表示为类,一个类描述了对象属性和实体行为。2024/5/21 周二58示例o“学生”类有学生的属性,如n学号、
20、学生姓名和性别等,o还包含模仿学生行为(如选修课程)的方法。o类-对象的实例对应于学生个体。2024/5/21 周二59o面向对象数据库基于把数据和与对象相关的代码封装成单一组件,外面不能看到其里面的内容。o因此,面向对象数据模型强调对象(由数据和代码组成)而不是单独的数据。o与传统的数据库不同,对象模型没有单一固定的数据库结构。2024/5/21 周二60o面向对象数据库管理系统(OODBMS)是数据库管理中最新的方法,它们始于工程和设计领域的应用,并且成为金融、通讯和万维网(WWW)应用欢迎的系统。o适用于多媒体应用以及复杂的很难在关系数据库管理系统中模拟和处理的关系。2024/5/21
21、周二612.5 数据库结构o2.5.1 模式的基本概念o2.5.2 三级模式结构o2.5.3 模式映像与数据独立性2024/5/21 周二62概述o考察数据库结构有不同的层次或不同的角度。n从数据库管理角度看,数据库通常采用三级模式结构。这是数据库管理系统内部的系统结构。n从数据库最终用户角度看,数据库的结构分为集中式结构、文件服务器结构、客户/服务器结构等。这是数据库的外部结构。o本节我们讨论数据库的内部结构。2024/5/21 周二632.5.1 模式的基本概念o数据模型(组织层数据模型)是描述数据的组织形式,o模式是用给定的数据模型对具体数据的描述。o就像用某一种编程语言编写具体应用程序
22、一样。2024/5/21 周二64模式的基本概念o模式是数据库中全体数据的逻辑结构和特征的描述,它仅仅涉及“型”的描述,不涉及具体的值。o关系模式是关系的“型”或元组的结构共性的描述。o实际上对应的是关系表的表头。2024/5/21 周二65关系模式o模式的一个具体值称为模式的一个实例。o如表中的每一行数据就是一个具体实例。o模式是相对稳定的,实例是相对变动的。2024/5/21 周二66关系模式关系模式实例属性1属性2属性n2024/5/21 周二67三级模式结构2024/5/21 周二68三个模式o关系数据库中的模式一定是关系的,在该层可见的实体是关系的表和关系的操作符。o外模式也是关系的
23、,它们的内容来自模式o内模式不是关系的,它是数据的物理存储方式。2024/5/21 周二69外模式o也称为用户模式、子模式。o用户对现实系统中感兴趣整体的局部数据结构的描述。o是DB整体数据结构的子集或局部重构。o用外模式定义语言表达。例,对RDB,定义视图结构。o是保证数据库安全的一个措施。2024/5/21 周二70示例1子集2024/5/21 周二71学学 号号姓姓 名名年年 龄龄性性 别别所所 在在 系系0611101李勇李勇21男男计算机系算机系0611102刘晨刘晨20男男计算机系算机系0611103王敏王敏20女女计算机系算机系0621101张立立20男男信息管理系信息管理系06
24、21102吴吴宾19女女信息管理系信息管理系学学 号号姓姓 名名性性 别别0611101李勇李勇男男0611102刘晨刘晨男男0611103王敏王敏女女0621101张立立男男0621102吴吴宾女女学生模式外模式学学 号号06111010611102061110306211010621102姓姓 名名李勇李勇刘晨刘晨王敏王敏张立立吴吴宾性性 别别男男男男女女男男女女示例2重构o学生(学号,姓名,性别,年龄,所在系)o课程(课程号,课程名,学分)o选课(学号,课程号,成绩)2024/5/21 周二72学生(姓名,课程名,成绩)姓名课程名成绩示例3安全性职工表(职工号,姓名,所在部门,基本工资,
25、职务工资,奖励工资)2024/5/21 周二73职工信息(职工号,姓名,所在部门,基本工资,职务工资)奖励工资模式 o也称为逻辑模式或模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据描述。o是数据库系统结构的中间层。o不涉及数据的物理存储细节和硬件环境,o与具体的应用程序、应用开发工具和环境无关。2024/5/21 周二74o模式实际上是数据库数据在逻辑级上的视图。o一个数据库只有一种模式。o不涉及存储记录对列、索引、指针或其他存储的访问细节。2024/5/21 周二75内模式o也称为存储模式。o是对整个数据库的底层表示。o描述了数据的存储结构,比如:n数据的组织与存储方式
26、n索引按什么方式组织n是否加密等o但不涉及物理记录的形式。2024/5/21 周二762.5.3 模式映象与数据独立性o数据库系统的三级模式是对数据的三个抽象级别,o它把数据的具体组织留给DBMS管理,使用户能逻辑地、抽象地处理数据,o而不必关心数据在计算机中的具体表示方式与存储方式。2024/5/21 周二77两个映像o为了能够在内部实现这三个抽象层次的联系和转换,数据库管理系统在三级模式之间提供了两层映象:外模式/模式映象模式/内模式映象2024/5/21 周二78外模式/模式映象 o当模式改变时,可用外模式/模式定义语句,调整外模式/模式映象定义,从而保持外模式不变。数据和程序逻辑独立(
27、概念独立)2024/5/21 周二79逻辑独立性示例2024/5/21 周二80(学号,姓名,性别)学生(学号,姓名,年龄,性别,所在系)学生(学号,姓名,年龄,性别,所在系,专业)模式/内模式映象 o当存储结构改变时,可(由DBA)用内模式定义语句,调整内模式定义,从而保持模式不变。数据和程序物理独立(存储独立)2024/5/21 周二81物理独立性示例2024/5/21 周二82学学 号号姓姓 名名年年 龄龄性性 别别所所 在在 系系0611101李勇李勇21男男计算机系算机系0611102刘晨刘晨20男男计算机系算机系0611103王敏王敏20女女计算机系算机系0621101张立立20男
28、男信息管理系信息管理系0621102吴吴宾19女女信息管理系信息管理系D:xE:a学生数据库学生数据库 D:xF:b学生数据库学生数据库 物理独立性示例2024/5/21 周二83学学 号号姓姓 名名年年 龄龄性性 别别所所 在在 系系0611101李勇李勇21男男计算机系算机系0611102刘晨刘晨20男男计算机系算机系0611103王敏王敏20女女计算机系算机系0621101张立立20男男信息管理系信息管理系0621102吴吴宾19女女信息管理系信息管理系模式小结o模式是数据库的中心与关键,它独立于数据库系统的其他层。设计数据库系统时也是首先设计数据库系统的逻辑模式。o内模式依赖于数据库的全局逻辑结构,但独立于数据库的用户视图,也独立于具体的存储设备。o外模式面向具体的应用程序,它定义在逻辑模式之上,但独立于存储模式和存储设备。2024/5/21 周二842024/5/21 周二852024/5/21 周二86