1、 数据库复习基本知识1、数据库的4个基本概念:数据(描述事物的符号记录)、数据库(长期存储在计算机内、有组织的、可共享的大量数据的集合。数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享 概括的讲,数据库数据具有永久存储、有组织和可共享三个基本特点)、数据管理系统(DBMS)和数据库系统(DBS)2、数据库系统的特点:数据结构化(数据库系统实现整体数据的结构化,这是数据库的主要特征这一,也是数据库系统与文件系统的本质区别)、数据的共享性高、冗余度低且易扩充(数据共享可以大大减少数据冗余,节约存储空间,数据共享还能够避免数据之间的不相
2、容性与不一致性)、数据的独立性高(物理独立性和逻辑独立性)、数据由数据库管理系统统一管理和控制(必须具备的4各控制功能1、数据的安全性保护2、数据的完整性检查3、并发控制4、数据库恢复)3、数据库的定义:数据库是长期存储在计算机内有组织、大量、共享的数据集合。它可以提供各种用户共享,具有最小冗余度和较高的数据独立性。数据库管理系统在数据库建立、运用和维护时对数据库进行统一控制,以保证数据的完整性和安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对数据库进行恢复。4、两大数据模型:1、概念模型(也称信息模型,主要用于数据库设计)2、数据模型(包括逻辑模型和物理模型 逻辑模型主要用于数
3、据库管理系统的实现) 数据模型应满足三方面的要求:1、能比较真实的模拟现实世界 2、容易为人所理解 3、便于在计算机上实现5、概念模型:它是按用户的观点来对数据和信息建模,主要用于数据库设计,从现实世界到概念模型的转换是由数据库设计人员完成的。6、 数据模型:它是对现实世界数据特征的抽象。是用来描述数据、组织数据和对数据进行操作的。数据模型是数据库系统的核心和基础。包括逻辑模型(主要包括层次模型、网状模型、关系模型等。它是按计算机系统的观点对数据建模,主要用于数据库管理系统的实现)和物理模型(对数据最底层的抽象,它描述数据在系统内部的表示方式和存取方方法是面向计算机系统的) 从概念模型到逻辑模
4、型的转换可以有数据可设计人员完成,也可以用数据可设计工具协助设计人员完成;从逻辑模型到物理模型的转换主要由数据库管理系统完成。7、 数据模型的组成三要素:1.数据结构(数据结构描述数据库的组成对象以及对象之间的联系,是对系统静态特性的描述,相对来说属稳定不变的)2.数据操作(对数据库中各种对象的值允许执行的操作及有关操作规则,主要有查询和更新两大类操作 是对系统动态特性的描述)3.数据的完整性约束条件(数据的完整性约束条件是一组完整性规则 在关系模型中,任何关系必须满足实体完整性和参照完整性两个条件)8、 常用的3中数据模型:1.层次模型(1.有且只有一个结点没有双亲节点,这个节点称为根节点
5、2.根以外的其他节点有且只有一个双亲节点。层次模型像一颗倒立的树,结点的双亲是唯一的)2.网状模型(1.允许一个以上的结点无双亲 2.一个结点可以有多于一个的双亲 层次模型中子女结点与双亲结点的联系是唯一的,而在网状模型中这种联系不唯一)3.关系模型(关系模型要求关系必须是规范化的,关系的每一个分量必须是一个不可分的数据项 关系模型中的数据操作是集合操作,操作对象和结果都是关系)9、概念模型:现实世界的基本概念:1.实体(客观存在并可相互区别的事物)2.属性(实体所具有的某一特性)3.码(唯一标识实体的属性集)4.实体型(用实体名及其属性名集合来抽象和刻画同类实体 例如 学生(学号,姓名,性别
6、,等)就是一个实体型)5.实体集(同一类型实体的集合 例如 全体学生)6.联系(通常指实体之间的联系)9、 数据库系统模式:模式是数据库中全体数据的逻辑结构和特征的描述,它仅仅涉及型的描述,不涉及具体的值。模式的一个具体指称为模式的一个实例。同一个模式可以有很多实例。模式是相对稳定的,而实例是相对变动的。10、 数据库系统的三级模式结构:模式(也称逻辑模式,是数据苦衷全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图 一个数据库只有一个模式)、外模式(也称子模式或用户模式,它是数据库用户能故看得见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑
7、表示 一个数据库可以有多个外模式)、内模式(也称存储模式,它是数据物理结构和存储方式的描述,是数据在数据库内部的组织方式 一个数据库只有一个内模式)11、 数据库的二级映像功能与数据独立性:数据库系统的三级模式是数据的三个抽象级别,为了能够在系统内部实现这三个抽象层次的凉席和转换,数据库管理系统在这三级模式之间提供了两层映像:外模式/模式映像和模式/内模式映像12、 两层映像:1.外模式/模式映像(模式描述的是数据的全局逻辑结构,外模式描述的是数据的局部逻辑结构。对应于同一个模式可以有任意多个外模式。对于每一个外模式,数据库系统都有一个外模式/模式映像,所以当模式改变时,数据可管理员对各个外模
8、式/模式的映像做相应改变,可以使外模式保持不变。保证了数据的逻辑独立性)2.模式/内模式(数据库只有一个模式,也只有一个内模式,所以模式/内模式映像是唯一的,保证了数据的物理独立性)13、码和外码的定义:唯一标识实体的属性集称为码,不一定是一个属性,也可能是一个属性组。如果一个关系中的一个属性是另外一个关系中的主码则这个属性为外码。外码的值要么为空,要么要为其对应的主码中的一个值。需要指出的是,外码并不一定要与相应得住吗同名,不过在实际应用中为了便于识别,当外码与相应的主码属于不同关系时,往往给他们取相同的名字。外码能反映两个关系之间的一对多或多对多的关系14、笛卡儿积:两个集合之间的乘法15
9、、关系可以有三种类型:基本关系(通常又称为基本表或基表)、查询表和视图表。基本标识实际存在的表,它是实际存储数据的洛基表示;查询表是查询结果对应的表;视图表是由基本表或其他视图表导出的表,是虚表,不对应实际存储的数据。16、 关系模型要求关系必须是规范化的,及要求关系必须满足一定的规范条件。这些规范条件中最基本的一条就是,关系的每一个分量必须是一个不可分的数据项。规范化的关系简称为范式(NF)。17、 关系数据库中的关系时要满足一定要求的,满足不同程度要求的为不同范式,最低为第一范式,简称1NF;往上一次为2NF、3NF;一个低一级范式的关系模式通过模式分解可以转换为若干个高一级范式的关系模型
10、的集合,这种过程就叫做规范化。范式有一个大题:一范式或二范式书上例题P18218、 完整性约束的定义:是一组完整性规则的集合。它定义了数据模型必须遵守的语义约束,也规定了根据数据模型所构建的数据库中数据内部及其数据相互间联系所必须满足的语义约束。主要分为3种(下面25点有介绍)。19、 概念模型的主要特点:具有较强的语言表达能力,能够方便、直接的表达应用中的各种语义知识;应该简单、清晰、易于用户理解。能真实、充分的反映现实世界;易于更改;易于向关系、王庄、层次等各种数据类型转换。概念模型是各种数据模型的基础,比数据模型更加稳定,描述概念模型的有力工具是E-R模型。20、 E-R图的三要素:1.
11、实体型(用矩形表示,矩形内写明实体名)2.属性(用椭圆表示,并用无向边将其与其相应的实体连接起来)3.联系(用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1、1:n或m:n)E-R图设计有一个大题相应例题P21721、 结构化查询语言(SQL)是关系数据库的标准语言,数据库查询语言及相应例题见P89数据的查询、分组、嵌套会考大题22、 视图是从一个或几个基本表(视图)导出的表。它本身不独立存储在数据库中,及数据库中只存放视图的定义而不存放视图对应的数据。所以说视图是虚表。23、 视图的建立一般格式:CREATE VIEW (,。)AS /子
12、查询可以使任意的SELECT语句WITH CHECK OPTION /表示对视图进行操作时保证操作的行满足视图定义中的谓词条件 (即子查询中的条件表达式)例如:(1)建立信息系学生的 (2)建立信息系学生视图并要求进行操作时仍需保证该视图 视图,只有信息系学生 CREATE VIEW IS_Student CREATE VIEW IS_Student AS ASSELECT Sno,Sname,Sage SELECT Sno,Sname,SageFROM Student FROM StudentWHERE Sdept=IS /条件表达式 WHERE Sdept=IS /条件表达式 WITH C
13、HECK OPTIONCREATE VIEW 语句的结果只是把视图的定义存入数据字典,宁不执行其中的select语句。只是在对视图查询是,才按视图的定义从基本表中将数据查出。上面例二中加上了WITH CHECK OPTION字句,以后对该视图进行的一系列操作关系数据可管理系统会自动加上Sdept=IS24、 删除视图和查询视图:1、 删除DROP VIEW CASCADE /如果删除的视图还导出了其他视图,则使用CASCADE级 联删除语句例如: DROP VIEW BT_S; /删除BT_S视图 DROP VIEW IS_S1; /删除失败 DROP VIEW IS_S1 CASCADE;
14、/删除IS_S1视图和由它导出的所有视图2、 查询与基本表的查询一样。也可参考P124页25、 数据库安全性:三个方面:1、技术2、管理3、法律26、 数据库安全性控制方法:用户身份鉴别、多层存取控制、审计、视图和数据加密用户身份鉴定:静态/动态口令鉴别、生物特征鉴别、智能卡鉴别存取控制:自主存取控制(DAC)、强制存取控制(MAC)授权GRANT 和 回收REVOKEGRANT语句的格式 REVOKE语句的格式GRANT ,权限。 REVOKE,。ON,ON。TO,。 FROM,。WITH GRANT OPTION CASCADE|RESTRICT其语义为:将指定操作对象的指定操作授权给 C
15、ASCADE起到一个级联收回的作用,即 指定用户,如果指定了WITH GRANT OPTION子如果要回收的用户传播了该权限,若加 句,则获得某种权限的用户还可以把这种权限再上CASCADE则会全部回收,否则仅仅回 授予其他用户,若没有,则获得某种权限的用 指定用户。有的数据库系统用RESTRICT 户只能使用该权限,不能传播该权限。 来实现这一功能。SQL标准允许用户把相应的权限或其子集传递授予其他用户,但不允许循环授权,即被授权者不能把权限在授回给授权者或其祖先。如下图 U1 U2 U3 U4 具体的实例见p142与P143 27、 触发器定义:触发器使用户定义在关系表里上的一类有事务驱动
16、的特殊过程。触发器又叫做事件-条件-动作规则 。当特定的系统事件(如对一个表的增、删、改操作,事物的结束等)发生时,对规则的条件进行检查,如果条件成立则执行规则中的动作,否则不执行该动作。触发事件可以是插入、更新、删除,也可以是这几个事件的组合。P169注:一个数据库上可定义多个触发器28、 触发器的类型:触发器按照所触发动作的间隔尺寸可以分为行级触发器和语句级触发器。25、 完整性约束的种类:关系模型中有三类完整性约束:实体完整性、参照完整性、用户定义的完整性,其中实体完整性和参照完整性是关系模型必须满足的完整性约束条件,被称作是关系的两个不变性。1.实体完整性(保证关系数据库中的每一个元组
17、是可分的,是唯一的 即保证主码唯一;主码不能为空)2.参照完整性(具有参照完整性约束的表中的外码字段,是其参照表的主码字段。外码取值必须取参照表中主码字段已经有的值,可以为空也可不为空)3.用户定义完整性(针对某一具体关系数据库的约束条件,它反映某一具体应用所涉及的数据必须满足的语义要求)26、 事物的定义:所谓事物使用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,是一个不可分割的工作单位。例如,在关系数据库中,一个事物可以是一条SQL语句、一组SQL语句或整个程序。事物和程序是两个概念,一般来讲,一个程序中包含多个事物。27、 事物的特性(ACID):原子性、一致性、隔离性、持续
18、性。28、 故障的种类:1、事物内部的故障(该故障的恢复操作称为事物撤销UNDO)2、系统故障(该故障的恢复操作称为重做REDO 系统故障通常称为软故障) 3、介质故障(称为硬故障)4、计算机病毒。29、 故障对数据库的影响有两种可能:一是数据库本身被破坏,二是数据可能不正确。恢复的基本原理:冗余30、 恢复的实现技术:1、数据转储(即备份,有动态海量转储、动态增量转储、静态海量转储、静态增量转储)2、登记日志文件(登记日只为见是必须遵守两条原则:等级的刺须严格按并发事务执行的时间次序、必须先写日志文件,后写数据库)P29731、 并发控制:在多处理机系统中,每个处理机可以运行一个事物,多个处理机可以运行多个事物,实现多个事物真正的并发运行,这种并行执行方式称为同时并发方式。32、 并发控制带来的不正确:1、丢失修改2、不可重复读3、读脏数据33、并发控制的主要技术:封锁、时间戳、乐观控制法和多版本并发控制等。基本的封锁类型有两种:排他锁(又称写锁 X锁)、共享锁(又称读锁 S锁)见P312死锁与活锁:避免活锁的简单方法就是采用先来先服务的策略。死锁的预防(一次封锁法、顺序封锁法),死锁的诊断与解除(超时法、等待图法)见P31534、数据库设计的6个阶段:需求分析、概念结构设计、逻辑结构设计、物理结构设计、数据库实施、数据库运行和维护