收藏 分销(赏)

《数据库原理与应用》北师珠必备复习重点.doc

上传人:天**** 文档编号:10821066 上传时间:2025-06-18 格式:DOC 页数:24 大小:589.06KB 下载积分:10 金币
下载 相关 举报
《数据库原理与应用》北师珠必备复习重点.doc_第1页
第1页 / 共24页
《数据库原理与应用》北师珠必备复习重点.doc_第2页
第2页 / 共24页


点击查看更多>>
资源描述
第1章 数据库系统概述 1. 数据库的概念 1) 数据库是存储在计算机存储设备上的: 数据库是存在于计算机存储设备上的一个或多个(数据库)文件组成的统一体,是可感知的数据库形体。 2) 数据库是按一定的组织方式存储在一起的: 数据库中的数据是以结构化的形式存储的,这种结构化形式实质上就是数据库的数据模型,是不可感知的数据库形体。 3) 数据库是相关的数据集合: 数据库中的数据既有某特定应用领域涉及的各种基本数据,也有反映这些数据之间联系的数据,也是不可感知的数据库形体之一。 DBMS的概念 数据库管理系统(DBMS)是建立、管理和维护数据库的软件系统,是一种位于应用软件和操作系统之间,实现数据库管理功能的系统软件。 2. DBMS的主要功能 定义、 操纵 、控制、 维护数据库 并有 通信功能 3. 数据库应用系统概念成 以计算机为开发和应用平台, 以OS、DBMS、某种程序语言和实用程序等为软件环境, 以某一应用领域的数据管理需求为应用背景, 采用数据库设计技术建立的一个可实际运行的, 按照数据库方法存储和维护数据的, 并为用户提供数据支持和管理功能的应用软件系统。 4. 三个世界对数据的描述 现实世界是存在于人们头脑之外的客观世界。可狭义地将现实世界看作为各个事物、各个现象、各个单位的实际情况。 计算机世界——数据世界 对数据和信息的处理 信息世界是现实世界在人们头脑中的反映和解释,是现实世界的概念化。 5. 数据模型的概念及组成 数据模型是现实世界中的各种事物及各事物之间的联系用数据及数据间的联系来表示的一种方法。一个数据库的数据模型实际上给出了在计算机系统上进行描述和动态模拟现实世界信息结构及其变化的方法。 是一组面向计算机的概念集合, 由数据结构 、数据操作 、数据约束三部分组成 6. 层次模型、 是一种用树型(层次)结构来组织数据的数据模型。 树中的每个结点代表一种记录类型。 网状模型 (1)至少有一个结点多于一个双亲结点; (2)至少有一个结点无双亲结点。 关系模型 系模型是一种用二维表格结构表示数据及数据之间联系的 (优于上面两个) 7. 数据库的三级模式及两级影像与数据独立性 数据库的三级模式结构指的是 一种从数据库管理系统(DBMS)的角度看到的 数据库模式结构和映射关系。 内模式 是对数据库表物理存储结构的描述。 逻辑模式 是对DB中全部数据的整体逻辑结构的描述, 体现了全局、 整体的数据观点。 外模式 是对数据库用户能看见和使用的局部数据逻辑结构的描述,体现了 应用程序员对数据库的数据观点。 三级数据库结构 : 用户级DB 局部逻辑结构 概念级DB 全局逻辑结构 存储级DB 存储组织结构 (1) 数据的体系结构如何保证数据独立性? 应用程序是依据数据的外模式编写 当逻辑模式改变时候,只需要把 外模式/模式映像 做出相应的改变就行,以至于外模式保持不变,从而可以不必修改应用程序,保证了数据与程序的逻辑独立性(只要没有改变逻辑模式中与外模式定义有关的属性及与其关系模式名的隶属关系,就可使外模式保持不变) 当内模式改变的时候,由数据库管理员对 模式/内模式映像 做相应的改变,可以使逻辑模式保持不变,从而应用程序也不必修改,保证了数据与程序的物理独立型。 第2章 关系运算 1. 关系的定义 关系是一张表,表中的每行(即数据库中的每条记录)就是一个元组,每列就是一个属性。 在二维表里,元组也称为记录。 定义2.1 设有属性A1和A2分别在值域D1和D2中取值,则这两个属性的值域集合的笛卡儿积定义为: D1×D2={<d1,d2>|d1∈D1且d2∈D2} 其中,序偶<d1,d2>中的两个元素d1和d2是有序的,也即其次序是不能改变的。进一步讲,D1×D2≠D2×D1。 但是 不强调其n元组中元素次序的笛卡儿积运算,称为广义笛卡儿积运算 比如:设D1={1,2,3},基数为3;     D2={a,b},基数为2; 则有: D1×D2={<1,a>,<1,b>,<2,a>, <2,b>,<3,a>,<3,b>} 且基数为3×2=6。 例2.1:设D1={李兵,王芳},D2={男,女},     D3={北京,上海}。 D1×D2×D3= {<李兵,男,北京>,<李兵,男,上海> ,      <李兵,女,北京> ,<李兵,女,上海> ,     <王芳,男,北京> ,<王芳,男,上海> ,     <王芳,女,北京> ,<王芳,女,上海>} 且基数为2×2×2=8。 笛卡儿积的基数即为笛卡儿积定义的 元组集合中的元组的个数 定义2.2 笛卡儿积D1×D2×¼×Dn的任一子集称为在域D1,D2,… ,Dn上的关系。   其中,值域集合D1,D2,… ,Dn是关系中元组的取值范围,称为关系的域(Domain),n称为关系的目或关系的度(Degree)。 例如: n=2时,二元关系 n=m时,m元关系 2. 关系的性质 (1)关系中的每个属性值都是不可再分的数据单位,即关系表中不能再 有子表; (2)关系中任意两行不能完全相同,即关系中不允许出现相同的元组; (3)关系是一个元组的集合,所以关系中元组间的顺序可以任意; (4)每一个关系都有一个主键,用于唯一地标识它的各个元组。 3. 关系代数的运算 (1) 知道运算的含义及表示符号 (2)能够求解关系代数表达式的值 (3)能够用关系代数表达式表达查询要求 4.等值连接、自然连接与外连接的含义 略 第3章 数据应用系统设计方法 1. 数据库设计的主要步骤及每一阶段的主要任务 问题定义、可行性研究、 需求分析 : 用户需求分析是指分析用户对数据管理的功能需求和应用需求, 是进行数据库应用系统设计的基础。 数据流图 是一种用于描绘系统逻辑模型的图形工具,是逻辑系统的图形表示。 数据字典 表达出每个数据和处理的具体含义和详细描述信息 、总体设计、详细设计、编码与单元测试、综合测试、软件维护 2. 数据库各级模式(概念模式、逻辑模式、外模式和物理模式)形成的阶段 概念模式 E-R图 步骤 局部E-R图 集成局部的形成一个完整的E-R图 优化(消除命名冲突、消除属性特征冲突、消除结构冲突、消除冗余数据和冗 余联系) 逻辑模式 概念结构设计阶段设计好信息结构转换为一组关系模式; 2、步骤 (1)将设计好的概念结构转换成关系模型; (2)利用规范化理论对转换好的关系模型进行规范化设计和处理; (3)对关系模型进行优化处理。 物理模式 是指数据库在物理存储设备上的存储结构和存取方法。在物理存储设备上为逻辑结构设计阶段设计好的数据库逻辑结构,选取和设计一个占用存储空间较少、查询效率尽可能高、维护代价较低的数据库物理结构;并对设计好的物理结构从时间和空间效率方面进行评价,以便确定是否对其逻辑结构或物理结构进行进一步的优化设计。 存储数据库信息的物理文件包括:数据文件、日志文件、控制文件三类。 外模式 又称子模式或用户模式,对应于用户级。它是某个或某几个用户所看到的数据库的数据视图,是与某一应用有关的数据的逻辑表示。外模式是从模式导出的一个子集,包含模式中允许特定用户使用的那部分数据。用户可以通过外模式描述语言来描述、定义对应于用户的数据记录(外模式),也可以利用数据操纵语言(Data Manipulation Language,DML)对这些数据记录进行。外模式反映了数据库的用户观。 3. E-R图的设计方法 1、E-R图的基本要素   (1)实体集 正方形 (2)联系集 菱形 (3) 属性集 椭圆形 4. E-R图向关系模型的转换方法 1、主要任务 就是按照一定的规则,将概念结构设计阶段设计好的,独立于任何DBMS数据模型的信息结构,转换为一组关系模式;并利用关系数据库的规范化理论对这组关系模式进行规范化设计和优化处理,从而得出满足所有数据要求的关系数据库模型,也即数据库的逻辑结构。 2、步骤 (1)将设计好的概念结构转换成关系模型; (2)利用规范化理论对转换好的关系模型进行规范化设计和处理; (3)对关系模型进行优化处理。 5. 索引的概念及作用 索引是一种表形式的数据结构,由给定的一个或一组数据项(主键或非主键)组成。 对于主键值 Ki(i=1,2,…,n)和对应记录的地址A(Rki),{Ki,A(Rki)}称为索引项 6. 稠密索引、稀疏索引及聚簇索引 1稠密索引(dense index)及其特征 1)按主键值的排序建立索引项,每个索引项包含一个主键值和由该主键值标识的记录的地址指针。 2)每个索引项对应一个记录,记录的存放顺序是任意的 。 3)索引项的个数与记录的个数 相等(也就是说索引项较多,所以称为稠密索引)。 2稀疏索引(sparse index) 及其特征 1)所有数据记录按主键值顺序存放在若干个块中 。 2)每个块的最大主键值(即该块最后一个数据记录的主键值)和该块的起始地址组成一个索引项 。 3)每个块中的索引项按主键值顺序排列组成索引表(由于是每个块只有一个索引项,索引项较少,所以称为稀疏索引)。 3、 数据聚簇 是数据库物理结构设计中提高查询性能的另一种有效方法。 使那些经常在一起进行联接查询的表的数据在物理介质上尽量临近存放,也即把它们聚集地存放在一起。 进行联接查询的几个表必定存在公共字段,这些公共字段或者是某个表的主键,或者是某个表的外键,所以就可利用这些公共字段,把相关表中主键与外键相同的记录临近存放,把多个表的数据存储到同一物理块上。这样在进行联接查询操作时,进行联接运算的几个表的数据就可在同一个物理块中同时调到内存中,从而可以减少存储管理中的页面调进调出次数和搜索时间。 第5章 关系数据库语言SQL 1. SQL的功能及特点 SQL语言有三大功能: 1、数据定义功能 用于定义基本表、定义视图、定义索引等。 2、数据操纵功能 用于实施对数据库的数据查询和数据更新。 3、数据控制功能 用于实现对数据库对象的控制。 SQL具有两个特点: 1、SQL具有2种工作方式: 交互式命令 用户可以联机在系统提供的查询编辑器窗口上,通过直接键入SQL命令(语句)对数据库进行操作,系统然后会把处理结果显示给用户。 嵌入式 SQL语句可以被嵌入到某种高级语言(比如,C语言)程序中实现对数据库的操作,并利用主语言的强大计算功能、逻辑判断功能、屏幕控制及输出功能等,实现对数据的处理和输入输出控制等。 2、 SQL支持数据库的三级模式结构 外模式 模式 内模式 2. 常用的SQL语句 (1) create table CREATE TABLE <表名> (<列名1> <数据类型> [<列1的完整性约束>][, <列名2> <数据类型> [<列2的完整性约束>], … … , <列名n> <数据类型> [<列n的完整性约束>], [<表的完整性约束>]]); <>的必须要填 []的可选 表的主键约束子句,格式为 PRIMARY KEY(<主键列名1> [,<主键列名2>, …,<主键列名r>]) 表的外键约束 格式为: foreign KEY (<列名1>) reference <表名> (<列名2>) (2) Alter table 增加列 在表的最后一列后面增加新的一列。 语句格式: ALTER TABLE <表名> ADD <增加的列名> <数据类型>; (3) 、drop table 删除列 ALTER TABLE <表名> DROP <删除的列名> [CASCADE | RESTRICT]; 当选择CASCADE时,表示在删除名为“<表名>”的表中的列“<删除的列名>”时,所有引用到该列的视图或有关约束也一起被删除。 当选择RESTRICT时,表示当没有视图或有关约束引用列“<删除的列名>”时,该列才能被删除,否则拒绝该删除操作。 (3) create view、drop view CREATE VIEW <视图名> [(<列名表>)] AS <SELECT 语句> [WITH READ ONLY | WITH CHECK OPTION]; drop view (view name) (4) insert INSERT INTO <表名> [(<列名表>)]) <子查询>; 用于把从某个或某些表中查询出的数据插入到另 一个表中去——数据的导入。 例 INSERT INTO S_C(S#,SNAME,SSNAME,CLASS) SELECT S .S#,SNAME,SSNAME,CLASS FROM S,SS WHERE S.SCODE# = SS.SCODE AND S# IN (SELECT S# {↑学习了信息安全技术课程的学生的学号} FROM SC WHERE C# IN (SELECT C# {↑信息安全技术课程的课程号} FROM C WHERE CNAME ='信息安全技术')); (5) 、update、delete UPDATE <表名> SET <列名1>=<表达式1>[,<列名2>=<表达式2>,…, <列名n>=<表达式n>] WHERE <条件(含有SELECT查询子句)> ; (6) Select 1. COUNT distinct(列名) 计算列名所在列中不同值的个数 COUNT(*) 计算元组的个数 COUNT(列名) 计算列名所在列的值的个数 2. 给列名起别名的语句格式为: <函数名> AS <该函数的别名> <原列名> AS <该列的别名> 例如 查询所有学生所学课程的最高分数、最低分 数和平均分数。 SELECT MAX(GRADE) AS 最高分数, MIN(GRADE) AS 最低分数, AVG(GRADE) AS 平均分数 FROM SC; 3. 把某数值型列的值限定在某个数值区间的比较查询条件(<、<=、>、>=),均可以用比较运算符“BETWEEN … AND”来表示。 格式为: <数值型列名> BETWEEN <数值区间下限值> AND <数值区间上限值> 4. 分组查询 在SQL语言中,把元组按某个或某些列上相同的值分组,然后再对各组进行相应操作的查询方式称为分组查询。 语句格式: SELECT <列名表> FROM <表名表> [WHERE <条件>] [GROUP BY <列名表> [HAVING <分组条件>]]; GROUP BY子句用来将列的值分成若干组,从而控制查询的结果排序。 5. 按学号递增的顺序(查询)显示学生的基本信 息。 SELECT * FROM S ORDER BY S# ASC; 6. 按学号递增、课程成绩递减的顺序(查询)显 示学生的课程成绩。 SELECT S#,C#,GRADE FROM SC ORDER BY S# ASC,GRADE DESC; 字符串的匹配 <列名> LIKE ‘[字符串1] % [字符串2]' % 什么都行多少个都行 <列名> LIKE ‘[字符串1] __[字符串2]'(那个下划线要两条才能代表一个汉字) __中间那个字可以是什么都行 3. 视图与基本表的区别、视图的作用 视图是由数据库中满足一定条件约束的数据组成的“虚表” 作用 可起到了对数据库中数据进行安全保护的作用 用户视图给数据库应用系统的设计提供了极大的优越性 实现了数据库的逻辑数据独立性 第6章 关系数据模式设计 1. 函数依赖的基本概念及表示 一个关系模式是一个五元组{R,U,D,DOM,F}:  R ---------关系名  U ---------关系R的属性全集  D ---------属性的值域的集合  DOM -----属性集U到值域集合D的映射  F ---------关系R中的属性集U上的一组约束,即函数依赖集合 简化:R(U,F) 函数依赖不是指关系模式R的某个或某些关系实例满足的约束条件, 而是指关系模式R的所有实例均要满足的约束条件。 一个教员对应一个教研室,课程号与课程名相互联系等。   这类依赖是最基本、最重要的一种数据依赖,人们称之为函数依赖。 Functional Dependency 简称 FD 函数依赖与属性之间的联系类型有关。 属性X与Y有1:1的联系,X→Y,Y→X。 公司名®总裁,总裁®公司名,即:公司名«总裁 属性X与Y有m:1的联系,则只存在X→Y。 学号与专业之间是m:1,则:学号→专业 属性X与Y有m:n的联系,则X与Y之间不存在函数依赖关系。 a) 平凡函数依赖、非平凡函数依赖、 b) 部分函数依赖、完全函数依赖、传递函数依赖 c) 决定属性集(决定因素) 2. 逻辑蕴含及F的闭包 3. X的候选键R的函数依赖定义 4. Armstrong公理系统及推论 5. X关于F的闭包及计算方法 所有被F逻辑蕴涵的函数依赖组成的依赖集称为F的闭包,记为F+。 ① F+中的元素是函数依赖; ② 一般地有FÍF+; ③ 一个FD能够成为F+中的元素的条件是:能够从F中推导出该FD。 1 那里 Z=EG 是因为 X0=BD 的子集的函数依赖只有D->EG,该依赖的呗决定因素组成的集合记为Z=EG 6. 最小函数依赖集 满足下列条件的函数依赖集F称为最小函数依赖集。 ① F中每一个FD的右端都是单个属性; ② 对F中任何FD:X®A,F-{X®A}不等价于F;(F没有多余的FD) ③ 对F中的任何FD:X®A和X的任何真子集Z, (F-{X®A})∪{Z®A}不等价于F。(每个FD左端无多余的属性) 求解方法 (1) 用分解规则将F中的所有函数依赖分解成右端为单个属性的函数依赖; (2)去掉F中冗余的函数依赖 (3)去掉左端多余的属性 例子: 7. 模式分解的概念及等价标准(无损连接、保持函数依赖) 关系模式分解是解决数据冗余和操作异常问题的基本途径或者说是常用方法。 无损连接判断定理 设有关系模式R(U,F),ρ=(R1,R2)是R的一个分解,当且仅当 (R1∩R2)→(R1-R2)∈F+ 或(R1∩R2)→(R2-R1)∈F+ 时,ρ具有无损连接性。 保持函数依赖判断定理 πR1(F) U πR2(F) ∈F+时 ρ具有保持函数依赖性 8. 范式(1NF、2NF、3NF、BCNF)的定义及应用 (1)给定一个关系模式R,能判定最高符合第几范式 1、候选键的形式化定义 设有关系模式R(U,F)和属性集U={A1,A2,…,An}的子集X。如果: ①X→A1A2…An∈F+; ②不存在X的真子集X’,使X’→A1A2…An∈F+。 则称X是R的一个候选键。 2、候选键的求解方法 l 若X是L类属性,则X必为R的某一候选键的成员。 l 若X是L类属性,且X+包含了R的全部属性,则X为R的唯一候选键。 l 若X是R类属性,则X不是任一候选键的成员。 l 若X是N类属性,则X必包含在R的任一候选键中。 l 若X是N类和L类属性组成的属性集,且X+包含了R的全部属性,则X是R的唯一候选键。 一、 在一个关系模式R中,如果R的每一个属性的值域中的值都是不可再分的最小数据单位,则称R是第一范式(1NF)的关系模式 1NF是最基本的范式,满足1NF的关系称为规范化的关系,否则,称为非规范化的关系。 二、 如果一个关系模式R是1NF,且它的每一个非主属性都完全函数依赖于候选键,那么称R是第二范式(2NF)。 (完全依赖意思是所有候选键都依赖 不单单依赖一个) 保证数据库中各关系模式属于2NF是数据库逻辑设计中的最低要求。 三、 如果一个关系模式R属于1NF,且R的任何一个非主属性都不传递依赖于R的候选键,那么称R为满足第三范式(3NF)的关系模式。 是3NF的关系模式,一定就是2NF模式 第7章 Transact SQL与存储过程 1. 掌握存储过程的定义及使用 第10章 数据库保护技术 1. 事务的概念、定义语句及ACID特性 2. 数据库的存取控制方法及SQL Server的具体实现 3. 为什么视图机制提供了一定的安全性防护 4. 实体完整性、参照完整性的定义及违约处理 5. 其他常用约束的含义及定义(非空、唯一、check、default) 6. 数据库故障的分类 7. 数据库实现数据冗余的方法 8. 常见故障的恢复策略 9. 数据不一致性的表现 10. 基本的封锁类型及含义 11. 活锁与死锁的概念及产生原因、解决办法 12. 调度的可串行性 13. 两段锁协议的含义及判定
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服