1、语法树学习笔记——数据库实现原理
5.2写sql语句-画语法树-逻辑查询计划-简单优化(选择、投影)
5.2.1 写sql语句
这部分不是在这儿学的,简单说说吧,高手略过,挑毛病也可:
举例:查询生于1960 年的影星的名字:
SELECT name FROM MovieStar WHERE birthdate LIKE ’%1960’;
Select 是查询语句开头的关键字,永远不变,记住即可(别写错单词就行)
后面跟着的是一个或多个属性名(在数据库中叫字段名),此处是影星数据库表的一个字段“name”,存储的是影星的名字。注意:如果这里有多个属性名,请用逗号“,”分隔开
F
2、rom 也是关键字,后面跟着的是数据库表名,就是关系名(R),也可以有多个,用逗号分隔
Where 查询是条件部分,后面跟着的是查询条件表达式,由属性名、值、运算或比较符号等组成。
这个例子的查询条件是:生日(birthdate)属性值为以1960结尾的那些记录,“%”是通配符(通配所有长度的字符串,“_”只通配长度为1的字符串),注意:用通配符时一定要用Like关键字哦。如果字段是日期类型的,快看SQL的书吧,要对准格式的!
5.2.2画语法树
先看语法树中要用到的语法:
语法类,和(或Pattern)比较特殊, 因为它们不是通过语法规则定
3、
义的,而是通过它们所代表的原子的规则来定义的。
– Attr的子女必须是符合数据库模式中属性名的字符串
– Rel的子女必须是符合数据库模式中关系名的字符串
– Value(或Pattern)必须是符合SQL语法的字符串或数值
看个例子吧:
假设一个数据库中存储着学生和系院两个表如下:
我们想要查询到所有具有四年级学生的系院的名称:
Select DeptName from Department,Student
where Student.Major= Department.Code And Student.Year=4
就是让Student和Department两个
4、表通过“专业”Major进行等值连接(join),并限定只返回Student中有四年级的那些记录
语法树如下:
这里只要注意语法名称和画法即可。
注意:1、在FromList中的属性名用Rel表示,不要用Attr,2、如果FromList中有两个以上的关系(表)名,则请在第二个以后的的上层加入一个!
3、条件中如果有多个条件,请将每个条件用多级分层,直到最后细化到,对应的具体属性名称或值为止。
5.2.3 逻辑查询计划树
从语法分析树到逻辑查询计划树,看一个简单的情况的图例:
5、
转换成关系代数的方法:
– 直接将所有“简单的”select-from-where结构转换成关系代数,具体地:
• 如果有一个属于“SFW”成份的<query>,并且该成份中的没有子查询,则我们可以用一个关系代数表达式来替换整个成份—select列表、from列表以及条件,其中代数表达式自底向上由以下内容组成:
– 中提及的全部关系的积是以下操作符的参数:
– 选择σC,其中C就是要被替换成份中的“condition”表达式的参数,同时选择又是下面操作符的参数
– 投影πL,其中L是”SelList”中的属性列表。看下面的图例琢磨琢磨
6、
如果涉及到嵌套查询,那么有关如何从条件中去除子查询的部分大家就到网上查找吧,如果知道了原理也不难,这里就不研究了,汗……
5.2.4 启发式优化
启发式优化的原则:
– 尽可能地将选择条件下推,尽早执行选择,使得过滤后的中间结果尽可能地小;
– 用连接(join)替换笛卡尔积
– 尽可能下推投影,在适当的位置增加投影操作
– 利用pipeline,减少查询计划的执行时间
看图例吧:
呵呵,上图不需要优化,按照启发式优化的原则,已经是最优了。
这个需要优化:
1、用join替换了笛卡尔积和选择的组合,注意替换的细节,选择的条件成为了join的条件,
2、
7、下推了投影,因为下面from列表中的Department是可以提前进行投影的(可以减少结果集),不过注意要将code一起投影下来,因为在上层进行join时是需要code这个属性的,否则将join不出任何结果,这个很重要,一定要记住!
再看一个例子:
注意:这个例子比上图多了一个下推了选择,下推选择时要注意,因为只有Student有Year(学年)的属性,所以,只能下推到Student那里,而且因为Department中没有Year属性,所以Join时不需要这个条件!
也就是因为以上两个原因才可以进行优化,最后显示了优化前和优化后的结果,虽然优化后表达式复杂了,但是效率肯定是大大提高了!
嵌套查询比较麻烦,但是如果弄懂了上面的原理,也是可以迎刃而解滴!
By lzq2000 2011-11-3