资源描述
吉林化工学院理学院
毕业论文外文翻译
阿德里恩.甘卡,伊莫.盖格尔
罗马尼亚布加勒斯特迪杜奥列斯库大学
德国派尔博登施泰特威廉学校
数据库优化服务
Database Optimizing Services
学生学号: ********
学生姓名: ***
专业班级: 信息与计算科学0801
指导教师: ***
职 称: 教授
起止日期:2012.2.27~2012.3.14
吉 林 化 工 学 院
Jilin Institute of Chemical Technology
吉林化工学院理学院毕业论文外文翻译
数据库优化服务
摘要
几乎每一个组织都存在它的中心数据库。数据库为不同的活动提供支持,无论是生产,销售和市场营销或内部运作。为了获得战略决策的帮助,一个数据库每天都在被访问。要满足这种需求,因此需要与高品质的安全性和可用性。
为实现一些需求所使用的DBMS(数据库管理系统),事实上,是一个数据库软件。从技术上讲,它是软件,它采用了标准的编目,恢复和运行不同的数据查询方法。 DBMS管理输入数据,组织安排这些数据,并提供它的用户或其他程序修改或提取数据的方法。数据库管理就是一种需要定期更新,优化和监测的操作。
关键词
数据库,数据库管理系统(DBMS),索引,优化,成本,优化数据库。
1 引言
该文件的目的是介绍有关数据库的基本优化代表的观念,在不同类型的查询中使用数学估计成本,可以达到性能水平的审查,以及分析在特定查询的例子中不同的物理访问结构的影响。目标群体应该熟悉SQL在关系数据库的基本概念。
通过这种方式,可以执行复杂的查询策略,允许以较低的成本获得信息的使用知识。一个数据库经过一系列转换,直到其最终用途,以数据建模,数据库设计和开发为开始,以维护和优化为结束。
2 数据库建模
2.1 数据建模
数据模型更侧重于数据是必要的,而做出数据的方式应该是一种有组织的和少操作的方式。数据建模阶段涉及结构的完整性,操作和查询。这有多个这方面的事项,如:
1。数据定义方式应该是有组织的(分层网络,关系和重点对象)。这需要提供一个规则,来约束实例的定义结构的允许/限制。
2。提供了数据更新协议。
3。提供了数据查询的方法。
一个结构简单的数据通信,能够使得最终用户很容易的理解,是数据建模想要的的实际结果。
2.2 自定义数据库/数据库发展
数据库的开发和自定义答复了顾客的需求。自定义数据库的重要性主要体现在通过它,使向目标客户直接提供服务的产品的商业化成为可能。一个数据库的质量通过定期更新来维护。
2.3 数据库设计
如果数据库有以下任何问题,如故障,不安全或不准确的数据或数据库退化,失去了其灵活性,那么是时候换新数据库了。因此,必须定义具体的数据类型和存储机制以便通过规则和正确地运用操作机制,确保数据的完整性。所有数据库应构建一个客户方面的规范,包括它的用户界面和功能。通过这些可以使运用数据进入一个网站成为可能。
2.4 数据挖掘
数据挖掘是科学从更大的数据集和数据库中提取有用信息。每个组织都希望其业务和进行流程可以进行优化实现最佳生产力。优化业务流程所需要的,包括客户关系管理(CRM),质量控制,价格和交货系统等。数据挖掘是指一个数据开发自我违规,即通过使用复杂的算法彰显在这些过程中的错误的过程。数据挖掘的进行主要是处理数据,包括失误分析和测试。
2.5 数据库迁移
数据库迁移,基本数据库的转让(或迁移)方案和数据进入数据库管理的过程,如甲骨文,IBM的DB2,MS-SQL的服务器,My-SQL等。一个数据库迁移系统,需保持数据可靠性和完整性。因为标准之间的差异,从一个数据库平台迁移应该是困难且费时的,然而,不同的数据库之间的数据,在确保数据的完整性的前提下,快速迁移是可能的,可以没有任何数据丢失。对数据访问的保障及其保护是必不可少的,尤其是当大量的数据或重要的应用在系统之间移动时。在投影和运用Oracle或Microsoft SQL Server数据库基础设施中提供的经验使数据的安全性、可用性和可靠性得到了保证。
2.6 数据库维护
对于每一个组织,数据库维护是非常重要的过程。在数据库安全开发后,具有重大意义的下一道工序是数据库维护,它提供了数据库的更新,备份和高安全性。我们可以问自己,为什么公司需要数据库维护?当数据库被改变,很容易发现被观察到的记录不再反映现实。这个问题通常在数据库恶化的情况下发生。建议,消除任何手动更新有关的疑虑,并定期进行完整备份。
由于该结构活性的增长,数据库的维度也随着增长。一个有用的做法是定期删除不可用数据,从而增加数据库的访问速度。数据库压缩可以使数据供应更加容易,以及使处理数据库中相关信息更加简单化。可以保持相同的数据库,在这种方式下,它可以针对不同的问题提供正确的结果。例如,可以利用相同的讨论列表提取通讯地址以及电子邮件地址。
3 数据库优化
数据库是在现代世界中无处不在。 “信息库”这个概念,代表持久、冗余和均匀分布,已成为IT领域中最重要的概念。事实上,许多人通常无需使用计算机,就可以在每一天的每一时刻,在一定的水平上与数据库管理系统进行交互。
由于每次访问需要接受以百万计的数据传输,数据库优化在大学以及企业团体的研究机构的研究领域中,是一个关键 。从一个软件开发公司的角度出发,关系数据库往往成为在该领域的应用软件,以及维持客户和公司所需的重大成本所缺乏的优化部分。 随着数百万每秒的数据传输,优化作为一个惊喜,在研究领域中由此迈出了关键性的一步。
优化数据库,可以更好的配置和更快的搜索到结果。偶尔的数据库可能会出现的问题,如未能提供所要求的结果,或缓慢的执行,这时很必要收购服务器。在该数据库不能优化的情况下,操作系统可能有类似的作用。
通过修改当前数据库的基础设施,从而确立最佳的优化方法和规划,可以更好的提高工作环境的效率。通过实施数据库质量监控,它可以不重复且保持高完整性的进行优化。如今,这种优化是一个真正的挑战,特别是当前软件在不断更新变化。但是,数据库管理员能够提供有关的解决方案以满足客户的要求。
图3-1:数据结构
3.1 数据库管理应用程序
数据库管理有不同的做法,也有不同的方式,优化数据库使性能得到提升,这也将提高服务器的使用。数据库优化依赖于数据库管理系统。每个系统都有自己进行优化的设施。优化过程中,有一些程序有对所需的数据进行收集和分析的作用。这些应用程序将以一种高敏锐的方式被用于数据库的优化,这样的使用也越来越显著。随着数据库系统变得越来越重要,一个数据库的持续更新是必很必要的,这样才能保持与IT领域的变化同步。
3.2 索引
一个数据库的各种优化途径之一是索引。它可以增加从一个数据库到另一个不同的数据库间的查询性能。但是,一般来说,用户更受益于高效的索引。高效的索引可以避免扫描整个结构表来进行查询来确定解决方案。这种索引可以通过Microsoft SQL服务器来实现,SQL服务器已经取得了相关的指标集。此外,为了让在查询处理中进行最有效的选择,它的保持永久性更新。在提高查询的性能这方面,专家提供的意见是,由于数据库的性能必须要更新,所以必须考虑在动力系统的变化。
数据库管理系统提供了其自己的更新方式,如Oracle,它包括一个SQL型“顾问”和另外一个访问“顾问”。这些都是用来改善在打包应用程序中被使用的SQL。它使用样本来收集必要的数据更新。
优化是保持系统最佳性能的最重要途径之一。他们可以有不同的名字,但本质上它们有助于提高系统的性能。数据库优化包含在该持有人可以使用的软件中。他们指的是只有IT专家可以使用的一种更复杂的方式。如今,这种应用程序提供提高优化效率的特性,为了能够保持数据库的生命周期,持有人需确保他们数据库的先进性。
3.3使用索引优化数据库
数据库索引是一个数据库表的物理访问结构,顾名思义,它是一个有序的文件,通报位于光盘上登记的数据库的去向。为了更好地理解索引做的是什么,请考虑阅读一本教科书。为了找到某个部分,读者可以读这本书,直到他所发现他寻找的,或者可以检查的“目录”,找到所需的部分。数据库索引可以比教科书索引长得多。在一个大表中添加足够的索引在优化数据库中是最重要的组成部分。为不包含任何索引的一个大表创造唯一索引,可以大大降低查询的执行时间。
举个例子,假设有下列情景:有一个数据库表名为“雇员” ,有100份登记数据,我们想在这个未索引的表上执行下面的一个简单查询:
从第一个名字到最后一个名字中查找ID为12345的人。
为找出上述ID与登记的雇员,数据库需扫描整个登记的100数据以返回正确的结果。这种扫描方式,通常被称为全表的扫描。幸运的是,数据库开发人员可以创建一列雇员ID的索引以防止这种扫描。此外,在该数据库的域名受到唯一性约束的情况下,可以编译表中的每个雇员的物理地址,且地址是实时登记的,因此,扫描变得毫无意义。增加了这个索引列的开发后,数据库可以找到雇员ID与12345相同的雇员登记,这潜在的减少了100份数据的查询操作。
3.4索引类型
索引包括两种类型:聚集和非聚集。两个类别之间的主要区别是,聚集不影响索引在硬盘上的排序,而非聚集索引不行,由于聚集索引不影响在光盘上的物理登记顺序,所以可以为每个表建索引群集。同样的限制不能适用于非聚集索引,从而在光盘上创造的空间是可能的(虽然它不代表最佳的解决方案)。
3.5 优化数据库的成本估算
成本估算是对某一查询费用采用一致的、重要的措施的执行过程。不同的度量,可实现这一目标,但最相关和最常见的度量是块访问查询车。由于磁盘上的输入/输出是很耗时的操作。因此,成本估算的目标是在不影响正常功能的前提下最大限度地减少块访问数量。
数据库有一系列的成本优化方法,查询操作的估计成本,注册操作估计成本,嵌套循环,单回路(使用索引)和排序合并注册等都可以考虑在内。每个方法的最终其结果都减少了算法的复杂性。这些所使用的技术之一,是GREEDY的技术。GREEDY算法在用于优化问题时大体上是很简单的。例如,找到一个最简单的路径图表,在大多数情况下,我们有如下方案元素:
l 大量元素(图形的顶点,工程进度等);
l 一个函数,用来检测候选人的规模是可能的,虽然不一定是最优的解决方案;
l 一个函数,用来检测候选人的竞争对手的规模是可能的,虽然不一定是最优的解决方案;
l 一个查询功能,查询在任何特定时间未使用的最佳元素;
l 一个函数,通知用户已达成的一个解决方案。
为了解决这个问题,GREEDY算法可以一步一步的建立解决方案。
GREEDY的技术状态即结构因素的数量(图中的节点和弧)指的是安排大量候选人的工作量的指数。在同一时间内,当有很大数量的候选人安排的情况下,靠主体算法来解决这个工作量不是可行。
减少GREEDY技术根系的结构因素数量就是GREEDY算法:
Ø 如果工作量是一个序列,那么该算法被命名为GREEDY-SQL;
Ø GREEDY-SQL的算法使用UnionPar功能。
UnionPar函数:
Ø 设,p1= [a1, S1,…,aN,SN, aN+1] si p2= [b1, S1,..., bN,SN, bN+1],序列:[S1,...,SN];
Ø 相同的序列将生成一个新的解决方案;
Ø 对于每一个K,都可以产生附加结构因素,在图中从AK和BK始添加结构;
Ø 出口是在生成的图的最短路径。
图3-2 由函数UnioPair生成图表
GREEDY-SEQ算法:
Step 1:对于S = {S1,S2,...,SM}中的每一个结构,通过使用的GREEDY-SEQ算法找到了最佳的解决方案,对于每一个结构有很多P解。
设P= {P1,..,PM}} pi= [ai1, S1,...,SN, aiN+1];
Step 1:设C是单个结构上的所有构造因素的数量;
Step 1:在数量P上运行GREEDY搜索;
Step 3a:设r = [c1, S1,...,cN,SN, cN+1] ,当COST(r)最小时,得到解P,P=P-{r}.
Step 3b:当对于P中所有的元素使得T = UnionPar(R,S)的执行成本最低时,且COST(t) < COST(r),我们从选择从P 中得到S。
如果s不存在继续执行Step 4。
P=P-{s}, P=PU{t}执行Step3a。
Step 4:从这一阶段,当最短路径算法运行后,所有的结构因素图将由P产生,并已给出了解决方案。
窗体顶端
4 结论
我们使用算法和技术降低中央数据库的复杂性。,本文件以更好地认识数据库优化的开发为目的,以及了解数据库(如数据库管理系统)在不同类型的查询策略中的执行方式。虽然本文所提出的例子中,数据库优化的范围有限,但还应当指出,创建良好的数据库应该包含具有选择指标和标准的索引列。
参考文献
[1] I. Lungu and A. Bara.执行信息系统.ASE印刷行,Bucharest,2007年.
[2] I. Lungu and I. Tanase.关系数据库中优化问题.Informatica公司的经济学刊杂志,nr.1(13)/ 2000查询.
[3] T. Marston.关系数据模型,归一和有效的数据库设计.2005年.
[4] J.Date.数据库系统的介绍.Addison Wesley,2004年.
附录:作者简介
阿德里恩.甘卡是罗马尼亚首都布加勒斯特迪杜马奥列斯库大学-经济学系讲师。他获得金融和银行-学士学位,ASE Bucharest - 国际会计硕士学位,布加勒斯特大学 - 开发和实施Web服务硕士。在ASE Bucharest中,他是目前计算机科学博士学位的候选人之一。他所教的课程,有经济信息,Visual B编程,数据库设计。他写了多篇科学论文,如:计算机系统的体系结构在经济主体的趋势水平,基于对象模块化应用的数学模型,计算机控制战和业务发展,Web 2.0和业务推广,以自学习系统为前提的自适应信息系统设计等。
伊莫.盖格尔是德国派尔博登施泰特威廉学校的教授,是该机构的教师和助理主任,他著称于学科和教育活动,所教范围是包括计算机科学在内的很广泛的学科。
- 10 -
展开阅读全文