1、摘要摘要近几年来,电子政务建设取得长足的进步,作为其中之一的网上 行政审批系统也快速发展起来。网上行政审批系统的业务数据涉及民 生、地方经济发展状况等信息,若能有效利用其海量的数据,使之为 政府领导的决策提供支持,将对建设服务型政府有重要的意义。本文以行政审批方面的数据为背景,深入了解行政审批方面的业 务特点,充分分析行政审批方面的实际需求,确定了多个面向行政审 批方面的主题,通过利用Oracle Database 11g、OWB等工具及其数据 仓库技术,构建了面向行政审批的数据仓库。该数据仓库把现有的网 上行政审批数据、电子监察数据、企业投资状况数据等信息充分集成,通过统一、标准的数据源接口
2、,将分散的政务信息有效的整合到面向 行政审批数据仓库下,并在此数据仓库上,使用AWM、OBIEE等工 具并结合联机分析处理技术设计和实现面向行政审批的多维数据集 可视化,将多维数据通过多种方式进行个性化展现。用户能够通过简 单界面操作就可以进行较为复杂的多维查询,并可从不同的角度对数 据进行分析。1.介绍了数据仓库与联机分析处理的相关理论与技术,重点介绍 了快速响应用户要求的方法,即数据仓库中的分区、物化视图以及位 图索引等技术,举例说明了 OLAP相关操作。2.构建并实现了面向行政审批的数据仓库。主要方法是:通过对 行政审批方面的异构数据源进行深入分析与研究,结合数据仓库技术 以及实际的需求
3、,确定了相关主题,如业务事项主题等,并围绕着这 II摘要些主题设计数据仓库的结构模型即星型模型。然后通过使用Oracle Warehouse Build er(OWB)对数据仓库进行建模,根据反馈不断进行调 整,并结合使用分区、位图索引、外部表等技术。在ETL阶段,通 过工具以及人工编码相结合的方式对数据进行抽取、清洗、转换。最 后为了提高数据的处理速度,通过使用位图索引、分区表、自动内存 管理、物化视图以及其他相关的存储策略对数据仓库的性能进行调 整,并通过工作流技术实现对数据进行定期装载与更新。3.构建了面向行政审批的多维数据集。多维数据集能够从多方 位、多角度对数据进行展现,因此能够实现
4、对数据进行多方位的、快 速的、一致的分析目的。首先方法是:首先通过AWM基于已实现的 数据仓库上设计了多维数据模型,包括维表、立方的设计与实现,并 创建一些不同的度量以达到不同的聚集目的。然后将多维数据集与数 据仓库中的事实表进行映射,结合使用了查询重写机制、物化视图、聚集等技术,并研究了通过SQL语句对多维数据集进行不同层次的 查询。最后根据不同的分析主题,对结果从不同的角度以不同的方式 进行展示,提供各种不同层次不同级别的查询,并通过设计个性化的 页面进行展现。同时,从趋势分析、统计分析以及预测分析等方面对 数据进行快速的、一致的分析。通过对行政审批历史数据的整合再利用,并将结果以易理解、
5、一 致的方式进行展示,提高了政府部门领导所需数据的质量,大大减少 对收集资料、统计数据所花费的人力和物力,帮助政府决策者做出正 确、明智和科学的决策。本文研究的结果,在泉州市行政审批系统上III摘要运用的效果颇佳,证明本方法对政务智能(Government Intelligence,GI)具有一定的理论和实用价值。关键词:行政审批,数据仓库,OLAP,多维数据IVAbstractAbstractIn recent years,E-Government construction has mad e great progress,as one of the E-Government,Online
6、Ad ministrative Examination and Approval System(OAEAS)are also quickly d eveloped.The d ata of OAEAS contains large information related to peoples livelihood,local economic d evelopment and so on,if those massive d ata can be exploited efficiently,and makes it assist the government lead er5s d ecisi
7、on,which will have great significance for build ing service-oriented government.This paper take the d ata of OAEAS as background,d eeply und erstand the business character of OAES,sufficiently analyze its practical requirements,confirm some subjects about OAEAS,through utilizing the Oracle Database
8、11g,OWB tools and combining with d ata warehouse technology,build the d ata warehouse for the Ad ministrative Examination and Approval.The d ata warehouse sufficiently integrates the d ata of OAEAS,electronic supervision d ata and the d ata about enterprise investment,through uniform,normal source i
9、nterfaces,collect the d ispersed government information to the d ata warehouse,then d esign and implement the multid imensional mod el based on the d ata warehouse through using AWM,OBIEE tools and combining with OLAP technology,d isplay the ind ivid ual multid imensional d ata in various ways.Uers
10、can vAbstractmake complex and multid imensional query through simple operations and analyze the d ata in d ifferent aspects.1.Introd uce the relevant theory and technology about d ata warehouse and OLAP,put emphasis on partition materialized view and bitmap ind ex technology,then take the examples a
11、bout OLAP operations.2.Build and implement the d ata warehouse for the Ad ministrative Examination and Approval.Through d eeply analyzing and researching on the d ata of Ad ministrative Examination and Approval,combined with the d ata warehouse technology and realistic d emand,d etermines the releva
12、nt subjects,and d esign the star schema for d ata warehouse around the subjects.Then utilize the Oracle Warehouse Build er(OWB)to build the d ata warehouse mod el combined with the partition,bitmap ind ex and external table technology,and ad just the mod el accord ing to feed back.In the ETL stage,e
13、xtract,cleanse and transform the d ata through tool and manual cod ing.F inally,to improve the rate of d ata processing,use bitmap ind ex,partition table,automatic memory management,materialized views and other storage strategies to tune the performance for d ata warehouse,then load and upd ate the
14、d ata through workflow technology regularly.3.Build the cubes for the Ad ministrative Examination and Approval.Cubes show the d ata from d ifferent orientations and various angles,so they implement that analyze the d ata fast and consistently from various VIAbstractaspects.F irst d esign the multid
15、imensional mod el based on the d ata warehouse,includ ing table and cube,and creates some d ifferent measures to implement some complex aggregations.Then map the cube and fact table in d ata warehouse,combined with the query rewrite,materialized view,aggregations technology,and research on how to qu
16、ery the cubes from d ifferent hierarchies through SQL.F inally,d isplay the result from d ifferent aspects in various ways,and also support search on d ifferent levels from d ifferent hierarchies,and d esign the characteristic page layout to show them,then analyze the d ata fast and consistently fro
17、m trend analysis,statistic analysis and forecast analysis.Through integrating and reusing the historical d ata of OAEAS,and d isplay the results und erstand ably and consistently,which improves the quality of d ata the government lead ers need,greatly d ecreases the cost of manpower and material res
18、ources on collecting d ata,assists the lead ers make correct,ad visable and scientific d ecisions.The result of this research is applied in OAEAS of Quanzhou and has quite good results,which proves that the method has some theoretical and practical value for Government Intelligence.Keywords:Administ
19、rative Examination and Approval,data warehouse,OLAP,multidimensional dataVII第一章绪论第一章绪论1.1 论文研究背景与意义1.1.1 研究背景泉州市行政服务中心于2006年7月31日起正式运行,这是泉州市为深化行 政审批制度改革、推进网上审批而创立的,集信息与咨询、审批与收费、管理与 协调、投诉与监督为一体,服务大厅与计算机网络相结合的综合性审批服务窗口 o 网上行政审批系统逐步理顺审批流程和各个部门的协同合作审批方式,整合了政 府各部门大量的政务信息,建成共建公享的信息资源库,并对原有的系统进行了 修改和更新,服务内
20、容更加丰富,功能逐渐完善,互动性得到很大提高。在管理 模式上逐渐出现了开放式、交互式、一网式、一表式的管理特征。结合相关的法 律法规,系统的网络安全方面也有较大的提高,将CA认证引人到网上行政审批 系统中来。另外,网上行政审批系统还逐渐和网上监察系统结合起来,加强了在 审批工作中监控管理,规范政府行政行为,完善政府管理,杜绝暗箱操作,提高 了政府办公的透明度。目前,通过几年的实践探索和业务积累,网上行政审批系 统逐渐成熟起来。泉州市行政审批已经做到了多部门联合审批以及市县联动等功能,几年来积 累的数据已经达到千万条记录,本课题正是基于网上行政审批系统的普遍应用背 景下,将软件技术作为辅助工具,
21、有效利用积累下来的业务系统数据,对行政审 批活动进行多维分析,来帮助政府提高决策能力、决策效率、决策准确性。1.1.2 研究意义(1)本课题针对泉州市网上行政审批系统的应用现状,在现有IT基础设施上,整合其数据资源,通过利用商业智能技术及其相关工具,构建了面向行政审批系 统的多维数据模型,实现了对电子政务历史数据的充分利用,提高了政府部门领 导所需数据的质量,大大减少对收集资料、统计数据所花费的人力和物力,帮助 政府决策者做出正确、明智和科学的决策。(2)电子政务建设长期生存下去的根本就在于如何解决好稀缺资源使用效 1第一章绪论率。社会的组织越完善,越有效,处于组织顶端的决策人物的时间与精力的
22、机会 成本越是高,领导者的时间与精力是更为宝贵的稀缺资源。作为政府的管理者,组织顶端的决策人物,他们对国家数据、信息、知识的快速而准确的获取以及具 备的分析、预测能力决定着是否能很好地服务于政府职能转变、政府机构改革,是否能充分发挥财政资金等各种政府资源的优势,为公民及相关组织提供优异的 管理和服务。通过对行政审批历史数据的整合利用,能够逐步消除信息孤岛现象,达到信息交换共享与决策分析,使政府与公众的互动开始变得有有章可循,为未 来政府智能市场的发展进行了有益的探索。1.2 国内外的研究现状随着电子政务系统的发展以及中国信息化程度的不断提高,在政府决策支持 方面需要不断吸纳新的信息处理技术,提
23、高决策的科学性和规范性,以达到提高 政府办公效率、促进经济发展的目的。1.2.1 国外理论研究与应用概况目前,在世界很多国家和地区,基于电子政务的数据分析已经广泛应用在包 括军队管理、环保监测和预测、税务征收、公共卫生及人口普查等领域。在这些 应用当中智能工具以新的方式将数据展现出来,不仅极大地提升了监管质量,而 且将数据转化成更有意义的报告为高级管理人员决策提供了充分的科学依据。例 如,在美国的财政应用领域,美国国防部负责采购的官员可以通过查询和分析工 具,了解同一州内陆海空部队从不同经销商处采购汽车轮胎的情况。国防部标准 采购系统(位于弗吉尼亚州F airfax市)项目副经理Gino Ma
24、gnifico称,通过对采 购工作的整合,他们可以调整采购能力来实现更划算的交易。他们的下一项挑战 是应用智能工具将数据转化成更有意义的报告呈交给高级管理人员。文献1探 索使用聚类算法来帮组检测犯罪模式和加快案件的侦破过程。期望在确认犯罪模 式的过程中使用一些增强的K-means聚类方法进行协助。还对犯罪记录使用了半 监督学习技术(semi-supervised learning)进行知识发现,以提高预测的准确度。2第一章绪论1.2.2 国内研究概况在国内,对该领域的研究只是刚刚起步,主要研究成果有:苏莉文等(2006)在电子政务与电子商务的同构与协同中分析了电子政务与电子商务在支撑体 系(信
25、用管理体系、法律环境、标准体系、基础管理体系等)方面的同构性以及在 对外服务方面的交叉和关联,他们认为,电子政务与电子商务二者相互影响、协 同发展。沈丽宁、赵雪芹等(2007)分析了当前我国电子政务网站服务提供现状,设计出一个由web用户聚类层、web信息利用分析层和个性化Web服务层三个 层面构成的智能信息服务模型。樊博、孟庆国等(2006)提出,商务智能系统中 使用的技术并不完全适合政务智能系统:他们认为,具有空间分析能力的政务智 能系统,将大量的政府管理服务对象以空间数据的形式存储并管理于地理信息系 统(Geographic Information System)中,并实现地理信息系统与
26、政务数据仓库的集 成。政府部门将通过系列空间分析技术主动地分析海量的空间对象,为社会提供 更具个性化、更高效的服务。文献给出了一种基于OLAP的OLAP-eGDSS电 子政务决策支持系统方案,改方案利用数据仓库与模型库一起支持OLAP分析,并对传统星型模型进行了扩展。但是,目前对行政审批方面进行的数据分析研究少之乂少,而行政审批系统 的业务数据又是涉及民生、地方经济信息最集中最全面的地方,有效利用其海量 的业务系统数据,使之为政府领导的决策提供支持将对我国建设服务型政府有重 要的意义。1.3 论文主要研究内容本课题采用理论研究与软件应用相结合的方式。通过利用数据仓库、OLAP 等重要技术,以泉
27、州市网上行政审批系统和电子监察系统等数据为数据源,利用 相关系列工具,构建并实现了面向行政审批的数据仓库,并在数据仓库基础上创 建多维数据集,以便对行政审批的数据进行多角度、多层次分析。主要研究内容 为:1)相关软件产品的技术研究在注重对相关理论的学习同时,研究了:Oracle Database 11g的相关 原理与应用;Oracle Warehouse Build er(OWB)对数据的 ETL(Extract Transform 3第一章绪论Load ing)和数据仓库建模;Analytic Workspace Manager(AWM)对多维数据的建 模;Oracle Business I
28、ntelligence Enterprise(OBIEE)的相关商、也智能功能的应用与 实践。2)面向行政审批的数据仓库建模研究基于对行政审批源数据的充分理解上,结合数据仓库技术,研究了构建面向 行政审批数据仓库的各个过程,包括需求分析与主题的确定、数据仓库体系结构 的设计、数据仓库模型的设计与实现、ETL过程的实现,并在此过程中使用了位 图索引、分区技术、外部表、模式匹配等技术。3)研究多维数据建模与多维数据展现研究了基于行政审批数据仓库上的多维数据的建模,包括多维数据的创建、数据的映射、多维数据的计算(聚集操作等)等,并在多维数据上结合使用了物化 视图、查询重写等技术。同时研究了根据主题将
29、多维数据用图表、图形等方式进 行清晰的、直观的、多角度的描述,并通过设计个性化的页面进行展现。L4研究的创新点(1)第一次将数据仓库、OLAP等技术应用到行政审批上。本课题针对泉州市 网上行政审批系统的应用现状,利用Oracle Database 11g、OWB、AWM等工具及 其相关技术,构建了面向行政审批的数据仓库。该数据仓库把现有的网上行政审 批数据、电子监察数据、企业投资状况数据等信息充分集成,通过统一、标准的 数据源接口,将分散的政务信息有效的整合到面向行政审批数据仓库下,并在此 数据仓库上构建了具有行政审批业务特点的多维数据集。(2)设计和实现面向行政审批的多维数据集可视化。使用O
30、BIEE工具将多 维数据进行通过多种方式进行个性化展现,使用户通过简单界面操作就可以进行 较为复杂的多维查询,可从不同的角度对数据进行分析。4第二章关键技术概述第二章关键技术概述2.1 数据仓库2.1.1 数据库与数据仓库概述数据库技术是在操作系统的文件系统基础上发展起来的,是研究数据的结 构、存储、设计、管理和应用的一门技术,与计算机硬件、系统软件、计算机应 用的范围有着密切的联系3。数据库技术中最要的部分是数据库管理系统(Database Management System,DBMS),数据库管理系统是位于用户与操作系统 之间的一层数据库管理软件,它为用户或应用程序提高访问数据库的方法,包
31、括 数据库的创建、查询、更新及各种数据控制,其目标是提供一个可以方便、高效 地存取数据库信息的环境。根据DBMS基于数据模型的不同,DBMS通常可以 分为如下三种:支持关系模型的关系数据库系统(Relation Database Systems,RDBS);支持以对象形式对数据建模的面向对象数据库系统(Object-Oriented Database System,OODBS);基于对象关系模型的对象关系数据库系统(Object-Oriented Relation Database System,ORDBS)。关系数据库采用关系模式 来组织数据。关系模型(Relation Mod el)是建立
32、在数学概念的基础上,是目前 最常用的主流数据模型,在关系模式中用表格结构表达实体以及实体集之间的联 系。在关系数据库中,数据被存放在二维表格结构的表中,每一个表又包含行(记 录)和列(字段)。一个关系数据库包含多个数据表,这些表之间通过主键和外 键所体现的参照关系实现相互关联。关系数据库除了包含表,还包含了如视图、索引和存储过程等其他数据库对象3。关系数据库的主要技术已经非常成熟,相关产品将会不断朝着更加自动化、更加全面的数据支持、更加优越性能等方面 发展。国际国内的主导关系型数据库管理系统有ORACLE、SQL Server.SYBASE、INF ORMIX 和 DB2 等。关系数据库是面向
33、业务处理的,需要经常进行各种不同类型的操作(如查询、修改、更新、删除等)与计算(如聚集、连接等)。比较常用的关系数据库的几 个概念与代数运算介绍如下:属性和域3。在现实世界中,要描述一个事物常常取若干特性来表示,5第二章关键技术概述这些特征称为属性(attribute)。每个属性的取值范围所对应一个值的集合,称为 该属性的域(d omain)。笛卡尔积与关系。兄.为任意集合,定义兄2%的笛 卡尔积为出 xDe x x D汽=(d/原=)1%u。”:=1.,:其中,每一个元素(匈.*/)叫做一个n元组(n-tuple属性的个数),元组 的每一个值房叫做元组一个分量,若B(f=L 2.3,一,R)
34、为有限集,其基数(Card inal number元组的个数)为叫=勤2.丸.肛 贝I臭X必X“,X的 基数乂为乂=口叫笛卡尔积可以用二维表来表示。/X。二X“.X以的子集叫做 在域先,上的关系,记为R(生以X,“X 4),称为关系R为兀关系。关系数据库模式。关系的描述称为关系模式(Relation Schema)。可以形 式化地表示为:R(U,D,dom,F)。其中R表示关系名;。是组成该关系的属性名集 合;。是属性的域;d。也是属性向域的映像集合;F为属性间数据的依赖关系集 合。通常将关系模式简记为:R(U)或R(工,也,广义笛卡尔积(Extend ed Cartesian Prod uc
35、t)o设关系R和S的元数分别为 r和s,定义R和S的笛卡尔积是一个(r+s)元的元组集合,每个元组的前r个 分量(属性值)来自R的一个元组,后s个分量来自S得一个元组,记为RxS。形式定义如下:fix5=t|t-=e Atr 5 SAt-sc 5)若H有机个元组,S有个元组,贝ijRxS有汽X几个元组。投影(Projection)o投影是对给定的关系从垂直方向进行运算,即对关 系中指定的属性(或列)进行保留,而将其余属性及其值舍弃,并重新安排列的 顺序。选择(Selection)o选择是根据某些条件对给定的关系从水平方向进行运 算,即在关系中选取符合某些条件的元组(或行)。连接(Join)4。
36、连接是从两个关系R与S的笛卡尔积中选取属性间6第二章关键技术概述满足某一。操作的元组。形式定义如下:/怖5=fl H/那叫收tsq呻其中,i和/为关系火与S中的第i个和第/个属性的序号,邛、号分别为元组之第,个分量、元组髀的第j个属性的序号,打也;为这两个分量值满足g操纵。目前,关系型数据库技术已相当成熟并在各个领域得到大量的应用。随着数 据库管理系统的广泛使用,数据量急剧增加,为了从海量的数据中得到获取有用 的信息以提供决策支持,数据仓库技术的诞生成为必然。数据仓库技术是在关系 数据库、并行处理技术等技术的基础上发展起来的,它能够有效地存储和管理各 类数据信息,以提供一个集成的、可靠的和一致
37、的统一视图。William H.Inmon 将其定义为:“数据仓库是一个面向主题的、集成的、时变的和非易失的数据集 合,以支持管部门的决策过程”5。与其他数据库主要任务是执行联机事务处 理(On-line Transaction Processing,OLTP)不同的是,数据仓库更像是对各种异 构的数据进行整合、加工、清洗以便为数据分析和决策支持提供服务的过程。数据仓库与传统的数据库比较如表26。当前,市场上数据仓库产品和解决方 案的提供商主要有Oracle公司、Sybase公司、IBM公司等。表2数据仓库与传统数据库比较对比内容数据库数据仓库数据内容当前数据历史的,存档的,归纳的,计算的数据
38、数据目标面向业务操作程序,重复处理面向主题域,分析应用数据特征动态变化,按字段更新静态,只能定时添加、刷新数据结构高度结构化,复杂,适合操作计算简单,适合分析使用频率高中到低数据访问量每个事务只访问少量记录有的事务可能需要访问大量记录响应时间以秒为单位时间长2.1.2 数据仓库的设计数据仓库的设计一般分为三个阶段:概念模型的设计、逻辑模型的设计、物 7第二章关键技术概述理模型的设计。概念模型设计是在较高的抽象层次上进行的,该阶段不考虑系统 的具体实现技术,而是根据用户的现实需要,对需求进行详细的分析,并按用户 的观点对数据和信息进行建模,然后将分析模型映射为主题,确定数据仓库所应 包含的主题,
39、最后对每个主题的内容进行更加清晰的描述。该阶段强调的是语义 表达功能。逻辑模型设计阶段是在概念模型的基础上,根据已经确定的主题设计 数据仓库的逻辑数据模型。为了便于进行数据分析,数据仓库的模式必须是简明 的、面向主题,因此数据仓库的模型通常使用星型模型或雪花型模型进行定义。该阶段工作主要有分析并确定主题、确定数据仓库的粒度层次等等。物理模型设 计阶段主要包括确定数据的存储结构、确定索引策略、确定数据存放位置和确定 存储分配。选择正确的数据仓库存储策略可以极大的提高数据仓库的访问查询效 率。对于较大的数据量,可以使用表分区技术(如范围分区、列表分区、散列分 区等)对数据进行分割存储,并可结合使用
40、合适的索引技术(如B树索引、位图索 引等)。2.1.3 数据仓库粒度粒度是数据仓库中数据单元的细节程度或综合程度的级别。粒度问题是设计 数据仓库的最重要的方面,对数据仓库环境所处的整个体系结构都有影响7。而基与数据仓库的多维分析一个显著优点是可以对维度进行细化(下钻)和汇总(上钻)等操作。因此,维度的粒度直接影响多维数据集的浏览层次。但是,实际 应用中粒度也不能无意识的细化,而要根据实际需要进行处理。如行政服务中心 中的数据仓库包括两种类型的数据:当前细节数据和轻度综合数据。当前细节数 据是来自操作系统的细节数据,行政服务中心的每一条审批记录、每一条满意度 信息都被放入数据仓库中,其数据量相对
41、轻度综合数据大的多C轻度综合数据是 经过一定程度综合的细节数据,比如对审批数据可以按周进行汇总审批量,对投 诉信息、企业注册信息按月进行汇总,而对企业财务信息的时间维粒度则只能确 定到“年”,因为企业的一些有关财务信息是表示一个会计年度的信息。根据主 题应用之分析目的,以上划分按概化到细化进行,可按需进行适当调整。因此对 数据仓库采用双重粒度级别进行设计。8第二章关键技术概述2.1.4 数据仓库相关技术(1)分区(Partition)分区是指将海量的数据按一定的规则分割成相对较小的、可独立管理的部 分,分区又可以根据具体需要进一步细分成子分区。如果分区表上对应的索引是 未分区的,可以使用与分区
42、表相同或不同的方式对它们进行分区。可以使用并行 操作来访问分区表的每个分区,可以在一个大表的分区上执行数据装载、索引创 建以及执行备份和恢复操作,而不是在整个表上执行8。因此,使用分区技术 能够增强数据库的可用性,减少维护工作量,均衡I/O,减少争用,提高查询速 度等。Oracle 11g提供的表分区包括:范围分区(Range)、散列分区(Hash)、列表 分区(List)、组合分区、Interval分区、外键分区、虚拟列分区等;索引分区分为 本地索引分区(Local Partitioned Ind exes)与全局索引分区(Global Partioned Ind exes)两种。如代码为对
43、某个包含大数据量的表(表中包含时间与地区名)组合使用范 围分区与列表分区技术来存储数据。范围分区是按照时间将数据分割存放到不同 的时间段中,列表分区是按照地区名将数据存放到不同的地区表中。CREATE TABLE workeventunid VARCHAR2(32)PRIMARY KEY,createtime DATE,cityname VARCHAR2(10),)PARTITION BY RANGE(createtime)-以时间列 createtime 做为范围分区的列SUBPARTITION BY LIST(cityname)一以地区列cityname做为子分区中列表分区的 列SUBPA
44、RTITION TEMPLATE(-不同的地区对应不同的子分区SUBPARTITION AREAONE VALUES(泉州市级丰泽区鲤城区市辖区),SUBPARTITION AREATWO VALUES(石狮市?晋江市?泉港区:南安市,SUBPARTITION AREATHREE VALUES C惠安县:,安溪县?洛江区;永春县:德化 县)(-不同的时间段对应不同的分区PARTITION Y2006 VALUES LESS THAN(TO_DATE(01-01-2007,DD-MM-YYYY)TABLESPACE year2006,PARTITION Y2007 VALUES LESS THA
45、N(TO_DATE(01-01-2008,DD-MM-YYYY)TABLESPACE year2007,9第二章关键技术概述PARTITION Y2008 VALUES LESS THAN(TO_DATE(01-01-2009,DD-MM-YYYY)TABLESPACE year2008,PARTITION Y2009 VALUES LESS THAN(TO_DATE(01-01-2010,DD-MM-YYYY)TABLESPACE year2009);(2)物化视图(Materialized View)物化视图可以看成是具有表和视图特性的一种特殊视图O物化视图也是从对 一个或多个表的查询中得
46、到结果(视图特性),并将视图的结果集存储在物理空 间中(表的特性)。传统上,数据仓库和其他类似的大型数据库需要用聚集表或 汇总表来执行其任务。定义这些汇总表并对它们进行持续维护是一项复杂的任 务。在任何时候向基表中添加数据时,都必须手动更新所有的汇总表以及索引。而实图化视图提供了简化大型数据库中汇总管理的方法8。物化视图预先计算 并保存耗时多的操作结果以避免联接和聚合的数据库对象,当定义该视图的基表 发生变化时由数据库自动更新。物化视图能够减少物理的读写次数,提高响应速 度,减少CPU的计算时间。在数据库环境中,对被频繁的操作数据可以使用物化视图。在数据仓库环境 中也可以使用物化视图来提高涉及
47、聚集(包括求和、计数、平均值、方差、标准 差、最小值和最大值等)或表连接的查询性能。可以在实体化视图上进行分区和 创建索引,也可以在分区表上创建实体化视图。在创建物化视图时,可以为该视 图指定存储参数、指定视图刷新方式,还可以强制一个物化视图使用物化视图的 日志来进行增量式更新,或者在进行刷新时可以强制执行物化水的完整重建。下 列为2007年与2008年各个部门每个月成功受理申请总数的物化视图创建代码。create materialized view sum_d ept_monthtablespace mytablespace-指定物化视图存放的表空间build d eferred-第一次使用
48、物化视图时才将其填充refresh on commit-当主表有提交事务处理时才执行更新enable query rewrite-启用查询重写机制 asselect d.d epartment_long_d escript d epartment,t.calend ar_month_long_d esc month,sum(successd ealnum)as d ealnumfrom region_olap_view r,d epartment_olap_view d,olap_time_view t,project_olap_view p,workevent_view wwhere(r.d
49、 im_key=w.region_olap10第二章关键技术概述and d.d im_key=w.d epartment_olapand t.d im_key=w.olap_timeand p.d im_key=w.project_olapand r.level_name=ALL_REGIONSand t.calend ar_year_long_d escr in(2007,2008)and p.level_name=ALL_PROJECTS)and d.d epartment_long_d escript is not nulland t.calend ar_month_long_d esc
50、 is not nullgroup by rollup(d.d epartment_long_d escript,t.calend ar_month_long_d esc);ord er by month asc;(3)位图索引(Bitmap ind ex)索引通过对特定列的排序数据进行存储来提供对表行的快速访问。位图索引 在基数较低的列(即被检索的列具有非常有限的可能取值)上频繁执行连接操作 的环境中能够提供优化的查询。位图索引用位图标识被索引的列值,即使用一个 二进制1或。组成的字符串来表示一个特定的列值存在与否。使用位图索引可以 在查询中非常有效地对表的几个列执行多个AND和OR操作。在