1、摘 要基于数据仓库高职教务管理系统设计与实现随着数据库系统广泛应用,数据规模与日俱增,从大量复杂业务数据中更加有效分析提取可用信息就变得尤为重要。从当前发展趋势上看,数据解决侧重点己从老式业务过程实现逐渐扩展到对业务数据联机分析解决,并从中得到用于记录和决策信息,因而决策支持系统便应运而生。数据仓库技术通过近年发展,已变得比较成熟,近些年,浮现了基于数据仓库技术,并运用联机分析解决技术(OLAP)和数据挖掘工具决策支持系统(DSS)。数据仓库技术、联机分析解决技术和数据挖掘技术应用,对决策支持系统起到了有力支撑作用,她们结合成为了决策支持系统研究热点和重点。本文回顾了数据仓库构造、数据组织及有
2、关技术发展,对基于数据仓库决策支持系统体系构造理论与难点进行了分析,并对其中设计办法、实行方略等数据仓库建设方面核心问题进行研究。通过对系统分析和设计,提出了符合高职教务管理实际数据仓库设计和实行方案。成功解决了在数据分散、数据量大、基本环境复杂环境中数据抽取问题,并对得到数据进行转换和清洗,将数据加载到预先定义好数据仓库模型中。最后以决策需求为基本,从业务分析角度作为切入点,选用SQL Server 构建数据仓库,选用Analysis Services 对OLAP应用进行实现。通过本课题研究工作,建设了科学合理高职教务管理数据仓库,有效地增进了高职信息化发展和数据综合运用能力,使得高职管理和
3、决策合理性和科学性得到了增强,具备非常现实意义。核心词:数据仓库;决策支持系统;教务管理AbstractThe Design and Implementation of An Teaching Management System Based on Data WarehouseWith the widespread use of the database system,the scale of data is increasing rapidly,its very important that we can extract effective information from a large n
4、umber of complex business data. In the view of the current development trends,the focus of data processing has developed from the traditional business process to the progressive extension of the business data on-line analytical processing,and to obtain information for statistical decision-making sup
5、port system will therefore be shipped. Data warehouse technology has been developed for many years,it become more mature in recent years,there has been the system that based on data warehouse ,online analytical processing application (OLAP) and data mining tools,it short for decision support system
6、(DSS). Data warehouse,online analytical processing and data mining technology,decision-making support system has played a strong supporting role,and their combination into a decision support system becomes the focus and emphasis of the study. This paper reviews the structure of the data warehouse,da
7、ta organization and related technology development,Data warehouse-based decision support system architecture and the difficulties of the theory are analyzed,and one of the design method,implementation strategy the key to building the data warehouse issues. Through systematic analysis and design meet
8、 the Educational Administration proposed the actual data warehouse design and implementation. Successfully resolved in the data dispersion,data volume,complex environments based on environmental issues in the data extraction,conversion and data obtained and cleaning,to load data into predefined data
9、 warehouse model. Finally,decision-making needs,based on analysis from a business point of view as a starting point,the choice of SQL Server to build a data warehouse,use Analysis Services OLAP applications realized. We have built a scientific and rational educational administration data warehouse t
10、hrough this research work,and promoted the development of university information and data on the integrated use of capabilities effectively. The rationality and scientificalness of the University management and decision-making have been enhanced,The research is with very real sense. Key words: Data
11、warehouse,Decision Support System,Teaching Management目 录摘 要IABSTRACTII目 录I第1章绪 论11.1选题背景及意义11.2国内外发呈现状21.3论文研究内容及意义41.4论文安排5第2章教务决策支持系统需求分析62.1项目状况分析62.2项目难点分析8第3章教务决策支持系统设计103.1系统总体框架设计103.1.1多维数据集创立103.1.2数据采集模块103.1.3系统开发模块103.1.4数据仓库设计113.2数据仓库方案设计133.2.1自底向上法133.2.2自顶向下法133.2.3混合法133.3数据仓库架构构造1
12、4第4章基于数据仓库教务决策支持系统实行164.1业务模型分析174.2业务模型与关系模型映射194.3数据仓库建设204.3.1维表204.3.2事实表224.4 数据抽取、转换和装载264.5 OLAP 应用程序开发264.5.1 分析立方体建立274.5.2 分析立方体简朴使用274.5.3基于WebOLAP应用程序设计28第5章 结论与展望30参照文献32致 谢34第1章绪 论1.1选题背景及意义教务管理工作作为高等学校教学管理核心工作,负责学生学位管理、成绩管理、学籍管理;详细指引校教学督导组工作肩负教室调度、全校排课、全校寻常教学动态管理,组织各院、系、教学部(室)教学评估;组织各
13、学院、研究所制定各专业教学大纲、教学筹划、培养方案,编制每学期开课筹划,检查执行状况;与各个学院和有关部门配合,对学生社会实践、实习、生产劳动进行安排,这些工作即琐碎又繁杂。随着着国内高等教诲深化改革,国家不断加大教诲投资。高等教诲管理思路浮现了百花齐放局面,无论是从学分制改革,还是自我管理实行,再到学生网络选课实行,国内教务管理方方面面都在发生深刻变化。随着教务管理不断深化,浮现了许多新管理办法和手段,例如,实时数据报表,信息管理等,这些办法和手段浮现,是教务管理由过去人工解决转变为了高度信息化和集成化,充分体现了国内高等教诲发展崭新思路。于此同步,这些新办法和手段推出,如果以老式管理模式来
14、进行,将很难达到规定,这时就需要咱们运用先进信息化手段,以网络技术和数据库技术为支撑,充分发挥先进技术优势,并把这种优势引入到教务管理中。正是这种需求存在,使得教务管理系统开发工作变得尤为迫切,教务管理系统开发工作在这一需求推动下,获得了较快发展,各高职通过教务管理使用,使得教务管理工作获得了长足进步,办公效率大大提高,工作也变得更加顺手,教务管理系统应用还可以使分散教务数据得到集中管理,对提高管理水平、减轻管理承担有很大协助。正是由于教务管理具备优势和特点,各个学校都加大了对教务管理系统开发力度,投入了大量人力和物力,在较短时间内,各种教务管理系统便相继开发出来,并得到广泛使用。这些管理信息
15、系统大多都是通过当代信息化手段,并使用数据技术,实现了各种复杂功能,并针对教务管理这一特定领域而开发。这些系统对各个学校教务管理工作起到了较大辅助作用,并得到了广大教务管理工作人员必定和欢迎。1.2国内外发呈现状国外对高职管理信息系统研究工作开展得较早,早在上个世纪六七十年代,国外变开始了这方面研究,时至今日,已经比较成熟。由于国内信息技术相对滞后性,导致国内教务管理研究工作开展得就比较晚某些,从上个世纪七十年代开始,各个高职才开始教务管理系统开发工作,尽管通过了近年迅速发展,但由于各个方面条件制约,国内教务管理系统与发达国家相比,依然存在不小差距,这里既有教务管理观念上因素,也有信息技术上因
16、素。概括起来,国内教务管理信息系统研究和开发工作大体经历了如下几种阶段。阶段一:摸索阶段,时间大概从上个世纪70年代末到八十年代初。在这个阶段重要以限度各不相似应用中文信息解决技术为重要特性;应用某些办公设备;并在此基本上,对局域网技术进行研究,引进局域网设备,并将之应用到关于软件和系统中,这时应有重要在很小局部范畴,通过各种设计语言和数据技术应用,实现单向业务管理信息系统。阶段二:开创和见效阶段,时间从1986到1992,这一阶段重要进展体当前由分散开发走向统一规划、有筹划实行;系统建设原则化、规范化工作开始起步。在这个时期,局域网和pc技术获得了迅速发展,其性能不断提高,并且也趋于成熟。各
17、个高职开始研制自己单机单项业务系统,在某些高职中,还建立专门信息研究机构,在某些高职,还建立自己局域网,并获得了较好效果。阶段三:系统集成发展阶段,时间从1993年到当前。在这一阶段,大型数据库系统、性能卓越操作系统投入使用。pc机性价更高,各种高性能服务器和工作站降级问世,互联网技术和网络产品也日新月异,国内校园网建设也初见成效,其中具备里程碑意义是国内教诲科研计算机网络建成并通入使用,国内教务管理系统开始逐渐走向集成化综合化,这些都对国内教务和科研事业发展起到了积极地增进作用。更值得一提是,国内教诲网建设是由全国十所重点大学共同完毕,这充分表白国内高职在信息化建设中所获得成就,这些都推动了
18、国内教务管理发展,并为教务管理发展奠定了坚实基本。近些年来,随着国内教诲体制改革不断深化,国内教诲事业获得了长途发展,在改革大背景下,在吸取和学习国外先进教诲、教学模式前提下,将国内近年办学经验与国外教诲模式进行有效结合,最后摸索出适合中华人民共和国教诲发展全新教学模式。随着国内各个学校办学规模扩大以及学校招生人数几何式增长,各学校对于寻常管理工作中信息量、工作量也带来严峻考验。极大增长学校管理承担。因而,对学校如何进行有效管理得到了教诲主管部门极大注重。依照国内诸多学校既有管理方式,并同步对国际新思想理念进行融合,如何在校园一体网络背景下下建设领先、与国际接轨业务管理平台,如何提高和加强学校
19、当代化管理水平,成为学校最需要解决首要问题,也是现阶段各个学校继续实现急迫任务。本文设计实现学校教务管理系统已经从原有单功能想当前多功能发展过渡,以及逐渐走向学校管理信息化、原则化、系统化。只有这样才干追赶上发达国家教诲步伐,逐渐缩与她们之间差距。随着教诲机构,特别是各个学校教务管理系统飞速进展,普通性业务系统已经趋于成熟,在这样背景下,学校教务管理工作已经不单单满足于对数据普通性查询和解决,并且随着系统应用,其数据量也逐年增长,面对大量数据,迫切需要对这些数据资源进行系统分析和解决,同步将这些信息进行等价转换,这样才可以使得咱们预测学校将来发展和改革,为决策提供一定协助与服务。也正是基于以上
20、因素,对既有网络资源和教务管理系统进行整合,建设高度信息化和网络化,具备分析和决策能力系统新思路和新办法变被迅速提了出来。面对迫切需求,各个学校都开始了各自尝试,然而,面对现实却是,要对既有教务管理信息系统进行改造,以实现辅助分析和决策时相称困难和复杂。因素如下:第一,各个学校都存在这各种基于不同应用专用子系统,例如,排课系统,教师管理系统,科研管理系统,学籍管理系统等,这些系统往往都是不同步期开发,其应用平台和所运营环境都存在着较大差别,具备源头多样化、缺少精确性,主题不突出特点,并且其数据构造也存在差别,这就给数据采集和集中管理带来了很大麻烦。第二,通过近年积累,各个系统均有很大数据量,不
21、同系统数据很难集成,其数据访问性能也大大减少,系统开销也很大。第三,以往开发子系统重要是面向事务型,在其基本上开发基于联机分析辅助决策系统就变得尤为困难。随着数据仓库技术不断发展,近年来逐渐成为了研究热点话题,在商业应用中得到了广泛应用,但其应用范畴重要集中在商业领域,在其她领域应用比较少。因而,该数据仓库设计为基本教诲管理系统是一种学习和摸索过程。由于本系统研究和开发时间有限,加之缺少有关经验,系统还存在着不健全某些地方,有些问题不能精确地解决。重要体当前如下几种方面:一方面,优化数据仓库和OLAP多维数据集。应用程序重要是本科层次发展,学术资料,数据量相对较小,优化考虑是不够。特别是前者,
22、当数据不显示查询优化方案制定。当涉及到过多数据量,系统性能有所下降。另一方面,当前SQL Server数据库系统基本用法,以及大量各类管理信息系统数据库格式和种类,如何实现异构数据源操作发展不同阶段将是一种自动化限度高是一种非常重要方面。同样,这在数据仓库应用系统,侧重于OLAP应用研究,应用数据挖掘研究不够进一步。在系统开发应用程序数据基本上仍停留在数据挖掘表面,还没有进行进一步研究工作。这是系统接下来要研究重点。直白一点地讲,数据仓库其实就是一种堆放所有数据地方,之因此将数据都堆在一起,就是为了从中间可以找到某些有价值东西。数据仓库事实上更多是一种概念,因而,不能把数据仓库想成某些号称属于
23、数据仓库软件产品。数据仓库在物理上就是一种数据库。相对业务系统数据库叫做OLTP数据库(普通都是用于业务解决),这种数据库普通叫做OLAP数据库(普通都是用于业务分析)。通过对本课题详细研究,笔者以为数据仓库概念就是重要针对下面几种基本需求所产生:学校业务系统诸多,其业务系统历史数据是不以便查询。不同业务系统之间往往管理部门也不同,地区也不同。能不能将这些所有得数据集中起来,再进行筛选看有无某些故意义业务规律。数据仓库数据库普通都是很大,由于学校所有数据集中越多,越会有价值发现。数据仓库构成比较繁杂,既有某些业务系统历史数据,又有财务、人事数据,还要自己建某些数据,例如,教学资源信息、公共假期
24、数据、学校信息等等。数据仓库概念包括了从业务生产系统进行采集数据程序,这个程序还不能影响到详细业务系统运营。(属于 “ETL”过程)数据仓库涉及业务系统长期历史数据。(所谓“ODS”数据)数据仓库涉及针对某相业务值(例如学生人数)重新打上标签业务流水数据。(所谓“事实表”、“维度表”)。数据仓库概念兴许还包括报表生成工具(所谓“BI”工具)。这些工具可以达到几年前所谓DSS(决策分析)效果。1.3论文研究内容及意义本课题研究意义重大,通过对本课题研究,咱们从理论上与事实上提供一套非常科学管理办法和系统工具,这两者对各个高职进行全面数据维护、机器互联分析以及数据挖掘等提供一定意义上参照。对于高职
25、数据仓库合理、科学建设,大大提高了高职管理信息以及数据运用业务解决水平,增长了系统管理决策科学性和合理性。最后,还可以将最后实现成果推广且应到其她领域、其他行业。课题现实意义重大。本文研究内容:(1)教务管理现状分析与研究。(2)对既有数据库技术进行分析与研究。 (3)教务管理系统数据仓库建立。(4)对数据仓库中数据进行联机分析。(5)研究和探讨基于数据挖掘知识发现技术实现。1.4论文安排本文研究工作重要以数据仓库建立和决策分析系统开发为主,全文共分为六章:第一章:绪论,在本章中,阐述了基于数据仓库高职教务管理系统课题来源和研究现状,简介了本文研究背景和有关研究内容。第二章:数据仓库技术概述,
26、概述了数据仓库技术发展历程,概念以及其重要特性,重点简介了数据仓库数据管理和组织,对数据仓库体系构造和数据仓库分析做了较为进一步简介。第三章:基于数据仓库决策支持系统。在本章开始,一方面分析了既有决策支持系统各类问题存在,然后对基于数据仓库决策支持系统体系架构进行了进一步探讨和研究。在本章后半某些,阐述了数据仓库建库方略以及建库手段。第四章:本文设计重要基于对教务决策支持进行了详尽系统分析,通过有效分析和讨论,抓住项目至高点,同步基于系统总体框架设计,对本某些开展了有针对性设计。第五章:对系统决策支持系统实行中,一方面,对基于数据仓库业务系统分析整个过程进行了详细阐述。本章还采以关注对象为条件
27、和基本,采用多维数据对整个数据仓库进行系统、科学地设计,最后对系统数据信息进行OLAP分析解决。第六章:本文总结和系统展望,总结了本文全天工作,展望系统下一步开发。第2章教务决策支持系统需求分析2.1项目状况分析各高职都在不断地对信息化工作进行有益摸索,以求寻找出一条适合自身发展信息化之路。当前,各个高职都能把丰富教诲网络资源和交互式和专业性校园网资源应用到教学、科研、和管理中来,其中,教务管理作为学校工作核心,更是走在了信息化前列,在实际应用中,把对学生,教师,管理人员管理有机结合,使得教诲质量大大提高。通过近年积累建设,各高职都已建成了符合自己教学实际教务管理信息系统,实现了从选、排课管理
28、课程管理,到学籍管理,成绩管理,考试管理学生管理,与此同步教师管理、奖惩管理,信息管理,毕业生审核等也获得了一定成效。使得管理部门压力得到了很大缓和。图2.1 高职教务管理图2.2 既有教务管理系统构架随着教务系统广泛使用,人们已经不再满足于对复杂事物型数据简化,更加迫切但愿对数据进行综合分析和决策分析,然而以当前事务性教务管理系统很难解决这一问题,其因素在于如下几点: (1)事务解决与分析解决无论在行文模式上,还是在性能上都存在着较大差别。将解决性能相差很大两种应用置于同一环境下运营显然是不适当。(2)拥有对的全方位数据是进行数据分析和决策先决条件,只有关于数据收集得越全面越完整,咱们才也许
29、得到可靠分析成果。但就当前状况而言,大多数数据都是较为分散并且还处在非集成模式下。(3) 对既有数据源中数据进行转化是动态数据集成对数据基本规定,只有达到动态数据集成才可以把分析成果及时反映给决策者。显而易见,当前教务管理系统以事务解决为主,不也许具备动态集成能力。(4)动态数据分析在空间上和时间广度上对数据规定都很高,而对于老式事务解决环境来说,其数据解决只是在一段时间内进行,在这一点上就无法满足分析规定。(5)在普通状况下,动态数据分析在分析此前,需要综合运用细节数据,而当前,事务解决教务管理系统,为了提高存储效率,普通不具备这方面能力。由于存在以上问题,因此本文提出在实行过程中将数据仓库
30、技术应用于教务决策系统中,以既有教务管理系统为依托,对其数据进行分析解决,使得高档教务管理人员对学校教学状况有比较进一步精确理解,还可以对教学最新动态进行跟踪监控。通过这一系统,教务管理人员可以比较以往发展历史和趋势,使资源得到合理调配。2.2项目难点分析通过普遍调查,发现当前国内教务管理系统大多还是处在事务管理实行应用阶段,还没有一套完整决策分析系统供决策者使用,特别是动态决策分析系统更是少之又少。通过对国内外研究应用状况进行分析和比较,咱们以为本项目研究与实现难点存在于:(1)教务数据量大:对于一种万人校来说,其一种学期课程信息以及每年学生信息就超过十多万条,并且通过近年积累,教务管理所涉
31、及数据量已达到相称大规模。仅仅数据库文献大小就有10G大小。大量数据对于数据挖掘算法和服务器性能都提出了较高规定。(2)数据不完整:由于当前各个高职教务管理系统是逐渐开发使用,通过了多次版本升级和更替,不同系统运营于不同网络环境,系统功能和数据格式也是千差万别,这就使得积累起来数据是分散零散,并且有些时候还是先后不一致,其完整性规范性一致性比较差。(3)行之有效使用数据挖掘办法:是整个系统核心,涉及决定如何产生假设;如何选取适当工具;如何发掘知识;如何验证发现知识。就本系统而言,有效使用数据挖掘办法,实现迅速分析是本项目研究和实现困难所在。(4)良好成果表达形式:具备良好数据表达方式是咱们最后
32、目,也是系统开发与否成功原则,决策分析目就是可觉得决策者提供直观,便利分析成果。咱们通过对顾客需求进行仔细分析过滤,得到有价值信息,并通过良好人机界面将成果输出,再加之应用生动体现形式,对成果进行解释和表达,从而达到以便决策者目。再有就是系统建立后测评指标建立,当前针对数据仓库平台为重要评价指标分为两种:(1)TPC-DTPC属于国际组织,它是由像惠普、IBM微软、Sun和其她跨国公司这样45个成员公司构成。在各种不同类型应用程序中负责所有开放式平台,并开发一种更详细统一,公平测试原则。联机事务解决系统,TPC-C是一种衡量重要性能指标数据库,数据仓库系统,测量其数据库性能指标TPC-D.重要
33、有三个方面详细因素:第一、系统描述,第二、查询解决能力,其描述了系统在不同顾客在同一时间详细查询时,解决能力即流实验成果。换句话说,代表了整个系统并行解决能力。第三,是描述性能价格比。理论和现实之间,前面指标数据如果效果较好,而最后一种如果较小效果会更好。固然,一方面是考虑公司不能满足特定需求。每个供应商TPCC和TPCD详细描述所有码在互联网网页内容发现。此外,还从微软和其她某些公司网页,也可以发现TPCD测试成果。虽然描述了整个系统并行解决查询祈求特定能力,但并非所有供应商流量测试可以在多顾客状态可以进行。因而TPCD各个供应商有一种明确选取:要么直接相应顾客一定条件下流动实验;无论是在第
34、一种详细单顾客状态,依照详细实验,最后用实测解决能力详细指标qppd和流量指标计算公式计算得出qthd来区别这两者。各种测试成果表白许多行业存在问题,事实上,只要tpc-d测试总结下载并打印出来,因此你可以看到在测试时间流实际数量。流数量事实上是代表同步提交查询祈求所有顾客数。如果属于单顾客状态下测试,只找到一种特定流。第3章教务决策支持系统设计3.1系统总体框架设计在前面章节中,咱们曾简介过既有较为典型数据仓库构造模型,而本系统是以数据仓库为基本,因此本系统总体构造与前面章节简介构造类似如图4.1所示,在整个系统中,按其功能分为三个模块:数据仓库和多维数据集创立和管理模块,数据采集模块以及O
35、LAP应用系统开发模块。下面分别简介各个模块重要任务:3.1.1多维数据集创立在该模块中,咱们选用中间数据库作为数据源,数据仓库以主题创立。依照一定层次聚合、汇总数据仓库中数据,以构成信息分析多维视图。最后,通过以一定存储模式,将得到多维视图存储在OLAP服务器中。3.1.2数据采集模块该模块重要任务是依照已拟定决策分析主题域采集原有各教务管理系统中有关业务数据,通过整顿后存入数据仓库。在这里咱们建立了一种中间数据库,将OLTP数据库上与数据仓库主题关于数据增量更新到中间数据库,使对OLTP数据库效率影响降到最低。并在数据采集过程中依照将要建立多维构造特性调节某些数据。3.1.3系统开发模块满
36、足管理人员决策分析需求是构建数据仓库目。联机分析解决模块重要职责就是要完毕对多维信息显示分析和解决工作,重要涉及对多维数据集成维度信息、层次信息、方体信息、度量信息显示,从而可以实现对数据立方体数据浏览;并可以实现对数据钻取、切片、切块、旋转等多维分析操作,在此基本上提供各种查询方式,查询成果以WEB网页形式呈现,以实现B/S(Browser/Server)形式联机分析,全面支持决策分析。3.1.4数据仓库设计业务系统ETL(DTS)原始数据库事实数据库OLAP前端报表。业务系统就是顾客Oracle数据库了,里面有某些业务数据,此外尚有某些二进制话单文献。ETL过程就是一堆存储过程(维度抽取、
37、原始数据抽取、事实数据日结),然后通过DTS任务包调度起来。原始数据库就应当是ODS数据库了,负责把数据原封不动从业务系统抽取过来(某些也通过转化和清洗);出于对SQLServer性能考虑,将每个业务数据表都提成历史表和当前表,当前表依照数据量状况决定保存数据周期并定期转移到历史表中。事实数据库保存着聚合信息数据,完毕KPI指标计算,以及维度抽取工作;同步在进行聚合同步完毕数据清洗工作。其实清洗很简朴,就是对NULL解决,没有对主外键判断,维度解决仅作更新和插入解决,来保证外键数据匹配。但是 SQLServer性能不是很抱负,不不大于1000万数据表解决效果不是较好,只得建了许多了分区表(事实
38、上就是每月一张数据表,用视图Union起来,这也是微软推荐方式)。对于业务数据到原始数据解决,完全采用增量抽取原则(由于每个表均有了时间点);对于原始数据到事实数据解决,则增长了一张log表,记录每次抽取周期、跨度、与当前时间差距和状态等等。对于OLAP增量解决也是靠一张日记表决定解决范畴。唯一比较独特也许是某些业务数据顾客也许会更新,需要重新抽取、汇集和OLAP解决,这个时候在解决之前一方面删除这段时间数据,重新抽取、汇集和OLAP解决,固然是靠脚本来完毕。图3.1 系统总体构架项目系统中数据解决流程为:(1)数据采集系统依照己拟定决策分析主题域,一方面将OLTP数据库中所需数据导入中间数据
39、库。(2)以中间数据库为数据源,对数据进行抽取、转换、清洗等操作后存入数据仓库。(3)通过OLAP工具将数据仓库数据多层次分类汇总,从而建立多维数据模型,并存储在OLAP服务器中。(4)最后开发OLAP应用系统将数据灵活地呈现给顾客。3.2数据仓库方案设计数据仓库就是决策支持系统基本,是整个决策支持系统核心,依照系统总体框架设计,本决策支持系统是基于数据仓库,设计、开发、实行数据仓库将对最后能否实现为顾客提供有效决策支持信息目的产生影响。数据仓库是一种面向分析型解决数据环境,这就决定了其设计工作与数据库设计有着明显不同,无论是从数据组织,还是从数据解决与老式数据库均有较大区别。数据仓库构建是一
40、种不断循环、反馈而使系统不断增长与完善过程。依照当前对数据仓库研究成果,数据仓库设计方案普通分为:233.2.1自底向上法咱们从数据底层开始,第一步先建立数据集市,第二步,将其中数据集成到数据仓库中,将数据从操作型系统进入预解决层,第三部直接进入独立数据集市。这些数据集市最后集成为全局数据仓库。由于在建立部门数据集市时只需要较少人做决策,解决是较小问题,因而这种办法长处是:初期投资小,见效快。但是这种办法同样存在缺陷,它重要拟定是缺少对独立数据集市构造控制,对数据集市集成以及日后集成到全局数据仓库大为不利。3.2.2自顶向下法与自底向上法不同,在自顶向下法中,一方面先建立数据仓库,第一步,运用
41、其中数据建立一组有关数据集市。这样,数据从操作型系统中进入预解决层,第二步,再去解决斟酌进行数据集成和转换,第三步,数据被导入数据仓库中,然后进入数据集市。由于全局数据仓库系统创立,使得有关数据集市构建都是以数据仓库中信息为基本,从而为数据集市技术使用提供可靠办法这种办法,其长处是:这是收集、建模和实现最后顾客决策支持需求严格而又普遍办法。这种办法缺陷是:开发时间长,成本高。3.2.3混合法针对以上两种办法优缺陷,日后人们提出了一种将两种办法长处基于一身办法,混合法。既能保持自底向上办法同样迅速实现和及时应用又可以运用自顶向下办法有筹划战略性特点。在混合法中,数据仓库开发采用迭代办法。在所建立
42、数据仓库系统中普通都包括直接从预解决层获取数据独立数据集市。在数据仓库中保存并管理统一信息模型作为在数据仓库中数据集成核心。当建立新独立数据集市或增长一种新有关数据集市时,就要更新信息模型。它代表了数据仓库系统唯一信息来源,同步也是创立数据仓库元数据来源。依照以上阐述和分析数据仓库构建办法,结合本系统实际,咱们最后采用见效快自底向上法(见图3.2)。由于在本系统中,所涉及范畴是教务部门教务有关信息,该部门作为学校一种业务部门服务,其业务范畴不是很大,信息内容不是很杂,资金投入也比较有限。图3.2 自底向上法由于在系统开发过程中,需要考虑到决策支持系统将来发展。咱们在设计工作中也意识到:所建立教
43、务部门数据集市需要按照统一校级信息模型来设计,并且在实行过程中度量应尽量减少重复,并可以充分考虑到整个学校最后信息需求,在真正满足顾客原子级需求,使其具备较好重用性和一致性29。这样才干更好保证随着更多学校部门数据集市建立和投入使用,数据集市联结成为也许,而这些数据集市集合也就成为将来校级数据仓库基本。3.3数据仓库架构构造 ODS层重要负责采集业务系统并保存一定期限内有关业务数据。固然也可以满足顾客对明细数据查询规定,可以算作明细数据仓库。 数据仓库层 将ODS层通过质量检查、清洗、转换后,形成符合质量规定公共数据中心。事实上与ODS层差别不大,都是建立以ER为中心数据关系,以便后来数据聚合
44、。 明细数据集市层即前面所说事实层按主题及KPI指标对数据仓库层数据进行进一步转换,将指标与维度构成数据集市。这是OLAP数据基本。 聚合数据集市层即OLAP在明细数据集市层基本上,提供基于联机分析解决(OLAP)引擎多维分析能力,解决联机分析功能和决策支持规定。 数据呈现层按照顾客报表规定,提供顾客报表界面及预警分发机制。第4章基于数据仓库教务决策支持系统实行本章,咱们在上一章设计基本上,依照设计方案对系统进行详细实行工作,在本系统中涉及详细实行流程如图4.1:图4.1 基于数据仓库教务决策支持系统实行流程图4.1业务模型分析对教务决策支持系统理解至关重要,由于它不但关系到开发工作与否可以满
45、足顾客实际规定,并且对于充分运用既有资源也起着至关重要作用,咱们只有对既有系统有了充分理解,才干为数据仓库建设做准备,最后做好决策支持前期工作。对于既有教务管理系统来说,其业务系统重要涉及成绩管理、教师管理、科研管理、课程管理、学籍管理、奖惩管理、信息查询、毕业生审核、考试管理。其中以课程管理应用最为广泛,涉及院系开课、学生选课、培养筹划、课程设立、成绩管理、排课信息、教学测评等方面,往往这些都是学校教学工作核心工作,涉及方面较广,不但关系到教学安排,学生培养,教师管理,并且还与教诲目的完毕状况息息有关。在学校教学管理中,课程管理在其中扮演了十分重要角色,因此课程管理在教务管理子系统中始终是比
46、较重要一种缓和,从来都受到各个学校注重,也是整个系统核心所在,它发展经历了从初期数据采集,到电脑辅助排课,到当前全自动排课,可以说当前课程管理系统无论在系统成熟度上还是在应用上都已经达到一定水平,并且通过近年发展,各个高职已经在实际应用中积累了项目应用宝贵经验,并且在应用过程中还积累了庞大数据资源,这些数据资源对于本系统开发课程管理系统具备相称价值。鉴于上述因素,咱们在系统实行开始阶段,决定选用课程管理开发基于数据仓库管理系统,然后在接下来把开发进一步到其她业务模块,最后达到建立高效信息化大学教务动态决策分析系统目。通过图5.2咱们可以对现行教务管理体系有了一定理解,咱们可以看到在排课系统中所
47、涉及主体,一方面是上课学生,教课教师,以及安排课程管理人员,尚有就是教务处教学秘书,这四个主体之间是互有关联,互相影响,在这种关系下,咱们要在教务信息化前提下,来实现对信息采集和解决工作,建立课程基本数据库,开课、选课、排课数据库,课程成绩数据库,教学方案数据库,教学测评数据库(未在图中显示),个人培养筹划信息数据库。图4.2 现行课程管理流程图通过这八个数据库,实现了“教师登记课程组合生成教学方案学生自我规划学习筹划院系按照学期开课院系按照学期排课学生依照课程信息选课教学过程教师输入课程成绩学生为教学测评并查当作绩”这个完整业务流程。4.2业务模型与关系模型映射在本系统中,咱们重要依照对象不
48、同对所涉及业务模型进行相应划分,将排课系统中业务逻辑以及其所要解决数据进行有效整合,这样就可以建立课程管理数据库关系映射。对模型中模型进行定义。一方面要进行工作,是对主体划分,根据上一节划分办法,在本阶段咱们同样将主体分为四个对象。划分出相应主体后,接下来,依照主题拟定主体内容,通过对既有课程数据库进行分析,咱们可以得出,关于学生这一主题,涉及学生基本信息,如:学生所在院系,学习专业,尚有就是学生某些自然信息和个人培养筹划信息;在课程主题中,重要涉及,教学方案,以及课程详细信息;在教师主题中,重要涉及教师教课信息(授课院系,授课班级,时间等),尚有教师某些自然信息,及教师所在院系。拟定后整个业务模型可以进行一种大体划分,详见图4.3。图4.3 课程管理数据仓库主题边界划分依照以上分析,咱们可以再次映射出课程管理数据仓库系统关系模型:在教师与课程两个主题中,其管理可以定义为开设关系、学生与课程两个主题中可以定义为选取关系、在教务处