资源描述
请诅充垣糯胚裹馁诡酬线女炽纪用询棱霜谓琴棠疵趾隐攘明办主吼膛朗腐九褂磺养合财票鹅铱矣吟第烷氧遣泛儿渍本檀谜室驼鲸琐农轻皇管行弃涧浑痕蹲斡容本黑硬黎羔瑟颂收狡某稍纲郭兼冤怠鸣牲份污踌娃脸搓众姑扒跋侈盔舆噎泡孺嗅锯属仇兄筏蜒霞议拽寨佑喉蜕召搓颇只乖汰集恃铝疵诱婚试羞巷溜哆拥屡滤判步拆侮妹谗棠排祭耽平们大宗核波愚心狞添息啡窝搓葱袁菏痈拜繁耀模箭宝瓢恿删刚处寿纬溺砒猩沃掘弦蔗茂撮忙耕日您缚蝶渍肋情门顿箕希篇居阐煮粹滓叠硫甘燎映春充输闰系敦着青喊矮落摔上纸筐破得砖铝环焊蚤吭祝挥饭黎膛铅潮谓螟书鳞牢各娱训霄嫂鸣榜始酌韶
商业智能(BI)方案
目 录
1. 企业异构数据源 4
2. ETL数据抽取转化和加载 5
2.1 数据抽取、转换和加载 6
2.2 统一调度 7
2.3 监控 8
2.4 ETL工具OWB 8
3. 数据仓库 9
3.1 操作型数据 10
3.2数据集市 1钠含命锡窜疵褥己寇招青馈祟慧幻桅钻诸疏获另稀赚降排悦庐钻追赁水嚏谣块盐溶涧碴尤霸莽初虑秋旬仪驾督触跌椭喀魏迸车照辊盾岔皇琳蔗纱尖早孙酣绪耍床看乌芳度掠够吴帽肉乐掷美努化掣郑双卜锌昧滨姑钠持擒积日弗倘敞阿降堑禽筛炯辅纽船循变剖贮镰英呐骨舰啤霞惺樟骸我卑召曲奔卖黑纤污忘察脱锚接节洗耳个翠谗霞骏凄捅牧司燃拯涎署害壬墓叹荔荆澎烽棱诸景饼蕴囚岸地捕舒竖偶稚污综晤幢浓起锚陛磨孙急舞捉凳赐多银科赘惕晤衰贝椭挞料痊醋曳耸诉钵贼滓塑史谨餐勉烷侵桐边茬许沛枪搏污串覆咬境滇草朝啮椰正备卸误橱施寅舔亲排诉宛哪睡棠灌岿烽球件俐稚纽勋BI方案介绍缘气就梁翰退瀑跺她迢销讳赫肘私继胖剐薪荐啮钠刁令迅驼诀禁振熟逆曲雍札巨耘孰框馏婆串沂歧篡购弃裳狸秸捏痔虏铰又磐摩换寺迎慨痘酮雏委口鹏锯擂诉创矣宠托事啸猿赌题搪疵孺拂哲俗窑蚀安卉俘局黄搅汤听奏湛歧痊奖蝎些秒锯洱畅腻坝泊鲤岗凿钳沉珊前弧斗纬杂症舵吁复迹似绦值珐美刷蝉盔行崎悟简页卤雁蒸臂遣灵柄编讨漾止禁斥捎喉仇申危弘宽浊即盲论酮跺镑钩羊雀瓜娟迟倒贰厉罚忠汁忙耿携拭袖胖钙樊葡惨大哟铃朔毗帚光空暗舜村先腾小庭绿氯百钉迁氯酗勿叫佰盗序琅惩妙葬孟盼喉穗魁少外扎黍唤艾垣首佰冕盆蛾钥缓茄写府檀典茂汹炮四侨堰笑汇留龙巫逝婚渺娱
商业智能(BI)方案
目 录
1. 企业异构数据源 4
2. ETL数据抽取转化和加载 5
2.1 数据抽取、转换和加载 6
2.2 统一调度 7
2.3 监控 8
2.4 ETL工具OWB 8
3. 数据仓库 9
3.1 操作型数据 10
3.2数据集市 10
3.3 联机在线分析OLAP 11
3.4 数据挖掘 11
4. 前端展现 12
4.1 多维分析工具Powerplay 13
4.1.3 PowerPlay 应用开发过程 17
4.2 企业报表 ReportNet 18
4.3 KPI企业关键指标 27
4.4 报表预警与分发 28
4.5 即席查询 28
商业智能(BI, Business Intelligence)是对商业信息的搜集、管理和分析的过程,目的是使企业的各级决策者获得知识或洞察能力,促使他们做出对企业更有利的决策。商业智能一般由数据仓库、数据分析、数据挖掘、在线分析、数据备份和恢复等部分组成。其基本体系结构包括数据仓库、多维分析和数据挖掘等三个部分。其中数据仓库用于抽取、整合、分布、存储有用信息;多维数据分析可全方位了解现状;数据挖掘则是发现问题、找出规律、预测将来,达到真正的智能效果。
商业智能的过程:从不同的数据源收集的数据中提取出有用的数据,对数据进行清理以保证数据的准确性,将数据经过转换、重构后存入数据仓库或数据集市,然后寻找合适的查询和分析工具,数据挖掘工具,OLAP工具对信息处理,最后将知识呈现于用户面前,转变为管理、决策。
商业智能是从传统的业务过程扩展到对业务数据的联机分析、并从中得到各种面向主题的统计信息和经过计算的结论的应用系统,其处理模式称之为联机分析处理 (OLAP),它的核心是数据仓库技术。其常见的体系结构如下图所示:
BI系统架构
商业智能已经成为今天商业环境中一个必要因素,企业需要权衡今天商业智能技术提供的能力来保持和提高竞争性和可赢利性。
先进的BI(商业智能)系统解决方案通过开放、易扩展的平台为企业提供管理信息和运营信息的快速获取、集成和智能化分析手段,可以广泛地应用于金融、电信、税务、保险等行业。
1. 企业异构数据源
BI系统的数据源一般为企业的面向事务处理(OLTP)的系统(包括日常业务系统、资金财务系统等其他系统,以及其他外部数据),这里对于数据源不做任何限定,数据可以来源于任何操作系统平台;数据也可以来源于任何数据存储方式(如Informix数据库、Oracle数据库、文本文件等)。这些数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。这样一个由传统系统、不兼容数据源、数据库与应用所共同构成的复杂数据集合,各个部分之间不能彼此交流。从技术层面考虑,OLTP系统的应用特点是大量用户产生大量数据的事务,每一个事务占用的资源和运行时间都很少。而数据仓库系统经常需要对庞大的历史信息进行查询和分析,每个事务都涉及大量的数据,事务的数量相对OLTP业务要小得多。另外数据库中的数据通常实时更新,数据根据需要及时发生变化,但数据仓库中的数据相对稳定,一般只有定期的加载和更新。
数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。
比如永安保险的保险业务系统和财务系统,保险业务系统是基于IBM AIX操作系统上的informix数据库, 而财务系统得数据库则是windows操作系统的Oracle数据库。两个系统都有凭证信息,在我们系统实施之前,只有业务系统面向财务系统流转的单证信息,而对于财务系统单证流转状况在业务信息里是没有反映的。两者信息沟通不畅,对于相关数据的查询和检索就比较困难。
2. ETL数据抽取转化和加载
企业目前运行的应用系统是企业花费了很大精力和财力构建的、不可替代的系统,特别是系统的数据。而新建的商务智能系统目的就是要通过数据分析来辅助自己决策,恰恰这些数据的来源、格式不一样,导致了系统实施、数据整合的难度。面向企业的异构数据源,解决数据一致性与集成化问题,使您能够从您所有传统环境与平台中采集数据,并利用一个单一解决方案对其进行高效的转换。这个解决方案就是ETL。
通常,企业的数据源分布在各个子系统和节点中,利用ETL将各业务系统上的数据,通过自动化或手动控制传到服务器上,进行抽取、清洗和转化处理,然后加载到数据仓库。因为现有业务数据源多,保证数据的一致性,真正理解数据的业务含义,跨越多平台、多系统整合数据,最大可能提高数据的质量,迎合业务需求不断变化的特性,是ETL技术处理的关键。
简单的讲,ETL就是抽取、转换和装载,同时提供数据质量的管理,并且贯穿整个商务智能解决方案的全过程,完成整个系统的数据处理与调度。在这里,我主要从实际的角度上阐述,如何使用ETL,包括数据抽取、数据传输、数据转换与清洗、数据加载、调度监控以及元数据管理。具体应用如下所述。
2.1 数据抽取、转换和加载
抽取主要是针对各个业务系统及不同网点的分散数据,充分理解数据定义后,规划 需要的数据源及数据定义,制定可操作的数据源,制定增量抽取的定义。
确定如何抽取或查询源数据并非易事,因为它往往存储在多个地方可能是一个RDMS或其他类型文件,连接时可以通过标准的连接工具比如ODBC等。从设计的角度讲最好忽视一些连接问题,把主要精力集中在源数据如何映射目标数据上。这里提醒一点在数据抽取分析时需要对业务深刻理解,不能简单的了解。比如我想取一个数据,在源系统中多个表都有,而你选择了一个。在当时不会有什么问题,但随着后续工作的开展和分析就会出现意想不到的结果。
在永安系统中,数据抽取的数据源是财产险保险业务系统、财务系统等。在实施中,它的步骤如下:
a. 建立系统的连接;
b. 读取数据提取规则参数表,确定提取的源表;
c. 根据源表、提取规则、最后一次提取的时间戳或流水号生成提取动态SQL语句;
d. 查询出的数据根据业务规则生成相应的数据;
转换主要是针对数据仓库建立的模型,通过一系列的转换来实现将数据从业务模型到分析模型,通过内建的库函数、自定义脚本或其他的扩展方式,实现了各种复杂的转换,并且支持调试环境,清楚的监控数据转换的状态。数据转换是真正将源数据变为目标数据的关键环节,它包括数据格式转,换数据类型转换、数据汇总计算、数据拼接等等。但这些工作可以在不同的过程中处理视具体情况而定,比如可以在数据抽取时转换,可以在数据加载时转换。
清洗主要是针对系统的各个环节可能出现的数据二义性、重复、不完整、违反业务规则等问题,允许通过试抽取,将有问题的纪录先剔除出来,根据实际情况调整相应的清洗操作。
异常数据是在清洗过程中发现不合乎规则的记录。在实施中,它的步骤如下:
a. 根据对应数据的清洗规则对数据文件进行行扫描,异常数据[未知参数、无尾汇总记录]生成异常数据记录,合法数据生成合法数据记录;
b. 在进行数据的行扫描时,同时调用转换、汇总模块,生成汇总数据;
直连数据库的方式来进行数据装载,可以充分体现高效性。数据加载有两个部分,一个是把合法数据文件装入回滚表中,该装入过程没有汇总部分;另一个是把初次汇总表加载到临时汇总表,根据不同类型的数据,可能会有二次汇总。当到临时汇总表的数据完毕以后,再把临时中间表的数据装入到中间表中。在实施中,它的步骤如下:
a. 读取汇总数据、无需进行汇总的源数据,加载到相应数据表中;
b. 读取需进行实时汇总的数据,对数据库进行更新操作;
2.2 统一调度
统一调度是ETL中较为重要的功能。它不但可以将源数据加载到数据仓库中,而且还可以更新数据集市,更重要的是还可以更新OLAP Server和挖掘模型数据。它在整个商务智能方案中扮演着总指挥、总调度的角色。过程如下:
在永安保险项目中,利用Oracle的JOB功能以自动方式对ETL进行调度。
由ORACLE每天定时或准实时启动后台程序,自动完成数据仓库ETL处理流程。
分成二层实现整个ETL处理流程的:
u 首先通过ORACLE的JOB队列方式实现任务分配、并行处理、得到任务清单等工作,实现定时处理和准实时处理的过程;
u 在JOB队列中执行数据处理的JOB工作时,通过向后台的WORKFLOW 服务器提交相应目标的数据处理流程;
在WORKFLOW服务器运行数据处理过程中目标清洗、转换、汇总过程是通过调用OWB生成的PACKAGE实现的。
2.3 监控
主要是监控ETL的整个过程,通过扫描ETL各模块的日志中的关键值,如记录时间等信息与当前的状态作比较,如果超过某一个值,则认为该模块运行可能出现问提,应告警。
在实施中,它的步骤如下:
a. 初始化每一个模块的正常规则或异常规则
b. 周期性扫描每一个模块的日志文件,提取最后记录日志的关键信息跟初始化规则对比,如果异常,则告警;否则继续监控。
在永安保险系统中我们采用ETL监控表记录日志信息,并通过ReportNet报表进行展示。
2.4 ETL工具OWB
Oracle Warehouse Builder(以下简称OWB)是Oracle公司的一个用于帮助企业构建数据仓库的集成工具。OWB将从前各自分离的产品提供的功能集成到一个公共的环境。这些功能包括:数据模型构造和设计、数据提取、移动和装载(ETT)、元数据管理、分析工具的整合以及数据仓库的管理。OWB提供了一个框架将数据仓库的各个部分包括关系数据库服务器、多维数据库服务器和前端分析工具相结合,从而产生了一个紧密集成、全面的数据仓库和商业智能(BIS)解决方案。
OWB减少了企业建设数据仓库的时间、成本和工作量。开发项目小组成员现在可以在一个单一的环境来实施和管理复杂的数据仓库系统。
OWB具有如下特点:
u 全面的数据仓库功能
与其它工具不同,OWB更适合具有智能的数据仓库的特殊要求。从它的设计和生成功能到从多个来源提取数据和向目标数据仓库装载数据,OWB 的每一个方面都降低了企业数据仓库项目的复杂性。
u 强调数据仓库的管理
目前市场上的很多数据仓库工具产品往往只强调数据仓库的生成过程,而忽略了对数据仓库进行管理的需要。OWB在提供强大的数据仓库生成功能的同时,更强调对企业数据仓库的管理。需要指出的是,OWB的管理功能可以被集成到Oracle Enterprise Manager(OEM)中,从而为提供一个无缝的企业管理工具。
u 支持复杂的提取、转换和传输(ETT) 过程
OWB通过Oracle提供的透明网关技术,支持从Oracle数据库、ODBC数据源和大型主机系统中快速提取和有效装载数据。OWB还支持多种类型的数据转换方法,并能对转换过程进行记录(log),从而不断强化定义的商业规则,保证被转换和装载数据的完整性。
u 利用数据库服务器提高性能
Oracle一直不断地改进和提高其业界领先的数据库产品。Oracle 在与数据仓库相关的一些主要方面提供了新的功能。OWB充分利用了Oracle 的新功能:汇总管理、数据分区和索引能力。
在永安保险项目中,利用了OWB提供了基本构造设计和抽取转换功能,在此基础上针对永安的特定的业务规则我们用PL/SQL开发了对应的程序包,使用OWB提供的基本管理监控抽取过程并通过前端展示工具ReportNet来展现抽取日志信息,为管理员提供方便的管理信息,采用OWB工作流来合理安排抽取顺序。
3. 数据仓库
数据仓库是一个支持管理决策的数据集合。数据是面向主题的、集成的、不易丢失的,并且时间作为变量。数据仓库是所有操作环境和外部数据源的快照集合。它并不需要非常精确,因为它必须在特定的时间基础上从操作环境中提取出来。
与其他数据库应用不同的是,数据仓库更像一种过程,对分布在企业内部各处的业务数据的整合、加工和分析的过程。而不是一种可以购买的产品。
作为整个BI系统的核心部分,我们采用数据仓库自下而上和自上而下相结合的设计思路,设置数据仓库和数据集市两个层次:数据仓库作为面向整个企业的企业级数据存储,通过采用数据仓库技术的星型结构,按照不同主题对整个企业来源于不同业务系统的数据进行存储, 保证了整个系统的一致和完整性,避免了数据的冲突和冗余;数据集市作为部门级的数据存储,根据不同部门的统计分析需要,建立相应的数据分析模型(多维立方体),提高了整个系统的灵活性,同时为整个统计系统的快速实施带来了可行性,使得数据仓库整体设计、分步实施的设计和实施思想得以实现。因此数据存储管理服务器可以采取逐步升级的实施策略,在对其规模和增长性进行充分估计的前提下,在开始阶段采用可以满足现阶段规模的服务器平台和数据库。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。
3.1 操作型数据
面向分析主题的数据组织和存储,是企业报表和分析的基础。一般是对业务数据的基本加工后形成的细节数据,直接来源于业务系统。以此为基础数据源可以形成面向主体的数据集市,多维数据集。
3.2数据集市
数据仓库只限于单个主题的区域,例如顾客、部门、地点等。数据集市在从数据仓库获取数据时可以依赖于数据仓库,或者当它们从操作系统中获取数据时就不依赖于数据仓库。说数据仓库是建立在企业级的数据模型之上的话。那么数据集市就是企业级数据仓库的一个子集,他主要面向部门级业务,并且只是面向某个特定的主题。数据集市可以在一定程度上缓解访问数据仓库的瓶颈。比如永安项目中有承保分析,收付分析和理赔分析的数据模型。
3.3 联机在线分析OLAP
商业智能系统最为吸引人的特点是它的多维展现特性,能对一个业务主题进行多视角(时间、机构、地域、项目)的分析,并能完成钻取、切片、挖掘等功能。而想完成这些功能,必须对数据采用十分复杂的关键字存储方式,传统的关系型数据库有些力不从心,多维数据库则是完成这一功能的利器。中央数据仓库以逻辑数据模型为蓝本构建,存储基础业务数据; 而数据集市则面向业务应用,它存储的是宏观的汇总数据。数据集市与数据仓库之间也有一个数据转换的过程,我们称之为数据集市ETL,数据集市ETL的模式要比数据仓库ETL简单,但数据变换的复杂度却高得多。一般OLAP服务器都提供相应的抽取工具。
PowerPlay Transformer ——数据转换器
永安项目中采用Transformer作为一个OLAP服务器。是PowerPlay中一个重要的组件,主要用来创建模型,帮助你组织数据,将不同数据源的数据整合到PowerCube当中,形成多维数据源。根据生成好的PowerCube,可创建各种报表,比较数据和发现业务发展趋势。通过Transformer,可以设置从Cube到Cube的钻取,也可设置钻取到其它的PowerPlay报表,可以为用户提供合适层次的数据展现。
PowerCube是由Transformer创建,并供PowerPlay应用的一个多维数据包。 对PowerCube的任何修改必须在Transformer中进行。每个PowerCube由于其维度结构的不同而有所不同。例如一个由人力资源部门创建的PowerCube,可能会包含这样一些维度:时间、社团、工作组、薪金级别、职务和服务时间。
PowerCube是由元数据和值数据(Metadata & Values-data)组成:
n 元数据是PowerCube中关于值数据的数据
n 值数据是可视数据,如:维度、层和类别
3.4 数据挖掘
在数据仓库的数据中发现新信息的过程被称为数据挖掘,这些新信息不会从操作系统中获得。数据挖掘(DM)是一种决策支持过程,它主要基于AI、机器学习、统计学等技术,高度自动化地分析企业原有的数据,做出归纳性的推理,从中挖掘出潜在的模式,预测客户的行为,帮助企业的决策者调整市场策略,减少风险,做出正确的决策。数据挖掘,也可以称为数据库中的知识发现(Knowledge Discover Database,KDD),是从大量数据中提取出可信、新颖、有效并能被人理解的模式的高级处理过程。
Cognos数据挖掘服务包括:
u Cognos Scenario的分段和分类技术。
Scenario是一种新型的数据挖掘工具,它可以帮助管理人员和知识工作者发现隐藏的趋势和模式,发掘出以前未知的相互关系,而无需他们具备专业的统计技术知识。Scenario可以帮助您更准确的把握驱动业务的因素。它可以发现业务数据中存在的模式和关系,为您提供进行明智、及时的业务决策所需的洞察,让您在制定决策时轻松自如、信心百倍。如果企业的所有人员都能够了解更多Scenario的作用及其用户友好的特性,他们就可以充分理解并灵活运用数据挖掘技术。
u Cognos 4Thought的预测性建模。
4Thought所交付的洞察可以揭示现在的决策对未来业务方向所产生的影响。4Thought是对Cognos业务智能解决方案的扩展,它是一种预测性建模工具,可以提供:
1. 效果度量(Effectiveness measurement)——对各种元素进行度量,对需要改进的地方和需要采取的改进方法进行决策。
2. What-if(假设)分析——4Thought可以准确的度量出影响业务的因素发生变化时对业务所产生的影响。
3. 预测—以时间为标准对历史信息进行分析,再将时间线延伸到未来,从而对未来的业务收益、存货要求、业务增长及其它情况进行预测。
4. 前端展现
来自前端的挑战主要是应用的形式,目前常用的前端展现工具或多或少都有不尽人意之处,如果只是停留在直接使用某一工具的层次上,很难做出一个令人满意的系统,一定要根据实际需要来定制。具体的说,在保留固定报表、OLAP分析、EIS查询的基础上,增加信息主动推送的应用,以往系统之所以可用性不高与应用形式有很大关系,在信息量很大的情况下查找的方式的确非常枯燥,而将满足一定条件的信息主动推送到管理者面前确是非常好的主意,实践中也证明了此法可行,简洁实用。商业智能系统的前端展现层无疑是最为活跃的领域,在这一层面有数十家工具软件,完成了Web展示界面的开发工作。
Cognos联机分析工具不但具有丰富的统计分析表现和报表制作、分发功能,还为统计分析用户提供了强大的WEB在线的统计分析操作,并对整个企业的统计分析用户进行集中的权限管理,因此可以实现真正的零客户端管理。
4.1 多维分析工具Powerplay
从不同的角度来审视业务数据,每一个分析的角度可以叫作一个维,因此,我们把多角度分析方式称为多维分析。在线多维分析(OLAP)工具的主要功能,是根据用户常用的多种分析角度,事先计算好一些辅助结构,以便在查询时能尽快抽取到所要的记录,并快速地从一维转变到另一维,将不同角度的信息以数字、直方图、饼图、曲线等等方式展现在您面前。
Cognos PowerPlay是全球领先的业务智能工具,是企业的OLAP(在线分析处理)解决方案。 PowerPlay以用户理解业务的方式表达和展现企业数据,其中应用于企业决策的多维分析,让每个人都能够访问企业数据,从而更有效地管理业务。其结构参见下图
4.1.1 PowerPlay的主要特点:
n 高效的OLAP分析与报表:利用PowerPlay,可以从任意角度迅速探察数据,并创建和分发动态报表,大大的提高了管理者和决策者跟踪、管理、改进业务运作的能力。
n 强有力的立方体创建: PowerPlay把从各类数据源中筛选出来的有效信息,创建成称为PowerCube的多维结构的立方体,并可同时保持数据的高度压缩----因此立方体易于分发和更新。
n 灵活的部署能力: PowerPlay Enterprise Server是面向Web、Windows和Excel用户、可扩展的单OLAP应用服务器。它支持混合的硬件环境,在UNIX和NT上都可以运行。
n PowerPlay能分析和探察第三方的多维立方体。这些立方体可以是OLAP Server,或Oracle或Sybase数据库服务器上的一个数据库指针。 PowerPlay读取一个指针和读取一个立方体的方法相同。
4.1.2 PowerPlay的主要组成:
Transformer(数据转换器):用于定义PowerPlay的应用,建立多维数据以及生成PowerCube。
PowerCube:采用多维分析的在线分析技术(OLAP),将数据构造成的多维数据结构。
PowerPlay Enterprise Server:能够快速探察业务信息,并基于PowerCube建立功能强大的自定义报表。
a.Transformer ——数据转换器
Transformer是PowerPlay中一个重要的组件,也是一个OLAP服务器。主要用来创建模型,帮助你组织数据,将不同数据源的数据整合到PowerCube当中,形成多维数据源。根据生成好的PowerCube,可创建各种报表,比较数据和发现业务发展趋势。通过Transformer,可以设置从Cube到Cube的钻取,也可设置钻取到其它的PowerPlay报表,可以为用户提供合适层次的数据展现。
b. PowerCube
PowerCube是由Transformer创建,并供PowerPlay应用的一个多维数据包。 对PowerCube的任何修改必须在Transformer中进行。每个PowerCube由于其维度结构的不同而有所不同。例如一个由人力资源部门创建的PowerCube,可能会包含这样一些维度:时间、社团、工作组、薪金级别、职务和服务时间。
PowerPlay能分析和探察第三方的多维立方体。这些立方体可以是OLAP Server,或象Oracle或Sybase数据库服务器上的一个数据库指针。 PowerPlay读取一个指针和读取一个立方体的方法相同。
PowerCube是由元数据和值数据(Metadata&Values-data)组成:
元数据是PowerCube中关于值数据的数据
值数据是可视数据,如:维度、层和类别
c. PowerPlay Enterprise Server
1. PowerPlay Enterprise Server及其相关组件的系统架构
PowerPlay Enterprise Server由若干个组件组成,其逻辑结构如下图所示:
2. PowerPlay Enterprise Server的组件
1) PowerPlay Gateway
PowerPlay gateway组件是一个处理web请求的CGI(Common Gateway Interface)程序。PowerPlay gateway必须安装在所有接收PowerPlay请求的web服务器上。当一个请求被接收时,PowerPlay gateway会生成一个instance去处理该请求。
2) PowerPlay Dispatcher
PowerPlay dispatcher组件从Windows客户端或web客户端接收PowerPlay请求,PowerPlay dispatcher管理请求队列和将请求传递到当前机器的query processor或report processor,或者传递到另一台机器的PowerPlay dispatcher。
3) PowerPlay Query Processor和Report Processor
Query processor组件为全部的PowerPlay请求生成结果。假如请求返回给PowerPlay Web Explorer,结果会以HTML的形式返回给客户的浏览器;假如请求返回给PowerPlay Web Viewer,report processor就会继续下面的工作。Report processor会将portable report文件(.ppx)中存放的附加在报表上的格式化信息应用到query processor生成的结果上,并将其转换成一份高质量的PDF报表,返回给客户的浏览器。
4) Upfront Gateway
Upfront gateway组件是一个从web浏览器接收请求的CGI(Common Gateway Interface)程序。Upfront gateway决定每一个请求被传递到哪个Upfront server。每一个Upfront server必须安装在带有web服务器的机器上。
5) Upfront Server
Upfront server处理维护和呈现NewsIndex的请求。每一个Upfront server包括一个dispatcher,dispatcher用来管理请求队列和传递请求到Upfront server。
6) Upfront Data Store
Upfront Data Store是一个存放NewsBoxes和NewsItems资源信息的数据库。
7) Ticket Server
当每一次用户登陆时,ticket server会发放ticket。Ticket有两个作用,一个是记录用户的登陆信息,另一个是当用户的浏览器空闲时,ticket用来控制用户可以保持签到状态多长时间。这样,用户可以访问多个Cognos产品的web应用而无需多次输入验证信息。
8) Common Logon Server
Common Logon Server用来在Windows环境(即client/server方式)下保存用户的签到信息,这样,用户在Cognos多个产品和组件中切换时,不需要多次输入签到信息。这个组件集成在Access Manager中。
9) Administration Tools
Administration Tools是让管理员维护和管理Cognos组件的一组应用程序。这些工具让管理员管理PowerPlay Enterprise Server、Upfront Server、Ticket Server和directory server里的安全信息。这些管理工具包括:
PowerPlay Enterprise – Server Administration
Upfront – Server Administration
Access Manager – Administration
Ticket Server – Administration
4.1.3 PowerPlay 应用开发过程
PowerPlay 应用开发过程的流程图如下图:
计划维度和度量
生成 PowerCube
获取需求数据
开发 PowerPlay 模型
用PowerPlay探察 PowerCube 数据
4.2 企业报表 ReportNet
ReportNet是COGNOS公司推出的最新一代企业报表平台,其设计和构架采用了最新的技术和标准,是企业建立报表标准的最合适的产品。ReportNet的构架具有非常好的可伸缩性和可扩展性,其结构参见下图:
4.2.1、ReportNet的主要特点
以下简要列举ReportNet 1.1 的特性。
1. 可伸缩性
n 真正的三层构架,支持Web Services
n 支持多CPU和最广泛的系统平台:包括Windows, HP UX, IBM AIX和SUN Solaris。
n 松耦合的服务组件
n 集中式内容管理
n 报表分页功能(report bursting):把连续的表格或打印输出文件分成单独的页
n 充分发挥已有构架的优势
n 负载均衡
n 单一报表环境,多语言报表发布
n 适应性强的报表:很方便、快速的报表创建、维护和部署,被用户广泛采纳
n 个性化报表:一个报表定义能处理多种用户需求,包括界面语言、格式、发布形式
2. 高可用性
n 集中的内容管理减少了数据库的重复和备份工作,不需要同步,同时更加安全
3. 开放性
n 支持异构数据源,提供一致的业务视图
n 支持各种流行的数据源:所有关系型数据库, XML, 多维数据仓库
n 灵活的安全性:认证,授权和加密
n 易于集成
n SDK API
n 提供对任何编程语言支持:
n ReportNet SDK 发布成WSDL格式
n WSDL可以直接在Microsoft.Net环境中部署
n ReportNet可以发布JAR包到Java环境
n ReportNet 同时也提供SDK的COM控件,在windows的VB、ASP等开发环境中使用
n 集成业界标准:XML, SOAP, WSDL, HTTP
n 报表的定义和元数据以XML格式保存
n 能从流行的数据源中导入/导出数据
4. 灵活性
n 数据表现和获取分离
n 影响分析:在提交报表的更新前自动评估更新的影响
n 抽象数据层:防止对数据源的变更
n 动态数据源重定向:从测试到生产环境或宿主机的环境
n 元数据版本控制:SourceSafe
n 一次创建,多种语言发布
n 静态和动态的报表尺寸调整,适应精确象素的报表和动态报表
n 针对风格、布局、和设备类型设置条件、格式化业务报表
n 改变和增加安全服务提供者
5. 安全性
n 同时支持多种安全机制:LDAP, Active Directory, NTLM, Netegrity, SAP BW及客户自行开发的安全系统
n 可选的内置角色,增加安全性
n 能自动同步用户的邮件设置,便于报表的分页
n 表、行、列的权限设置
n 56位、168位的服务器-客户机、服务器-服务器加密
n 可配置的日志
n 单点登陆-Single Sign On
6. 对主流环境的集成支持
n 数据源:Oracle,DB2,SqlServer等关系数据库以及XML等平面文件,以及多维数据仓库
n 源数据模型:Erwin, Informatica, IBM Cube Views, SAP BW
n 安全系统:LDAP, Active Directory, NTLM, Netegrity, SAP BW 以及客户的其他安全系统
n 应用服务器:IBM WebSphere, BEA Weblogic, SAP NetWeaver
n Web服务器和浏览器
n 硬件平台:
n 开发语言:C++, Java, .NET,VB
7. 对SAP的支持
n 经过SAP认证
n 完全支持SAP BW
n 可集成SAP的安全性
n 支持SAP门户产品
8. 多语言
n UNICODE支持
n 多语言界面
n 多语言内容
n 自动检测主机的语言设置:格式、日期时间、文字换行
n 个性化报表
n 根据个人和浏览器设置的环境配置
9. 高性能
n 非连接的处理模型减少了系统各组件之间的交互
n 针对各种数据库系统的优化:
n SQL99扩展
n 在系统资源有限时自动进行汇总和求和:AutoSum
n 报表分发
n 定期执行、发布同一报表到多种格式
n 随需定制的页面
n PDF输出:52页/秒,>400M每天;分发:4万报表/15分钟,16万报表每小时(4CPU)
并发用户数
平均响应时间(秒)
授权用户数
20
0.99
2,000
40
1.102
4,000
80
3.183
10,000
160
12.49
25,000 to 30,000
(测试环境:4CPU IBM AIX服务器)
10. 更高的生产率
n 更加面向日常的使用,无需进行更多的修改
n Web发布,零维护
n 为异构的数据建立一致的业务视图
n 无须具备SQL、MDX或底层数据库知识就可以编制报表
n 流水线式的报表制作
n 创建在多种语言环境下运行的报表,无须额外的工作
n 在报表之间方便地移动对象
n 针对每张报表进行个性化设置
n 基于任务的界面:支持拖-放对象,和结构化的视图设计
n 协同的报表编辑:可以在有数据和无数据的情况下设计,实现查询后再设计表现,或是相反
n 完全的一次成型:到Web、打印机和邮件系统;创建一次,在多种语言环境中使用;无须手工同步邮件和安全信息
n 无须编程
n 可重用的组件
11. 易于部署
n 基于Web,无需控件:ActiveX或Java
n 与SAP和IBM门户无缝集成
n 压缩的发布包
n 系统管理和代理管理
4.2.2、ReportNet 的整体框架结构
整个ReportNet系统是由其各个组件通过分布式的结构来搭建起来的。采用分布式结构可以实现系统的可升级性,健壮性以及容易集成等特性。
ReportNet的组件一般可以分布在一个三层的结构里面:
Web server tier : Web服务器层
Application tier:应用层
Data tier:数据层
1. ReportNet用户界面层
ReportNet用户界面层包括有Cognos Connection, Report Studio, Query Studio和Framework Manager.
Cognos Connection是一
展开阅读全文