1、统计分析系统设计文档统计分析系统V1.0设计说明书中科软科技股份有限公司17:18目 录第一章 前言1.1 编写目的1.2 背景说明1。3 项目范围1.4 读者对象1。5 术语和缩写词1.6 系统目标1。6。1 建立数据平台1。6。2 建立应用平台1.6。3 建立指标体系1.7 发送对象第二章 整体规划2。1 总体逻辑架构2。1.1 源数据2.1。2 数据导入2。1。3 数据平台2。1。4 BI工具2.1.5 应用平台2。1。6 标准平台2.2 设计原则2.2。1 整体性整体规划2。2.2 延续性分步实施2。2。3 高起点、快建设、高回报第三章 技术方案3。1 技术架构3。2 源数据3。3 数
2、据导入3。4 数据存储3.5 数据访问3.6 用户及权限第四章 应用方案4。1 用户角色4。1。1 岗位4。2 应用举例4。2。1 承保报表举例4。2。2 清单报表举例4。2.3 理赔报表举例第五章 指标体系建设第六章 系统软硬件配置6。1 系统硬件配置6。2 系统软件配置6。2。1 数据库软件6。2.2 ETL软件6。2.3 BI报表软件6。2。4 WEB应用服务器软件6。2.5 系统门户软件6.2。6 指标体系管理软件6.3 系统配置推荐清单中科软 保密文件III统计分析系统设计文档第一章 前言1.1 编写目的本文档将描述统计分析系统的总体设计实施方案,该方案将为评估和选择技术产品提供依据
3、,为最终形成一个高度集成的可运行系统奠定基础。该文档建立在了解保险公司现有信息系统结构的基础上,描述统计分析系统的基本轮廓,对系统的软硬件结构、实施步骤进行了说明。1.2 背景说明1.3 项目范围1.4 读者对象本文档主要针对系统开发人员,甲方业务及IT人员.1.5 术语和缩写词名词和缩略语解释1.6 系统目标1.6.1 建立数据平台本系统最终将建成数据收集、数据存储、数据利用一体化的数据平台,为统计分析应用以及其它数据应用系统提供数据支持。1.6.2 建立应用平台建立统计分析系统的应用平台是本项目的另一个重要目标,用来支持未来的各种统计分析数据应用,如承保报表、承保清单、理赔报表等等.1.6
4、.3 建立指标体系经营管理指标是保险公司用以评估日常经营情况的重要依据。由于岗位职能、业务目标的不同,使得公司范围内各层次用户分析、管理角度存在差异.这种差异通常会在公司范围内产生大量的歧义指标和不一致的统计标准。系统的建立客观上需要跨越各部门的纵向划分,制定全公司统一的经营管理指标体系。1.7 发送对象本文档将发布给以下人员: 保险公司相关人员 中科软相关人员第二章 整体规划2.1 总体逻辑架构中科软建议的统计分析系统整体逻辑架构如上图所示.整体架构主要由以下几部分组成,即:数据源,数据导入,数据平台,BI工具,应用平台,统一标准平台。2.1.1 源数据源数据指目前正在运行的各种业务系统数据
5、和一些外部数据,包括核心业务系统、收付费系统和财务系统等系统的数据.2.1.2 数据导入主要完成源数据向数据平台的抽取、传输、转换和加载,这个过程也叫ETL处理,需要配备ETL服务器完成数据抽取、转换和加载工作。由于各源系统业务处理周期和方式的不同,导致各种源数据的更新周期和方式有较大的差异。数据采集层必须能够适应和满足这些变化和需求,保证数据及时、正确、完整地进入数据库。2.1.3 数据平台作为统计分析系统的核心,它存储和管理来自各种源数据系统的数据,并为访问用户提供数据服务。这些数据是按照数据模型分主题进行组织、重构和存放的,包括当前数据和较长期的历史数据.根据数据的分布和粒度粗细,分为O
6、DS、MID、APP层.2.1.4 BI工具在数据平台的基础上,通过BI工具可以快速地生成固定格式报表、灵活动态查询、OLAP分析、图形分析等应用。2.1.5 应用平台提供承保报表、承保清单、理赔清单、信息披露等不同业务应用。应用功能根据保险公司的经营现状和管理热点逐步的细化和开发。2.1.6 标准平台标准平台是统计分析应用的基础,包括代码的标准化,维度的标准化,指标的标准化,流程的标准化等。2.2 设计原则2.2.1 整体性整体规划统计分析系统中存储着大量的客户基本信息、保单信息、财务信息等,这些对于来说,都是巨大的财富。系统建成以后,将形成一个统一的数据应用平台,将在全公司范围内使用.因此
7、,其规划和实施都应该在总公司的统一规划、部署和指导下具体实现,系统的整体性必须得以保证。2.2.2 延续性分步实施统计分析系统是为公司经营管理服务的信息系统,随着公司经营管理的逐步细化和管理热点的动态转变,统计分析系统的功能也随之逐步转换和深入,统计分析系统的建设是一个长期复杂的过程,持续时间会很长。因此在系统的建设过程中,需采用“整体规划、分步实施”的策略,在系统的整体框架下系统开发投产能够分阶段地进行,并保持各阶段工作的连续性和可继承性。这就要求不论是系统的整体规划、体系结构设计、应用规划还是平台的选择、人员的配备都应考虑到项目的连续性和可持续发展性。2.2.3 高起点、快建设、高回报将保
8、险行业已经成功实施的成熟的报表数据模型、分发管理、口径管理等体系,经过少量修改,直接应用在的系统中,这样既节省了系统建设成本,又能够快速满足大多数的管理需求。第三章 技术方案3.1 技术架构统计分析系统的整体技术架构如下:整个体系架构中主要设计源数据、数据导入、数据存储、数据访问等方面。3.2 源数据源数据指目前正在运行的各种业务系统数据和一些外部数据,包括核心业务系统、收付费系统和财务系统等系统的数据。核心业务系统等生产系统对系统的性能要求很高,而统计分析系统的数据访问通常是大量且成本较大的访问,为了保证生产系统的性能与安全,建议在生产系统的基础上建立同步的备份数据库,统计分析系统以备份数据
9、库作为数据源,通过备份数据库将生产库与统计系统进行有效隔离,保证数据的安全性和高性能。生产数据库备份数据库统计数据库3.3 数据导入主要完成源数据向统计数据平台的抽取、传输、转换和加载,这个过程也叫ETL处理。数据导入提供对数据的流动和控制的程序及服务,从而将数据装载进统计数据库。如下图所示:ETL可以采用自主研发,也可以采用成熟的ETL工具完成。3.4 数据存储统计分析系统的数据存储不同于操作型的核心业务系统,数据的存贮方式、数据库结构都有所不同。需要按照业务管理主题对原数据进行重新的整合。通常的统计分析系统的数据存储模型框架如下:3.5 数据访问统计分析系统通常的访问方式有以下几种:联机查
10、询访问、统计报表访问、OLAP访问、操作型访问。联机查询访问:例如查询业务清单,明细数据,需要实时访问统计分析数据库。统计报表访问:例如查看保费计划情况等统计报表,统计报表通常事先已经生成完毕,具有固定的格式。OLAP访问:通过OLAP工具对事先生成的多维分析数据进行动态访问,查找、分析业务问题.操作型访问:为完成特定的管理应用,通过操作型功能与统计分析系统进行交互,类似于业务系统,例如准备金评估等。统计分析系统通常使用前端工具来完成数据的访问工作,已满足高效率和多样性。3.6 用户及权限统计分析系统的用户及权限管理如下图所示:每个使用统计分析系统地员工将被赋予一个或多个角色,每个角色将被赋予
11、若干功能权限,这样不同的角色进入统计分析系统将只能看到并使用设置给他的功能。对于数据管理的权限,将在统计分析系统的内部进行约束,不同机构层级的员工将被约束,例如某中支公司的员工将无法看到其他中支公司的数据.第四章 应用方案4.1 用户角色用户角色是指使用统计分析系统的人员,分为以下几种类型。4.1.1 岗位4.1.1.1 统计岗具有统计系统权限的用户。理赔统计人员可查看理赔相关报表和清单。承保统计人员可查看承保相关报表和清单.财务统计人员可查看财务相关报表和清单。4.2 应用举例以下是建议统计分析系统的部分应用,具体需求还需要在需求分析阶段和业务部门做进一步分析确认。4.2.1 承保报表举例可
12、通过设置查询条件直接查看。可导出Excel报表查看:4.2.2 清单报表举例n 承保清单第一步:选择查询条件第二步:查看结果清单第三步:可导出到查看4.2.3 理赔报表举例如下列例子所示:第五章 指标体系建设统一的指标体系可以消除各个数据使用者之间可能产生的歧义,达到企业范围内的最佳秩序。中科软科技通过多年来在保险统计分析领域的经验积累,已经拥有一了套完整的统计分析指标体系.该体系不但经过了保险行业内众多的实际案例的检验,也完全与保监会、保标委等管理机构下发的指标体系兼容,在统计分析系统项目中,可以在中科软科技提供的指标体系的基础上稍作本地化,就可以投入使用,可以大大的缩短指标体系的建设过程。
13、一下为指标体系中的指标举例:详细请参加数据字典第六章 系统软硬件配置6.1 系统硬件配置建议的第一期统计分析系统的物理拓扑结构如上图所示.BI数据库:存放统计分析数据,为保证不相互影响,需要和业务系统数据库分离。ETL服务器:负责ETL,完成数据的抽取、转换和加载。BI服务器:负责统计分析报表生成和统计分析应用展示。在后期应用逐步增加时,为平衡性能,将BI服务器逐渐拆分为:报表服务器,应用服务器。6.2 系统软件配置需要的软件配置如下:6.2.1 数据库软件存储统计分析系统数据.6.2.2 ETL软件将业务系统等数据源数据经过转换,加载到统计分析数据库中。6.2.3 BI报表软件生成台帐清单、
14、固定报表、多维分析报表等各种统计分析应用。6.2.4 WEB应用服务器软件提供统计分析系统的运行环境。通常为weblogic 或websphere或jboss等。6.2.5 系统门户软件提供统一的访问路径和权限管理。6.2.6 指标体系管理软件提供指标体系管理、代码集管理。6.3 系统配置推荐清单1、第三方软件产品一览表序号产品名称推荐配置数量1数据库引擎及其管理软件ORACLE 10g12BI/OLAP/报表工具软件Mondrian13Web应用服务器BEA WebLogic或jboss11、自有产品一览表序号产品名称推荐配置数量1BI数据模型Sinosoft IDM 3.012ETL工具SinoSoft Data Integrator13系统门户Sinosoft Portal 2。014指标体系管理SinoSoft Metadata ManagementTool1.013、硬件产品一览表序号硬件名称厂商配置简述数量1数据库服务器IBM或同类设备PC服务器:4 CPU, 8GB Memory 12ETL服务器IBM或同类设备PC服务器:2 CPU, 4GB Memory ,13应用服务器IBM或同类设备PC服务器:4 CPU, 8GB Memory ,14数据存储第一期100G存储空间100G中科软 保密文件