1、企业数字化转型规划设计目录CONTENTS1企业数字化转型建设背景2企业数字化转型需求分析3企业数字化转型顶层设计4企业数字化转型业务应用5企业数字化转型未来展望1企业数字化转型建设背景PartPage4企业数字化转型建设背景综合化经营提供包括企业、证券、信托、保险等及非企业服务在内的、全方位、专业化、个性化、多元化的综合企业服务互联网企业战略PC端向移动端转化趋势明显,互联网企业向移动互联网企业转变,移动先行战略呈现移动化、社交化、平台化、开放化、产业化的发展趋势,以泛在、跨界、聚合、智慧为发展方向,以用户体验和用户价值为中心,全面融入到企业价值链各个环节和个人衣食住行玩等生活场景中,企业服
2、务无处不在以移动支付、大数据应用为核心,向电商、O2O、P2P等拓展,围绕互联网生态体系,持续推进产品创新、客户体验创新和商业模式创新客户深耕:“主办企业”、“伙伴企业”、“社区企业”、“县域企业”渠道创新:“移动企业”、“社交企业”、“智慧企业”产品差异:“专业化企业”、“全能企业”、“不仅是企业”管理转型科技引领创新成立互联网企业实验室、大数据分析中心,通过组织创新推动新技术创新通过生物识别技术、互联网、移动支付、大数据、云计算、智能可穿戴设备等技术的创新应用,迅速加强客户洞察、全渠道协同、精准营销、线上线下协同、信用评估、风险监控等可持续业务创新的能力建设业务转型创新优化业务结构,变粗放
3、型发展为集约化经营,实现向轻资产、轻资本的表外业务拓展发展资产管理、投资企业、资产托管等市场化业务,从传统企业变身为数据分析者、撮合交易者和财富管理者服务国家战略,服务实体经济营销精准化、管理精细化、决策科学化运营集约化、自动化运营集约化、自动化组织扁平化、团队专业化差异化、特色化经营123456Page5企业数字化转型建设背景Page6企业数字化转型建设背景Page7企业数字化转型建设背景Page8企业数字化转型建设背景Page9企业数字化转型建设背景中国P2P模式纯线上模式线下模式线上线下结合O2O模式P2P公司已接近2000家,市场规模约0.2万亿元,在整个融资体系中占比还非常小借款客户
4、主要以中小企业客户为主,个人贷款客户少纯线上模式少,多以线上线下结合,投资端以线上为主,资产端以线下为主,营销、运营成本高贷款利率高,信息不透明,纯线上大数据风控技术不成熟,信用风险较大,平台风险与收益不对等企业直接进入P2P比较少,主要是监管政策不明确,但已有不少企业与P2P公司合作,布局P2P现状往行业垂直细分领域发展,提供特色化、专业化服务与供应链企业融合,实现产融结合;向交易撮合平台、信息中介平台、综合化网络理财平台等综合性平台方向发展随着监管政策明确,企业会快速进入P2P,以企业信用优势给P2P行业带来快速发展机会企业拓展与P2P公司合作范围:客户推荐、信息共享、风险评估、资金托管、
5、资金流监控、贷款催收、资产保全、委托贷款等全方位合作企业自营或共营方式建立P2P平台:客户自助信用评估授信;社交信用评估(社交授信、熟人授信);社交信用隐性担保增信;熟人信用显性担保增信;跟投贷款、领投贷款模式创新发展趋势Page10企业数字化转型建设背景Page11企业数字化转型建设背景Page12企业数字化转型建设背景Page13企业数字化转型建设背景Page14消费企业管理分析类应用建设现状基本分析关注的内容关注的内容关注的内容关注的内容存在的问题存在的问题存在的问题存在的问题基本的现状基本的现状基本的现状基本的现状l商城数据仓库累积数据没有充分利用商城数据仓库累积数据没有充分利用l缺乏
6、面向整个消费企业的统一、完整缺乏面向整个消费企业的统一、完整的数据视图;的数据视图;l缺乏支撑消费企业日常业务运转的风缺乏支撑消费企业日常业务运转的风险评估体系;险评估体系;l缺乏消费企业客户缺乏消费企业客户360360度视图,客户度视图,客户行为分析和预测无法实现;行为分析和预测无法实现;l缺乏面向企业业务运营管理的关键绩缺乏面向企业业务运营管理的关键绩效指标体系;效指标体系;ll商城已建立面向整个零售业务的数据商城已建立面向整个零售业务的数据仓库,整合了前台业务运营数据和后仓库,整合了前台业务运营数据和后台管理数据,建立了面向零售的管理台管理数据,建立了面向零售的管理分析应用;分析应用;l
7、消费企业已开展供应链企业、人人贷消费企业已开展供应链企业、人人贷和保理等多种业务,积累了一定量的和保理等多种业务,积累了一定量的业务数据,同时业务人员也从客户管业务数据,同时业务人员也从客户管理、风险评级和经营规模预测等方面,理、风险评级和经营规模预测等方面,提出了大量分析预测需求;提出了大量分析预测需求;l数据平台、数据应用、数据管控数据平台、数据应用、数据管控数据平台、数据应用、数据管控数据平台、数据应用、数据管控基础数据平台和基础数据平台和基础数据平台和基础数据平台和BIBIBIBI应用建设是未来一段时间的重点!应用建设是未来一段时间的重点!应用建设是未来一段时间的重点!应用建设是未来一
8、段时间的重点!l数据平台整体架构;数据平台整体架构;l数据平台各层建设的标准;数据平台各层建设的标准;l较成熟的企业业数据模型;较成熟的企业业数据模型;l数据质量治理;数据质量治理;l元数据管理;元数据管理;l数据标准建设数据标准建设l数据整合;数据整合;l数据应用建设;数据应用建设;l数据平台的软硬环境数据平台的软硬环境lPage15企业数字化转型建设目标外部非结构化数据统一制定目标和分析模型统一划分分析主题统一设计数据模式统一规划分析方法统一部署技术基础统一定义BI应用自定义报表工具自定义报表工具行列的简单定义方式行列的简单定义方式多种格式报表多种格式报表集团集团决策层决策层集团集团职能管
9、控层职能管控层各级业务操作层各级业务操作层关注关注集团集团主主要经营指标要经营指标业务人员使用业务人员使用BIBI应用应用实现业务协作和创新实现业务协作和创新BIBI分析工具分析工具供应链企业系统POP系统其他业务系统云数据推送平台已实现了主要零售及企业业务系统数据清洗、整合,为未来消费企业数据平台提供了丰富的数据源。通过数据平台和BI应用建设,消费企业将搭建统一的大数据共享和分析平台,对各类业务进行前瞻性预测及分析,为集团各层次用户提供统一的决策分析支持,提升数据共享与流转能力采购管理系统查看职能部门的查看职能部门的业务经营情况业务经营情况Page16企业数字化转型建设预期收益2.2.加强业
10、务协作加强业务协作实现分散在供应链企业、人人贷、保理等各个业务系统中的数据在数据平台中的集中和整合,建立单一的产品、客户等数据的企业级视图,有效促进业务的集成和协作,并为企业级分析、交叉销售提供基础3.3.促进业务创新促进业务创新消费企业业务人员可以基于明细、可信的数据,进行多维分析和数据挖掘,为企业业务创新(客户服务创新、产品创新等)创造了有利条件4.4.提升建设效率提升建设效率通过数据平台对数据进行集中,为管理分析、挖掘预测类等系统提供一致的数据基础,改变现有系统数据来源多、数据处理复杂的现状,实现应用系统建设模式的转变,提升相关IT系统的建设和运行效率5.5.改善改善数据质量数据质量从中
11、长期看,数据仓库对消费企业分散在各个业务系统中的数据整合、清洗,有助于企业整体数据质量的改善,提高的数据的实用性通过数据平台实现数据集中,确保消费企业各级部门均可在保证数据隐私和安全的前提下使用数据,充分发挥数据作为企业重要资产的业务价值1.1.实现数据共享实现数据共享2企业数字化转型需求分析PartPage18企业数字化转型总体架构历史数据查询数据交换平台应用集市数据区商城零售供应链企业人人贷系统基金系统系统企业内外部半结构化、非结构化数据大数据交换组件数据库数据交换组件数据区数据交换组件数据计算层大数据区沙盘演练数据区数据应用层实时数据区客户主题协议主题产品主题业务沙盘演练数据增值产品零售
12、数据供应链数据增值产品数据区主题数据区用户访问层客户汇总账户汇总机构汇总社交媒体移动互联用户评价访问日志处理后大数据待处理大数据流程调度监控告警数据标准数据质量元数据数据安全流程调度平台数据管控平台流程调度层数据管控层数据产生层数据交换层实时数据查询客户管理财务管理外部用户贴源数据区内部管理分析内部用户历史归档数据区IT人员风险管理Page19企业数字化转型总体架构数据产生层l内部业务系统产生的结构化数据内部业务系统产生的结构化数据v商城日常零售业务处理过程中产生的结构化数据,存储在关系型数据库中,如:供应商信息、采购信息、商品信息、销售流水商城日常零售业务处理过程中产生的结构化数据,存储在关
13、系型数据库中,如:供应商信息、采购信息、商品信息、销售流水v消费企业日常业务处理过程中产生的结构化数据,存储在关系型数据库中,如:客户信息、账户信息、企业产品信息、交易流水消费企业日常业务处理过程中产生的结构化数据,存储在关系型数据库中,如:客户信息、账户信息、企业产品信息、交易流水l企业内部非结构化数据企业内部非结构化数据v日常业务处理过程中产生的非结构化数据,存储形式多样,主要包括用户访问日志、用户投诉、用户点评日常业务处理过程中产生的非结构化数据,存储形式多样,主要包括用户访问日志、用户投诉、用户点评l企业外部数据企业外部数据v企业外部数据以非结构化为主,主要包括国家政策法规、论坛等互联
14、网信息、地理位置等移动信息、微博等社交媒体信息企业外部数据以非结构化为主,主要包括国家政策法规、论坛等互联网信息、地理位置等移动信息、微博等社交媒体信息源数据内容源数据内容l在本次项目实施中将采用以增量为主、全量为辅结合的方式获取源数据在本次项目实施中将采用以增量为主、全量为辅结合的方式获取源数据l商城和消费企业业务系统的数据商城和消费企业业务系统的数据v增量数据识别、获取由云数据推送平台负责,增量数据识别、获取由云数据推送平台负责,云数据推送平台采用云数据推送平台采用分析、对比源系统日志方式实现分析、对比源系统日志方式实现v对于无法通过上述方式获取增量的源系统数据对于无法通过上述方式获取增量
15、的源系统数据,则采用某一个时间范围内的全部数据作为增量,则采用某一个时间范围内的全部数据作为增量v初始数据加载均采用全量模式初始数据加载均采用全量模式源数据增量源数据增量Page20企业数字化转型总体架构数据交换层数据交换层设计目标数据交换层设计目标传输组件是根据数据源存储的不同分类而设计的,本质是通过分析数据存储结构和数据存储库的特点来针对性的设计工具,以追求卓越的性能保证数据在平台内高速流转高速流转保证数据交换过程中不失真不失真保证数据交换过程中不丢失不丢失保证数据交换过程安全可靠安全可靠数据区数据交换组件数据库数据交换组件大数据交换组件消费企业系统消费企业系统数据服务层外部外部大数大数据
16、据商城系统商城系统Hadoop元数据云数据推送平台云数据推送平台数据平台导入临时区数据平台导出临时区NAS存储ETL程序区Page21企业数字化转型总体架构数据交换层NAS存储HadoopHadoop集群元数集群元数据据区区数据平台数据平台ETLETL数据数据处理程序区处理程序区数据平台临时数数据平台临时数据区据区存储数据平台各个Hadoop集群的元数据信息,如:HDFS文件系统元数据集团数据交换平台每日获取运输局推送平台提供的业务系统变化数据,暂存在NAS临时数据区企业数据平台加工计算结果返回给业务系统,暂存在NAS临时数据区数据平台ETL加工处理程序(数据压缩、数据加载、各数据数据处理等)
17、统一存储在NAS集群指定目录,各接口服务器通过文件系统Link建立映射Page22企业数字化转型总体架构数据交换层大数据交换组件l企业内部非结构化、企业内部非结构化、半结构化数据,如:半结构化数据,如:音频、视频、邮件、音频、视频、邮件、OfficeOffice文档、抵押文档、抵押品扫描件等品扫描件等l企业外部非结构化、企业外部非结构化、半结构化数据,如:半结构化数据,如:微博、贴吧、论坛、微博、贴吧、论坛、用户点击流、用户用户点击流、用户移动位置等移动位置等l批量采集:大数据批量采集:大数据源以源以SFTPSFTP协议批量协议批量传输数据传输数据文件文件l在线访问:开发在线访问:开发Java
18、Java或或C C应用,调用应用,调用大据源大据源APIAPI,或以网,或以网络平台爬虫方式抓络平台爬虫方式抓取源系统非结构化、取源系统非结构化、半结构化数据半结构化数据l组件以实时和批量组件以实时和批量两种模式实现下列两种模式实现下列功能:功能:v数据采集数据采集v数据传输到数据交换数据传输到数据交换平台(接口服务器)平台(接口服务器)NASNAS指定目录指定目录v存储数据到数据平台存储数据到数据平台大数据区指定大数据区指定HDFSHDFS目目录录l定时抽取用户访问定时抽取用户访问日志,加载到数据日志,加载到数据平台大数据区平台大数据区HDFSHDFS指定目录,指定目录,MRMR程序程序加工
19、处理加工处理l开发网络爬虫程序,开发网络爬虫程序,扫描用户微博,抓扫描用户微博,抓取用户微博内容,取用户微博内容,社交圈信息,存入社交圈信息,存入大数据区大数据区处理对象处理对象实现技术实现技术实现功能实现功能应用场景应用场景Page23企业数字化转型总体架构流程调度层批量处理流程l批量数据处理由流程调度层部署的批量数据处理由流程调度层部署的自定义开发自定义开发WorkFlowWorkFlow组件调度运行组件调度运行l整个流程主要完成如下工作:整个流程主要完成如下工作:1.1.获取业务系统结构化数据,存获取业务系统结构化数据,存入临时数据区入临时数据区2.2.获取企业内外部非结构化数据,获取企
20、业内外部非结构化数据,并进行结构化处理,存入主题并进行结构化处理,存入主题或集市数据区或集市数据区3.3.按照贴源数据模型整合数据按照贴源数据模型整合数据(标准化、数据更新(标准化、数据更新/追加)追加)4.4.按照主题数据模型整合数据并按照主题数据模型整合数据并生成汇总生成汇总5.5.数据加工计算后,结果交付到数据加工计算后,结果交付到数据集市,支持分析类应用数据集市,支持分析类应用Page24企业数字化转型总体架构流程调度层实时数据处理流程l实时数据处理强调的是实时或准实时获实时数据处理强调的是实时或准实时获取并处理数据,通常采取消息队列等技取并处理数据,通常采取消息队列等技术构建术构建“
21、数据流数据流”l整个处理流程由流程调度层部署的自定整个处理流程由流程调度层部署的自定义开发义开发WorkFlowWorkFlow组件调度运行组件调度运行l整个流程主要完成如下工作:整个流程主要完成如下工作:1.1.通过数据库数据交换组件获取增量通过数据库数据交换组件获取增量数据,加载到实时数据区数据,加载到实时数据区2.2.通过大数据交换组件获取非结构化通过大数据交换组件获取非结构化数据,并利用数据,并利用StormStorm处理数据,加处理数据,加载到实时数据区载到实时数据区3.3.针对实时数据区数据执行标准化处针对实时数据区数据执行标准化处理和贴源整合理和贴源整合Page25企业数字化转型
22、总体架构数据存储层l业务系统前日增量数据业务系统前日增量数据l缓存数据,支持后续缓存数据,支持后续ELTELT数据处理数据处理数据内容主要用途数据模型保留周期用户访问模式工作负载平台要求l贴源数据模型贴源数据模型l保存最近保存最近7 7天数据天数据l贴源数据区和主题数据区批量作业访问贴源数据区和主题数据区批量作业访问l无最终用户访问无最终用户访问lI/OI/O敏感,连续小批量的数据抽取和加载敏感,连续小批量的数据抽取和加载l少量量数据使用少量量数据使用HiveHive的的LoadLoad命令,大量数据使用命令,大量数据使用MRMR程序程序l与主题区与主题区/贴源区贴源区/集市区构成一个集市区构
23、成一个HadoopHadoop集群(集群(HiveHive)l无单点故障,无单点故障,724724小时小时+非工作日有限停机非工作日有限停机l主题数据区、集市数据区和沙盘演练数据区批量作业访问主题数据区、集市数据区和沙盘演练数据区批量作业访问l无最终用户访问无最终用户访问lI/OI/O敏感,日终批量敏感,日终批量ETLETLl以以ELTELT形式通过形式通过HiveSQLHiveSQL执行执行l与主题区与主题区/贴源区贴源区/集市区构成一个集市区构成一个HadoopHadoop集群(集群(HiveHive)l无单点故障,无单点故障,724724小时小时+非工作日有限停机非工作日有限停机l贴源数
24、据模型贴源数据模型l不保存历史不保存历史l业务系统前日快照数据和一段时间的流水数据业务系统前日快照数据和一段时间的流水数据l数据标准化,为后续主题模型、集市和沙盘演练提供数据数据标准化,为后续主题模型、集市和沙盘演练提供数据临时数据区贴源数据区Page26企业数字化转型总体架构数据存储层(续)l企业内外部非结构化、半结构化数据企业内外部非结构化、半结构化数据l采集并存储数据,进行结构化处理,最终得到结构化数据采集并存储数据,进行结构化处理,最终得到结构化数据数据内容主要用途数据模型保留周期用户访问模式工作负载平台要求l数据按照数据按照HDFSHDFS文件存储文件存储l建议保留建议保留1 1年年
25、l集市区集市区/沙盘区沙盘区/增值产品区增值产品区/主题区主题区/归档区批量作业访问归档区批量作业访问l少量高级业务人员进行大数据分析少量高级业务人员进行大数据分析lMapReduceMapReduce分布式计算,半分布式计算,半/非结构化数据的结构化处理(包非结构化数据的结构化处理(包括文本检索、语义分词、图像识别、音频识别等)括文本检索、语义分词、图像识别、音频识别等)l与主题区与主题区/贴源区构成一个贴源区构成一个HadoopHadoop集群(集群(HDFSHDFS)l无单点故障,无单点故障,724724小时小时+非工作日有限停机非工作日有限停机l集市区集市区/沙盘区沙盘区/增值产品区增
26、值产品区/主题区主题区/高时效区批量作业访问高时效区批量作业访问l业务人员执行历史数据查询业务人员执行历史数据查询lMapReduceMapReduce分布式计算,分布式计算,HDFSHDFS命令实现命令实现HadoopHadoop集群内归档,集群内归档,SqoopSqoop实现数据库归档,通过实现数据库归档,通过HiveHive提供历史查询提供历史查询l独立的独立的HadoopHadoop集群(集群(HDFS+HiveHDFS+Hive)l无单点故障,无单点故障,724724小时小时+非工作日有限停机非工作日有限停机l数据按照数据按照HDFSHDFS文件存储文件存储l数据文件按照数据区划分目
27、录,建议保留数据文件按照数据区划分目录,建议保留7 7年年l其他各数据区历史数据其他各数据区历史数据l按数据生命周期规划归档平台过期数据,支撑历史数据查询按数据生命周期规划归档平台过期数据,支撑历史数据查询大数据区历史归档数据区Page27企业数字化转型总体架构数据存储层(续)l业务系统历史明细数据业务系统历史明细数据l打破业务条线整合数据打破业务条线整合数据数据内容主要用途数据模型保留周期用户访问模式工作负载可用性要求l第三范式模型第三范式模型l保留长期历史,需要根据主题细化保留长期历史,需要根据主题细化l主题区主题区/集市区集市区/沙盘区沙盘区/增值产品区增值产品区/归档区批量作业访问归档
28、区批量作业访问l少量高级业务人员进行灵活查询、挖掘预测少量高级业务人员进行灵活查询、挖掘预测lI/OI/O敏感,日终批量敏感,日终批量ETLETL(合并、拉链、关联、汇总等等)(合并、拉链、关联、汇总等等)l以以ELTELT形式通过形式通过HiveSQLHiveSQL执行,复杂处理使用执行,复杂处理使用MRMR定制定制UDFUDFl与大数据区与大数据区/贴源区构成一个贴源区构成一个HadoopHadoop集群(集群(HiveHive)l无单点故障,无单点故障,724724小时小时+非工作日有限停机非工作日有限停机l集市区集市区/沙盘区沙盘区/增值产品区增值产品区/归档区批量作业访问归档区批量作
29、业访问l少量高级业务人员进行灵活查询、挖掘预测少量高级业务人员进行灵活查询、挖掘预测lI/OI/O敏感,日终批量敏感,日终批量ETLETL(连接、聚合、汇总等等)(连接、聚合、汇总等等)l以以ELTELT形式通过形式通过HiveSQLHiveSQL执行,复杂处理使用执行,复杂处理使用MRMR定制定制UDFUDFl与大数据区与大数据区/贴源区构成一个贴源区构成一个HadoopHadoop集群(集群(HiveHive)l无单点故障,无单点故障,724724小时小时+非工作日有限停机非工作日有限停机l逆范式宽表逆范式宽表l依赖于集市数据需求依赖于集市数据需求l对主题数据预加工后的结果数据对主题数据预
30、加工后的结果数据l针对应用需求进行数据预连接、预汇总,为集市提供数据针对应用需求进行数据预连接、预汇总,为集市提供数据主题数据区明细主题数据区汇总Page28企业数字化转型总体架构数据存储层(续)l按沙盘演练需求,准备的明细或汇总业务数据按沙盘演练需求,准备的明细或汇总业务数据l为数据科学家的挖掘预测操作提供数据服务为数据科学家的挖掘预测操作提供数据服务数据内容主要用途数据模型保留周期用户访问模式工作负载可用性要求l模型依赖于沙盘演练需求模型依赖于沙盘演练需求l在整个沙盘演练周期内保留在整个沙盘演练周期内保留l集市区集市区/沙盘区沙盘区/归档区批量作业访问归档区批量作业访问l少量高级业务人员进
31、行灵活查询、挖掘预测少量高级业务人员进行灵活查询、挖掘预测lI/OI/O敏感,终批量敏感,终批量ETLETL(合并、拉链、关联、汇总等等)(合并、拉链、关联、汇总等等)l以以ELTELT形式通过形式通过HiveSQLHiveSQL执行,复杂处理使用执行,复杂处理使用MRMR定制定制UDFUDFl独立的独立的HadoopHadoop集群(集群(HDFSHDFS)l无单点故障,无单点故障,724724小时小时+非工作日有限停机非工作日有限停机l沙盘区沙盘区/归档区批量作业访问归档区批量作业访问l决策人员、管理人员、业务人员访问决策人员、管理人员、业务人员访问lI/OI/O敏感型,敏感型,BIBI工
32、具提交的报表、查询、分析工具提交的报表、查询、分析SQLSQL命令和日终命令和日终批量批量ETLETL(汇总、聚集等操作,以(汇总、聚集等操作,以ELTELT形式通过形式通过SQLSQL执行)执行)l基于开放平台的完全无共享基于开放平台的完全无共享MPPMPP数据库集群数据库集群+内存数据库内存数据库l无单点故障,无单点故障,724724小时小时+非工作日有限停机非工作日有限停机l维度数据模型维度数据模型l依赖业务需求依赖业务需求l面向企业内部管理分析类应用需求的汇总数据面向企业内部管理分析类应用需求的汇总数据l为客户、运营等管理分析主题和数据增值产品提供数据服务为客户、运营等管理分析主题和数
33、据增值产品提供数据服务沙盘演练数据区应用集市数据区Page29企业数字化转型总体架构数据存储层(续)l根据外部用户的数据使用需求数据平台加工计算的结果数据根据外部用户的数据使用需求数据平台加工计算的结果数据l为部署在数据平台上的企业内外部增值产品提供数据支持为部署在数据平台上的企业内外部增值产品提供数据支持数据内容主要用途数据模型保留周期用户访问模式工作负载可用性要求l应用模型,依赖于用户业务需求应用模型,依赖于用户业务需求l依赖于依赖于用户业务需求用户业务需求l企业外部人员,如:客户企业外部人员,如:客户l通过自己部署在通过自己部署在PaasPaas平台上的应用访问平台上的应用访问lI/OI
34、/O敏感型,敏感型,BIBI工具提交的报表、查询、分析工具提交的报表、查询、分析SQLSQL命令和日终命令和日终批量批量ETLETL(汇总、聚集等操作,以(汇总、聚集等操作,以ELTELT形式通过形式通过SQLSQL执行)执行)l独立的独立的PaasPaas平台,部署平台,部署HadoopHadoop集群集群l无单点故障,无单点故障,724724小时小时+非工作日有限停机非工作日有限停机l企业业务人员企业业务人员l高时效、高并发、高可靠性的联机交易类查询高时效、高并发、高可靠性的联机交易类查询lCPUCPU敏感,敏感,BIBI工具或业务系统高并发、高时效查询,以及准工具或业务系统高并发、高时效
35、查询,以及准实时连续实时连续ETLETL处理处理+SQL+SQL批量处理批量处理l独立的内存数据库集群独立的内存数据库集群l无单点故障,无单点故障,3652436524小时不停机小时不停机l贴源数据模型贴源数据模型l依赖用户业务需求依赖用户业务需求l面向应用的业务系统快照数据和一段时间的交易流水面向应用的业务系统快照数据和一段时间的交易流水l为实时获准实时分析应用提供数据服务为实时获准实时分析应用提供数据服务增值产品数据区实时数据区Page30企业数字化转型总体架构数据存储层数据流数据集成层数据集成层操作型聚合数据临时数据区实时数据区实时数据区公共汇总数据主题明细数据结构化数据非结构化&半结构
36、化数据沙盘演练数据区沙盘演练数据区实验室数据集市数据区集市数据区POP自营数据贴源数据区贴源数据区企业业务数据主题数据区主题数据区客户管理集市财务管理集市运营管理集市风险管理集市集市大物流系统数据供应链系统数据财务审计数据财务研发数据操作型明细据归档数据区归档数据区大数据区大数据区源系统数据文件贴源数据主题数据集市数据高时效数据大数据增值产品数据区增值产品数据区Page31企业数字化转型总体架构数据应用层大数据大数据平台应用平台应用l针对公检法查询需求、内外部审针对公检法查询需求、内外部审计需求和最终用户的历史交易查计需求和最终用户的历史交易查询需求,以贴源存储的归档数据询需求,以贴源存储的归
37、档数据为基础,实现的查询类应用为基础,实现的查询类应用l历史查询类应用通常使用历史查询类应用通常使用BIBI工具工具或自主开发实现或自主开发实现l客户经理等最终业务人员针对当客户经理等最终业务人员针对当前业务的发生(如:用户交易、前业务的发生(如:用户交易、用户访问日志),进行实时查询、用户访问日志),进行实时查询、分析的应用分析的应用l管理分析类应用主要实现了集团管理分析类应用主要实现了集团客户管理、运营管理、财务管理、客户管理、运营管理、财务管理、风险管理、监管信息披露五大分风险管理、监管信息披露五大分析体系功能析体系功能l管理分析类应用通常采用套装软管理分析类应用通常采用套装软件和件和B
38、IBI工具(工具(MicroStrategyMicroStrategy等)等)实现实现l业务人员根据业务需求或自己对业务人员根据业务需求或自己对业务的理解,设计计算模型,准业务的理解,设计计算模型,准备各类明细或汇总数据,导入模备各类明细或汇总数据,导入模型运算,验证业务结果型运算,验证业务结果l沙盘演练类应用通常使用沙盘演练类应用通常使用R R语言在语言在HadoopHadoop分布式体系下实现分布式体系下实现l消费企业数据科学家根据自己对消费企业数据科学家根据自己对业务需求的理解或者对市场的判业务需求的理解或者对市场的判断,设计并运行模型,发掘数据断,设计并运行模型,发掘数据价值,并封装成
39、商业产品价值,并封装成商业产品l数据增值产品通常采用数据增值产品通常采用R R语言和语言和BIBI工具实现,面向企业内外部用户工具实现,面向企业内外部用户管理分析类应用管理分析类应用1沙盘演练类应用沙盘演练类应用3历史查询类应用历史查询类应用4高时效类分析应用高时效类分析应用5数据增值类产品数据增值类产品2l实时分析类应用通常使用实时分析类应用通常使用CEPCEP、ESBESB等技术实现等技术实现Page32企业数字化转型总体架构平台发展不同阶段对应应用工作负载复杂度大数据平台发展阶段划分操作为主阶段什么正在发生?动态数据仓库阶段让正确的事情发生!分析为主阶段为什么会发生报表为主阶段发生了什么
40、预测为主阶段将会发生什么?批量随机查询数据分析持续更新加载/短查询基于事件的动态触发数据量增长用户数增长查询复杂度增长ETL处理复杂度增长管理分析类应用管理分析类应用历史查询类应用历史查询类应用实时分析类应用实时分析类应用沙盘演练类应用沙盘演练类应用数据增值类产品数据增值类产品Page33企业数字化转型总体架构管理分析类应用r总账分析*资产负债表分析*损益表分析*现金流量表分析*财务指标分析r盈利分析*机构贡献度*产品贡献度*客户细分贡献度*渠道绩效r资产负债分析*主要指标报告,如:净利息收入、净收入、净现值、市场价值等*头寸报告*现金流报告*风险价值(VaR)计算r财务预算与计划*财务预算*
41、财务计划执行监控*执行过程分析*年末财务计划执行分析r预测与场景分析*业务规模预测*收益预测rr领导管理驾驶舱r机构绩效考核r客户经理考核*客户经理工作量评估*客户经理服务客户收益评估r产品绩效考核r业务量考核*供应链企业业务*人人贷业务*保理业务*基金业务*其它中间业务*r渠道成本与收益rr风险监控报表/信息披露*流动性报表*利率敏感性报表*资本充足率报表*r市场风险*市场风险暴露值*流动性管理、利率管理r信用风险*信用风险暴露值计算*信用风险控制(贷前控制、贷中监控、贷后分析)r操作风险*异常交易预警*后督差错检查*r防欺诈/反洗钱*定义欺诈交易模型*可能性欺诈交易预警*欺诈交易分布分析r
42、全面风险管理rr目前监管机构没有明确要求r客户单一视图*公司客户信息管理*个人客户信息管理*同业客户信息管理r目标客户搜索*重点客户*关怀客户*风险客户*异动客户r客户细分*个人客户细分*公司客户细分r客户行为分析*客户轮廓分析*产品交叉销售分析*百分比分析*渠道偏好分析r营销活动管理*营销活动规划*营销活动定义*营销活动执行*营销活动苹果r营销活动自动化*渠道接口与集成*流程自动化r客户管理运营管理财务管理风险管理监管披露示例Page34企业数字化转型总体架构数据访问层l即席查询:即席查询:通过即席查询工具或手工书写SQL语句,完成业务信息的即席查看l多维分析:多维分析:从多个维度灵活组合对
43、目标值进行分析,常见功能包括上下钻取、透明钻取、旋转、分页、层钻、跨维钻取等l主动问题发现:主动问题发现:通过事件触发、规则匹配等方式发现企业运营中的问题,通过手机、邮件等方式报警决策层管理层业务人员即席查询即席查询静态报表静态报表多维分析多维分析仪表盘仪表盘挖掘预测挖掘预测l仪表盘仪表盘:通过仪表盘及其它展现方式对企业关键绩效指标进行展示,为领导层决策提供直观的数据支持l静态静态报表:报表:按照预先定义格式,批处理报表,在线查询报表等lOfficeOffice集成集成:将分析应用嵌入到Office界面中,利用Office的方便、易用特性,降低用户使用难度问题发现问题发现OfficeOffic
44、e集成集成WebWeb服务服务l挖掘挖掘预测预测:使用专业的软件工具,通过数理统计等高级统计分析算法,分析结构化、非结构化数据,通过数据模型去挖掘隐藏在数据中的价值数据科学家业务系统lWebWeb服务服务:将分析应用的功能发布为Web服务,注册在企业服务总线上,供其它业务系统或分析应用调用,获取分析结果多种展现形式满足各层级用户及应用系统使用需求Page35企业数字化转型总体架构数据管控层企业数据管控体系涵盖组织架构、评价与考核、管控流程、管控平台组织架构、评价与考核、管控流程、管控平台四个域。数据标准管理数据质量管理元数据管理工作流管理组织数据与信息标准化委员会数据管理人数据所有人数据生产人
45、数据使用人IT支持团队考核指标责任评价标准执行评价政策执行评价评价标准数据类型数据格式业务分类真实性定义及时性定义完整性定义技术元数据流程评价与考核流程考核指标建立/维护流程标准建立/维护流程组织建立/维护流程评价与考核业务含义一致性定义数据认责平台安全等级权限定义数据停用数据共享数据移动数据存储数据创建业务元数据管理元数据数据全生命周期数据安全管理数据标准数据质量元数据数据安全审计定义保留策略Page36企业数字化转型总体架构数据管控体系内部运转机制管控组织q数据管控委员会q数据所有人q数据认责人qIT支持q管控流程q数据接入流程q数据变更流程q数据授权流程q数据退役流程q标准/政策制定流程
46、q评价考核流程q评价与考核q标准(数据标准、质量要求、安全要求)q遵守标准所需要的政策q政策与标准遵从考评定义qq数据产生者q数据使用者q流程支撑流程支撑制定管控平台工具支撑明确了数据管控过程中的组织结构、角色、职责等。管控组织除了要负责制定数据标准、质量、安全等要求外,还需要负责制定管控的相关流程和评价考核指标等内容。考评制定通过建立一些定性或定量的数据管控评价考核指标,去评估及考核数据相关责任人职责履行情况、数据管控标准及数据政策的执行情况等。规范了数据管控过程中,各个环节日常任务处理的运作模式,例如数据定义如何变更、数据冲突如何协调等。采用专门的技术平台支撑管控流程的自动化,发布管控组织
47、制定的一些相关标准和规范,及时反映管控过程中存在的一些问题等。管控综合管理q标准/规范管理q流程管理q考核仪表盘q元数据管理q业务元数据管理q技术元数据管理q管理元数据分析q数据质量管理q稽核规则管理q数据稽核q质量报告q工具支撑组织架构、评价与考核、管控流程、管控工具组织架构、评价与考核、管控流程、管控工具这四个域相互作用、相互支撑,提供对各信息系统数据的管控。Page37企业数字化转型总体架构数据管控组织l数据管控组织是数据管控体系中最重要的因素,它负责定义和管理业务数据相关标准,制定遵数据管控组织是数据管控体系中最重要的因素,它负责定义和管理业务数据相关标准,制定遵寻标准所必须的政策,监
48、测正在进行的数据管控行动。寻标准所必须的政策,监测正在进行的数据管控行动。l数据管控组织是否有完整与合理的角色定义、是否有高层领导的参与,是整个数据管控的成败数据管控组织是否有完整与合理的角色定义、是否有高层领导的参与,是整个数据管控的成败的关键。的关键。l典型的数据管控组织如下所示:典型的数据管控组织如下所示:数据管控负责部门岗位角色数据管控主导方信息管理委员会信息管理委员会数据标准管理员数据质量管理员数据产生部门数据管控参与方业务协调人数据分析员数据主管数据使用部门业务协调人数据分析员数据主管数据拥有部门业务协调人数据分析员数据主管数据管理部门运维组织实施项目组数据安全管理员数据管控经理元
49、数据管理员Page38企业数字化转型总体架构数据标准管理l消除一数多义,提升数据的唯一性、一致性,将逐步形成的数据标准纳入一个规范的管消除一数多义,提升数据的唯一性、一致性,将逐步形成的数据标准纳入一个规范的管理流程中,进行数据标准的更新、发布、使用监督等工作。理流程中,进行数据标准的更新、发布、使用监督等工作。l数据标准管理工作可以分为以下几个部分:数据标准建立和维护、数据标准执行、数据数据标准管理工作可以分为以下几个部分:数据标准建立和维护、数据标准执行、数据标准管理的考评。标准管理的考评。数据标准建立和维护数据分类数据结构关键业务对象关键代码数据维度代码映射客户类数据标准产品类数据标准。
50、类数据标准数据标准执行数据标准管理的考评定性考评定量考评数据标准分析报告数据标准理念推广归档系统ODSPage39企业数字化转型总体架构数据质量管理l数据质量管理框架蓝图如下,其中数据质量提升是改进数据质量的手段和质量考评的目的:数据质量管理框架蓝图如下,其中数据质量提升是改进数据质量的手段和质量考评的目的:v数据质量要求确认,根据业务要求制定和明确数据质量要求,同时也需要符合数据标准的要求;数据质量要求确认,根据业务要求制定和明确数据质量要求,同时也需要符合数据标准的要求;v数据质量考评,对数据质量的量化评价数据质量考评,对数据质量的量化评价v制定数据质量问题解决方案,根据数据质量考评和日常