ImageVerifierCode 换一换
格式:DOCX , 页数:8 ,大小:139.53KB ,
资源ID:4782861      下载积分:5 金币
验证码下载
登录下载
邮箱/手机:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/4782861.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
声明  |  会员权益     获赠5币     写作写作

1、填表:    下载求助     留言反馈    退款申请
2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【二***】。
6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
7、本文档遇到问题,请及时私信或留言给本站上传会员【二***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

注意事项

本文(如何使用Scrum敏捷方法-快速搭建数据集市?.docx)为本站上传会员【二***】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

如何使用Scrum敏捷方法-快速搭建数据集市?.docx

1、如何使用Scrum敏捷方法,快速搭建数 据集市?数据仓库自最早1988年被提出来,开展至今也有几十年了。从数仓1.0到数仓 4.0 ,从关系型数据库到大数据仓库。现如今,数据集市和数据湖以及湖仓一体 化是业界研发和开展的重要方向。数仓的建设有一套业界成熟的方法论,但数据集市如何建设各家企业众说纷纭。 作为数据产品经理,对数据仓库和数据集市等技术领域也并不会陌生,企业在搭 建数据集市过程中 往往会因为流程和工程管理的问题导致数据集市可用度不高 以及业务价值较低。那如何更高效搭建一套面向业务应用场景的数据集市?是否可以将产品敏捷方 法论快速高效地应用在数据集市的搭建上?1 .数据仓库和数据集市数据

2、仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合, 用于支持管理层和业务层的经营分析和业务决策制定。数据仓库用于支持决策, 面向分析型数据处理,为了进行OLAP ,把分布在各个散落独立的数据库孤岛整 合在了一个数据结构里面,称之为数据仓库。有了数据仓库,为什么还需要数据集市呢?我们看看数据集市是为了解决什么问 题。数据集市可以理解为是一种小型数据仓库,它只包含单个主题,且关注范围 也非全局。数据集市可以分为两种: 一种是独立数据集市,这类数据集市有自己的源数据库和ETL架构;另一种是非独立数据集市,这种数据集市没有自己的源系统,它的数据来自数据仓 库。数据集市是一个结构概念,它

3、是企业级数据仓库的一个子集,主要面向部门级业 务,并且只面向某个特定的主题。数据集市是数仓之上更聚焦的业务主题合集,更偏向于应对业务数据快速高效应 用的需求,一般用于商业智能系统中探索式和交互式数据分析应用。2 .产品敏捷方法论现在绝大局部互联网公司都在使用敏捷开发,最流行也最成熟的敏捷开发框架当 属Scrum。这里简单介绍下Scrum的三个重要角色和三个重要概念。Scrum中的人员分为3个重要角色:产品所有者(Product Owner), Scrum Master (敏捷教练),开发团队(Dev Team )。三个重要概念:Sprint, Product Backlog , Sprint

4、Backlogo1. Sprint : 一个冲刺或迭代周期,一般24周,是一个可以交付验收的产品需求功能集合;2. Product Backlog :产品需求集合,是产品规划中所有的需求点;3. Sprint Backlog :每个 Sprint 的功能需求点,来自于 Product Backlog。一般的Scrum开发流程如下:为什么说数据集市工程特别适合使用Scrum方法来迭代:1 .数据集市需求划清楚确。集市的业务域和主题域正好对应Scrum的Story和Sprint.2 .做出来的集市宽表是否有用,可以在某个业务域内先做一张,快速验证效果。3 .每个宽表的产出时间周期相对好评估,整体工

5、程风险可控。针对面向主题域的数据集市,来看看我们的计划和安排: P0 ( Product Owner):数据产品经理。 SM ( Scrum Master):数据研发主管。 Team ( Dev Team ):数据架构师,数据研发工程师,数据测试工程师。 Story :每个Story可以根据业务域来划分,比方我们划分了资金域,用户域,模 型域,市场域,营销域,信审域,风控域,财务域,征信域。 Sprint :每个Sprint可以规划一到两张宽表,比方资金域我们规划了借款宽表,还 款宽表,其他类似。二,Scrum敏捷方法解决了哪些问题.效率问题以前开发一个主题域的数据集市,需要自顶向下进行建模设

6、计、维度表设计、事 实表设计、架构设计、数据表开发、表验证、表测试,完整的瀑布流走下来,几 个月过去了,出来了一个大而全的数据集市,交付给分析师和业务。分析师大呼看不懂,查起来还是很慢,很多表还是需要我来JOIN ,业务也大呼 为什么取个数据这么久,为什么做个分析要一周?基于敏捷方法的数据集市建设,提高了整个生产流程的效率,针对具体的业务场 景和分析师的需求,小步快跑地先建设一张或几张宽表,先产出给分析师,再不 断调整数据字段,大大缩短了生产建设周期。1 . MVP验证问题 通过小步快跑模式,每个Sprint花费两周,建设12张宽表,解决一些核心的 分析取数场景,然后再交付验证有价值后进行迭代

7、,增加新的字段,不断进行 MVP闭环验证。2 .业务价值问题直接基于业务分析场景和分析师使用场景来建设,基于怎么用来怎么设计宽表, 可以快速验证并产生直接的分析价值和业务价值。相比于传统的自顶向下的瀑布 建设流程,不追求大而全的数据集市和数据字段,紧密结合业务场景来进行设计。三,案例提供.工程介绍数据集市工程启动前,已有一套数据仓库,初期只做了两层分层,一层ODS ,一层 DWD。DWS层表很少几乎可以忽略不计。在业务分析过程中,我们发现很多的分析竟然还是依赖ODS层的表,局部能用到DWD层的表,说明数据仓库分层不明确, 违反了数仓和数据集市建设的跨层访问的原那么(一般来说分析师不用访问ODS

8、为了进一步打破数据孤岛,提升数据使用链上人员的工作效率,进一步快速支持 分析和决策,我们打算建立一套基于现有的基础数仓上的数据集市层系列主题宽 表。1 .工程规划我们采用Scrum敏捷方法来规划每个Sprint的迭代节奏,主题宽表和应用场景规划如下列图:借款主题主题政策主题 信由主超 财务主卷 征信主题用户主题 次用声表市场主题 UBT 5MS Umt应用腐其分f,孟E菅甫,晒表日菖分析应用场后* RK-盯樊工尸方史也飞应月均基/网声直手,IUV.工程实施工程团队搭建,除了常规的SCRUM核心团队以外,我们还加入了需求来源团 队以及用户团队。需求来源团队数据产品经理收集需求和痛点的主要受访用户

9、,用户团队是所有数 据使用人员。其他的P0 , SM和Dev , Test团队是敏捷开发的角色。具体工程团队配置分工如下:- FgVg数仓工程团队.效果评估Sprintl上线了借款主题域的两张宽表(借款还款和还款宽表),我们并没有迅 速进入下一轮迭代,而是基于已上线的表收集使用价值以及评估降本提效的指 标,整理如下表:Case 1借款主题表CategoryindicatorsBefore! After数据表比照字段数量2468表效后6 +2| 1报,月报15-30min3-5min应用场导艮裳,月报没再切片,查词集时每月切片,支持历史数1B回避KPI.月报,日常统计分析月报指标跪完成1小时月报10分钟分析团队(分析,报表,取数)多人加工,敌寮孤岛, 取数慢统一加工,菇到至化.取配代7丁 m幽。1 .数仓和数据集市建设,市面上有成熟的方法论;2 .传统的建设流程存在过程冗长,人员庞杂,脱离业务场景,价值评估存在偏差等问题;3 .敏捷Scrum方法框架可以优化数据集市建设流程,做到降本提效,紧密贴合业务;4 . Scrum本质上是一套工程管理流程和敏捷迭代流程,要集合具体工程具体分析,吸取Scrum精华为我所用。

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服