收藏 分销(赏)

腾讯游戏数据资产管理实践之路.docx

上传人:二*** 文档编号:4484250 上传时间:2024-09-24 格式:DOCX 页数:24 大小:1.34MB 下载积分:5 金币
下载 相关 举报
腾讯游戏数据资产管理实践之路.docx_第1页
第1页 / 共24页
本文档共24页,全文阅读请下载到手机保存,查看更方便
资源描述
腾讯游戏数据资产管理实践之路 导读:数据是资产的概念已经成为行业共识。然而现 实中,对数据资产的管理和应用尚处于摸索阶段,企 业数据资产管理面临价值评估难、数据标准混乱、数 据质量不高、数据平安威胁等诸多挑战。 腾讯互娱早在2013年开始启动数据资产管理工作,历 经从数据管理到治理,再到资产化的转变,并启动实 施大数据资产管理体系的建设,本文提供在此过程中 的一些实践经验与思路。 数据共享管理 数据价值管理 数据平安管理 数据质量管理 主数据管理 元数据管理 数据模型管理 数据标准管理 战略规划、组织架构、制度体系、审计机制.培悔赢学堂(来源《数据资产管理实践白皮书3.0》) 数据资产管理(DAM, Data Asset Management)是指规划、 控制和提供数据及信息资产的一组业务职能,包括开发、执 配异构和集中存储。 2、元数据到底存储了什么数据?举个例子,游戏行业是有 很多指标去衡量它的运营状态。比方说7日留存率,意思是 说这个玩家注册当天往后去推移7天有没有流失,有些业务 平台是按注册后第二天才开始计算,这样同一个指标大家就 理解不一样,自然导致计算结果不一致。所以将游戏内部累 计两、三千个业务指标,连同它的计算逻辑等描述都存储到 元数据里面去,然后再开放给所有的业务平台。比方 DataMore (智能游戏运营方案)、图灵(数据挖掘分析平台), 一体化(游戏指标开发平台)等内部平台,都采用一套标准, 包括指标名称及计算逻辑,这样便可有效防止数据不一致的 情况。 3、描述数据,其为元数据的本质,在元数据管理中发挥核 心作用。定义数据的来源,包括责任人,创立与更新时间, 分区号及数据字典等一系列的描述信息,以及表与表之间的 关系等。通过数据描述模型,数据使用者可以看到整个数据 的全景以及数据的描述信息,可大大降低其使用数据的成 本,最大化利用数据的能力,协助产品做精细化的运营,更 好地完成运营KPI。 4、自动构建血缘关系链,这是一个非常重要的考核指标, 后面会详细讲解。 5、扩展能力,辅助运营。元数据不仅包括业务的元数据, 还包括技术的元数据、运维日常工作过程当产生的告警指标 及阀值,甚至是AIOps模型的算法等,都会统统存储至元数 据中,以辅助做好运营,提供运营策略支持。 日志食 羽名 2034,-2 10 13 38 涉6174 P 13 38 20,AI-14 tO DM 2D1,,W tO t) 38 MV7 20m,J14 to 13 刈 ,e* 如 m,88,8 wse 918«l /♦T&0*w_1 ・,9T 阕 *«)«WX •«»rmMM^Ademoww •>«K*J'920iXd,7T2, 3, 49用号字QC。iWC9 1 _woi«wieSTRjnoiMvcnSDSTRING 2 dtEitic8TRMOt^VoridOBKMNT iOwZonecoOIGMTMUm8OKT 6 i4KW«lDSTRINGAC*UMWwiiMWT 以上是元数据管理功能截图,包含一个数据全景及数 据属性描述的功能,可以清晰看到数据责任人归属、 创立时间、最后变更时间,它的表结构、字段、信息 等信息,这些信息对数据的使用者而言都是非常有用 的。 04腾讯游戏数据质量管理介绍下面介绍构建数据质量体系的过程。不合格、不具备交付价 值的数据那么为垃圾数据,所以数据质量的保障是一个核心 点。 数据质量体系的构建分为以下四个步骤: 第一,定义数据的标准,包括它的格式、类型以及上报模式 等均需统一标准化。内部通过制定好的标准去约束,比方定 义一张数据表的描述,包含数据类型,表名称,字段类型与 长度等,研发人员那么根据此格式打日志,标准贯穿采集、传 输、转换、存储全链路。 第二,定义质量规那么。此局部同业界一致,我们也采用完整 性、一致性、准确性及延时性等监控维度。具体介绍如下: 1、“完整性”,比拟好理解,即数据不能缺失,不能出现 “采集一万落地八千”的不合格情况,此指标采用数据对账 的方式去做数据验证。 2、“一致性”,相当于数据定义的标准化,意思是怎么让 内部所有人按照指定规那么去理解数据,且涵盖各个技术平 台、业务线系统。比方定义一个ipv4的IP地址是15位, 定义手机号码为13位的或者国内的 地址为6位,这个 理解上大家肯定是统一的,我们也会将这个标准存储到元数 据里面去,各业务平台一起去遵循这个标准。最终达成一致 性。 3、“准确性”,数据中防止出现乱码或者不是预设类型的 值。 4、“及时性”,从数据的采集到数据应用,它的时效性是 否满足业务的需求,比方正常打完一个对局时会收到系统推 送的一条消息,内容可能是一个道具或一个金币,这个及时 性要求是非常高的,绝不允许出现对局完成后两个小时再把 金币推送出去,这就没有意义了。这是一项非常重要的数据 质量考核指标,对应用层面的影响也是非常敏感的。 第三,质量监控。定义完这些规那么和标准后,接下来便是质 量监控,包括对帐、心跳、内容检查还有延迟告警等相应的 保障。 第四,质量报告。会给产品侧输出整体数据质量的趋势报告, 包括同比、环比及各个质量维度的达标率情况等,目前数据 交付的质量都维持在三个九。 总结来说就是通过业务+流程+技术的手段来实现数据 质量的总体保障。 05大数据资产管理之影响评估&快速定位 下列图为一个非常典型的数据实时微服务的架构,从开 始的采集到传输,再到离线的计算和存储,还有一条 实时分支做数据的转发、透传、会涉及到消息队列以 及流式计算,然后将数据的结果写到Tredis (NoSQL) 中。写到NoSQL中的数据,来源可能是实时计算或者 离线计算任务。 基于实时流的数据微服务技术 研发人员会根据业务规那么开发接口逻辑,调用数据存 储层,接下来研发会将接口交付至运维人员,进入完 整的DevOps全链路,最终完成整个数据+业务逻辑的 发布。整个应用过程会遇到几点问题: 第一点是整个数据服务涉及到的环节众多,只要其中一个环 节出问题,故障的定位就非常困难。第二点是业务层的数据 异常回溯,难度更大。比方一个玩家看到战报数据,正常的 话应该是20级,结果显示8级,如何快速确认数据从哪算 的,经过哪个环节,属于哪个业务逻辑、哪个工程、哪个逻 辑指标以及哪个计算服务集群等。第三点就是底层数据平台 故障,如何快速评估影响面。比方当离线计算平台其中一个 集群挂了,如何确认影响哪个工程、哪个接口、哪些指标、 哪些功能,也无从去判断跟定位。这里给出的解决方案是通 过“数据”加“业务”的血缘组合来解决。 (End)微服务 ■集群管理■容量管理 如上图,血缘数据贯穿从数据采集开始到最终的数据服务整 个链路。首先将采集的粒度细到IP、端口与进程,业务表 ID、计算的任务ID、透传的表ID、计算业务指标以及Tredis 里面的Key前缀,最终交付给接口的业务ID以及集群的ID, 均上报至血缘数据库。此时整个解决问题思路清晰可见,无 论从上往下还是从下至上,均可轻易地实现问题的快速定位 以及影响面的快速评估。 三GDAM蜀0大故据即产■埋平台S I RTE 上图为平台截图,是一张普通业务的血缘关系图。从关系图 中我们可以快速了解数据从采集到应用中的全部处理过程, 知道其部署资源信息、接口信息以及指标信息等。具备这些 能力之后,那么可运用其有效辅助运营。 比方,当一个计算任务出库出现延迟,运维人员通过血缘监行和监督有关数据的计划、政策、方案、工程、流程、方法 和程序,从而控制、保护、交付和提高数据资产的价值。 数据应用 数据资产管理 大数据平台 大数据平台 (来源《数据资产管理实践白皮书3.0》) 数据资产管理的定位及架构如上图所示,其处于大数据平台 (中台)与数据应用的中间层,连接着底层的大数据平台(中 台),覆盖数据全生命周期管理,同时为上层数据应用提供 高质量数据的保障能力。 01腾讯游戏大数据运营概况 腾讯互娱增值服务部服务于50+款端游,40+款页游, 还有300+多款手游,每日数据量级为17000亿条,每 日数据增量约为260TB,总存储是80PB的规模。 控可快速知悉此延迟可能会影响的工程、接口以及相应具体 指标,且可快速启动故障预案,如跟产品沟通,采取挂公告 或补偿性的动作等预案策略。 06大数据资产之生命周期管理 F面探讨如何去做数据的生命周期管理,首先给出一个结论:数据生命周期管理的策略与数据的在线度有关。 ■数据分类和重要等级 蹒分类说明|重要等级 在线类 状态类 行为类 性能类 收入类 充值、消费类,跟资金财产有关的数据 ★★★★★ 用户注册、登录、登出等在线类数据★ ★★ ★ 游戏用户属性、等级等状态类数据★ ★ ★ 用户在游戏内的体验操作等行为日志★ ★ 服务器性能、资源容量等数据★•数据在线度与生命周期 •数据在线度与生命周期 数据在线度即为数据的活跃度,其随时间推移,数据使用价 值的降低不断衰减,用于数据的在线程度和使用衰减情况。 数据在线度主要受两个方面因素影响: 第一,其跟定义数据的重要级别有关系,我们共定义了 “收 入类”、“流水类”、“在线类”、“行为类”和“性能类” 等。其中,“收入类”和“流水类”的重要级别比拟高,故 而打上四星或者五星的标签。相应的,“行为类”或运维监 控日志,重要级别那么相对没有那么高,为其打上一星或两星 的标签。数据的重要级别由运营人员根据运营经验定义。 第二,数据的价值,主要参考数据的热度和数据的广度。数 据在线度的关联函数定义为: y(t) =/) 其中v(t)为数据访问热度,W(t)为应用广度,I为数据重 要等级。 07数据价值评估思路“三度”模型 接下来介绍资产价值评估的过程和方案。从三年前尝 试做这个事情,经历了两个阶段,第一阶段是数据的 成熟期,第二是研究的观察期,目前处于灰度放量阶 段。 在数据价值评估具体实施方面,提出了从“热度”、“广 度”、“收益度”等三个维度,按照价值指标、评估模型、 价值表现等三大评价流程进行价值评估的架构思路。 其中,关于数据的“热度”,内部有一个共识,就是“只有 当数据被使用了才有可能产生价值”,当然这是一个很笼统 的说法。第二就是“广度”。 举个例子,比方在国际某个机构发布一个专利,结果发现谷 歌也引用了、亚马逊也引用了,Facebook和其他国内的公司 也引用了,就认为这个专利是有价值的,这个理论相信不少 人会认同,同样在公司内部也是采用这样的思路,“广度” 依赖的是数据应用及功能模块,只要跟数据耦合程度越高, 就认为它的广度就越大。 第三就是“收益度”,即数据干预之后带来多大的收益,比 如带来多少活跃用户、UV、PV、流水等,这些数据直接上报 给平台,通过平台去做模型评估,加上每个价值点权重去计 算。这里通过A/B Test方案去做整个模型的训练。 做资产管理价值评估需经过三个阶段,第一是做指标的采 集,第二阶段是做评估模型的定制,最后一个阶段就是价值 的表现。在平台上看它的整个分数区间分布。下列图为某个业 务的热度跟广度表现趋势的情况。 BrCM力0*I,NJ 最后总结一下做数据资产评估的意义。 数据资产评估是衡量投入产出比的重要依据。通常希望 “价值产出”能做到无限放大,同时又希望本钱能越小越好、甚至没有。本钱核算的方法主流有“本钱法”和“价值 法”。 其中,“本钱法”是以数据本钱来结算数据服务,“价值 法”那么认为数据服务的结算定价应该跟本钱无关,跟价值有 关。具体选择因场景而定。如服务的是IEG内部用户,数据 服务结算的方式采用的是“本钱法”,目标是要助力产品成 功,应尽可能帮助业务减少本钱与支出,这样的方式可以很 好提升产品的竞争力。对于面向toB、toC或toG的业务场 景,这时候用价值法也是合理的,因为这样的机制有益于企 '也利益的最大化。 端游50+款 15w+表 4000E+数据 页游40+款 4000+表 6 口乙+缄 手游300+款 60w+表 13000亿+数据 技术栈是使用自研结合开源的混合模式,采用了 TEG 数平的TDW (腾讯大数据仓库)来构建离线数据的计 算与存储,结合自研的高性能分布式计算Bitmap技术 实现多维、下钻分析。 个人历程 FX 王者荣,S4回■之蔽 桁・幅W做石■晔 对局分析 个人中心 交左 对于具体的数据服务场景,大家对上图这些界面不会感到陌 生。图中只是数据增值服务的局部呈现,包括玩家在游戏里 面的历程、对战的战绩信息、个人中心、社区交友、任务系 统等服务。其中,任务系统是基于我们实时能力构建起来的 一个数据应用。 除此之外,还面向IEG内部的游戏AI、游戏反外挂系统、铁 算盘、游戏助手、渠道管理等提供数据服务。 02腾讯游戏数据资产管理体系介绍腾讯游戏数据资产管理体系如下列图所示自下而上主要 分为元数据管理、资产管理四大核心组成、资产管理 平台以及数据增值服务等四个层次。 价值评估I本钱管理数^热度分析质量监控 广度分析平安建设—数费收益度分析影响评估o 数据开放DevAIOps数捷 最底层是元数据管理。元数据在整个资产管理体系中是最核 心的一个部件。我们会定制实现整个元数据的标准化,存储 的数据包含业务元数据、技术元数据,提供元数据的检索、 开放等能力。 往上一层便是资产管理四大核心局部: 1、价值评估,定义出用于评估整个数据价值的评估模型以 及数据度量报告,这是资产管理中最核心的一个点,可以协 助决策者清楚了解数据的价值在哪里,到底有多大。 2、数据运营,其覆盖了整个数据生命周期管理,包含数据 的平安、质量、本钱等局部,采用了 DevOps和AIOps这些 业界先进理念贯穿整个数据运营过程,参与这个职能的角色 我们也叫DataOpSo3、数据治理,此概念更多强调的是数据标准化、制度、流 程等这一系列的内容。这里不详细展开。 4、数据集成,从数据的采集、传输、整合、到落地存储, 通过标准化去统一不同类型、格式的数据源,按指定规范去 实施转换,并最终落地至统一的大数据仓库,且访问数据采 用统一标准,这里采用的是TDW提供的方案。 最上层为资产平台能力。研发的思路遵循《数据资产管理实 践白皮书3.0》,并结合实际服务场景,提供多样及个性化 的数据资产管理服务。最顶层那么为提供的数据增值服务,比 如提供数据可视化与分析、营销活动的支持、消息推送、渠 道管理等一系列服务。以上便是我们数据资产管理的技术体 系架构。 针对如何去评判整个资产管理建设的能力水平这个问题,总结出“三好”能力模型。首先是“用好”数据资产,二是 “管好”数据资产,三是“看好”数据资产。 〃用好“数据资产 〃管好〃数据资产 其中“看好”资产属于数据平安的范畴。数据是企业里面 的核心资产,也涉及了数据泄露与用户隐私等问题,一旦发 生数据平安事件,对公司的损失是巨大的,甚至是灾难性的, 所以“看好”资产是重中之重。 践行“三好”能力模型的过程中,会根据不同的角色去定义 并提供相应的服务能力,公司内部资产管理平台研发与设计 也是基于此评估模型。 03腾讯游戏元数据管理介绍 元数据管理在整个数据资产管理中占有举足轻重的地 位,接下来介绍腾讯游戏是如何对其进行设计和构建 的。首先它要具备以下几个能力特点: 元数据检索 数据一体化 质量监控 元数据应用 元数据采集转换层■模型桥接器数据映射元数据管理体系技术架 1、数据的异构适配和集中存储。随着公司历经不同的开展 阶段,必然会出现多种多样的技术栈,那么不可防止的产生各 式各样的数据类型,比方说关系型、NoSQL类型,还有一些 文本的,一些业务接口、业务系统等。怎样去采集并且适配 如此之多的数据类型,怎样去描述和定义数据,其难度是非 常大的,因此定义了一个适配层,此做法和业界主流方案有 些类似。具体构建了一个模型桥接器来实现智能转换,去适
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服