1、商业银行数据应用方案
随着金融科技的不断发展,金融科技的发展方向已经从功能型应用 向数据型应用转变,各家商业银行都在研发数据平台,并在不断探索中 提高数据应用能力。本文设计的这套数据应用平台基于目前主流的架构, 包括业务场景梳理、数据清洗、指标库、建模平台、决策引擎、应用落 地、跟踪反馈七大模块,七大模块在运行中形成闭环,不断迭代,旨在 制定统一数据应用标准、实现银行自主建模、提升银行各部门数据应用 能力,具体如下:
业务场景是利用思维导图梳理全行数据应用的框架,清晰展示商业 银行各业务场景的明细,能帮助商业银行更加明确的规划数据应用的计 划。组织各部门的业务人员,整理所在部门的业务场景,
2、整合全行的业 务场景标准,包括渠道、信贷、个人财富、后台等业务场景.
整理完全行的业务场景后,可整理单部门或具体一类业务场景的所 用策略.
数据清洗是数据应用的基础,也是数据治理的重要组成部分,是保 证数据质量的基础性工作。可将征信、流水、尽调表、客户信息等重要 业务数据表清洗一遍,梳理全行的数据质量。数据清洗内容主要包括(数 据清洗具体流程后续会单独介绍):完整性:即每张表的字段是否全部 入数据平台,每张表的字段是够齐全;准确性:即每张表、字段的有效 数据、空数据和异常数据的占比;时效性:即每张表的数据是否及时入 仓;匹配率:即目标样本的数据匹配率是否达到要求。将数据清洗的结 果常态化,
3、定期发布清洗报告,跟踪数据变化情况,为数据使用部门提 供参考。商业银行可建设全行统一的指标库,向行内提供口径统一的指 标,可用于业务规则、模型、标签等应用场景,在各部门持续使用中优 化指标库,最终建成一套完整、稳定、适用性高的指标库,指标库包括 征信、流水、存贷款日均、调查表、客户信息等维度。以个人征信指标 为例,包括个人信息、贷款信息、信用卡信息、逾期记录、担保记录、 申请记录等维度.
四、建模平台目前市面上已经有较成熟的自动化建模平台,能满足 业务人员自主建模需求,自主建模可提升商业银行建模能力,将模型核 心内容掌握在自己手里。以国内某互联网巨头开发的建模平台为例,该 平台能满足数据业务
4、人员的建模要求,能完成评分卡、决策树、逻辑回 归、机器学习、深度学习等各类模型的自动化建模工作,在建模过程中 的指标调参灵活度不够,模型性能、模型稳定性上与传统建模有差距, KS差距在5%左右,属于可接受范围之内。在完善指标库的基础上,建 模周期可控制在1个月左右,相比传统建模3-6个月的时间大大缩短, 能实现银行快速建模、快速迭代的需求。
决策引擎是数据应用的策略部署环节和落地的关键系统,支持以“拖 拉拽”的方式实现规则、模型、策略、决策流的热部署,不再依赖代码 开发,不再等待上线窗口,主要功能包括数据源管理、规则/模型配置、 决策流配置、单笔实时调用、跑批管理等功能。业务部门把建完的模型
5、 部署在决策引擎上并形成决策流,在相应的业务系统上调用,实现模型 决策快速落地。
模型在银行业的应用方式主要是将客户分类,例如风险模型把将来 逾期可能性高的客户分成一类(以评级低、命中风险规则等形式归类), 营销模型把将来营销成功率高的客户分为一类(形成各类目标客户名 单)。根据各业务部门的应用需求,可设计各类数据应用落地场景,包 括贷前、贷中、贷后、营销、年审、提额、交叉销售、客户经理行为监 测等场景(应用落地后续会单独介绍)。数据平台正常运行后,需建立 完善的跟踪反馈机制,使平台不断更新迭代,更好去适应金融科技和数 据应用的不断发展,包括业务场景的补充调整、数据质量监控、指标库 补充调整
6、建模平台功能完善、决策引擎功能完善、应用落地跟踪(模 型性能、稳定性、策略效果跟踪)等,跟踪反馈的主要流程如下所示(跟 踪反馈后续会单独介绍):
建设数据平台的工作量非常大,非一朝一夕能建成,涉及到各部门 的相关协作,建设可分阶段进行,具体如下:阶段一:基础建设,梳理 商业银行重要的业务场景,以信贷、风控为主,进行相关数据表的清洗 并建立指标库;建模平台和决策引擎先实现基本功能,确保流程通畅。 阶段二:应用对接,以信贷、风控为场景建模,决策引擎部署落地,对 接业务流程,初期可作风险提示,不作流程强控,建立跟踪反馈机制; 继续梳理个人财富的业务场景。阶段三:全面推广,待系统功能和流程 趋于稳定后,将业务推广至商业银行主要业务场景,并完善跟踪反馈机 制,使数据平台进入稳定运用阶段:继续梳理后台应用场景。阶段四: 迭代完善,完善数据平台各流程和系统功能,使之能满足全行的数据应 用需要,最终建立一个稳定、高效、准确的数据应用平台。