1、利用多方平安计算技术构建数据融合新利器习近平总书记提出,要“发挥数据的基础资源作用和创新 引擎作用,“构建以数据为关键要素的数字经济”,“推动我国 数字经济健康开展”。金融业是数据密集型行业,数据效能的 充分发挥直接关系到金融服务能力和效率的提升。但是,由 于金融数据的高敏感性、隐私性等特点,在数据融合运用中 的困境十分突出。多方平安计算是破解数据壁垒的关键技术2021年12月,国务院办公厅在要素市场化配置综合 改革试点总体方案中提到:“建立健全数据流通交易规那么, 探索原始数据不出域、数据可用不可见的交易范式,探索 建立数据用途和用量控制制度,实现数据使用可控可计量以多方平安计算(Secur
2、eMulti-PartyComputation)为代 表的隐私计算技术采用基于数据价值流通而非原始数据流 通的价值融合模式,可实现数据的“可用不可见”;此外,该 技术可实现对原始数据按用途与用量授权使用,有效防止数一起,释放数据要素红利,助力“智能金融”开展。展望未来, 金融机构将携手共进。一是逐步扩大“可用不可见、可控可计量”的数据应用场 景,发挥数据要素价值。数据价值的发挥,要坚持合规开展、 平安开展,遵循和敬畏国家法律和金融规律。通过进一步运 用多方平安计算等技术,可提升数据交换、流通的便捷性, 进而逐步挖掘依法合规、保护隐私、提升平安、具有金融应 用价值的数据合作场景,降本增效,形成健
3、康完备的金融数 据应用方案。二是积极建设多方平安计算合作生态圈。推动多方平安 计算有序开展,需要从多方协同,联合打造数据要素融合应 用的良性生态。一方面在制度层面遵循法律法规,明确数据 平安保护要求,同时积极拥抱新思维、新方法、新模式,探 索解决问题的新途径;另一方面积极与政府、高校、金融同 业、科技公司、投资机构等外部合作伙伴开展广泛技术和业 务合作,建立合作生态,打通“产学研用”,推进技术攻关和 合作创新。三是多方平安计算应用应注重科技向善、数据平权。在 推进技术应用及合作生态的进程中,要坚持科技向善的创新 原那么,强调将服务国家战略、支持实体经济、满足人民美好 生活向往作为创新的出发点和
4、落脚点;要坚持“数据平权”的 价值理念,运用数据更好地解决信息不对称,而不是利用数 据垄断和技术壁垒来加剧信息不对称,综合发挥多方数据优 势,切实提升金融服务质效。据的二次流转,到达数据“可用并可控”;与此同时,该技术 可通过同分布式账本、可信身份验证等技术融合,使数据使 用可监督、可量化、可审计,实现数据开发利用“可控可计量。交通银行率先在多方平安计算技术领域实现零突破交通银行自2019年底开始关注多方平安计算技术。经 过研究分析,认为在国家数据要素化战略加快推进、顶层设 计持续出台的背景下,以多方平安计算为代表的隐私计算技 术可以融合大数据、人工智能、生物识别、知识图谱、区块 链等技术,形
5、成提升数据平安、保护客户隐私的综合性解决 方案,在金融科技领域具有广阔的应用前景。2020年,交通银行以加速全行数字化转型为目标,在多 方平安计算领域实现多项突破:一是率先搭建多方平安计算 平台,并广泛开展试点应用、持续进行技术研究;二是成功 申请国内首个多方平安计算技术的金融科技创新监管试点 工程(上海市第一批)“基于多方平安图计算的中小微企业融 资服务,在金融业内率先实现将多方平安计算同知识图谱技 术结合应用;三是在金融业内首次将多方平安计算应用于图 像隐私保护,并成功申请金融科技创新监管试点工程“基于多 方平安计算的图像隐私保护产品(上海市第二批)。图1展示了我行在多方平安计算领域的局部
6、探索。,交通银行自2020年初开始关注多方平安计算技术“成功申请三项利用多方平安计算技术的 金融科技创新监管试点工程基于多方平安图计算的中小微企业融资服务基于多方平安计算的图像隐私保护产品基于大数据技术的企业园区综合金融服期待未来更多合作图1交通银行多方平安计算技术实践构建广泛适配场景、高平安性的多方平安计算平台交通银行多方平安计算平台(以下简称“平台”)具有自 主可控、支持结构化及非结构化数据、支持关系图谱、全流 程可视化等特点。平台提供联合平安建模、联合平安统计、 联合平安查询等隐私保护下的数据开发利用能力,其中涉及的密码学技术有秘密共享、混淆电路、不经意传输、同态加 密、隐私集合求交、隐
7、私信息检索、零知识证明、联邦学习 等。1 ,实现适配多种应用场景的架构设计。交通银行深度参 与多项多方平安计算技术标准编写工作,并研制了交通银 行多方平安计算技术应用规范。通过将这些标准中的基础 思路与架构设想融会贯通,并应用于技术研究、设计、实践, 整体统筹设计了关键架构,充分预留了扩展空间,使我行多 方平安计算技术平台可适用多种应用场景、支持多类参与角 色、适配多种数据类型、支持异构技术平台,并在数据开发 利用的基础上形成了解决方案范式。平台采取私有化部署方式,基于开放式框架,有效实现 算法模型与平台的解耦,并支持自定义算法组件,可以更好 满足多元业务场景的协同计算与建模需求。平台架构分为
8、5 层,如图2所示,主要包含基础设施层、数据资源层、平安 计算引擎、平安接口层、可视应用层、系统管理层、HUB服 务层。应用场景智慧风控智慧营销生物信息保护苣踪平安宜联合平安匹联合统计分联合平安平安接口平安计算引擎关系型数据库非关系型数据库文件数据空间计算计算存储基础 设施图2 交通银行隐私计算平台基础设施层主要包含计算资源、网络资源、存储资源等, 通过对本地节点及节点间的链接管理,建立起金融大数据多方合作的平安可控环境。数据资源层可支持对接多种不同类型的数据资源,包括 关系型数据库、非关系型数据库、文件及三方数据接口类型, 如hive、csv文件等。平安计算引擎是平安计算平台的核心模块,提供
9、整套的 平安计算基础组件,为平台实现数据平安匹配、数据平安计 算、加密查询和模型运算等服务提供支撑,并实现可编排的 算法工作流。其中匿踪查询功能模块可执行匿踪核验、匿踪 检索两种应用的相关运算能力;多方平安计算模块提供基于 Python、SQL的编译环境执行能力,以及多方统计、多方计 算的运算能力;联合平安建模模块提供机器学习、特征工程、 模型预测的计算执行能力;多方平安匹配模块提供平安求交、 平安求补、平安求并的功能。此外,还提供一系列的基础组 件,包括加密算法组件、加密协议组件、机器学习算法组件、 基础运算算子组件、统计运算算子组件、数据融合组件。通 过这些基础组件可以组合实现复杂运算与算
10、法、应用流程。平安接口层主要实现对匿踪查询、平安匹配、联合统计、平安建模等应用提供接口封装。可视应用层对多方平安计算的应用执行提供可视化工 具,实现分析预测报告、平安驾驶舱、开发Studio等功能。系统管理贯穿服务始终,提供用户管理、商户管理、算 力管理、节点管理、密钥管理、授权管理、数据管理、系统 监控等公共调度和管理功能。HUB服务是交通银行多方平安计算平台用来实现与其 他跨厂商的多方平安计算引擎之间互联互通的适配器,能够 实现节点资源、数据资源、模型资源的互通与共享,内含资 源注册、资源发现、资源授权、统一资源协议等组件。基于上述技术组件提供的基础能力,可以实现交通银行 与其他外部机构之
11、间的平安数据协同应用,包括智慧风控、 精准营销、反欺诈、用户运营、联合统计、平安查询等,在 原始数据不转移不汇集的基础上,更加高效、准确地使用数 据、合法合规地进行金融大数据协同建模与计算。2实现基于国密的高性能、高平安性多方平安计算。平 台采用国密算法SM2/SM3/SM4,设计了符合国密标准的多 方平安计算密码模块,对多方平安计算协议进行平安加固及 性能提升,实现了算法及平安的自主可控。相比于传统多方 平安计算技术实现,在提升加密速度的同时降低了 CPU占用 率及网络消耗,进而提升技术应用能效,为多方平安计算技 术的大规模生产应用提供技术基础。3,实现全流程可视化、图形化操作。多方平安计算
12、平台 将计算任务设计为全可视化流程,使平台使用人员可以图形 化地了解、设计、运行相应计算流程,并实时管理相关内容。在整体管理层面,平台提供了全国、地区、合作机构三 个层次的管理视图,可实时掌握多方平安计算技术在全行范 围内的整体运行情况,并可及时发现、定位、解决异常情况, 进行事件报警。在任务操作层面,平台实现了全流程可视化操作,并支 持采用拖拉拽形式实现算法配置及整合,支持将跨机构间的 匿踪查询、平安统计、平安建模、平安预测、模型部署等任 务可视化、配置化管理,降低了数据分析人员对多方平安计 算技术的理解难度及操作难度,可高效、灵活地应对多样化 数据融合场景。基于多方平安计算技术释放数据融合
13、价值在实际业务驱动下,交通银行已应用多方平安计算技术 由点及面开展了多种应用创新,尝试从交通银行角度积极探 索和实践未来数字化新基建。在智慧风控场景中,通过多方平安计算平台可实现金融 机构同第三方数据供应商联合建模,并共同搭建审批模型、 欺诈模型、贷后行为模型,判断企业实际经营情况,防范潜 在的多头授信、空壳授信等问题,在授信流程中及时发现经 营情况不真实、业务数据不准确等情况。在智慧营销场景中,可通过多方平安计算平台提供的多 方数据虚拟融合能力,在产品营销、高价值客户提升、潜力 客户提升、目标客户筛选优化等方面,实现数据不出门的客 户联合精准画像平安建模,提高营销获客精度。在生物识别场景中,通过平台提供的数据加密分片存储 及加密分片运算能力,可将人脸信息等隐私数据分片后分别 存储在不同机构,并在验证环节进行平安比对,进而实现在 各参与方不进行存储特征交换的前提下完成特征校验。最终 提升了对图像隐私信息的保护能力,降低信息泄露风险。未来,多方平安计算技术可广泛应用于多种金融业务场 景,将上游的数据源、金融业务,以及终端用户紧密联系在