资源描述
5Use Cases for Trusted Data Exchange数据要素可信流通案例集前言Preface数字经济是继农业经济、工业经济之后的主要经济形态,是以信息通信技术融合应用、全要素数字化转型为重要推动力的新经济形态。数字经济的发展离不开数据要素流通交易,而数字技术创新应用是保障数据发挥价值的前提。2020 年中共中央、国务院出台关于构建更加完善的要素市场化配置体制机制的意见,提出数据与土地、劳动力、资本、技术等传统要素并列成为第五大关键生产要素,并强调加快培育数据要素市场。数据作为新型生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各环节,深刻改变着生产方式、生活方式和社会治理方式。近年来,为贯彻落实国家数据要素的发展战略,各地政府布局设立数据交易所,数据要素流通交易体系逐渐完善。基于各大交易所的平台渠道能力,更多优秀的数字技术解决方案商被挖掘出来,通过产品化应用,实现数实融合,推动实体经济产业的效益倍增。为加快推动数据要素流通交易,实现更好的技术普惠,梳理数据要素可信流通的优秀典型,开放群岛开源社区面向全国各地广泛开展数据要素可信流通优秀案例征集工作。截止 2023 年 3月,共精选了 35 个案例,主要应用场景覆盖金融投资、企业服务、智慧医疗、供应链、工业制造领域等多元化领域和细分应用场景,每个案例均围绕解决方案提供商、案例的概述、案例特色、产业收益等方面内容进行了介绍,综合展现了数据数据要素在流通交易中的技术需求及赋能实体经济的效能。通过整理收集的案例,开放群岛开源社区组织各案例提供单位共同编制完成了 开放群岛开源社区 2022-2023 数据要素可信流通案例集(以下简称“案例集”)。案例集旨在为各地开展数据要素流通交易提供场景规划和技术实施参考,推动数据要素市场的高质量发展。同时,通过分析案例集充分挖数据流通交易的技术标准,为制定行业技术标准规范提供丰富的实践支撑。我们期望,这些优秀案例能给产业链生态带来有益的启示和借鉴。6Use Cases for Trusted Data Exchange数据要素可信流通案例集专家寄语这份案例集收录了各个领域的数据流通优秀案例,为我们展示了数据共享与流通的价值和必要性,充分展示了数据流通带来的经济效益。通过数据的流通,各个领域的机构和企业可以更迅速、更准确地获得所需的信息,从而提高生产和研究效率,降低成本。同时,数据共享也可以促进跨领域合作,以产生更高的附加值。在数据流通过程中,我们必须保证数据的安全、隐私和正确性,利用技术创新、遵循法律法规和伦理准则,以促进数据流通的公平、公正和透明。这份数据要素优秀流通案例集为我们展示了数据共享与流通的多重价值。希望我们能够更加重视数据共享和流通,以加速我们的发展和创新,同时也要保障数据流通的合法性和安全性。加拿大工程院院士、加拿大皇家科学院院士 杨强数据要素流通在信息社会极其重要。首先,它可提高决策效率,为决策者提供丰富的信息支持。其次,有助于创新,推动新业务模式和服务的发展。再者,它可实现资源优化,提高生产力。最后,数据流通促进社会公平,通过分享数据,缩小信息差距。加拿大工程院院士、加拿大皇家科学院院士 于非建设全国一体化数据要素大市场,构建顺应中国国情的数据要素登记确权、评估计价、核算入表体系,是开启十万亿级数据资产“蓝海”的金钥匙,是数字经济有效赋能千行百业的必由之路,也是实现超大规模市场与超大规模数据优势叠加的不二选择。国家发展改革委价格监测中心副主任 王建冬“摸着石头过河”是我国改革开放取得成功的重要经验之一。细究起来,“摸着石头过河”有多层意思:一是没有桥,没有现成的办法,需要探索;二是目标导向,过河就是目标,不能留在原地;三是过河的方法,河水深浅不知道,需要摸着石头,踩稳当了;四是需要总结,即解决摸什么样的“石头”好过河,推广成功经验。这就是一本数据流通领域的“石头”集,探索不同领域的数据流通问题,相信对形成中国式的数据要素流通规则有重要的意义。国家发展改革委价格监测中心 赵公正7Use Cases for Trusted Data Exchange数据要素可信流通案例集Expert Message在安全、合规的大前提下,数据流通与交易才会有根本性保障。数据流通不仅是培育数据要素市场、构建全国统一大市场的关键环节,更是数据作为新型生产要素、释放更大价值的重要前提条件,是数字经济高质量发展的核心驱动力。应该说,“数据二十条”提出的数据产权“三权分置”,确实为数据流通与交易起到举旗定向的效果,更重要的是为个人、企业和政府部门带来以数赋能、乘数而上的新机遇。南都大数据研究院数据研发部产品主管、研究员 袁炯贤数字经济时代,数据要素具有资源和资产双重属性,是数字经济最核心的资源,发展数字经济应抓住数据要素市场化这个关键,必须重视数据要素市场的发展方向和规律,更为合理地挖掘数据资源、提高数据利用效率。就我国数据要素市场化发展面临的问题和挑战,在经济数字化、数据经济化的必然趋势下,促进数字经济发展,必须充分发挥数据要素对其他要素效率的倍增作用。东南大学教授、俄罗斯自然科学院外籍院士 李新德数据要素是传统生产要素理论的重大突破,准确反映了当下经济社会发展所呈现出的特征与趋势。不管是政府、企业还是个人,都无时无刻不在与数据产生着紧密关联。数据成为了新的生产要素,加速数据要素流通,释放数字生产力成为推进各国数字经济、数字政府、数字社会发展的关键任务之一。新华社广东分社经济采访部主任记者 卫韦华8Use Cases for Trusted Data Exchange数据要素可信流通案例集Contents目录P10 基于隐私计算的合规监管技术在金融反欺诈中的应用解决方案 神州融安数字科技(北京)有限公司#整体解决方案#P12 公积金区块链数据共享平台 郑州盛见网络科技有限公司#模式创新#P14 基于数库DAS系统的智能文档处理项目 数库(上海)科技有限公司#数据治理#P16 基于联邦学习技术的电信反欺诈服务 中国工商银行股份有限公司软件开发中心#隐私计算技术、数据合规技术#P18 银行隐私计算互联互通平台 同盾科技有限公司#隐私计算技术#P20 上市公司情绪感知系统 深圳飞笛数云信息技术服务有限公司#大数据的处理和应用#P22 联通大数据联合建模 中国联合网络通信有限公司深圳市分公司#模式创新#P24 中经社数据要素流通加速实践 中国经济信息社有限公司#整体解决方案#P26 E企查基于中国平安集团实战应用的企业大数据智 慧风控一体化解决方案 深圳前海征信中心股份有限公司#整体解决方案、模式创新#P28 金智塔隐私计算安全融合政务数据赋能银行智能风控 杭州金智塔科技有限公司#隐私计算技术#金融投资01 P30 德阳市数据安全与数据要素化工程 中电数创(北京)科技有限公司#整体解决方案#P32 面向零售行业数据中台建设案例 海南数造科技有限公司#数据治理、整体解决方案#P34 基于联邦学习技术的运营商联合反欺诈模型研究及应用 中国移动通信有限公司研究院 中国移动集团信息技术中心 中国电信股份有限公司数字智能科技分公司#隐私计算技术#P35 大数据精准招商方案 上海生腾数据科技有限公司#模式创新#P37 金智塔隐私计算赋能统计微观数据安全共享 杭州金智塔科技有限公司#隐私计算技术#P39 河南投资集团数据资产管理平台建设项目 恒生电子股份有限公司#数据治理、信息安全技术保障、整体解决方案、模式创新#P41 华为鲲鹏/昇腾生态数据空间应用案例 华为云计算技术有限公司#数据治理、模式创新、信息安全保障技术、整体解决方案#P43 幂磐子母双认证硬件密钥 青岛中元云册创新科技有限公司#数据存储、数据治理、信息安全保障技术#企业服务029Use Cases for Trusted Data Exchange数据要素可信流通案例集P69 粤港澳大湾区大数据中心项目 云基华海信息技术股份有限公司#数据合规技术、隐私计算技术、整体解决方案#P71 国有高速大数据全周期管理及多元创新应用 贵州数据宝网络科技有限公司#模式创新#P74 可信数据要素安全流通与隐私计算技术创新,服务国家数智化转型应用实践 中移信息技术有限公司#隐私计算技术#P76 面向中国算力网的可信数据空间-AI靶场 哈尔滨工业大学(深圳)、鹏城实验室#整体解决方案#P78 SPU可信执行环境管理平台 粤港澳大湾区数字经济研究院#隐私计算技术、整体解决方案#多领域06P51 UData数据服务分析一体化平台 京东物流供应链有限公司、京东科技信息技术有限公司#数据存储、数据治理、整体解决方案、模式创新#P53 芯查查元器件供应链波动监控与保障系统 深圳中电港技术股份有限公司#数据治理、模式创新#P56 中国首个智能制造领域数据空间应用案例 深圳数鑫科技有限公司#整体解决方案#供应链、工业制造场景04P58 面向车服务的云边协同隐私计算平台应用(车联网)平安科技(深圳)有限公司#数据合规技术、隐私计算技术、整体解决方案#P60 MIST数据存储安全桥(现场取证、刑侦破案)犀盐数据科技有限公司#数据治理、信息安全保障技术#P62 基于隐私安全计算的AI服务平台“揽睿星舟”助力AI模型方与数据源方安全交互(药物研发)翼健(上海)信息科技有限公司#隐私计算技术#P64 凤庆县智慧公园智能数字化(智慧生态)广东省坤舆数聚科技有限公司#数据治理、整体解决方案、模式创新#P65 云旗数据要素流通交易平台(数据交易)华东江苏大数据交易中心#模式创新#P67 面向算力网络的数据流通与调度(跨主体数据流通)中国移动通信有限公司研究院 网络与IT技术研究所#整体解决方案#特色细分领域05P45 基于隐私计算的强直性脊柱炎的全基因组关联分析 杭州锘崴信息科技有限公司#隐私计算技术、模式创新#P47 商保大数据服务平台IDS 上海健交科技服务有限责任公司#数据治理、模式创新#P49 基于IDS技术的居民健康数据安全共享实践 深圳市南山区医疗集团总部#数据治理、模式创新、信息安全保障技术、整体解决方案、数字合规技术#智慧医疗0310Use Cases for Trusted Data Exchange数据要素可信流通案例集金融投资Financial investment01 基于隐私计算的合规监管技术在金融反欺诈中的应用解决方案申报主体:神州融安数字科技(北京)有限公司一、案例介绍应用融安隐私计算平台多方安全计算引擎实现金融集团业务数据与外部数据源联合计算,输出企业信用评分,用于金融反欺诈场景,为金融企业合法使用外部数据源用于自身企业风控和营销等核心业务能力提升提供了可行的解决路径。创新性地引入第三方监管机构,应用融安隐私计算平台合规监管技术框架中的隐私度量技术、参数一致性监管技术、匿踪计量计费技术等一系列密文监管技术对交易全生命周期合规监管,在数据流通合规监管方面做了有意义的探索和实践,使得数据交易监管机构在密文状态下依然可以实现数据交易的事前、事中、事后的全过程合规监管。二、案例特色2021年10月央行发布关于做好小微企业银行账户优化服务和风险防控工作的指导意见,要求对小微企业银行账号全生命周期管理,加强涉诈涉赌交易识别管控,加强对存量账户的排查清理和对涉诈涉赌账户的责任倒查。金融集团在进行金融业务时,需运用技术手段加强涉诈涉赌交易识别能力,进行金融风险管控:在金融反欺诈实践中金融集团一方面需要引入外部数据源,拓展数据维度属性来提高金融反欺诈风控模型的精度;另一方面国家出台数据保护法 个人信息保护法等隐私保护法律,要求合法合规使用数据;金融集团运用融安隐私计算平台合法合规使用内外部数据,用于提高反欺诈风控模型精度,加强风险识别能力。根据中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见中的相关要求,需要相关的监管机构来加强企业数据合规体系建设和监管。作为数据流通的监管机构,需要在密文状态下确保数据是否合法合规使用并有序流通。运用多方安全隐私计算技术实现金融集团、运营商、电力公司三方联合计算,输出企业信用评分,用于金融反欺诈场景;同时方案中引入第三方监管机构,图片来源:神州融安数字科技(北京)有限公司11Use Cases for Trusted Data Exchange数据要素可信流通案例集运用隐私度量技术、参数一致性监管技术、匿踪计量计费技术等一系列密文监管技术对交易全生命周期合规监管。三、应用场景及产业效应本方案采用基于多方安全计算技术的评分卡模型,具有简洁稳定、技术成熟、可解释性好等特点。根据企业客户不同维度特性,运用评分卡模型输出企业的信用评分;在运营商和电力公司数据参与运算前,采用函数或算子隐私保护度量技术用少量的真实数据或模拟数据,对参与运算的每个维度数据给出隐私保护评分,用于运营商和电力公司数据输出的依据。监管机构期望监管交易流程,交易过程合法合规,包括事前监管,对目标函数或算子的保护程度给出隐私保护评分;事中监管,对授权完整性、模型和数据一致性进行核验;事后监管,提供计量计费功能及存证用于处理争议。四、未来发展前景本方案使用多方安全计算技术解决了金融集团运用内部数据和外部数据源的数据保护问题,各方数据联合运算,输出企业信用评分,实现风险控制,为金融集团降本增效:方案实施后,使得金融集团的成本降低2%。方案中创新地使用了隐私保护评分技术对参与运算的数据维度给出评分,使得外部数据源在提供数据服务时,既满足了金融集团对必要数据样本的内容分析需求,也避免了暴露自身数据的具体样本内容,属于业内首创。针对如何监管交易合法合规进行,方案中引入第三方监管机构,并对于事前、事中、事后的全程密文监管进行了有益探索和实现。应用解决方案架构图12Use Cases for Trusted Data Exchange数据要素可信流通案例集金融投资Financial investment01 公积金区块链数据共享平台申报主体:郑州盛见网络科技有限公司一、案例介绍公积金区块链数据共享平台基于多节点、多链、多机构的设计思想,结合公积金目前的流程特点,公积金区块链数据平台基于多个地区和机构构建分布式去中心化节点网络,针对不同的业务场景和机构,构建专享的业务链,基于底层的跨链中继器,实现各链之间的数据共享交换,实现链上数据隔离隐私,全局数据协调共享,打通多机构及系统之间的数据无缝可信交换流转,解决了目前公积金办理流程中用户个人数据无法确权与监督,个人数据流转过程中数据安全无法得到保障的问题。网络节点:公积金区块链节点基于各地市、各机构分布式互信节点,同时兼顾私有云和公有云节点环境;联盟链平台:公积金区块链数据共享平台和区块链数字身份,使用XPOA联盟链共识协议,管理区块链和业务系统,包括节点状态维护,证书颁发和销毁,合约管理,出块和交易监控告警等管理功能.使用区块链数字身份,实现身份跨链、跨系统的身份互认;基础服务:国密CA证书的管理,所有节点和用户证书均使用符合国家保密要求的国密证书,提供第三方合规CA厂商对接接口.所有数据都经过见过合约过滤,避免敏感信息和非法信息上链或读取。所有操作和交易都记录上链,不可篡改,用于回溯监管等需求.使用跨链中继器实现多链数据可信流转和互认,由中继链、跨链网关、应用链三部分组成;业务链:基于区块链多账本技术,单独的业务独立链运行,互相数据隔离,通过底链的跨链中继器进行跨链交互,可以快速构建某银行专有业务链、地市业务链、铁路公积金等多种场景的业务链;业务应用:基于业务链,搭建需求场景的业务应用,结合链下应用和链上DAPP,包括实名认证、数据同步、数据查询、查询记录等应用场景;使用接入:对接各种使用主体,包括用户、银行、认证机构、跨链调用、API、SDK等方式和主体。二、案例特色(一)技术创新基于区块链公私钥体系,数据传输全程加密,只有指定用户可以解密查看。使用临时授权签名机制,确保授权的有效期和数据授权范围。使用合约指令管理数据沙盒,确保使用数据处理过程安全,结果可信。使用合约虚拟机,支持主流语言开发合约,包括Java,C+,Go,Solidity等。基于模块化和可插拔设计,可以根据业务场景扩展定制共识算法,合约虚拟机,存储,P2P网络等核心组件。(二)模式创新数据确权:保证共享不改变数据的归属权;使用授权:在网银APP里调用支付宝或微信等进行人脸识别认证,基于去中心化考量,本次认证成功之后用户可以授权给银行查询个人的公积金信息和业务办理;全程留痕:公积金数据提供和使用过程可追溯,权责清晰利于解决纠纷。假如数据运用不当或者产生了隐私安全问题,可以追溯问题产生的原因,追溯由哪个机构负责,确保在数据使用过程中,可以确认权责,建立出权责匹配的问责体系;隐私保护:加密算法能够有效地降低数据共享过程中的安全风险,国密非对称加密技术保证了数据在机构传输过程中的安全性和准确性,并满足合规性要求。(三)流程创新由具备对应贷款需求的用户主动发起向金融机构的查询授权,授权包含了查询的授权人、授权范围、数据获取方式(数据实体、可用不可见数据共享服务)、授权生命周期。金融机构在向公积金中心请求该居民数据时,需在请求中携带授权私钥。同时,为防止出现数据泄露,数据的传输均采用公积金中心+数据所有人双方私钥共同加密,并约定只有数据所有人私钥+被授权人私钥共同使用可解密数据。在这个过程里,明确了数据的权益人、数据确权、使用授权、请求鉴权等环节,整个业务过程在区块13Use Cases for Trusted Data Exchange数据要素可信流通案例集链上进行,由区块链对过程、人员、结果进行存证。三、应用场景及产业效应以用心服务为核心理念,致力为客户提供最优秀的软件和数据解决方案及相关咨询、培训和实施服务。首先应用背景与痛点:在未应用该技术前,居民在申请购房使用公积金+商业贷款组合贷,基于公积金、社保数据的信用贷时候,银行对居民个人的数据查询仅仅是在中心化的网银系统、网点纸质签约以授权居民公积金资产数据查询,用户是否授权金融机构查询个人资产数据无法做到有效确权与监督,个人数据也无法实现确权与权利管理。在应用区块链技术后,由具备对应贷款需求的用户主动发起向金融机构的查询授权,授权包含了查询的授权人、授权范围、数据获取方式(数据实体、可用不可见数据共享服务)、授权生命周期。金融机构在向公积金中心请求该居民数据时,需在请求中携带授权私钥。同时,为防止出现数据泄露,数据的传输均采用公积金中心+数据所有人双方私钥共同加密,并约定只有数据所有人私钥+被授权人私钥共同使用可解密数据。在这个过程里,明确了数据的权益人、数据确权、使用授权、请求鉴权等环节,整个业务过程在区块链上进行,由区块链对过程、人员、结果进行存证。其次应用模式与流程:第一步,用户基于网银APP结合公积金目前的使用场景,首先登录网银账户;第二步,在网银APP里调用支付宝或微信等进行人脸识别认证,基于去中心化考量,本次认证成功之后用户可以授权给银行查询个人公积金信息和业务办理;第三步,用户人脸识别确认身份后,返回授权码和解密密钥,授权码是给银行APP,有授权码才可以进行查询,返回的数据也是加密的,需要使用密钥进行解密;第四步,用户将授权码传递给网银APP,允许银行查询个人信息,包括使用时长和次数;第五步,网银后台使用授权码,通过内网访问公积金的业务平行链获取信息,信息已经过加密。银行系统需要使用单独分配的密钥才能访问内网的业务链;第六步,业务链如果没有数据,会请求公积金区块链数据平台,获取加密后的信息,记录数据调用记录;第七步,返回经过密钥加密的数据,需要使用用户的密钥进行解密,确保数据传输过程的安全性;第八步,业务链将加密数据返回给银行的内网系统;第九步,网银APP将数据返回给用户,用户使用密钥解密加密后的数据,获取明文信息。项目在试用阶段已经覆盖多家金融机构,平均每月链上交易80万笔,累计服务了30余万公积金缴存职工,协助金融机构发现及防范金融交易风险一百余次。四、未来发展前景将继续扩大区块链技术在公积金业务合作银行的应用规模,将小微企业普惠金融服务纳入区块链技术应用范畴。后续还将扩展公积金内部业务上链,探索“公积金+区块链”新型业务模式,通过区块链业务协作网络系统搭建上链下链通道,服务公积金各场景应用。重点支持提取类、贷款类、跨省通办类、异地转移类等公积金业务,赋能跨机构数据合规安全可信流转。用户银行公积金业务平行链公积金区块链平台登录授权银行查询公积金信息使用授权查询银行APP查询授权同步主链信息数据查询1586349获取公积金查询授权/解密密钥授权银行查询非内网环境内网环境密钥解密密钥加密人脸识别/实名认证(调用支付宝或微信)27公积金区块链数据共享平台业务流程图14Use Cases for Trusted Data Exchange数据要素可信流通案例集金融投资Financial investment01 基于数库 DAS 系统的智能文档处理项目申报主体:数库(上海)科技有限公司一、案例介绍(一)案例背景及问题痛点在数字经济腾飞的大背景驱动下,较多行业开始步入数字化转型阶段,但受限于技术、经验等问题,企业和机构普遍存在数据处理痛点,许多机构虽内部拥有大量存量数据,但仍难以高效将数据资产盘活。针对目前企业及机构普遍存有的数据处理痛点进行了针对性地解决,帮助企业及机构解决定期报告披露的高峰期的文档处理问题,尤其在年报和半年报的披露时间,容易出现因机构人员无法大幅扩张而造成的数据处理延迟问题。期望以自身能力辅助各行业进行文档的高效处理,盘活数据资产,促进数据流通,实现真正行之有效的数字化转型。(二)产品设计理念数库科技DAS系统是一款以人工智能驱动金融数字化产品,集成了机器学习算法、标注系统、数据业务标准等系统模块,拥有一整套完整的数据自动化处理流程,能够覆盖对现有上市企业所有公开报告的数据提取,可以有效识别电子版文档和扫描件图片(结合OCR技术),结合数库科技积累的大量容错集,可以生产出高度标准化的元数据,实现数据的规模化生产,帮助银行等金融机构及多行业处理自身各类非结构化文档(信贷类、审计类、合同类文档等)。通过DAS,数库科技拥有了行业领先的数据处理能力,形成了全面的上市公司财务附注数据库,并能提供全市场最快的财务附注数据服务,包括T+15min的实时数据流和T+1频度的日度数据。二、案例特色(一)实施思路通过使用数库科技DAS系统,依托适度的模型训练,系统能以高准确度提取数据(包括附注含上千个财务指标)并在基于 DAS 的数据生产流程15Use Cases for Trusted Data Exchange数据要素可信流通案例集秒级把单个文档的数据提取完毕,并做自动化的质检,以及通过几千个复杂的公式将原始财务科目映射到相关财务科目体系上去。提取完毕后,通过将这些公式以及上百条质检规则配置到DAS里,系统又能以秒级的速度将这些转换和质检自动化执行完毕。(二)技术创新DAS系统基于Java/.Net/Python混合开发,采用了先进的云原生微服务架构,利用自然语言处理(NLP)、深度学习(Deep Learning)等人工智能技术手段,结合Kafka高效率消息处理机制,在系统架构上做到高可用、高可靠、扩展性,支持系统架构横向扩展。生产模式转变:由人工手工处理转变为机器自动化处理,可实现7*24小时生产;生产投入快:从耗时培训人员处理文档,转变为只要构建、训练模型,1-2周即可投入生产;生产效率高:手工处理1篇文档1人天,DAS只要几秒即可处理完成;数据准确率高:自动化质检代替人工质检,标准化的质检逻辑保障了高准确率,准确率可达95%以上;生产效益大:与传统人工生产相比,产生同样效益的情况下,只需1/10成本;行业痛点:解决了需要投入大量经验丰富的人员手工维护的行业痛点。三、应用场景及产业效应数库科技DAS系统旨在帮助数据部门以批量化形式高效、精准的生产数据,可以灵活处理各类文档中的表格与文本信息,并结合数库科技多年来积累的科目语料将提取的财务科目标准化;不仅限于公开的上市公司公告和研究报告的PDF表格化处理,也适用于机构内部文档的数字化,包括WORD文件,扫描件(结合OCR技术)。目前,数库借助DAS实现了三大报表的分钟级自动化处理,100多个财务附注可以在15分钟内处理完毕。一方面,数库科技自身使用DAS系统进行内部数据产品如产业链、图谱等数据产品的生产;另一方面,我们已经将DAS SaaS服务化,可对外提供给银行、保险、资管等金融机构用于处理自身各类非结构化文档(信贷类、审计类、合同类文档等)。数库科技DAS系统的应用,一方面,其自身产出的标准化数据可辅助金融机构投资决策,同时依托扎实数据自下而上建立Clue对公数字化中心等数字化转型解决方案,可通过产业链获客、供应链获客、商机线索等7大营销获客方式帮助银行实现对公营销业务的显著增量。另一方面,数库科技DAS系统可帮助企业、机构等完成非标准化数据-标准化数据的批量化生产及治理,帮助各行业将海量静态数据转化为有价值的数据,实现整体业务的增长,促进数字经济对实体经济的赋能。四、未来发展前景数库科技DAS系统为整个数字化转型领域开拓了全新标准,它重新定义了数字底座,即怎样的数据才能够被真正应用于各行各业,不流于皮毛的、真正促进行业发展,带来业务增量。未来,可以预见的是,数库科技DAS系统将能够被更多机构应用以处理自身存量数据及各类文档。同时,数字化转型腾飞的趋势也必将带动其他行业对于数据治理与业务数字化转型的重视。凭借基于产业逻辑的数据治理思路及方法,数库科技的数据能力将更广阔的赋能和应用于各行各业,在促进数据要素流通的同时,实现为实体经济赋能的精准滴灌。DAS 技术架构16Use Cases for Trusted Data Exchange数据要素可信流通案例集金融投资Financial investment01 基于联邦学习技术的电信反欺诈服务申报主体:中国工商银行股份有限公司一、案例介绍本案例目标是基于工行联邦学习平台,通过“数据可用不可见”的方式,为银行在安全隐私及合规的前提下引入运营商数据,实现银行运营商联合建模,极大提升银行电信反欺诈的效果和效率。创新技术方面:主要采用联邦学习、隐私求交、匿踪查询等隐私计算技术,主要提供隐私求交、联邦特征统计、联邦学习、匿踪查询等服务。平台支持100余种业界常用的联邦学习算子,覆盖了各种安全级别的特征探查、特征工程功能。组织架构方面:平台整体架构分为三层,上层建设功能完善、流程统一的平台服务;中层建设统一异构引擎功能接口,推动互联互通;底层建设统一算力、数据、权限等资源对接接口。业务流程方面:支持企业业务系统与互联网、政务、电信等外部合作方数据要素安全合作,在保障各参与方数据隐私和安全的前提下,促进工行风控管理、对客服务、产品创新、普惠金融等业务领域的提质增效。具体实施方面:通过整合开源技术框架和商用产品,打造企业级联邦学习平台,满足不同场景使用需要;同时面向用户提供跨机构一站式建模流水线、在线推理等功能,降低技术使用门槛;为满足金融行业使用的高稳定性要求,平台实现了负载均衡、断点恢复等高可用功能。二、案例特色本案例创新性地采用联邦学习技术完成联合建模,保证数据安全。联邦学习的特点是,基于统计学和机器学习建模的原理,在原始数据不进行传输、交换的情况下,通过模型训练过程中的中间结果交互,完成模型的训练,实现数据不动模型动,数据可用不可见。联邦学习多应用于计算量大、计模型训练图17Use Cases for Trusted Data Exchange数据要素可信流通案例集算逻辑复杂的机器学习建模场景。本场景中,工行、电信原始数据都保存在本地,原始数据不出域。使用隐私求交技术获取双方共有客户,但双方用户列表互不暴露。使用同态加密技术交互梯度更新模型,工行数据模型参数保存在工行,电信数据模型参数保存在电信,工行、电信模型参数汇总即为最终模型。在保障数据“可用不可见”的前提下,工商银行以自身电信诈骗风险特征基础,引入了运营商层面通话类、短信类、流量类、机主信息类指标,建立工行手机银行登录行为异常识别模型。在保护数据隐私和安全前提下,工行反欺诈系统通过与联邦学习平台的对接,可以基于该模型实现对异常客户的预判,助力更早抓出可疑客户,提前、准确地识别风险事件,减少风险账户数量,进一步减少银行客户的资产损失,提高服务客户水平。三、应用场景及产业效应本案例的场景结合银行与运营商双方的数据,还原了从打电话开始,以收款结束的完整诈骗流程,构建了完整链路的电诈风险特征,建立工行手机银行登录行为异常识别模型,进而提升了银行侧风险识别的准确率与覆盖率。首先,本场景提高了银行风控工作的准确性和智能化水平,使反欺诈从“被动防”走向“主动控”,有效助力国务院“断卡行动”的开展。银行将自身拥有客户手机银行各类交易信息、登录信息等数据,通过联邦学习方式与运营商数据进行联合建模,结合运营商通话类、短信类、流量类、机主信息等,补足了银行自有的客户风险特征,更加准确地识别风险事件。同时,“断卡”行动以来,监管对于电信诈骗涉案前的风险识别与管控提出了较高的要求。但银行侧受限于自身的数据对诈骗者与受害人的行外的风险行为知之甚少,涉案前模型一直无法落地,但引入运营商测数据后,不仅实现了完整涉案链路的还原,也加强了对客户行外风险行为的了解,真正实现了涉案前风险账户的精准识别,助力银行实现了主动风险防控。截止2022年9月,工商银行涉案账户数量同业排名压降至四大行最低,取得了国务院“断卡行动”以来的最好成绩。其次,本场景为金融行业的反欺诈构筑了新的体系和生态,有利于促进数据生态的良性发展。利用联邦学习平台,工商银行联合中国电信构建了电信反欺诈模型,在保障数据安全的前提下实现数据的流通和数据价值的挖掘,使得银行数据与外部数据得以实现合规、合法前提下的联合建模,实现了运营商、银行数据联合应用。未来工行也计划依托联邦学习这种方案拓展与其他运营商或其他行业的合作,完善反欺诈工作。四、未来发展前景在经济效益方面,本案例基于工行联邦学习平台搭建的电信反欺诈模型,能够助力银行更加全面准确地识别风险事件,减少工行风险账户数量,缩短风险账户识别周期,提前识别欺诈事件,进一步减少银行客户的资产损失,提升银行风控数字化、智能化水平,提高服务客户质量。在社会效益方面,本案例通过使用联邦学习有效提升了反欺诈识别能力,一方面更加能保护用户隐私,提高用户对金融机构的信任水平;另一方面,这种模式大幅提升了反欺诈的识别能力,可以有效降低欺诈风险和损失,提高整个金融系统的安全性,保障金融体系的稳定和健康,进而为社会提供更加安全和可靠的金融服务。手机银行登录行为异常识别模型流程图18Use Cases for Trusted Data Exchange数据要素可信流通案例集金融投资Financial investment01 银行隐私计算互联互通平台申报主体:同盾科技有限公司一、案例介绍隐私计算作为破解“数据孤岛”,兼顾数据高效利用和数据安全隐私保护的技术,近年来发展迅速。然而各隐私计算厂商研发的平台多为异构闭源平台,技术实现原理差异较大,跨平台难以互联互通,隐私计算原本连接的“数据孤岛”,又演变成“计算孤岛”,给数据应用方带来了系统重复建设和运维成本增加的问题。在该案例中,某股份制银行作为数据应用方,需要与不同数据提供方合作,且行内部署的第三方隐私计算平台为闭源实现,随着合作平台数量增加,对行内系统的安全监管也带来了巨大挑战。因此,互联互通成为连接不同隐私计算平台“计算孤岛”的技术最优解。对此,同盾科技依托自主研发的“智邦平台”以及联邦数据安全交换(Federated Learning EXchange,FLEX)协议与该银行的隐私计算平台实现互联互通,并协助该银行完成企业级隐私计算互联互通标准的制定。FLEX协议约定了联邦过程中参与方之间数据交换顺序,以及在交换前后采用的数据加解密方法。只要参与各方能够遵守这些约定,就可以安全地加入到联邦中提供数据或使用联邦服务,无需担心数据隐私会有泄漏风险。该银行隐私计算互联互通平台的构建使得数据、模型、场景可跨平台共享,便于共同构建隐私计算生态网络以及银行快速落地业务场景。二、案例特色银行隐私计算互联互通平台以“求同存异”为原则,关注跨平台协同能力基础环节的标准化,同时也需兼顾个性化和可扩展性。结合当前业内主流的互联互通方法,该案例根据实际情况,拟定了“可插拔式平台框架+算法组件架构”的技术方案。一是多方异构隐私计算平台管理系统互联互通。各方搭建可插拔式平台支持算法组件即插即用,并在平台层面使用同一套协议规范进行互联互通。不同平台服务商可插拔式平台间对算法本身的设计不作定义,而对算法基本信图:银行隐私计算互联互通平台19Use Cases for Trusted Data Exchange数据要素可信流通案例集息、输入输出协议规范定义,使算法可通过算法组件形式在平台上使用,同时定义不同平台间的认证互联、存证互联等协议。二是多方异构隐私计算平台算法组件互联互通。算法组件因其特殊性,互联互通策略不尽相同,对此项目组设计并落地了算法层面互通的白盒模式和黑盒模式,供实际场景灵活选择。三、应用场景及产业效应银行隐私计算互联互通平台的构建将为银行业务场景及产业带来三点重要价值:首先,数据、模型、场景可跨平台共享,便于共同构建隐私计算生态网络,可支持平台越多,越易扩展生态网络,极大简化技术对接流程;其次,对于有指定隐私计算平台的数据合作方,可在不要求其必须本地部署行内平台的前提下,快速落地业务场景;最后,各家金融机构使用同一套互联互通标准有助于监管部门统一管理,提升隐私计算的安全性和规范性。本案例中,该银行隐私计算平台已与同盾科技、平安科技等四家企业实现了异构隐私计算平台互联互通。并通过隐私计算跨平台互联互通企业标准,为各家金融机构提供一个可执行的、安全的、规范化的互联互通落地参考标准,有利于推动隐私计算金融行业发展进入平台互联、生态互通的2.0时代。此外,制定相应的隐私计算平台标准规范,将促进各隐私计算平台间的互联互通,已经成为推动数字经济发展,激活数据要素流通生态,赋能各行各业创新发展的必然之举。四、未来发展前景随着市场需求、政策法规、技术创新等因素推动,未来隐私计算将会在更多行业领域得到广泛应用,并催生新型数据流通生态。银行隐私计算互联互通平台及企业标准可作为金融行业实际案例参考,帮助各金融机构打通不同业务和数据合作生态,推动数据价值安全流通,有助于隐私计算互联互通在金融行业进一步推广,为中国数据要素流通市场高质量发展作出贡献;同时也有利于形成可落地的互联互通行业标准,方便中国人民银行落实金融监管,有效促进金融业务和金融科技的守正创新,以向善科技助力数字经济高质量发展。图片来源:同盾科技有限公司20Use Cases for Trusted Data Exchange数据要素可信流通案例集金融投资Financial investment01 上市公司情绪感知系统申报主体:深圳飞笛数云信息技术服务有限公司一、案例介绍在二级市场投资中,投资人通常重点关注标的公司内在基本面作为价值判断的主要投资依据,但由于公司股价往往会受到外在舆论情绪的影响产生不同程度的波动,而外在情绪一般主要由舆情面引导,尤其是社交言论在互联网发生、发酵的影响。研究和量化外在情绪的舆情对投资标的影响愈发显得重要;尤其在国内A股投资中,股价波动受到舆情和社交言论情绪的影响较大。二级投资市场的公司舆情分析工具极少,这类需求尚未得到满足。飞笛经过研究分析发现,对上市公司舆情面影响较大的主要集中在头部媒体及互联网社交平台,通过收集上述来源的公司新闻及评论进行分析量化,可以有效地量化出上市公司的舆情动态。二、案例特色(一)系统优势信源全:系统数据主要来自股东新浪旗下“新浪微博”全图:飞笛-财经情绪感知系统21Use Cases for Trusted Data Exchange数据要素可信流通案例集量社交商业数据(飞笛是新浪微博财经类独家信息合作伙伴),以及战略合作伙伴21世纪经济报道已授财经版权的数据。本系统拥有速度、访问
展开阅读全文