ImageVerifierCode 换一换
格式:PDF , 页数:91 ,大小:2.88MB ,
资源ID:1315118      下载积分:20 金币
验证码下载
登录下载
邮箱/手机:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/1315118.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
声明  |  会员权益     获赠5币     写作写作

1、填表:    下载求助     索取发票    退款申请
2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
7、本文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

注意事项

本文(金融业图数据库建设发展调研报告.pdf)为本站上传会员【Stan****Shan】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

金融业图数据库建设发展调研报告.pdf

1、金融业图数据库建设发展调研报告金融电子化杂志社有限责任公司2023年6月前言随着数字经济的高速发展,以图数据库、图计算、图学习为代表的图技术迎来了蓬勃发展的黄金时期,新技术在赋能数字经济的同时也带来了应用实践上的全新挑战。作为算力和数据存储的载体,图数据库技术能够实现底层数据的互联互通,充分挖掘数据内在关联,最大化释放数据资产价值,已成为金融业数字化转型的重要基础设施。国家相关部门高度重视,先后出台多项政策,推动图技术在金融行业的应用。中国人民银行金融科技发展规划(20222025 年)明确指出:运用联合建模、图计算、数据可视化、数字孪生等技术手段,对海量多样化多维度数据资源进行价值挖掘和关联

2、分析,建立面向用户、面向场景的大数据知识图谱和综合分析能力。因此,金融机构对激活数据要素和数智转型越发关注,图数据库凭借深挖数据价值、创新数据应用、释放数据潜能的关键能力,成为金融机构高效治理、利用数据资产实现业务升级的主要选项。为更好地了解我国金融业图数据库技术的应用现状及需求,发现行业共性问题,宣传成功经验,我们组织了针对金融业图数据库建设发展的调研工作,从建设背景、建设现状与挑战、趋势与展望等维度,对近百家金融机构进行了深入细致地调研,也获得了各方面的大力支持和积极参与。通过对调研数据科学的研究与分析,编撰出版了金融业图数据库建设发展调研报告,希望可以为金融行业的相关从业者和研究者提供有

3、价值的参考和借鉴,有效推动金融业务创新和发展。贡献单位中国银联中国农业银行交通银行中信银行华夏银行广发银行上海浦东发展银行浙商银行建信金融科技有限责任公司北京银行秦皇岛银行阜新银行辽宁振兴银行吉林亿联银行江苏银行厦门国际银行青岛银行郑州银行汉口银行湖南银行广州银行重庆银行成都银行中国工商银行中国银行中国邮政储蓄银行中国光大银行中国民生银行平安银行渤海银行成方金融科技有限公司兴业数字金融服务(上海)股份有限公司河北银行晋商银行大连银行吉林银行上海银行杭州银行齐鲁银行中原银行湖北银行武汉众邦银行长沙银行广东华兴银行四川银行四川新网银行贵阳银行青海银行河北省农村信用社联合社长春农村商业银行浙江农村商

4、业联合银行江西省农村信用社联合社青岛农村商业银行湖北省农村信用社联合社湖南省农村信用社联合社广州农村商业银行深圳农村商业银行广西壮族自治区农村信用社联合社四川省农村信用社联合社贵州省农村信用社联合社青海省农村信用社联合社中国人寿保险股份有限公司中国银河证券股份有限公司西安银行北京农村商业银行辽宁省农村信用社联合社江苏省农村信用社联合社宁波鄞州农村商业银行山东省农村信用社联合社河南省农村信用社联合社武汉农村商业银行广东省农村信用社联合社广东顺德农村商业银行东莞农村商业银行重庆农村商业银行成都农村商业银行甘肃省农村信用社联合社中国人民财产保险股份有限公司阳光财产保险股份有限公司浙江创邻科技有限公司

5、目录观点摘要第一章调研背景与方法一、调研背景二、调研内容三、调研对象及方法第二章图数据库建设洞察一、图数据库知识介绍1.图数据库概念2.图数据库技术的发展历史3图数据库的优势4图数据库的分类二、加快图数据库建设的驱动因素1国家政策支持推进建设进程2激活数据要素是行业的共性需求3图数据库成为解决业务痛点的重要手段三、图数据库市场现状与生态1全球市场现状2图数据库生态1444466668810101011121213第三章我国金融业图数据库建设现状一、被调研机构样本统计二、金融业图数据库整体表现1图数据库建设发展不均衡2图数据库应用场景多元发展三、金融业图数据库选型关注重点1性能表现成为金融机构关

6、注焦点2安全可控是金融机构的重要考虑因素3业务支撑能力是普遍关注点4简单易运维受行业青睐5用户普遍关注企业在行业的应用能力四、金融业图数据库建设难点1人才紧缺、业务场景价值有待验证是建设的主要瓶颈2亟待建立与推广图数据库行业标准第四章金融业图数据库建设与应用趋势一、金融业图数据库建设整体路径1自研应用+外采图数据库成为首要建设路径2业务发展是驱动金融机构图数据库应用的主要动力二、金融业图数据库建设方向1打破数据孤岛,打造企业级图数据库平台2图数据库应用场景向多元化、实时化发展3图数据建设与应用规模增速迅猛三、金融业期待与展望1大规模图数据实时分析需求增加,推动图技术向 Graph3.0 时代升

7、级2与 ML、DL 等人工智能技术结合,实现可解释的 AI3关注时序数据分析,实现业务动态化分析1414141419232427292932323236383838393940424446464849第五章图数据库未来发展建议一、底层技术自主可控成为关键竞争力二、人才是打通图数据库金融行业应用的关键三、存储、计算、分析一体化的图平台或成主流第六章金融业图数据库实践案例案例 1农业银行图数据库建设历程案例 2交通银行全栈式知识图谱平台及应用建设案例 3民生银行知识图谱建设与应用案例 4图数据库建设发展思考与实践案例 5基于图数据库的金融知识图谱典型应用案例 6图数据应用建设探索与实践案例 7基于

8、知识图谱的智能风控平台实施案例案例 8图计算在中原银行反欺诈领域的探索应用案例 9阳光财险非车新一代产品工厂参考文献5252525355555962656771747781831金融业图数据库建设发展调研报告观点摘要数字经济创造发展机遇,国家政策支持图数据库建设随着通信技术和大数据的快速发展,金融行业所具有的数据资产体量剧增,数据之间的关联关系也变得更加复杂交错。图数据库作为深入挖掘数据信息的有力工具,受到全行业的广泛关注。在国家将高性能计算技术提升到国家战略高度的大背景下,图数据库建设迎来了发展的黄金时代。2021 年 11 月,工信部发布“十四五”软件和信息技术服务业发展规划,在“关键基础

9、软件补短板”专栏中,明确指出“突破全内存高速数据引擎、高可靠数据存储引擎、分布式数据处理与任务调度架构、大规模并行图数据处理等关键技术,推动高性能数据库在金融、电信、能源等重点行业关键业务系统应用。”图数据库在金融行业获得长足发展,但总体建设进度不一作为创新技术,虽然图数据库技术尚在技术采用周期的早期阶段,但在我国数字化程度领先的金融行业,已获得长足发展。本次被调研的 100 家机构中,79 家金融机构返回了有效问卷,超过半数的机构已在使用图数据库,仅有 2.5%的机构表示没听说过图数据库技术。图数据库的使用受到机构规模和区域环境的双重影响,呈现出建设进度不一的特征。其中,国有大型商业银行发挥

10、领跑优势,对图数据库的认知、投入、建设规模均处于行业领先阶段,被调研的 6 家国有大型商业银行中,83.3%已进入图数据库的使用阶段,10 家股份制银行均已进入图数据库的使用阶段,6 家其他金融机构中,66.7%已进入使用阶段;32 家城商行中,50%正在使用图数据库;25 家农信社、农商行中,72.0%的机构未听说过图数据库,或听说但未使用过图数据库。长三角、珠三角地区的图数据库使用程度最高,超过半数的机构已使用一种及以上图数据库。金融业图数据库建设发展调研报告2金融机构图数据库建设规模增速快、技术应用差异化程度高图数据库能够实现底层数据的互联互通,充分挖掘数据要素的业务价值,已成为金融机构

11、在数字化转型中的关键选择,被越来越多的金融机构所认知并采用。统计截至 2022 年末金融机构图数据库建设现状发现,已使用图数据库的 41 家机构技术应用差异化程度高:图数据量从 100GB 到超过 10TB,58.5%的金融机构达 TB 量级,17.1%超过 10TB;图规模从百万点边到超过百亿点边,主流在 1 亿-10 亿点边规模(36.6%),14.6%达 10 亿-100 亿点边规模,9.8%的机构建设规模达 100 亿以上;图服务器节点数量 2-3 个占比39.0%;4-10 个占比 31.7%,12.2%的机构部署了超过 30 个节点。统计被调研机构的 2023 年图数据库建设规划发

12、现,图数据库市场增速快:规划中,31.7%机构的图数据规模达 10TB 以上,同比增长 85.7%;主流依然为 1 亿-10 亿点边规模(39.0%),24.4%达 10 亿-100 亿点边规模,同比增长 66.7%,17.1%达 100 亿以上点边规模,同比增长75.0%;图服务器节点数量 2-3 个占比 22.0%,同比降低 50.0%,4-10 个占比 36.6%,同比增长15.4%,14.6%的机构计划部署超过 30 个节点,同比增长 20.0%。这是由于一方面金融机构业务量的迅速增长导致数据量激增,对大数据的关联存储查询性能提出了更高需求;另一方面,金融机构的数字化转型压力在不断增加

13、,发挥数据资产价值的需求更加强烈,促进了以图技术为驱动的业务应用创新。大数据查询性能与自主可控是金融机构选型的首要关注点随着数据规模急剧增长,存储处理的数据类型、数据维度多样化、复杂化,图数据库技术有助于在即时查询,并发操作,关联关系等方面大幅赋能业务数据潜在价值的释放。金融业对于图数据库产品的技术价值关注度主要聚焦于存储、查询、分析能力上,87.8%的被调研机构将图数据库的大数据处理性能看作最重要的考量指标。此外,随着政治环境的不断变化、金融机构对安全、自主可控提出了更高的要求。48%的被调研机构将产品闭源、代码安全性保障、能够规避知识产权风险或是否“100%自主可控”列为重要考量因素。50

14、%以上被调研机构均认为“100%自主可控”是重要考量指标,其中 40%国有大型商业银行将其作为首要关注的指标。60%的被调研机构明确表示会选择自主可控的图数据库,其中所有被调研的股份制银行均表示必须为自主可控的图数据库。3金融业图数据库建设发展调研报告金融机构图场景建设方向明确,企业级图平台为首要建设目标金融机构在规划未来建设方向时,对于整合全行数据资源,打通各部门“数据孤岛”,实现统一的数据管理、关联挖掘、业务洞察表现出了极高的迫切性。在图技术场景建设方面,被调研机构更聚焦传统数据库不能有效支持的创新应用,超 90%的被调研机构规划建设企业关系图谱库、实时交易反欺诈应用、反洗钱应用。超过 6

15、0%的被调研机构有零售营销图谱及数据血缘场景的建设计划。虽然当前图技术主要由创新应用场景引入,但金融机构也明确表示希望形成跨单一场景的平台能力。调研结果显示,在有计划部署图数据库的 49家金融机构中,企业级图数据库平台成为首要规划建设的场景,80%的机构表示有相关建设计划。商业图数据库优势明显,单一供应商成为主流选择图数据库及其应用市场正处于快速发展迭代的过程中,市场内相关厂商较多,商业图数据库产品在性能表现、核心代码安全、综合运维管理成本,以及成熟的服务团队等方面都具有显著优势。相对于从 0 到 1 进行图数据库自研,或是基于开源图数据库自行搭建系统,金融机构更倾向于底层图数据库外采、上层应

16、用自研的建设思路。在 49 家计划部署图数据库的金融机构中,仅有 5 家机构表示会以自研为主,近 90%的机构表示会选择与商业图数据库厂商合作,其中 73.0%表示会选择单一商业图数据库供应商,以降低管理与运维复杂度。打通应用“最后一公里”,成为图数据库技术发展的关键点在计划部署图数据库的 49 家被调研机构中,图数据库厂商的实际落地案例成为金融机构的首要考量因素,95.9%的被调研机构均表示更倾向于与已有金融机构合作案例的图数据库厂商开展合作,股份制银行则尤其看重大型银行的合作案例。此外,83.6%的被调研机构表示会关注厂商是否具备完善的实施和售后支持。图技术专业人才的稀缺已经成为制约金融行

17、业图数据库应用的重要因素,78.5%的金融机构表示缺乏相关的技术专业人才。国有大型商业银行作为图数据库的深度用户,对业务、技术,以及技术业务结合的复合型人才均表现出了极高的需求。因此,被调研机构均表示期待有更多机会参与图数据库相关活动以获得技术指导,尤其对业务场景的具体解决方案的支持交流有着强烈需求,希望通过技术交流打通图技术应用“最后一公里”。金融业图数据库建设发展调研报告4第一章调研背景与方法一、调研背景当前,金融业积累的数据呈指数级增长,新的数据源层出不穷,且数据丰富程度增加,数据间的关联性增多,传统的对小量、单维度、静态化数据的分析已无法满足金融业数字化转型发展的需求。传统的关系型数据

18、库无法满足高效、可扩展、复杂数据管理和分析的需求,存在数据处理效率低、分析应用效果弱的问题。图技术以“点”“边”为数据结构直观简洁地描述业务实体之间的复杂关联关系,以复杂关联关系的存储、查询、计算性能优化为第一设计原则,能够高效地挖掘多源异构数据间潜在的内在关联、最大化释放数据资产价值,提升金融机构对客户的全局洞察力,激发金融机构的业务创新能力。面对挑战和新的发展机遇,金融机构逐步落地图数据库应用,打造数据互联网络效应,实现金融科技创新,赋能业务发展。为深入了解我国金融机构图数据库技术应用现状及发展趋势,开展本次调研。二、调研内容本次调研工作主要围绕金融机构在图数据库领域的布局、应用规模、典型

19、业务场景,以及在实际运用遇到的问题和未来发展规划等信息进行采集分析,力求客观反映当前国内金融机构图数据库的建设、应用和发展情况。三、调研对象及方法参与调研的金融机构包括:国有大型商业银行(简称国有大行)、全国性股份制商业银行(简称股份制银行)、城市商业银行(简称城商行)、农信社(农商行)及其他金融机构(银联、证第一章调研背景与方法5券和保险机构)。调研采用定量与定性结合的方法。定量方面,通过向100家金融机构发出份问卷,收到有效问卷 79 份,涵盖了长三角、珠三角、京津冀、中部、西部、东北等六大区域的金融机构。定性方面,与 13 家金融机构专家进行交流,详细调研了各家图数据库的应用现状。金融业

20、图数据库建设发展调研报告6第二章图数据库建设洞察一、图数据库知识介绍“图”是以图论(Graph Theory)为理论基础、以点(实体)和边(关系)为核心逻辑、描述现实世界中个体和个体之间复杂关系的数据结构,对现实世界的内在关系具有简洁、直观的表达能力。图技术泛指一切研究事物和事物之间的关系,描述、刻画、分析和计算事物之间关系的技术,用于从图结构数据中挖掘出有价值的知识或规律来指导业务决策,如风险评估、事件溯源、因果推理和影响分析等。图技术可大致分为三大类:一是处理图数据存储查询的图数据库技术;二是对图数据进行分析和计算的图计算技术;三是对图数据进行可视化展示的图可视化技术。实际应用中,三者的能

21、力呈现融合趋势。图数据库是以点、边为基础存储单元、以高效存储、查询图结构数据为第一设计原理的数据管理系统。图数据库非常善于处理海量关联数据,对于揭示数据之间的内在联系具有很大的性能优势。1.图数据库概念图的概念对于图数据库的理解至关重要。图(Graph)源于数学中的图论,是一组顶点和边的集合,“顶点”表示实体,“边”表示实体间的关系。图描述的是现实世界中一组对象以及这些对象之间存在的一组关联关系。图数据库是使用图结构存储数据、实现图语义查询的数据库管理系统,它通过“顶点”“边”和它们的“属性”来表示并存储数据。不同于传统数据库,数据间的关系以表与表之间的外键的形式隐形、间接存在,针对关系的查询

22、必须在运行时进行具体化操作,在图数据库中,数据间的关系和数据本身同样重要,它们被作为数据的一部分显性存储,关系上可添加方向以及属性对其进一步描述。这样的存储设计使图数据库能够直观、快速地响应复杂关联关系以及关系特征的查询,是存储、查询、分析高度互联数据的最佳技术方案。2.图数据库技术的发展历史以属性图为核心数据模型的现代图数据库从诞生到大规模应用大致分为三个发展阶段(见图1)。第二章图数据库建设洞察7Graph 1.0:单机原生图数据库2002-2010 年,以 Neo4j 为代表的支持事务性的原生图数据库的发布,标志着图数据库技术的诞生。原生图数据库采用“免索引邻接”的设计,让图遍历的性能仅

23、与被查询的顶点关联到的局部数据量相关,而不会像传统数据库那样随全局数据体量的增加而降低,实现了关联查询效率的极大提升。这个阶段的图数据库扩展性差,受限于单机的存储计算资源瓶颈,应用主要集中在知识图谱、股权图谱、数据血缘等小型静态数据的分析场景。Graph 2.0:分布式非原生图数据库2010-2015 年,随着大数据时代的到来,企业收集的数据的丰富程度与体量急速增长。图数据库应用开始从静态参考数据扩展到基于行为的核心交易数据,如资金流向、信贷申请、消费及生产关系上。此时,系统的横向扩展性成为行业刚需,是否支持大规模数据的分布式存储成为人们关注的重点。以 JanusGraph、ArangoDB

24、等为代表的分布式图数据库不断涌现,这些数据库底层基于分布式的开源 NoSQL 存储,实现了图数据的分布式存储和加工,一定程度上解决了单机图数据库在大数据量下的性能和扩展性问题。由于底层基于分布式的 NoSQL 存储,Graph 2.0 时代的图数据库产品的横向扩展性有长足提升。但由于底层的键值数据库、列式数据库等在内核设计上并不以“关系”的表达和处理作为优化重点,图遍历的查询性能较 Graph1.0 时代的原生图数据库有较大差距,无法满足大数据实时更新、查询、计算的需求,这个时代的图数据库技术多应用于大数据的离线分析场景。Graph 3.0:原生分布式图数据库2016 年开始,随着市场认知度的

25、加强,图数据库技术的技术成熟度不断发展,应用场景也数据来源:金融电子化杂志社,2023 年 3 月图 1图数据库技术发展的三个阶段金融业图数据库建设发展调研报告8不断被拓宽、升级到了基于行为、事件、物联网大数据的实时处理、分析场景。为满足大数据量级下的查询返回效率,在快速变化的商业环境下提供实时的商业智能,诞生了以 Galaxybase、Tigergraph 为代表的原生分布式图数据库,有效解决了大图数据深链查询效率和系统横向扩展性的双重需求。同 Graph 2.0 时代的产品相比,第三代图数据库不再依赖其他 NoSQL 分布式存储系统,直接控制了底层的数据存储与分布式数据通讯机制,实现了分布

26、式的原生图存储,因而大幅提升了大图数据的查询、处理性能。此外,由于图遍历的随机游走特性,大图数据的复杂查询任务往往涉及对不可以预测的数据量的分布式处理,查询优化需要复杂算法支撑,Graph 3.0 时代的图数据库同时增加了分布式并行计算的能力,以支撑实时图分析需求。大规模原生图存储、分布式并行计算能力正逐渐成为图数据库行业的主流。3.图数据库的优势相比传统的关系型数据库,图数据库有诸多优势:更直观、灵活的模型图数据模型直接还原业务场景,相比传统数据模型更直观、灵活,能够很好应对数据关系动态变化的场景,提升产品与研发的沟通效率,降低数据模型运营、变更成本。更简洁的查询语言图数据库的查询语言在关联

27、查询中更简洁,以通用的 Cypher 图查询语言为例,复杂关联查询的代码量比 SQL 大幅降低,提升应用系统开发效率。更高效的关联查询图数据库在处理关联性强的数据及天然的图问题场景时具有强大的关联查询性能优势。传统关系型数据库在进行关联查询时需要做昂贵的表连接(Table JOIN)操作,涉及大量的 I/O 操作及内存消耗,性能存在很大瓶颈。而图数据库专门针对关联查询进行优化,通过数据存储模式的重构,防止局部数据的查询引发的全局数据遍历,可以数万倍提升关联查询的效率。4.图数据库的分类图结构数据由具备多种属性的“点”“边”构成,且“点”“边”间存在关联复杂,图结构数据往往呈现出复杂性、多样性和

28、动态性的特征。图数据库的核心操作单元是图遍历,即通过不同的“边”关系查找给定“点”的多跳、不同属性的邻居点。这是所有图查询与图计算的原子操作,它的效率决定了图数据库的整体性能。“免索引邻接”(Index-free Adjacency)是一种数据组织形式,它能保证一个点和与它直接相邻的边被存储在一起,无需依赖其他索引类的数据结构即可通过图中的任意给定点直接访问它所第二章图数据库建设洞察9有的相邻边,让找到相邻点的时间成为一个不依赖整体数据量的常量开销。可以说图数据库的技术关键便是在于通过“免索引邻接”实现图查询效率的指数提升。根据实现免索引邻接的程度及方式不同,相应的图数据库的查询速度和数据的读

29、写性能也会出现巨大的差距。因此,依据不同图数据库在内核设计上是否实现了免索引邻接,以及在什么层面上实现的免索引邻接,可以将图数据库分为三类(见图 2)。完全非原生。这种结构未实现免索引邻接,它在数据层使用关系型数据库、键值数据库、文档或者其他多模数据库作为存储,在处理层通过多表链接及字段索引实现关联关系的查询,仅在业务层以图的方式进行呈现。该存储架构面对数据量小、关联跳数少、表关系简单、静态的场景也能良好支撑,但在数据量大、关系复杂的场景下查询效率会急速下降,还会带来大量表的大量全局索引的维护工作,对数据关系动态变化的场景运维成本很高,正在被主流图数据库市场淘汰。(见图 2)非原生存储。该内核

30、设计方式在数据层使用 Key-value 等非原生的存储结构,在处理层近似实现免索引邻接。由于存储层并没有完整的图语义支持,这种架构会导致图查询和计算时,存在存储层与处理层之间从非图模型到图模型转换的额外开销,产生性能损耗。在查询的点边数量较小,关联关系链路不深的场景中,非原生数据库性能尚可,但是当点边数量大,查询链路深,则需要数据来源:金融电子化杂志社,2023 年 3 月图 2图数据库的分类金融业图数据库建设发展调研报告10面对性能下降。此外,在处理层近似实现免索引邻接的过程受限于底层第三方存储系统的实现机制,还会导致查询性能稳定性、数据一致性差等问题。(见图 2)原生图存储。原生图存储不

31、依赖第三方关系型或 NoSQL 的存储系统,直接在存储层实现免索引邻接,实现复杂图数据遍历的极致性能。在原生图数据库上实现的图处理层,保持了存储与处理层的数据模型的一致性,降低了不同数据模型之间转换的处理成本,能够更好地实现存储与运算系统的无缝联动,降低非原生架构下不同系统间的黑盒沟通成本,最优化图处理性能。(见图 2)二、加快图数据库建设的驱动因素 1.国家政策支持推进建设进程当前,高性能图计算技术已经上升到国家战略高度。国家陆续出台多重政策,从技术前沿性和市场价值出发,指引图数据库的加速发展。近年来,国家大力支持信息技术应用创新产业,鼓励图数据库处理技术研发和产品应用。2021 年 11

32、月,工信部发布的“十四五”软件和信息技术服务业发展规划,在“关键基础软件补短板”专栏中明确指出需要:“突破全内存高速数据引擎、高可靠数据存储引擎、分布式数据处理与任务调度架构、大规模并行图数据处理等关键技术。推动高性能数据库在金融、电信、能源等重点行业关键业务系统应用。”相关政策强有力地激发国内企业对于图数据库这项新兴技术的投资和研发,并不断激发各个行业、领域开展对图数据库技术的应用探索。2.激活数据要素是行业的共性需求习近平总书记指出:“充分发挥海量数据和丰富应用场景优势,促进数字技术和实体经济深度融合,赋能传统产业转型升级,催生新产业新业态新模式,不断做强做优做大我国数字经济。”数据作为新

33、型生产要素,是数字经济时代区别农业、工业时代的关键特征。自党的十九届四中全会首次将数据列为生产要素以来,政府陆续出台“十四五”数字经济发展规划关于加快建设全国统一大市场的意见要素市场化配置综合改革试点总体方案、“数据二十条”等一系列顶层设计和落地举措,着力破解数据要素有序流通的体制机制障碍。中国人民银行金融科技发展规划(2022-2025 年)中强调,充分释放数据要素潜能,需要深刻认识数据要素重要价值,制定企业级数据规划和发展战略,深化数据综合应用。并且明确提出“运用联合建模、图计算、数据可视化、数字孪生等技术手段,对海量多样化多维度数据资源进行价值挖掘和关联分析,建立面向用户、面向场景的大数

34、据知识图谱和综合分析能力,发挥数据和技术双轮驱动作用”。第二章图数据库建设洞察11随着信息时代的快速发展,金融机构内部完成了海量数据的沉淀,大规模数字化的客户互动和业务进程的背后会产生海量数据,要求企业对于海量数据的管理、关联、挖掘进行更加深入的探索,实现经营策略从“经验判断”向“数据说话”,组织发展从“产能驱动”向“数据驱动”的转变。图数据库作为数据时代的重要基础软件之一,能够通过数据关联关系挖掘,全面连接数据要素,激活数据资产价值,赋能金融机构数据应用从“能用、会用”向“好用、爱用”转变,打造数据驱动的全局运营决策能力,帮助金融机构实现数据资源的资产化、价值化。3.图数据库成为解决业务痛点

35、的重要手段随着新一代互联网技术的发展,金融机构朝着更全面、深入、便捷的智能化方向发展,内部业务模式日趋线上化、平台化、实时化、场景化。而数字化运营背后,风险防控、智能营销的全新挑战随之而来。金融风控领域,一方面,金融机构内部传统风控手段出现效率低、精度差、成本高等问题,难以应对互联网技术下风险加速传播和交叉感染的难题;另一方面,犯罪分子在信息技术的加持下日趋职业化、集团化,作案手段多样化,难以直观定位。因此当前金融风险呈现出规模化、隐蔽性、快速性、动态变化的特征。而在营销场景,金融行业随互联网经济获得的流量红利逐渐见顶,竞争加剧,正逐步转向对已有客户深度运营阶段。传统客户管理系统中客户渠道多、

36、维度少,产品同质化严重,很难做到客户的精准营销,实现差异化运营,客户黏性低、流失率高;并且金融机构线上线下对客渠道割裂,导致内部数据打通难,时间、人力、经济成本较高。因此,金融机构亟需抓住数字化、网络化、智能化融合发展的机遇,全面推进数字化转型,推动数字技术从“支撑使能”向“价值赋能”变革,为数字经济发展提供强劲的金融支持。中国人民银行 金融科技发展规划(2022-2025年)中将激活数字化运营新动能定为关键任务,提出“构建集成数据整合、提纯加工、建模分析、质量管控、可视化交互等功能的综合型数据中台,打造科技赋能,数据驱动、业务联动的企业级数据服务能力中枢”。图数据库,一种基于图论的新型数据管

37、理及分析计算系统,擅长对海量、复杂、多变的数据进行深度、实时分析和计算,已成为金融机构在互联网时代的业务创新发展的核心引擎。基于图数据库,金融机构能够高效整合交易、客户、风险、运营等数据以及第三方数据,打造立体化的多维 KYC 完整视图,构建全行一张图,实现全客户、全渠道、全流程、全场景的数据智能融通,增强客户跨业务、跨产品、跨时间的风险识别及动机识别能力,并针对不同场景的不同客户定制化营销策略,助力客户全生命周期的精准营销,真正做到打通业务条线壁垒、解构业务逻辑、沉金融业图数据库建设发展调研报告12淀通用业务能力,赋能金融机构业务能力实现质的飞跃。三、图数据库市场现状与生态1全球市场现状当数

38、字经济、产业数字化转型进入深化发展阶段时,数据作为产业发展的核心资产,被赋予新的角色和使命。企业更为关注数据资产的利用,图技术在处理复杂关联数据上的性能优势决定其在未来数据资产价值变现的场景有广阔的市场空间。Gartner 在2022 年图数据库管理系统市场指南中预估,“到 2025 年,包括图数据库管理系统(DBMSs)在内的图技术市场将增长到 32 亿美元,年复合增长率为 28.1%”。并预测,“到2025 年,图技术将用于 80%的数据和分析创新,高于 2021 年的 10%,促进企业快速决策”。在数据体量日益膨胀和数据间关联关系日益复杂的今天,越来越多的企业和研究机构都开始关注图数据库

39、的应用。数据库门户网站 DB-Engines 数据显示,20132022 年图数据库的热度增长远远高于其他类型数据库(见图 3)。当前,基于图数据库技术日益增长的普及与使用,各国竞相布局图数据库赛道,全球图数据库市场已形成初步规模。中国的图数据库市场在政策和市场需求的共同推动下,正处于快速发展的起步阶段,市场中充满机遇和竞争(见图 4)。数据来源:DB-E,2022 年 12 月图 3各类数据库近十年来热度变化第二章图数据库建设洞察132图数据库生态2019 年末,国内图数据库市场加速发展,各类图数据库厂商在市场中亮相,图数据库迅速在各领域展开应用。现阶段商业图数据库厂商大致可分为三类:一是公

40、有云厂商基于自身业务需求及技术架构开发的数据库产品,并逐步由内部能力提供向外部赋能,典型代表厂商为 AWS、腾讯云、阿里云、百度等,它们占据了图数据库公有云的主流市场;二是新兴的商业图数据库创业公司,其图数据库产品最大特点是高性能与更贴近客户需求的服务能力,典型代表厂商为创邻科技、TigerGraph等;三是传统数据库厂商、应用开发商关注到图数据库的发展趋势,为了弥补自身产品矩阵在图数据库方面的短板而打造的产品。这类厂商分布在图技术产业链的不同上下游位置,共同推动图技术的发展与应用(见图 5)。数据来源:赛迪顾问,2023 年 4 月图 42020-2022 年中国图数据库市场规模及增长数据来

41、源:CB Insights 中国,2022 年 12 月图 5图技术产业生态金融业图数据库建设发展调研报告14第三章我国金融业图数据库建设现状一、被调研机构样本统计本次调研,我们共发出 100 份问卷,收集有效问卷 79 份。从机构类型来看,包括 6 家国有大型商业银行、10 家全国性股份制商业银行、32 家城市商业银行、25 家农信社(农商行)以及6 家其他金融机构。从分布地域来看,57 家城商行、农信社(农商行)按地域划分,1 家银行来自北部湾城市群、7 家来自成渝城市群、7 家来自东三省、5 家来自京津冀、3 家来自兰西城市群、2 家来自黔中城市群、9 家来自长江中游城市群、6 家来自长

42、三角、9 家来自中原城市群、8 家来自珠三角。(见图 6-1、6-2)。二、金融业图数据库整体表现1.图数据库建设发展不均衡调研数据显示,图数据库技术在金融行业已经开始进入大众市场的视野。被调研的金融机构中,仅 2.5%未听说过图数据库的概念。数据来源:金融电子化杂志社,2023 年 3 月图 6-1调研对象机构类型样本描述数据来源:金融电子化杂志社,2023 年 3 月图 6-2调研对象分布地域样本描述第三章我国金融业图数据库建设现状15当前,金融机构对于图数据库的认知存在两极分化现象。对图数据库技术本身的不了解及其场景落地价值的不清晰,成为制约金融机构引入图数据库产品的主要障碍。对图数据库

43、的使用进程主要集中在听说过但未使用过(20.3%),和已使用过一种以上的(51.9%),处于已了解、尚在探索或规划阶段(13.9%)(见图 7)。数据来源:金融电子化杂志社,2023 年 3 月图 7金融机构图数据库使用现状数据来源:金融电子化杂志社,2023 年 3 月图 8各类金融机构图数据库使用现状对比金融业图数据库建设发展调研报告16其中,中小型金融机构对图数据库的认知更多处于初期阶段。68.0%的农信社(农商行)、37.5%的城商行尚在接触概念、探索价值,使用率尚未超过 50%,仅 5 家采购了商业图数据库。相比之下,国有大行、股份制银行则均对图数据技术有了深入了解,除一家机构仍处于

44、 POC 测试阶段外,其他被调研机构均表已使用过一种及以上的图数据库,其中 66.7%的国有大行、40.0%的股份制银行已立项或采购了商业图数据库(见图 8)。在对 30 家尚未使用图数据库且无采购计划的金融机构的调研发现,近 1/2 的被调研机构表示未使用图数据库产品的主要原因是对于图数据库技术(43.3%)及其业务价值(36.7%)不了解。近 1/3 的用户认为是尚未碰到技术痛点,1/4 的用户认为是缺乏合适的解决方案及技术支撑能力。由此可见图数据库技术的市场普及推广仍然不足(见图 9)。在已经使用图数据库的 41 家金融机构中,图数据库建设进程在不同规模的金融机构间也存在较大差距。国有大

45、行、股份制银行等对图数据库技术的整体投入及应用规模更大,充分体现了大行的技术领跑优势。调研数据显示,60%的国有大行的图数据规模超过 10TB,图规模超过 100 亿点边。40%的国有大行图数据库部署规模达到 30 节点以上。50%的股份制银行的应用则多在 1TB-10TB 数据、数据来源:金融电子化杂志社,2023 年 3 月图 9金融机构未应用图数据库技术的原因第三章我国金融业图数据库建设现状171 亿-100 亿点边图规模上,部署节点数也多在 4-10 节点的中型集群规模。城商行与农信社则更多集中在 2-3 节点,千万到亿级别的图规模应用。投资力度上,大行更倾向于投入 128 核之上的大

46、算力服务器。(见图 10)。数据来源:金融电子化杂志社,2023 年 3 月图 10-1不同类型金融机构图数据库建设规模现状对比:存储规模数据来源:金融电子化杂志社,2023 年 3 月图 10-2不同类型金融机构图数据库建设规模现状对比:图点边数量金融业图数据库建设发展调研报告18数据来源:金融电子化杂志社,2023 年 3 月图 10-3不同类型金融机构图数据库建设规模现状对比:服务器节点数量数据来源:金融电子化杂志社,2023 年 3 月图 10-4不同类型金融机构图数据库建设规模现状对比:服务器核数第三章我国金融业图数据库建设现状192.图数据库应用场景多元发展被调研的 41 家已部署

47、图数据库的机构中,分别有 85.4%、73.2%、70.7%的机构在对公、内部管理以及零售三类业务场景中应用了图数据库(见图 11)。数据来源:金融电子化杂志社,2023 年 3 月图 11金融机构三大类场景中图数据库的应用率数据来源:金融电子化杂志社,2023 年 3 月图 12不同类型金融机构三大类场景中的图数据库应用率金融业图数据库建设发展调研报告20在零售业务中,申请反欺诈和交易反欺诈是主要应用场景,但整体图数据库应用普及率不及对公业务(见图 13-2)。在内部监管业务中,近半数被调研机构已将图数据库应用于反洗钱场景,合规与审计是仅次之的应用场景(见图 13-3)。不同机构间典型场景的

48、应用情况也呈现出不同的分布特点。对公业务中(见图 14-1),不同机构间呈现出明显的梯度差异。除保险和证券机构外,图数据库在企业关联关系图谱相关场景(股权穿透图谱、担保互保圈挖掘、集团客户管理、资金流向)中应用率高,国有大行 100%覆盖;在产业链图谱、投研图谱场景中,各金融机构普遍应用率低。此外,对公业务中图数据库在营销场景的应用率整体远低于风险场景。在国家政策大力推广的小微信贷业务中,图数据库的应用率也低于传统对公业务,未来的市场发展空间较大。在零售业务中(见图 14-2),不同类型机构应用情况差异较大。国有大行在个人信贷反欺诈总体上,国有大型商业银行在图技术应用上全面领跑其他金融机构,银

49、行机构更多将图数据库应用于对公场景,保险和证券机构则更加专注于内部监管等相关场景(见图 12)。在对公业务中,企业关系图谱是主要的应用场景,其中,股权穿透、担保互保圈挖掘为代表应用,超过 60%的被调研机构表示已经落地相关应用(见图 13-1)。数据来源:金融电子化杂志社,2023 年 3 月图 13-1对公业务中各场景的图数据库应用率第三章我国金融业图数据库建设现状21数据来源:金融电子化杂志社,2023 年 3 月图 13-2零售业务中各场景的图数据库应用率数据来源:金融电子化杂志社,2023 年 3 月图 13-3内部监管各场景的图数据库应用率金融业图数据库建设发展调研报告22场景下的应

50、用率达到 100%,远超其他类型机构的场景应用率。相较之下,股份制银行更多投入在信用卡相关场景(申请反欺诈、精准营销、反套现)。农信社(农商行)则在反诈骗、反赌博场景方面投入高于国有大行、股份制银行及城商行。值得一提的是,被调研的股份制银行及农信数据来源:金融电子化杂志社,2023 年 3 月图 14-1对公业务:不同类型金融机构各场景图数据库应用率对比数据来源:金融电子化杂志社,2023 年 3 月图 14-2零售业务:不同类型金融机构各场景图数据库应用率对比第三章我国金融业图数据库建设现状23社(农商行)都未应用图数据库技术刻画零售客户 360 图谱,此场景或为零售业务图数据库应用的一个增

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服