1、2023年央国企信创应用与实践研究报告2024年中国银行业数据库市场研究报告研究范畴及目的1987年,IBM给中国定制的第一版SAFEII系统在中国工商银行网点大量上线,标志着中国银行业开始走上信息化数据系统的道路。此后20余年时间中,银行业数据库市场一直由IBM垄断。目前我国信创产业已经从“规模化推广”进入到“深化落地”阶段,党政开始由省市向区县下沉,金融由一般系统向核心业务系统渗透,“8”大行业多个领域进入推广深水区。作为软件行业“皇冠上的明珠”,在众多行业里,银行业国产数据库对Oracle和DB2的替换,尤其是“核心业务系统”替换,就是一场中国数据库发展史上的“上甘岭之战”。银行业,不仅
2、是检验国产数据库大军的重要阵地,也是各大行业国产数据库替换的风向标,更将对中国数据库产业的长期发展产生深远的影响。目前银行业数据库市场现状如何?高速发展的背后,市场中存在哪些风险与痛点?AI时代下,银行业数据库市场需求有哪些?未来趋势又将如何?基于对以上问题的探究,第一新声研究院发布2024年中国银行业数据库市场研究报告,通过对银行业数据库市场的深入研究分析,以期达到以下目的:呈现中国银行业数据库市场发展现状;分析银行业国产数据库渗透情况;探讨中国银行业数据库市场增长趋势;深入调研数据库厂商,挖掘行业中优秀厂商及典型解决方案。2目录 CONTENTS01中国银行业数据库市场发展背景(1)数据库
3、按照数据模型、设计架构等维度可分为多种类型(2)我国数据库起步较晚,发展至今市场呈现“百花齐放”状态(3)不同类型银行科技投入存在巨大差异(4)银行业核心系统经历“胖核心”到“瘦核心”,当前分布式核心成主要趋势(5)银行业数据库场景不同,对于数据库技术要求有共性也有差异(6)当前我国银行业国产数据库应用占比已超过20%(7)当前国内开源数据库产品较多,主要基于MySQL、PostgreSQL等开源路线02中国银行业数据库市场现状分析(1)2024年中国银行业数据库市场规模预计35.8亿元(2)银行业关系型数据库占比83.5%,非关系型占比16.5%(3)银行业OLTP数据库占比约65.5%,O
4、LAP占比20.7%,HTAP占比13.8%(4)银行业集中式数据库占比近80%,分布式约20%(5)银行业数据库代表厂商可分为专业数据库厂商、ICT背景厂商和互联网背景厂商(6)当前国产数据库产商在银行业占据主要市场(7)开源数据库在银行业广泛应用,面临开源协议、停服、断供等风险(8)银行业数据库替换从规划选型到实际应用都存在诸多痛点03中国银行业国产数据库应用案例(1)中国银行大数据平台(2)某国有大行全行对私核心业务系统(3)中国农业银行构建新一代分布式信用卡核心系统(4)中国农业银行数据仓库(5)上海银行构建新一代会计核算系统(6)杭州银行新一代核心业务系统(7)泸州银行全国产化核心业
5、务系统建设项目(8)湖北银行核心系统国产数据库替换(9)晋商银行新一代手机银行升级3中国银行业数据库市场发展背景中国银行业数据库市场发展背景数据库按照数据模型、设计架构等维度可分为多种类型数据库(Database)是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合软件,与芯片、操作系统共同组成IT系统的核心,广泛服务于各类行业应用。按照不同的维度,数据库划分为不同类型:(1)按数据模型:分为关系型数据库(SQL)、非关系型数据库(NoSQL);(2)按设计架构:分为集中式数据库、分布式数据库;(3)按部署模式:分为本地部署数据库和云部署数据库;(4)按业务负载特征:分为
6、OLTP 数据库、OLAP 数据库和 HTAP 数据库。5数据库分类按数据模型按设计架构按部署模式按业务负载关系型数据库非关系型数据库集中式数据库分布式数据库本地部署数据库云部署数据库OLAP数据库HTAP数据库OLTP数据库指采用了关系模型来组织数据的数据库,其以行和列的形式存储数据,以便于用户理解,关系型数据库这一系列的行和列被称为表,一组表组成了数据库。可以简单理解为二维表格模型,而一个关系型数据库就是由二维表及其之间的关系组成的一个数据组织。混合事务/分析处理数据库,将OLTP和OLAP的功能集成到同一个数据库系统中,以满足实时分析和事务处理的需求。是一类用于存储和管理非结构化数据的数
7、据库系统。与传统的关系型数据库不同,非关系型数据库通常使用不同的数据模型和查询语言来存储和管理数据,如键值存储、文档存储、列族存储、图形存储等。多台机器联合管理数据,将所有的数据集中存储在同一地点的数据库。是一个由多个数据库组成的数据库,这些数据库相互连接并分布在不同的物理位置。在本地的硬件、网络和其他基础设施上安装的数据库服务。是指在公有云或混合云环境中构建、部署和访问的数据库。是专门设计用于处理事务性工作负载的数据库系统,主要功能是处理用户在线实时的请求。专注于决策支持和分析工作负载,用于处理大量数据的复杂分析查询和报表生成。我国数据库起步较晚,发展至今市场呈现“百花齐放”状态数据库起源于
8、上世纪60年代,在90年代前后IBM、甲骨文等相继进入中国,由于当时国内信息化技术薄弱,国外数据库厂商轻易垄断了中国数据库市场,银行业数据库市场几乎全被国外厂商占领。2000年左右,国产数据库厂商相继成立并开始发展,2016年左右国内开始了国产数据库替代试点,目前国产数据库替代工作已经进入规模化推广阶段,并逐步深入到核心系统。6196119681970198719901995当前2019201420101999美国通用电气公司的查尔斯巴赫曼成功开发出世界上第一个数据库管理系统IDS,奠定了网状数据库的基础IBM 的 IMS,Mainframe以 及 navigational 数 据库技术浮现,
9、商业数据库雏形诞生IBM 研 究 员 埃 德 加 弗 兰克科德发表论文“大型共享数据库的关系模型”,提出了数据库的关系模型,开创了关系数据库时代70-80年代,美国软件业进入黄金时代,1975年微软(Microsoft)成立,1977年甲骨文(Oracle)成立,数据库产品也相继诞生,几乎都是关系型数据库:IMS(1969年IBM的层次数据库);System R(1974年IBM的关系型数据库);Ingres(1974年IBM的关系型数据库);Oracle(1979年ORACLE基于System R开发的关系型数据库);Sybase(1988 年 Sybase 基 于 INGRES 开 发 的
10、 关 系 型 数 据 库);SQLServer(1989);INFORMIX(1980);MySQL(1995,MySQL AB);PostgreSQL(1995年Stonebraker基于Ingres开发的关系型数据库)IBM给中国定制的第一版SAFEII系统在中国工商银行网点大量上线,标志着中国银行业开始走上信息化数据系统的道路第一家国产数据库公司人大金仓(已改名电科金仓)成立,与后续成立的达梦数据(2000年)、GBASE南大通用(2004年)、神舟通用(2008年)并称“国产数据库四朵金花”国内银行启动信息化改造,开始普遍采用集中式数据管理模式,建立统一的数据中心和数据库;IBM、甲骨
11、文相继进入中国市场,金融业以IBM的DB2、Informix为主,电信行业被Oracle一统江湖数据库市场百花齐放,部分领域尤其分布式数据库可比肩世界顶尖数据库;我们正在越过高峰,我们终将成为高峰“去O”浪潮下,甲骨文垄断地位受到冲击,2019年5月宣布中国区裁员500多人“棱镜”事件爆发,助推中国数据库自研进程。国内市场开始选用国产数据库,“四朵金花”等国产数据库厂商被广泛关注阿里代表的国内互联网公司转向开源数据库 MySQL,开启“去O”之路。同年,Oracle收 购Sun(Sun于2008年收购MySQL AB)国外厂商垄断国产开始崛起国产替代试点国产替换规模化1983萨师煊主持,王珊执
12、笔合作编写数据库系统概论,解决中国数据库教材的有无问题中国银行业数据库市场发展背景不同类型银行科技投入存在巨大差异7我国银行可分为中央银行、政策性银行、大型国有商业银行、股份制银行、城市商业银行、农村金融机构六大类,除中央银行和政策性银行外,商业银行因资产规模不同,科技投入存在巨大差异,大型国有银行年度科技投入在100-300亿元之间,股份制商业银行在10-150亿元之间,城商行和农商行为百万元到数十亿元不等。银行分类数量代表银行业务类型2023年资产规模(万亿元)2023年金融科技/信息科技投入(亿元)中央银行1家中国人民银行政策性银行3家中国进出口银行、中国农业发展银行、国家开发银行大型国
13、有商业银行6家中国工商银行、中国农业银行、中国银行、中国建设银行、交通银行、中国邮政储蓄银行股份制商业银行12家招商银行、浦发银行、中信银行、中国光大银行、华夏银行、中国民生银行、广发银行、兴业银行、平安银行、浙商银行、恒丰银行、渤海银行城市商业银行100多家包括北京银行、中原银行、江苏银行、宁波银行等农村金融机构(农商行、农信社等)1000多家包括上海农商、广州农商,佛山农商,顺德农商等货币政策、监督核查、支付体系、征信管理等/负债业务、资产业务、担保业务等,不以盈利为目的,无To C业务/以利润为经营目的,商业化业务范围广泛14.06(交通银行)44.7(工商银行)112.78(邮储)27
14、2.46(工行)1.44(恒丰银行)11.03(招商银行)11.61(恒丰银行)141.26(招商银行)4家超万亿:1.24(北京农商行)1.44(渝农商行)百万至十亿元不等12家超万亿:1.02(长沙银行)3.75(北京银行)2家超十亿:24.42(上海银行)30.02(北京银行)数据来源:第一新声研究院基于各银行公开年报及相关公开信息整理中国银行业数据库市场发展背景银行业核心系统经历“胖核心”到“瘦核心”,当前分布式核心成主要趋势8银行IT系统业务系统渠道系统管理系统支持系统核心业务系统支付清算系统中间业务系统信贷管理系统存款业务资金业务保函业务中间业务现金业务凭证管理投资业务结算业务外币
15、业务内部清算贷款业务2008年以后瘦核心渠道管理系统柜台交易系统手机银行网络银行呼叫中心电话银行其他风险管理系统商业智能系统企业资源管理系统客户关系管理监管报送系统金融审计与稽查人力资源采购管理办公OA流程管理培训系统门户其他银行IT系统主要可以划分为业务系统、渠道系统、管理系统、支持系统以及外部系统。2000年中国银行业开始数据大集中,追求大而全的业务系统,很多业务系统、渠道系统和管理系统均被纳入核心系统范畴,被称做“胖核心”。但随着行业的不断发展,2008年前后,银行核心系统越来越庞大复杂,再加上移动互联网的广泛应用,曾经的“胖核心”架构无法满足银行业发展需求,为应对金融业务的频繁变动,银
16、行业务系统开始拆分为多个子系统或中心,开始进入“瘦核心”架构阶段。至2015年微众银行、网商银行采用分布式微服务、单元化架构为银行业提供新的设计思路。2017年中国人民银行提出发展规划,鼓励实施架构转型,推动了分布式核心系统的发展。外部系统央行征信系统信贷登记咨询系统其他个人结售汇系统 2000年-2008年胖核心来源:第一新声研究院访谈整理 注:不同银行系统定义存在差异,上图仅供参考 中国银行业数据库市场发展背景银行业数据库场景不同,对于数据库技术要求有共性也有差异9根据业务场景不同,对于数据库技术要求有共性也有差异,如客户账户查询、存/取/汇/贷款业务、小额支付业务等场景,业务时效性要求高
17、、不同业务类型SQL混合请求、强事务致性,小事务高并发;计提结息、总分核对、会计科目记账等场景,业务时效性要求相对较低,批量提交SQL,单位时间内对单个数据表读写量大,大事务高并发。根据业务场景从技术角度进行分类,可重点从数据规模、事务一致性、负载特征、数据分析能力、应用适配能力等角度进行对比,并得出合适的技术架构。需求分类典型系统适用场景架构描述存储模式业务场景数据规模事务一致性典型负载分析能力应用适配能力事务类 渠道类(单元化)核心业务类(单元化)其他 联机交易 轻量数据分析中单库强一致性多库应用层解决 高并发 小数据量事务读写 小数据量分析弱高单机集中式架构垂直资源扩张外置高可用及容灾行
18、存 渠道类 其他 联机交易 简单事务 大并发大(最终)一致性 点查、点写 有限规模关联分析弱低/中分布式架构应用入侵,需改造外置高可用及容灾行存 核心业务类 管理决策类 其他 联机交易 批量处理 实时分析 混合负载大强一致性 点查、点写 有限规模关联分析弱高分布式架构透明分布式内置高可用及容灾行存分析类 管理决策类 其他 批量处理 复杂分析 非实时查询大弱一致性 复杂分析强低/中分布式架构透明分布式外置高可用及容灾列存事务/分析混合类 渠道类(新业务)核心业务类 管理决策类 其他 联机交易 批量处理 实时分析 混合负载 轻量级复杂分析大强一致性 高并发 小数据量事务读写 复杂分析强高分布式数据
19、库透明分布式内置高可用及容灾行存+列存来源:根据数据库领域资深专家韩锋所提供资料整理注:数据库处于不断演进中,具体场景、指标均会存在变化,上图仅供参考中国银行业数据库市场发展背景当前我国银行业国产数据库应用占比已超过20%10数据来源:第一新声研究院基于公开资料整理1.09%4.02%18.46%19.82%30.44%50.00%民营银行城商行农商行、省联社股份制银行国有大行互联网银行15.69%49.02%52.94%核心系统一般系统办公系统银行业国产数据库应用情况按银行类型按系统类型银行业国产数据库应用占比17.88%银行类型银行名称系统名称数据库上线时间国有银行农业银行数据仓库GBas
20、e2013中国银行大数据平台GBase2019中国银行TiZabbix监控系统TiDB2019工商银行企业数据仓库系统GaussDB2019工商银行对公(法人)理财系统OceanBase2020.9建设银行信用卡核心业务系统GaussDB2020.12中国银行预算管理、商旅管理TDSQL2021.6工商银行IPVS业务系统GoldenDB2021.6中国银行个人借记卡、信用卡系统TDSQL2023.7股份制中信银行信用卡核心业务系统GoldenDB2019.1浦发银行邮件系统KingBase2021浙商银行总账、报表DM2022.6恒丰银行对公信贷业务系统GoldenDB2023.1广发银行E
21、CIF系统TiDB2023浦发银行结算账户报送系统GBase2024城商行湖北银行核心系统只读库DM2019.5天津银行核心系统OceanBase2019泸州银行新一代核心交易系统及OA办公系统等GBase2020上海银行增值税系统、电子发票系统PolarDB2021.12梅州客商银行分布式核心系统DM2021.7杭州银行核心业务系统TiDB2023.11绍兴银行新一代信贷风险管理系统KingBase2024.1农村金融机构江苏农信审计、银监、反洗钱、标签等平台GBase2019.9张家港农商核心业务系统TDSQL2019.9河南农信财务管理系统OceanBase2022.12海南农信二代信贷
22、管理系统KingBase2023.11江南农商信贷核算系统GaussDB2024.1历年银行业国产数据库项目列举(部分)数据来源:金融信息化研究所金融业数据库供应链安全发展报告(2022)中国银行业数据库市场发展背景根据金融信息化研究所数据,在2022年我国银行业国产数据库应用占比已经达到17.88%。至2024年,根据第一新声对于业内典型数据库厂商的调研结果,普遍认为当前银行业国产数据库使用占比已经超过20%。商业银行中,国有大型商业银行国产数据库替代推进策略与中小商业银行存在明显差异,头部大行肩负国产替代试点示范任务,同时具备人员能力、技术储备以及雄厚财力等优势,普遍采取先核心再外围的替代
23、策略。而中小银行因综合能力相对欠缺,普遍采用“先简单再复杂、先外围再核心”的策略。在绝对数量方面中小银行占据绝大多数,因此银行业整体来看,核心系统替代率明显低于外围系统替代。当前国内开源数据库产品较多,主要基于MySQL、PostgreSQL等开源路线当前国内数据库厂商中,集中式数据库代表厂商有GBASE南大通用、达梦数据、电科金仓等,分布式数据库代表厂商有腾讯云、奥星贝斯、平凯星辰等。涉及到开源数据库产品的厂商较多,众多开源数据库主要基于MySQL、PostgreSQL、openGauss(基于PostgreSQL重写)、Greenplum等开源路线。11数据库类型国内代表厂商集中式数据库G
24、BASE南大通用、达梦数据、电科金仓分布式数据库腾讯云、奥星贝斯、平凯星辰、GBASE南大通用开源路线MySQLPostgreSQLopenGauss(PostgreSQL)GreenPlum金篆信科、万里数据库、腾讯云、阿里云、星环科技华为云、电科金仓、瀚高数据库、优炫数据库、腾讯云、阿里云华为云、GBASE南大通用、海量数据、云和恩墨酷克数据、偶数科技、四维纵横、拓数派自研中国银行业数据库市场发展背景来源:基于公开信息整理汇总中国银行业数据库市场现状分析22.824.235.848.263.583.26.16.28.911.715.820.50204060801001202022年2023
25、年2024年e2025年e2026年e2027年e银行证券、保险及其他中国银行业数据库市场发展现状2024年中国银行业数据库市场规模预计35.8亿元132022-2027年中国金融业数据库市场规模及预测(亿元)CAGR:29.1%28.930.444.759.979.3103.7数据来源:第一新声研究院根据第一新声研究,2022-2027年中国金融业数据库整体市场将维持较高增长态势,2024年整体市场规模预计为44.7亿元,到2027年预计将超百亿元。金融数据库市场中,银行业占比最高,占金融整体数据库市场规模比例为80%左右,预计2024年中国银行业数据库市场规模达到35.8亿元。中国银行业数
26、据库市场发展现状14数据来源:第一新声研究院银行业关系型数据库占比83.5%,非关系型占比16.5%按数据模型不同,数据库可分为关系型数据库和非关系型数据库,其中关系型数据库占比为83.5%,非关系型数据库占比为16.5%。关系型数据库更适合高并发读写、严格数据一致性、复杂查询和处理等场景,但是银行业对于海量基础数据背后信息的挖掘,为非关系型数据库提供了丰富的应用场景。数据来源:金融信息化研究所中国银行业关系型、非关系型数据库占比关系型数据库,83.5%非关系型数据库,16.5%关系型数据库数据一致性和完整性:遵循ACID事务原则,可保证数据一致性和完整性;查询能力:支持结构化查询语言SQL,
27、可进行复杂数据查询和处理操作;数据安全性:提供了高级别的数据安全性,可以防止数据泄露和攻击。性能和扩展性:当数据规模较大时性能和扩展性可能会受到影响,需要投入更多的资源和精力进行优化和管理;高并发读写:在高并发读写场景下容易遇到锁竞争和性能瓶颈等问题;数据类型限制:对于数据类型和模式的限制比较严格,灵活性相对较差。优势劣势非关系型数据库分布式存储和可扩展性:通常采用分布式架构,可以轻松地扩展到多个节点,适合大规模数据集和高并发访问处理;灵活的数据模型:支持灵活的数据模型,可以轻松地适应不断变化的数据需求,避免频繁的模式设计和调整;实时数据处理能力:通常具有高性能实时数据处理能力,可满足实时响应
28、和预警等需求。数据一致性和完整性:缺乏严格的数据一致性和完整性约束;查询能力:查询能力相对较弱,不如关系型数据库灵活和强大;数据安全性:在某些情况下可能会出现数据丢失等问题。优势劣势银行业OLTP数据库占比约65.5%,OLAP占比20.7%,HTAP占比13.8%15按业务负载不同,数据库可分为OLTP(联机事务处理)数据库、OLAP(联机分析处理)数据库、HTAP(混合事务/分析处理)数据库。根据金融信息化研究所数据,我国银行业数据库中,OLTP数据库占比非常高,约为65.48%,OLAP数据库占比20.67%,HTAP数据库占比13.85%。数据来源:金融信息化研究所中国银行业OLTP、
29、OLAP、HTAP数据库占比中国银行业数据库市场发展现状OLTP数据库,65.5%OLAP数据库,20.7%HTAP数据库,13.8%OLTP数据库银行业面向客户交易类、业务办理等系统一般选择OLTP数据库,关键能力包含:高并发、高性能、ACID、高可靠、高可用、数据容量,其它能力重要性相对次要。高并发:是指同时操作数据库的并发量,不是数据库的连接数量;高性能:主要考虑平均交易响应时间,就是交易执行的快与慢;ACID:事务一致性;高可靠:是指系统稳定不出问题;高可用:是指出了问题能切换,保证系统持续运行,不丢数;数据容量:是指数据库可以存储和管理的数据容量。OLAPHTAP数据库银行业报表类、
30、分析类系统一般选择OLAP数据库。当前随着金融数字化不断加速,海量数据使得同一系统需要同时具备OLAP和OLTP能力,二者不断融合,HTAP需求不断增加。数据质量:确保数据库准确、完整和一致性是分析的基础;高性能:数据分析通常涉及大量数据和复杂计算,需要具备高性能计算的能力;数据分析能力:需要支持多种数据分析方法,提高数据处理能力和效率;安全:需具备强大安全机制,确保数据安全存储和访问控制。中国银行业数据库市场发展现状16数据来源:第一新声研究院银行业集中式数据库占比近80%,分布式约20%按设计架构不同,数据库可分为集中式数据库和分布式数据库。根据金融信息化研究所数据,我国银行业数据库中,仍
31、旧以集中式架构占据主导地位,应用占比接近80%。分布式数据库占比约20%,虽然占比较低,近年来受央行相关政策引导、国产数据库单机能力不足、互联网大厂及各方的技术普及和宣传等因素影响,分布式数据库在银行业受关注程度不断提升。数据来源:金融信息化研究所集中式数据库,79.6%分布式数据库,20.4%关键指标集中式数据库分布式数据库交易响应时间强一致性-响应时间优于分布式最终一致性,具有一点时间差可靠性与稳定性集中式数据库大于分布式数据分散在多个节点,可靠稳定性弱于集中式并发分布式大于集中式轻松应对高并发数据量单一服务器负载有限分布式单节点少,横向扩展可以更多,大于集中式批量计算能力弱于分布式分布式
32、(100个节点)大于集中式弹性分布式大于集中式可轻松实现规模扩展,适应业务需求变化对应用系统侵入性侵入性小分布式对应用侵入性更强软成本相对较低分布式更大,2地3中心,分布式3地5中心成本更大中国银行业集中式、分布式数据库占比集中式、分布式数据库关键指标对比中国银行业数据库市场发展现状ICT背景厂商专业数据库厂商I 金篆信科I 华为云I GBASE南大通用I 平凯星辰金篆信科有限责任公司是中兴通讯股份有限公司为拓展金融级交易型分布式数据库GoldenDB而成立的控股子公司,公司成立于2021年11月,目前GoldenDB金融业案例已覆盖全系列银行及证券保险领域。天津南大通用数据技术股份有限公司,
33、简称“GBASE”,成立于2004年,是具有自主知识产权的国产数据库产品与服务提供商。经过二十余年发展,GBASE南大通用构建了覆盖数据管理全生命周期、全技术栈的数据产品体系及服务解决方案。PingCAP 成立于 2015 年,是一家企业级开源分布式数据库厂商,由 PingCAP 创立的分布式关系型数据库 TiDB,为企业关键业务打造,具备分布式强一致事务、在线弹性水平扩展、故障自恢复的高可用、跨数据中心多活等企业级核心特性,帮助企业最大化发挥数据价值,充分释放企业增长空间。GaussDB是基于华为20余年战略投入,软硬全栈协同所创新研发的分布式关系型数据库。2019年9月华为宣布将开源 Ga
34、ussDB,开源后将其命名为 openGauss。2019年底,招商银行多套系统采用GaussDB并投产上线。2023年华为发布新一代分布式数据库GaussDB,至今已在金融业得到广泛应用。银行业数据库代表厂商可分为专业数据库厂商、ICT背景厂商和互联网背景厂商17I 腾讯云I 奥星贝斯2010年OceanBase 正式立项,2020年6月8日蚂蚁集团宣布,将自研数据库产品OceanBase独立进行公司化运作,成立由蚂蚁100%控股的数据库公司北京奥星贝斯科技有限公司。2020年12月腾讯云数据库品牌升级,腾讯云原有的TDSQL、TBase、CynosDB三大产品线统一升级为“腾讯云企业级分布
35、式数据库TDSQL”。全新升级后的腾讯云TDSQL涵盖分布式、分析型、云原生等多引擎融合的完整数据库产品体系。互联网背景厂商I 达梦数据I 电科金仓武汉达梦数据库股份有限公司成立于2000年,公司坚持原始创新、独立研发的技术路线。目前,公司已掌握数据管理与数据分析领域的核心前沿技术,拥有主要产品全部核心源代码的自主知识产权。中电科金仓(北京)科技股份有限公司(简称“电科金仓”)成立于1999年,是成立最早的拥有自主知识产权的国产数据库企业。坚持自主创新,专注数据库领域二十余载,具备出色的数据库产品研发及服务能力。中国银行业数据库市场发展现状 信创产业经历多年发展,国产替代已经步入深水区,尤其金
36、融业信创推进节奏显著高于电力、教育、医疗等其他行业。从银行业数据库来看,银行对于数据安全要求极高,所以普遍采用本地部署,而不采用公有云部署;国产数据库厂商经过持续深耕,在银行业渗透不断提升,当前在银行业市场中已经处于主导地位。截至2023年末,根据第一新声不完全统计结果,9家典型国产数据库厂商在银行业本地部署数据库累计装机部署接近6万套。9家典型厂商中,已有6家厂商的累计银行业客户数超过50家。当前国产数据库厂商在银行业已占据主要市场18数据来源:第一新声研究院基于业内专家访谈及公开资料整理,数据仅供参考02468101214020406080100120140160GBASE南大通用奥星贝斯
37、金篆信科平凯星辰华为云GaussDB阿里云PolarDB腾讯云TDSQL达梦数据电科金仓累计银行业客户数(家)累计银行业部署套数(千套)本地部署国产数据库在银行业渗透情况中国银行业数据库市场发展现状19来源:第一新声研究院基于公开信息整理开源数据库在银行业广泛应用,面临开源协议、停服、断供等风险从发展历程角度,我国数据库起步较晚,为迅速完成数据库产品商用,开源成为大部分数据库厂商发展的优先技术路线。开源数据库具备源码公开、功能丰富、成本低、获取途径广等诸多优势,社区支持为日益复杂的业务需求贡献越来越多的解决方案,使得开源数据库在银行业得以广泛使用。但同时开源数据库也面临开源协议、安全漏洞、侵权
38、、感染、停服、断供等诸多风险。伴随国际局势变化,科技行业合规压力日益增大,以全球最大的开源项目之一Linux内核项目为例,2024年10月18日,11名俄罗斯开发者因合规要求被从维护者名单中除名,表明开源社区在全球政治技术合作中,面临的形势将日趋复杂和多变。开源协议开源数据库风险安全漏洞侵权、感染停服、断供政策风险掌控能力开源产品通常需根据特定协议进行发布和分发,不同开源协议要求和限制差别较大,带来极为复杂、隐蔽的风险开源数据库由世界范围内个人自愿贡献代码,可能存在安全漏洞,导致数据泄露等多种安全威胁封装国外开源数据库内核代码的引用开源,无核心技术和知识产权,被国外开源软件体系限制,存在知识产
39、权、代码感染风险当前约90%金融机构在一般业务、管理系统应用开源MySQL,普遍面临5.6、5.7版本停服问题。在国际局势复杂的当下,可能面临复杂的司法纠纷相对闭源的专利技术,开源难以通过传统专利、知识产权等手段证明创新性及价值,政策、资金支持等方面难以评估和认定开源数据库的使用需要具备一定的自主解决问题能力,中小银行难以满足掌控能力要求,面对开源数据库缺陷与问题时,大多处于被动局面典型产品协议变更风险事件MySQLMySQL 基于 GPL 协议,GPL协议的一个显著特点是传染性,GPL的衍生产品、具有GPL协议的软件与其他协议软件的组合产品,都必须按照GPL的条款分发,确保持续开源MySQL
40、 5.6、5.7 版本已经停服,MySQL8.0将于2026年4月终结Greenplum2024年5月29日,Greenplum 关闭了 github 开源代码库,正式进入闭源商业运行MongoDB2018 年 10 月,MongoDB 宣布其开源许可证将从 GNU AGPLv3,切换到Server Side Public License(SSPL),指出更改原因为部分云计算公司使用MongoDB未遵循开源协议Neo4j2018 年 11 月 15 日,Neo4j 产品副总裁 Philip Rathle 宣布,从 Neo4j 3.5 版本开始,企业版将仅在商业许可下提供,不再在 GitHub
41、上提供源代码Elasticsearch2021 年 1 月,Elasticsearch 修改了开源协议,从 Apache 2.0 变更为 Server Side Public License(SSPL)与 Elastic License 2.0(ELv2)的双许可Redis2024 年 3 月 20 日,Redis Labs 宣布从 Redis 7.4 开始,将原先比较宽松的 BSD 源码使用协议修改为 RSAv2 和 SSPLv1 协议,标志着 Redis 在 OSI(开放源代码促进会)定义下不再被视为传统的开源产品。中国银行业数据库市场发展现状20信息来源:第一新声研究院调研整理近年来,国
42、产数据库在银行业替代取得丰富成果的同时,仍旧面临诸多问题和痛点亟待解决。规划选型阶段,替代节奏紧张、中小银行选型能力受限;替换实施阶段,迁移过程稳定性与连续性、性能要求、异地灾备、服务器、数据一致性等皆对国产数据库提出较大挑战;到实际应用阶段,国产数据库替代存在很多双轨并行,应用适配经验不足,真正从“能用”到“好用”仍需沉淀。银行业数据库替换从规划选型到实际应用都存在诸多痛点规划及选型替换实施实际应用 替代节奏紧张:大量银行对于Oracle等国外数据库使用非常深入,绑定较深,短期内实施替换存在问题。同时面临政策压力、Oracle许可证到期等问题,需进行全盘考虑规划;中小银行选型能力受限:中小银
43、行受资金、技术等限制,一般只能基于三方面考量:行业标杆案例参考、数据库厂商方案讲解以及ISV意见和看法。迁移过程稳定性与连续性:从业务层面,如何保证服务的稳定性、连续性是迁移过程中的首要问题。老旧系统迁移难度大、新产品学习及系统迁移适配成本高、重要系统迁移风险不可控、在线系统迁移带来的业务中断。如何保障业务连续,实现自动故障转移与恢复是替换实施的关键;性能要求高:银行业具有海量用户高并发、业务场景复杂等特征。MySQL数据库MGR仅单节点对外提供访问,无法发挥并发读写要求,且业务改造难度大;DB2和Oracle在春节、618等节日,手机银行负载提高10倍,存在一定性能压力;异地灾备:当前异地容
44、灾中心方案尚未成熟,网络存在不稳定性,性能无法保障,原数据库与国产数据库在数据存储精度一致性上存在偏差,影响双中心切换数据准确性;服务器性能:在海量数据加工、海量并发交易场景下,信创服务器CPU性能要弱于Intel服务器,因此如何对应用程序做极致优化,大幅降低CPU负载,确保核心资金交易系统稳定运行,是攻坚难点之一;数据一致性:银行系统需支持7*24小时交易,停机切割时间非常有限,需要在尽可能短的时间窗口完成切换。数据迁移,不只是简单地数据平移和业务平移,需要制定数据清理和补录的原则,在整个迁移测试验证过程中持续对迁移数据源存在的非法或例外数据进行清理,补录缺失数据,提升数据质量。如何确保迁移
45、后的数据库与原数据库数据一致,是需要解决的关键问题;核心系统改造难:银行业系统关联关系复杂,传统集中式数据库绑定程度很深,对于稳定性和性能要求极高。核心系统改造“牵一发动全身”,是一个系统性的复杂工程。应用磨合:数据库的应用高度依赖对应应用的契合,Oracle最大优势来自于几十年沉淀,生态非常完善。当前国产数据库与应用磨合仍需时间,包括优化、查询、数据分布的特点等,最大问题来自国产数据库厂商面向不同应用伙伴的适配经验不足,国产数据库从“能用”到“好用”仍需沉淀;双线并行:由于银行业对稳定性、连续性的极高要求,当前国产替换不是完全依赖国产数据库,而是存在很多双轨并行的运行机制,全量业务两边同时运
46、行,运行维护成本较高。中小型银行因能力不足等原因,即使不采用双轨并行,也会保留冷状态,原有数据库可以随时冷切换。中国银行业国产数据库应用案例中国银行业国产数据库应用案例22 项目背景:中国银行顺应国家战略,围绕集团业务发展,统筹规划数据治理,基于全栈国产化技术架构和开发运维一体化能力支撑,构建“三横两纵一线”的数字资产运营服务体系,为全行数据治理各项工作奠定坚实基础。建设目标:平台采用“MPP数据库+Hadoop技术架构”的混搭模式,构建海光国产芯片+麒麟国产操作系统+GBase国产数据库的全国产化企业数仓平台,实现全面自主可控;实现集团数字资产在桌面端、移动端的秒级展现,提供沉浸式用户体验。
47、中国银行大数据平台(GBASE)中国银行总行累计部署GBase 8a集群80多套,超3500节点,处理数据量超30PB。系统投产上线了6000多个批量任务,涵盖数据仓库、管理驾驶舱、信息管理报表、监管报送、审计、资产负债管理、银行卡数仓、零售风险集市、信贷风险集市、个贷系统等各类业务系统。GBase 8a集群在系统中的应用有如下特点:全国产化:采用全国产平台建设;在国产高配服务器环境下,GBase8a集群使用多实例部署提高了国产芯片服务器的资源利用率,性能达到与X86服务器一比一的替代;仓湖一体:GBase 8a集群应用了与Hadoop数据湖的高速数据加载导出功能,使用统一的开放格式数据交换,
48、打通数据仓库与数据湖的数据通道,实现仓湖融合;虚拟集群:在系统中使用虚拟集群提供多个业务系统的统一管理、统一数据视图、统一作业调度;并提供多租户能力,实现不同分行租户的资源隔离;高可用及高扩展:GBase 8a集群在项目发展建设中提供在线集群扩展、在线节点替换,满足了中行新业务上线、数据量持续增长的需求,解决了大规模集群下硬件服务器损坏带来的业务影响.项目成果实施方案23 项目背景:为满足未来业务发展需求,某国有大行率先推动IT系统分布式架构转型,并选择中兴通讯金篆GoldenDB分布式数据库支撑对私核心业务系统,前瞻性地实现了基于中兴通讯金篆GoldenDB的超大规模集群部署,有效解决了银行
49、业数据量爆发式增长、原有数据库扩容难的问题。建设目标:1.支持银行对私核心业务系统两地4AZ的多地多活解决方案,支持管理节点跨地域自动切换,满足未来扩展到4地以上多活的能力,满足金融业对数据库安全可靠的极致要求;2.支持多租户、全局索引,满足金融业不同业务的关键需求;3.提升数据库智能运维功能,提升产品化能力,满足银行智能运维需求;4.存量应用项迁移到开放式平台做兼容,做到现有应用无需变化,不做修改,直接迁移到新平台架构。某国有大行全行对私核心业务系统(GoldenDB)超大集群:新系统构筑两地4AZ超大规模集群,为未来实现多地多活部署奠定方案原型。数据安全:通过创新性的改造主备副本的同步/异
50、步(gSync/aSync)复制机制,保证本地与同城RPO=0,RTO30秒,数据不丢失,实现银行数据的安全性。高可靠:数据库集群统一管理,通过计算集群、数据分片主备机制、分组机制,自定义切换策略,在组件级故障、机房级故障、城市级故障时,实现系统高可靠。平滑迁移:新系统实现了大规模数据量下,从传统数据库到中兴通讯金篆GoldenDB的平滑迁移和替换。智能化:中兴通讯金篆GoldenDB通过集成大数据分析组件,增加智能性能分析组件,大大提升了数据采集、分析、检索能力,摆脱人力人工的依赖,确保业务平稳、高效运行。新系统正式投产前,成功在真实的业务场景下验证系统整体的正确性和稳定性,解决了生产系统与