1、数据库行业发展报告数据库行业发展报告证券分析师:钱劲宇 执业证书编号:S0210522050004证券研究报告行业评级 强大于市2022年10月请务必阅读报告末页的重要声明核心观点:数据库应用的发展趋势:混合事务分析处理(HTAP)针对OLTP和OLAP单独的数据应用需求,如果由各自专有系统处理,一般来说性能将比混合通用系统性能高一到两个数量级,但未来整合的趋势更明显,客户需要可以满足混合需求的通用系统,HTAP基于一体化架构高度融合,在事务支持和数据时效上更有保证,同时减少专有系统数据迁移处理下的同步成本。数据库架构的发展趋势:分布式架构分布式数据库继承了传统单机数据库的核心特性,同时还拥有
2、分布式系统的处理能力,具有可水平扩展、高性能、高可用、混合负载、更安全等优点。原生分布式架构数据库直接改变底层结构,因此性能不受底层数据库制约,也天然契合云原生理念。数据库部署的发展趋势:云原生部署云原生数据库结合云原生与分布式特点,最大限度实现资源池化、弹性变配、超高并发等能力,可实现随时随地的多前端访问,提供云服务的计算节点,并且能够灵活及时调动资源扩缩容,助力企业降本增效,国内云原生数据库虽起步晚,但发展迅速。投资建议:国内数据库相关软件企业国内处于早期快速发展阶段,建议关注相关拟上市或筹备上市公司。风险提示:技术发展不及预期、相关公司上市情况不及预期。投资要点pOzRpPsQqPtQz
3、RzQtRqMsOaQ9RaQnPqQoMnPkPnMmMiNpOwPbRrRxPwMrNpRwMnOyR目录3Part 1 数据库行业介绍及发展趋势P04-P13Part 2 国外数据库市场主要玩家P14-P18Part 3 国内数据库市场及竞争格局P19-P32关系型数据库:存储格式可直观反映实体间的关系,和常见的表格类似。我国数据库产品数量分布仍以关系型数据库为主,占比60%左右。NoSQL数据库:分布式、非关系型、不保证遵循ACID原则。随着数据量及数据结构复杂度提升,大量的NoSQL数据库出于简化结构、避免冗余目的被设计,支持海量数据的存储和高并发读写。NewSQL数据库:现代关系型
4、DBMS。分布式架构基因,兼具关系型数据库的ACID保证和NoSQL的强 可 扩 展 性。如 Google Spanner、AmazonAurora。ACID为了保证数据库一致性,事务必须满足以下四个原则:原子性(Atomic):事务中任何操作的失败会导致整个事务的失败一致性(Consistent):事务结束后系统状态都是一致的隔离性(Isolated):并发执行的事务彼此操作互不影响持久性(Durable):事务完成后所做的改动都会被持久化数据库(DBS)是一个按数据结构来存储和管理数据的计算机软件系统。数据库管理系统(DBMS)是数据库系统(DBS)的核心组成部分,主要完成对数据库的操作与
5、管理功能,实现数据库对象的创建、数据库存储数据的查询、添加、修改与删除操作和数据库的用户管理、权限管理等关系型数据库NoSQL数据库NewSQL数据库资料来源:公开资料整理,华福证券研究所数据库基本概念及分类关系型数据库按部署分类按架构分类本地部署需要大量维护成本集中式单机共享所有计算资源(CPU、RAM、Disk)和数据。不支持高并发场景,扩展难、数据迁移难、运维难。分布式分布式中间件+单机Shared-disk:通过数据在逻辑层的线性切割实现性能和存储的扩展。能力受单机数据库自身能力的制约。云部署云部署与分布式架构天然高度契合。分布式存储Shared-nothing:非对称计算节点+共享存
6、储(存储和计算未分开),如Netezza/Teradata/Redshift均采用此架构。原生分布式数据库Multi-cluster,Shared data:对称计算节点提供对等的读写服务(存储和计算彻底分离),如Snowflake/TiDB均采用此架构。数据库常见有三种分类:按模型可分为:关系型、非关系型(包括键值型、文档型、图、列簇型、时序、空间等);按架构可分为:单机、集中式、分布式;按部署形态可分为:本地部署、云部署。据中国信通院数据,截止2021年6 月,我国数据库产品共有135款,其中关系型数据库81个,占比60%。资料来源:公开资料整理,华福证券研究所关系型数据库是中国主流的数据
7、库产品NoSQL数据库键值型数据库支持高扩展、高并发,但数据无结构化,只被当做字符串或二进制数据,只能通过键来查询值。国外有Redis,国内有TcaplusDB,Tendis;宽列存储数据库适用分布式数据存储与管理,以列族式存储,高扩展,查找简单快速,但不支持事务强一致性。国外有HBase,Cassandra,国内有GeminiDB,iBASE;文档数据库适用存储面向文档或近似半结构化的数据,数据结构灵活,可以根据 value 构建索引,缺乏统一查询语法。国外有MongoDB、CouchDB,国内目前还没有;图形数据库适用于社交网络,专注构建关系图谱,支持复杂图形算法,但复杂性高只支持一定数据
8、规模。国外有Neo4j,国内有TGDB,Alibaba GDB,GeaGraph;关系型数据库的不足:高并发读写性能低:关系型数据库的性能和访问承载能力,在面向单一数据节点的企业级应用时代无可挑剔。但随着数据量和节点急剧提升,已很难继续支撑巨大的规模系统,甚至成为应用系统的瓶颈;不适合储存半结构和非结构类型数据:二维表格数据模型不能有效地处理多维数据,不能有效处理互联网应用中半结构化和非结构化的海量数据,如Web页面、电子邮件、音频、视频等;容量有限:当一个应用系统的用户量和访问量与日俱增的时候,传统的关系型数据库却没有办法简单地通过添加更多的硬件和服务节点来扩展性能和负载能力。NoSQL的出
9、现并非为了取代关系型数据库,而是指Not Only SQL,提供了在SQL之外的另一种选择。资料来源:公开资料整理,华福证券研究所NoSQL数据库是对关系型数据库的有益补充数据库诞生于20C60s,前后经历了网状数据库、层次数据库、关系型数据库、云数据库、云原生数据库。网状数据库:1964年,通用电气公司发布世界上第一个网状数据库系统IDS(Integrated Data Storage集成数据存储),IDS是网状数据库,奠定了数据库发展的基础。层次数据库:1968年,IBM发布世界上第一个层次数据库系统IMS(Information Management System信息管理系统),是第一个
10、大型商用的数据库系统。关系型数据库:1978年,第一个关系型数据库Oracle 1.0 诞生,后续几十年中关系型数据库一直占据市场主导地位,直至移动互联网时代到来。NoSQL数据库:随着WEB 2.0网站兴起,NoSQL数据库应运而生,解决了大规模数据集合和多种数据类型的处理挑战。New SQL既有No SQL相同的可扩展性,又保证了事务的ACID特性,既基于传统关系模型保留了SQL作为查询语言,又天生具有分布式架构基因(传统的SQL架构设计基因中是没有分布式的,而New SQL生于云时代天生就是分布式架构)。NewSQL 在SQL数据库的基础上集成了NoSQL强大的可扩展性;NewSQL 在
11、NoSQL的发展中增强了对SQL、OLTP的支持;关系型数据库No SQL数据库New SQL数据库资料来源:公开资料整理,华福证券研究所NewSQL集成了NoSQL和关系型数据库的优点联机事务处理/数据库OLTP(On-Line Transaction Processing)联机分析处理/数据仓库OLAP(On-Line Analytical Processing)应用场景面向交易的处理系统(业务系统)分析驱动,面向信息的分析过程典型应用银行交易系统数据仓库特征业务在数据库联机的日常操作,通常是对记录进行查询、修改,用户关心快速响应、数据的安全性、完整性和并发支持的用户数等一般针对某些主题的
12、历史数据进行分析,支持管理决策数据量每次交易涉及的数据量很小;对响应时间要求非常高;总体数据量相对较小。每次查询涉及数据量很大(常涉及多表联结);响应时间与具体查询有很大关系;总体数据量相对较大。数据来源于系统中交易本身产生的数据不产生数据,数据来源于生产系统操作数据使用人员操作人员管理人员用户数量极多较少交互载体SQL为交互载体以SQL为主要载体,也支持其他语言交互设计重点尽量避免冗余,为捕获数据而设计有意引入冗余,为分析数据而设计资料来源:公开资料整理,华福证券研究所数据库的两大应用场景:OLTP和OLAP2014年,Gartner提出 HTAP(Hybrid Transaction/An
13、alytical Processing)混合事务分析处理的概念。HTAP基于一体化架构,是高度融合的一个系统,在技术上更难,但对事务的支持和数据的时效上更有保证,同时减少数据在链条流动存在的多份数据冗余保存的负担,节省了技术、人力、时间和数据同步成本。而如果用“OLTP+OLAP”模式,两套系统让迁移适配成本大幅上升,且为系统后续的开发和运维带来难处,同时也没法保证对事务的支持能力和数据的时效。OLAP本身不生产数据,需通过对OLTP操作数据的转化清洗迁移后,才可以进行专题需求分析。针对OLTP和OLAP单独的数据应用需求,如果由各自的专有系统处理,一般来说性能将比混合通用系统性能高一到两个数
14、量级,但就软硬件技术发展现状和当前需求来看,未来整合的趋势更为明显。除了极少数企业需要使用专有系统来实现其特殊的需求,集成数据平台(HTAP)将能满足绝大多数用户的场景。集成数据平台(HTAP)节省了将OLTP的数据变化“以log日志的形式暴露、通过消息队列解耦传输、再被后端ETL拉取”,然后同步到OLAP的繁琐步骤。资料来源:公开资料整理,华福证券研究所数据库应用的发展趋势:混合事务分析处理(HTAP)从早期的单机关系型数据库到NoSQL再到如今的NewSQL,数据库领域不管是场景还是技术都发生了巨大的变化。在当下云原生时代,任何软件系统拥有分布式能力似乎成了标配。分布式数据库继承了传统单机
15、数据库的核心特性,同时还拥有分布式系统的处理能力。分布式数据库可水平扩展、高性能、高可用、混合负载、更安全。分布式数据库正以猛烈的趋势追赶,而传统数据库指数在慢慢下滑,且得益于国内互联网行业的快速发展,国外的数据库系统远不能满足需要,由此催生了一批走在世界前沿的国产分布式数据库。越来越多的国企、政府单位、银行证券这些传统行业也开始关注分布式数据库,去O道路正在加速。性能可水平扩展:数字化转型过程中,数据量、数据结构复杂度均呈几何级增长,传统数据库出现性能瓶颈。分析能力出色:分布式数据库的混合负载能力可大幅度提升分析时效性,减少数据冗余,灵活性大大提高。政策战略扶持:多项政策明确重点布局数据库分
16、布式转型、应用创新战略,扶持国产数据库“换道超车”。分布式数据库出现的原因:资料来源:公开资料整理,华福证券研究所数据库架构:从单机到分布式数据库1、分布式中间件+单机数据库:通过数据在逻辑层的线性切割实现性能和存储容量的扩展,但能力受单机数据库自身制约。且移动扩展困难、数据迁移困难、运维难度高。2、分布式存储:大部分公有云数据库都属此类,以共享存储和非对称计算节点实现数据一致性和读写分流,有限解决了扩展性问题。如GaussDB(for MySQL)、TDSQL-C、SequoiaDB等。3、原生分布式数据库:各计算节点提供对等的读写服务,TiDB、OceanBase、ZNBase等。原生分布
17、式架构直接改变底层结构,因此性能不受底层数据库制约,也天然契合云原生理念。资料来源:公开资料整理,华福证券研究所数据库架构:分布式架构的三条技术路线据Gartner 2021年数据库产品提供商排名,Microsoft 凭借云数据库的后发优势,抢占了Oracle占据十年的榜首,前十名中有四家以云服务为主的企业,分别为 Microsoft/Amazon/Google/阿里云。Gartner预测到2023年,全球75%的数据库将完成云平台的迁徙,仅有 5%的数据保持在原本的本地部署。据中国信通院,2020 年中国公有云数据库市场规模为 107.68 亿元,后续5年公有云数据库市场年复合增长率将达到3
18、6.1%,预计到2025年,中国公有云数据库市场总规模将达到 503.31 亿元。传统数据库的云部署:云与数据库的集合,减少了数据库参数的重复配置,具有快速部署、高扩展、高可用、可迁移、易运维和资源隔离等特点。云原生数据库:随时随地的多前端访问,提供云服务的计算节点,并且能够灵活及时调动资源扩缩容,助力企业降本增效。传统数据库的云部署基于云资源部署的传统数据库。云原生数据库基于容器化、微服务等设计的存算分离架构。云原生数据库结合云原生与分布式特点,最大限度实现资源池化、弹性变配、超高并发等能力。云原生数据库起源于Amazon,后受到国内厂商的广泛关注。据中国信通院对国内企业调研,受访者认为云原
19、生数据库前四分别是AWS的Aurora、华为云GaussDB、阿里云PolarDB和腾讯云TDSQL-C,可以看出国内云原生数据库虽起步晚,但发展较快。资料来源:公开资料整理,华福证券研究所数据库部署:从本地到云部署据 Gartner 在2011-2021十年期间的全球数据库市场份额变化,云厂商在数据库领域的竞争力不断提高,”云+数据库”已成为行业新的竞争力。目前市场份额显著增长的厂商,都以云作为核心竞争力和创新方向。2021年Oracle 已经连续两年市场地位下降,跌 至 第 三 位,而 Microsoft、Amazon AWS 都是凭借数据库上云超越 Oracle,Google也通过云数据
20、库进入排名前。中国的三大云厂商阿里云、华为云、腾讯云同样获得数据库的高速增长。在传统数据库厂商中,市场份额正在下降的厂商都是因为不具备云优势,例 如IBM、SAP、Teradata、Cloudera 等。资料来源:Gartner,华福证券研究所数据库部署:云数据库后来居上Gartner 2021年数据库市场份额排名显示:微软2020-2021连续两年蝉联榜首;AWS排名上升一位超越Oracle位列第二;Oracle 降至全球第三。DB-Engines 2022年10月排行榜显示:微软两款数据库受欢迎度前十SQL Server(第三)和Access(第九)。1、Access:1992年推出的Ac
21、cess与专业数据库比简单易用,但它又只支持有限的使用范围。从2013年起,Access就已不再推新并不断削减功能,如dBASE导入旧格式功能、数据迁移至SQL Server的升级向导等;2、SQL Server:至今为止已发布30+个版本,最新的Microsoft SQL Server 2019具有三大特性:核心引擎:SQL Server是HTAP混合负载能力的行业引领者,早在2017年的版本中就已实现了在单一引擎中对 OLTP 和 OLAP 工作负载的同时支撑;数据虚拟化:为维护在企业整体架构中的核心地位,数据库必须支持多模型多范式,针对客观存在的异构数据源,在传统建立ETL通道外,数据虚
22、拟化是更先进的理念。大数据集群:创造性地将Hadoop和Spark等开源大数据技术组件直接纳入SQL Server,将SQL Server完全容器化并以Kubernetes为基础架构实现底层计算资源的编排和管理资料来源:公开资料整理,华福证券研究所数据库产品特点适用场景/客户Microsoft SQL Server整合封装:如大数据集群的一体化架构本地部署的大型客户Amazon Aurora计算存储分离:每个数据组件单独的功能云部署的中小企业客户Microsoft:2020-2021蝉联数据库市场份额榜首从云数据库到云原生数据库:近几年随着云基础设施的高速发展,同时具有按需扩展、按需付费优异特
23、性的云数据库获得中小企业及互联网客户的青睐。然后云数据库本质不是针对云场景或云环境来设计或构建的,只是用到了云的资源,因此存在一些天然的问题,比如存储空间浪费、计算资源浪费、较大的恢复时间目标和数据滞后、系统性能受限、网络带宽消耗大等,从而限制了业务发展。云原生数据库应运而生。2012年,亚马逊云科技推出首个云原生数据库DynamoDB,也是业界第一个真正意义上云原生数据库;2014年,亚马逊云科技又推出云原生的关系型数据库Aurora,成为亚马逊历史上用户增速最快的云服务;为了进一步简化客户在创建、维护和扩展数据库方面的工作,亚马逊云科技推出多种具有Serverless功能的数据库,让数据库
24、的扩展性及自动伸缩容量达到新的高度,其中Aurora Serverless V2可以在几分之一秒内将数据库工作负载从数百个事务扩展到数十万个事务,与按照峰值负载配置容量的成本相比,最多可节省 90%的数据库成本。亚马逊云科技SQL数据库Aurora、Relational Database ServiceNoSQL数据库DynamoDB、DocumentDB、NeptuneServeless数据库Aurora serverless、DynamoDB、Timestream、Keyspaces、QLDBGartner发布的2021年全球数据库管理系统市场报告显示,亚马逊云科技在全球数据库市场的份额由
25、2020年的20.6%增长到2021年的23.9%,跃居全球数据库细分市场第二位,2021年增长率高达42.3%。截至2022年9月底,亚马逊云科技已帮助超65万个数据库迁移服务至亚马逊云科技。资料来源:公开资料整理,华福证券研究所Amazon:云原生数据库鼻祖1970年,IBM研究员发表论文提出关系数据模型的概念,奠定了关系数据模型的理论基础。1978年,Larry Ellison在为中情局做数据项目时发现了关系数据库的商机。同年Oracle1.0诞生,Oracle成为第一家销售RDBMS软件的公司,在1982年一年内年收入就达到250万美元。2022年10月DB-Engines的全球数据库
26、统计排名图片来源https:/db- 等搜索引擎上的数目,专业技术讨论中提到次数,专业网站中使用频率等影响力指标。Gartner2021年数据库市场份额排名显示:微软:2020-2021年蝉联榜首AWS:上升一位,位列第二Oracle:降至全球第三资料来源:公开资料整理,华福证券研究所Oracle:关系型数据库巨头在传统数据库领域,海外厂商起步较早,包括 Oracle、IBM、Microsoft 等,通过早期不断的技术积累和产品迭代主导了传统数据库市场,具有先发优势。IBM 在1973年就启动 SystemR 项目来研发关系型数据库,1983年发布商业版数据库 DB2。DB2代表了一组完整的数
27、据管理系统,包括可在云环境中使用的服务器。早期 DB2 支持关系数据库模型,但现在很多产品已经扩展为支持关系和非关系结构。IBM 在2019年为 DB2 制定的目标是成为帮助增强认知应用程的人工智能数据库,在数据库产品中融入 AI 功能,帮助用户跨本地和多云环境实现结构化数据和非结构化数据管理,并加速他们的 AI 应用程序开发。Gartner 在2021年云数据库管理系统魔力象限中再次将 IBM 提名为领导者。IBM 作为传统巨头在数据库领域历经几十年而不衰,我们认为主要有以下四点原因:起步较早:海外数据库厂商起步早于国内厂商20-30年。IBM 在上世纪70年代已经开始研发数据库,先发优势带
28、来了领先技术和客户粘性,因此海外巨头厂商至今仍然占据国内数据库市场较大份额。IBM 在过去几十年的产品开发和服务中建立起强大的品牌效应和客户声誉,在数据库领域意义重大。迭代迅速:巨头数据库厂商积极进行产品迭代,产生较大的用户粘性,帮助厂商维持市场份额优势。DB2 每年进行一或两次重大更新,并根据需要进行增量修复、性能优化,吸引已有用户持续使用这款产品。技术领先:产品性能是数据库最重要的指标之一,DB2 产品具有全球领先的技术。能够通过快速数据检索以及磁盘空间压缩使事务响应时间缩短30%,同时在高安全性、持续可用性、自动化管理和调优、可伸缩性等特点上优势出众。生态完善:作为传统数据库巨头,IBM
29、 的 IT 布局非常完备,开发产品涉及多个领域且商品化程度高。注重技术创新和边界拓展,近年来在 AI、混合云、量子计算以及安全领域不断创新。资料来源:IBM,华福证券研究所IBM:传统巨头经久不衰云原生时代下,大数据的爆发带来多元化需求,传统数据库厂商难以满足各类复杂场景下的业务需求,一大批独立厂商、初创厂商快速崛起。独立厂商 Snowflake 于2012年成立,专注于数据仓库的开发,主要应用于分析类场景。Snowflake 云数据平台基于公有云实现智能基础设施、产品弹性和优化的存储。核心产品数据仓库建立在云原生构架上,创造存储、计算以及管理服务分离的架构,摆脱了传统大厂数仓架构带来的局限性
30、,能够满足客户对数据仓库并发性、易用性、扩展性的诉求,确保客户在各种分析场景下安全访问数据,同时支持在 Amazon AWS、Microsoft Azure、Google Cloud 三大公有云进行灵活部署,符合未来多云部署的发展趋势。资料来源:Snowflake,华福证券研究所Snowflake:云原生时代下的独立厂商中国信通院测算,2020 年全球数据库市场规模671亿美元,其中中国数据库市场占全球 5.2%,约35亿美元。预计到 2025年,全球数据库市场规模将达到798亿美元。中国 IT 总支出在全球占比为12.3%。预计2025年中国数据库市场在全球的占比接近中国IT支出在全球的占比
31、,因此2025年中国数据库市场总规模将达到 688 亿元,年复合增长率(CAGR)23.4%。24130936849361168828.4%19.0%33.9%24.0%12.6%00.10.20.30.4020040060080020202021E2022E2023E2024E2025E中国数据库市场规模及增速左轴:市场规模(亿元)右轴:增长率(百分比)资料来源:中国信通院,华福证券研究所中国数据库市场规模及增速全球数据库玩家众多。海外来看,传统数据库Oracle、IBM DB2、Microsoft SQL Server等长期占据了to B领域的重要行业,拥有众多企业级用户。海外开源数据库M
32、ySQL、PostgreSQL等通过开源数据为用户提供了一条开放通路,走向更广阔的应用。国内来看,达梦、人大金仓等是老牌数据库厂商,PingCAP 是初创厂商的代表,凭借开源数据库 TiDB 在市场中占据一定份额。近年来,云计算的兴起也吸引全球众多云厂商成为数据库玩家。海外云原生数据库以AWS和Google Cloud为代表;国内阿里云的OceanBase和PolarDB,华为云的openGauss和GaussDB都乘云而上。资料来源:艾瑞咨询,华福证券研究所国产数据库乘云而上根据 IDC 数据,2021年下半年国内数据库厂商在关系型数据库市场的市占率继续扩大。其中公有云模式市场前五有三家国内
33、厂商,两家海外厂商份额均下降,腾讯、华为市场份额都扩大。在本地部署模式市场,国内厂商正在快速追赶 Oracle、IBM 等海外厂商。达梦市场份额扩大接近一倍;人大金仓过去一年在政府行业获得大量订单;华为在政企、金融行业也获得突破。总体国内厂商的份额不断扩大。国内,达梦、人大金仓等是老牌数据库厂商,PingCAP 是初创厂商代表,凭借开源数据库TiDB在市场中占据一定份额。国内阿里云OceanBase和PolarDB,华为云openGauss 和GaussDB则纷纷乘云而上。资料来源:IDC,华福证券研究所0.0%5.0%10.0%15.0%20.0%25.0%30.0%OracleHuawei
34、DamengMicrosoftSAPIBMKingbaseAlibaba GroupOthers中国关系型数据库软件市场份额本地部署模式2021H12021H20.0%10.0%20.0%30.0%40.0%50.0%Alibaba GroupTecentAmazon Web SercicesHuaweiOracleOthers中国关系型数据库软件市场份额公有云模式2021H12021H2国产数据库市占率持续扩大受到国产替代化的影响,PingCAP、Sequoia、易鲸捷等初创厂商纷纷涌入数据库市场,国产厂商阵营日渐强大。2022年,PingCAP 入选 Gartner 云数据库领域的 Pee
35、r Insights“Voice of the Customer”,成为唯一入选的中国企业级开源分布式数据库厂商,并在 Strong Performer 象限位列第一。公司旗下的 TiDB 数据库获得 94%全球用户的高度认可。TiDB 是开源分布式关系型数据库,同时支持在线事务处理与在线分析处理(HTAP),具备水平扩容或缩容、金融级高可用、实时 HTAP、云原生的分布式数据库、兼容MySQL 协议和生态等重要特性,运维成本极低。TiDB 技术创新能力处于世界领先水平,每年会进行超过 50%的代码更新,在 GitHub 总计获得超过32000颗星,目前已服务于全球超过3000家企业。TiDB
36、 6.0的发布以及 TiDBCloud 的商用化标志着 TiDB 数据库和云正在不断融合,加速释放数据价值。资料来源:Gartner,PingCAP,华福证券研究所PingCAP:不同于老牌厂商的定位作为国内初创厂商的主要代表,PingCAP 的发展战略相比老牌玩家有四点优势:全球化:公司成立开始即定位全球化,通过全球化路线构建社区并使用英文创作代码,为打造国际化企业奠基。开源数据库:公司的竞争壁垒不在于代码,而是快速构建强大的生态。数据扩展性最重要的门槛是使用人数、迭代和计算速度。针对开源,TiDB 每年会进行超过 50%的代码迭代。互联网为市场切入点:互联网是当前面临数据挑战和压力最大的行
37、业,同时互联网技术也是目前最先进的技术,只有利用未来的技术才能抢占未来的市场。公司2015年成立后,充分借助了2015-2020年互联网行业高速发展的红利,利用互联网客户使用 TiDB 数据库的反馈不断积累场景经验、更迭产品技术。国内头部用户带来的场景经验成公司在海外市场的竞争优势。选择 MySQL 协议兼容:MySQL 在中国市场最为流行,对于业务或代码基于 MySQL 生态的用户,TiDB 数据库和 MySQL 协议兼容能够大大降低他们的迁移和学习成本。6月15日,PingCAP 与阿里云达成合作,集双方技术优势打造的云数据库 TiDB 上线阿里,使TiDB成为全球横跨 AWS、Googl
38、e Cloud、阿里云三朵云的数据库,这一合作代表了开源数据库和云服务不断融合的大趋势。PingCAP 的未来发展方向仍然以分布式数据库为主,将云原生技术融入数据库底层架构,助力更多企业数字化转型。同时,TiDB 数据库的定位基于 HTAP,降低用户的程序写作门槛,继续革新数据库的易用性,打造更开放、更通用、更大生态的 TiDB 数据库。资料来源:PingCAP,华福证券研究所PingCAP:不同于老牌厂商的定位OceanBase 是全球唯一在 TPC-C 和 TPC-H 测试上都刷新了世界纪录的国产原生分布式数据库,实现100%自研,没有基于任何开源数据库模块,兼顾分布式架构的扩展性与集中式
39、架构的性能优势,用一套引擎同时支持 OLTP 和 OLAP 的混合负载,具备数据强一致、高扩展、高可用、高性价比、高度兼容Oracle/MySQL、稳定可靠等特征,不断用技术降低企业使用数据库的门槛。OceanBase 经历开源到闭源,2021年6月再次开源,以开放化的方式让软件本身和上下游技术以及应用生态对接,共建分布式数据库的未来。同时,OceanBase 也实现了跨云架构统一。2022年8月,OceanBase Cloud 面向全球开服,以OceanBase 数据库为核心,结合强大的运维管控平台和工具体系,以底层的阿里云、AWS 云基础设施为支持,为客户提供弹性扩展、卓越性能、主流兼容的
40、高性价比的数据库云服务。资料来源:OceanBase,华福证券研究所特点原生分布式高兼容HTAP稳定可靠自主研发高性价比技术支持自研一体化架构突破高性能和高可用,实现应用无限扩展和服务永远在线Oracle/MySQL平滑迁移快速、最小成本搬迁应用与数据一份数据既能做事务处理又能实时分析,通过 HTAP助力拓展更多可能全量数据校验真正实现数据强一致,数据不丢失,“三地五中心”实现城市级容灾 RTO30s12 年完全自主研发,代码级可控,大规模金融核心场景 9 年可靠性验证基于 LSM-Tree 的高压缩引擎平衡了“性能”和“压缩”的瓶颈,有效降低存储成本 70%-90%,原生多租户,资源隔离按需
41、使用阿里:OceanBase&PolarDB据 Gartner 预测,2023年全球75%的数据库将在云平台上,云发展趋势不可抵挡。2015年 PolarDB 只是阿里云的一个探索产品,而今天 PolarDB 成为阿里云数据库众多产品中的王牌,见证了阿里云在云原生数据库领域的自研创新突围。阿里云已经在2020-2021年连续两年进入 Gartner 云数据库的领导者象限。传统数据库采用单节点架构,存储和计算绑定在一起。而分布式最大的特点是采用解耦合的共享存储,通过 RDMA 网络形成分布式共享存储,可以实现一写多读共享存储的模式。因此,PolarDB采用存储与计算分离的设计理念,数据库计算节点
42、和存储节点之间采用高速网络互联,并通过 RDMA 协议进行数据传输,I/O 性能不再成为瓶颈,让跨区域、跨共享区的复杂度降低。在云数据库这一新赛道上,中国的云原生数据库在很多技术创新领域已经处于领先地位。目前 PolarDB 已经实现的计算、内存与存储资源的三层解耦、多主多写、HTAP、Serverless 等功能,皆为全球领先技术。未来,数据库领域的核心发展方向是云原生+分布式,中国云数据库必将更上一层。资料来源:Gartner,PolarDB,华福证券研究所阿里云PolarDB数据库架构图阿里:OceanBase&PolarDB据华为 GIV 报告显示,全球数据量到2025年将增长至180
43、ZB,AI应用率也将达到80%。在未来数据量不断增长的背景下,华为面向全球发布人工智能原生(AI-Native)数据库 GaussDB,广泛应用于金融、运营商、政府、能源、医疗、制造、交通等多个行业,金融行业成为最主要的用户。对数据安全和可靠性要求最为严苛的金融行业,GaussDB 在业内领先的金融级分布式数据库可以满足其高可用的诉求。一方面,构建 openGauss 开源社区,打造开放生态;另一方面,首创的 Switch Turbo 技术在数据中心出现故障后实现秒级切换,该项指标是同类产品的1/500,实现 RTO0 的诉求。因此,GaussDB 既拥有商业数据库的稳定可靠性,又拥有开源数据
44、库的灵活性和低成本。相比其他数据库,GaussDB 也有独特的亮点:GaussDB 支持 X86、ARM、GPU、NPU 等异构架构,支持行存储和列存储,可增加节点实现存储、查询及加载性能的线性扩展。可以看出,GaussDB 未来的目标市场不只是国产服务器市场,可能还包括未来5G 带来更多的计算应用场景。GaussDB 是业界第一个人工智能原生态(AI-Native)数据库,首次将 AI 技术融入分布式数据库的全生命周期,实现了一定的自运维、自管理、自调优、故障自诊断和自愈能力。通过多元算力+DFV存储+RDMA 的技术支持,实现国内唯一软硬全栈与数据库调优,调优性能比业界提升60%以上。Ga
45、ussDB 可以建立在华为高度耦合的 IT 架构底层生态上,包括网络设备、芯片、操作系统、云计算、人工智能等。资料来源:华为,华福证券研究所华为:GaussDB 未来可期GaussDB 结合数据库云化改造技术,大幅优化传统数据库,针对不同的使用场景打造了更高可用、更高可靠、更高安全、更高性能、即开即用、便捷运维、弹性伸缩的数据库服务,目前在金融政企等主要行业已经拥有超过2500家标杆大客户。资料来源:华为,华福证券研究所分类产品使用场景性能容量规格关系型数据库GaussDB(for openGauss)应用于金融、电信、政府等行业关键核心系统,高性能场景1.最大支持256分片1000+节点扩展
46、能力;2.有效存储最大4PBGaussDB(for MySQL)中大型企业生产系统(高性能,大数据容量),例如金融、互联网等1.单节点最高可达150万QPS、50万TPS;2.支持并行查询,NDP算子下推,提升复杂查询效率,TPCH 标准SQL测试,性能提升3-20倍;3.单实例最高支持128TB存储非关系型数据库GaussDB(for Mongo)应用于游戏(装备、道具)、泛互联场景1.支持最大12个节点集群;2.支持最大96TB数据存储;3.同等资源情况下性能可达到社区3倍GaussDB(for Cassandra)泛互联网日志数据存储(并发写入量大,存储容量高)、工业互联网数据存储(写入
47、规模大、存储容量大)1.支持最大12个节点集群;2.支持最大96TB数据存储;3.同等资源情况下性能可达到社区3倍GaussDB(for Influx)工业互联网时序数据、用户银行流水数据、物联网数据存储(时序)1.同等资源情况下性能可达到社区5倍;2.压缩比为10:1;3.扩展比大于80%;4.最大支持12节点集群GaussDB(for Redis)Key-Value存储模式,可用于互联网场景1.最大支持12个节点集群;2.同等规格成本低于自建4倍;3.数据压缩比为自建4倍;4.p99时延达到社区2倍华为:GaussDB 未来可期达梦数据库是老牌厂商的主要代表之一,2000年成立至今,二十余
48、年的发展几乎构筑了一部国产数据库的成长史。其主要产品线从通用关系型数据库产品向全栈数据产品延伸,目前各类数据库产品可覆盖数据全生命周期。二十多年自主研发技术的历练既是与国外巨头不断交锋的过程,也是让国内客户逐渐认可的过程。最新版本 DM8 是国内第一款实现数据共享存储集群的数据库,采用全新的体系架构,在保证大型通用的基础上融合分布式、弹性计算与云计算的优势,对灵活性、易用性、可靠性、高安全性等方面进行了大规模改进,支持超大规模并发事务处理和事务-分析混合型业务处理(兼顾 OLTP 和 OLAP),动态分配计算资源以降低成本。受益于多年自研技术积累和国产替代的热潮,目前达梦数据库的多款产品已经实
49、现对标 Oracle,未来将继续赶超国外巨头厂商。资料来源:达梦,Oracle,华福证券研究所达梦DM达梦数据库管理系统DM8DMDSC磁盘共享集群DMMPP分布式并行集群DM MGBase非结构化数据库DMTDD透明分布式数据库DMETL数据抽取、转换、加载工具DMHS异构数据同步工具DM Designer数据仓库建模工具DM OLAP联机分析服务DM DataMinner数据挖掘工具OracleOracle Database Software 20COracle RAC Oracle ExadataOracle NoSQLCloud Oracle ODIOracle Golden Gate
50、Oracle Data DesignerOracle Data WarehouseOracle Intelligence Bl VS达梦:国产数据库的成长见证达梦数据库产品线完备,通过基础数据库软件、面向不同应用场景的数据库集群软件以及云计算系列软件、大数据系列软件等产品形成以数据库管理系统为核心的产品生态体系,覆盖从数据交换、数据储存、数据治理到数据分析的全产业链,可为客户提供企业级的全栈数据解决方案和技术服务。达梦数据库在国产数据库中市占率持续领先,凭借多年的市场积累,市场销售额保持快速增长,在国内处于领先地位。根据赛迪顾问发布的报告,达梦数据库在2019-2021年中国国产数据库管理软件
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100