1、数字经济DIGITAL ECONOMY 52COvER StORY 2022封面本文通过海量数据自身的发展经验,总结了国产数据库生态建设的基本思路,即牢牢抓住自主可控之“魂”,扎根行业内核根技术,不断实现技术和应用的突破。文肖枫 海量数据总裁星移斗转,回顾人类科技发展史,就是一个不断突破认知边界、学习并再创造的过程。进入数智时代,科技的进步不再只依赖于人类的大脑,数字被赋予了“生命”和“智慧”,数字化开始让万物互联,让产品和系统更智能,能够实现自我学习和进化。今天,我们正在经历一场立体的、多要素的、全景式的数智化变迁。随着数智化向千行百业不断深入,现代社会也将会拓展出一幅超出当前想象的时代图景
2、。而这一切改变的发生,都离不开一个关键要素:数据。数据是数字世界一切行为的基础。而作为存放、管理数据的手段,数据库软件犹如数字世界中的一把金钥匙,对数据的存储、读取、调用、管理、维护,都起着决定作用,支撑着数字世界所有应用的正常运转。根据华为全球产业展望(GIV)预测,到 2030 年,全球数据将进入 YB问“数”那得清如许为有“自研”活水来数字经济官方微信赛迪网官方微信DOI:10.19609/10-1255/f.2022.12.006532022 年第 12 期数字经济Dig it a l Ec o n o myDigital Economy 时代。数智时代,如何更好地获取并利用数据要素,
3、发挥其价值,已成为全球科技竞争的新战场。一、国产数据库步入黄金发展期数据库作为信创三大基础软件之一,它向下连接着硬件算力,向上支撑着各种应用,是信息系统高效运行的关键基础。在科技竞争的今天,我们必须以国产数据库实现替代,才能保障我国重点行业的数据和应用安全。当时针回拨,我们常会惊叹国产数据库近年来的发展速度之迅猛。四五年前,那时国际形势一片祥和,现在发生的事件,在当时都是匪夷所思。近年来,随着国际局势的突然变化,中国科技被西方国家“卡脖子”,以芯片、操作系统、数据库等为代表的产业,得到了从国家到地方、从行业到用户的各方重视,国产数据库也因此迎来了前所未有的机遇。市 场 数 据 是 最 好 的
4、证 明。2019 年我国数据库市场规模为 138.5 亿元,到2021 年,我 国 数 据 库 市 场 规 模 达 到 了223.5 亿元。从 2019 年到 2021 年期间,我国数据库三年的市场规模增速分别为:17.8%、26.6%和 27.5%。去除国外商业数据库巨头固有的市场空间,刨去公有云市场,增速依旧惊人。国产数据库的快速发展,一方面得益于政策、产业的扶植,另一方面得益于客户思维的转变,他们给予了国产数据库厂商更多信任,逐渐敢于把核心业务系统和项目迁移部署到国产数据库中。而国产数据库厂商的技术实力、产品性能也在快速提升,开始从“能用”向“好用”阶段过渡,两者相互促进,形成了产业发展
5、的正循环。作为国产数据库厂商中的一员,海量数据也在 2021 年实现了多个重点行业的相继突破。去年,海量数据赢下了制造行业中的比亚迪,券商行业中的中信证券、国泰君安等头部厂商,央企龙头中海油、中交建也选用了海量数据库。同时我们的产品继续服务于广州、深圳等极具示范价值的政务系统改造,公安、城商、保险等行业也都有所斩获。特别值得一提的是,中海油、中交建等是被美国列入了实体名单的客户,而海量数据的产品应用在这些被美国打压的“国之重器”企业中,助力客户实现了数据库的本地化发展。这不仅是我们的一份荣誉与骄傲,更是作为从业者,深刻感受到了肩上的那份责任与担当。我国的数据库市场,大致经历了探索期、萌芽期、成
6、长期、发展期四个阶段。市场从最初完全被海外巨头垄断,到国产数据库艰难起步,再到行业燃起星星之火,直到今天也迎来了百花齐放的局面。目前国产数据库厂商数量,据不完全统计已经超过了 200 家。但国产数据库的市场发展还远未见顶。据 信 通 院 预 测,中 国 数 据 库 市 场2020-2025 年 复 合 增 长 率 达 23.35%,2025 年市场规模有望达 688 亿元,国产数据库市场发展前景广阔。中国拥有巨大的经济体量、广阔的市场空间,其土壤足以支撑我们发展起自己的技术体系。目前,国产数据库已经数字经济DIGITAL ECONOMY 54COvER StORY 2022封面在政府、金融、电
7、信等行业得到了越来越多的应用,行业呈现出技术创新、生态繁荣、人才涌动的特点,市场正在释放出前所未有的活力。二、国产数据库亟待“立根铸魂”但是,我们仍需清醒地认识到,国产数据库从技术、高可用、生态等各方面,距国际知名数据库厂商的差距依然巨大,市场发展还存在多而不强的现状,尤其在自主可控方面,纯国产自研数据库占比还非常低。据 Gartner 报告显示,按收入统计,目前海外商业数据库份额占 39%,公有云数据库占比 45%,基于开源的国产数据库占 6%,纯国产自研内核数据库占比仅有10%。如果扣除云市场份额,国外厂商则占据了国内数据库市场70%左右的份额。另外,从企业规模和研发投入上,国内数据库厂商
8、与国外厂商也存在较大差距。我国数据库厂商虽有超过 200 家,但中国信通院发布的数据库发展研究报告显示,员工人数少于 300 人的国产数据库企业高达 84%,而单看甲骨文一家巨头在全球有约 13 万员工,年度研发投入大于 60 亿美元,差距可见一斑。国内数据库厂商研发投入较多的包括 华 为、阿 里、腾 讯 等 大 厂,也 有 达梦、海量数据等独立数据库厂商,大的独立数据厂商员工人数基本都在 800 以上。近年来,海量数据持续坚定加大在研发方面的投入,2021 年海量数据研发投入同比增长 54.39,占营业收入的17.50。虽然我们距离世界级软件巨头的差距还很大,但我相信中国在 20 年内,有希
9、望诞生世界级的软件企业。数据库其实是一种生态产品,一款数据库之所以“好用”,是因为它的开发环境、工具、功能都成为了用户使用中的默认选项,这就是所谓的生态。华东师范大学周傲英教授也曾经感慨过,“数据库一直都是我们的切肤之痛,但我们始终没弄明白为什么做不出自己的数据库,直到进入了互联网时代,我们一下子就醒悟了,就是生态!这之中既包含用户生态,更包含技术生态,前者是我们要将国内数据库市场空间做大,后者是我们要形成合力,因为数据库要解决的问题是综合性的,只有一起才能将这个事情做好。”所以国产数据库要想“好用”,首先要有很厉害的内核根技术,其次就是要有繁荣的产业生态、足够的行业人才。因为软件生态越往后发
10、展,越会呈现出指数级的加速度态势,软件行业的人才、市场、生态,都会螺旋式上升。在国产数据库的生态建设中,海量数据也会一直秉承专注做好数据库的初心,为用户提供更好的数据技术服务,为国产数据库发展贡献我们的力量。三、竞争加剧引发技术路线收敛目前,国产数据库主要有四条主流技术路线:代码授权(源于国外代码)、基于国外开源封装(开源修改)、仿制国外商用(仿制)、自主重构(国内自研)。随着中西方对抗加剧和科技武器化552022 年第 12 期数字经济Dig it a l Ec o n o myDigital Economy的趋势凸显,信息、数据安全已经关乎国家发展战略,极限思维也成为了用户在选型数据库时首
11、要考虑的问题。因此,未来国产数据库的四种技术路线也将加速收敛。对于国产数据库未来技术路线的预判,海量数据的思考是:国外代码授权因独立演进可能性不高;基于国外开源封装的产品具有协议风险、断供风险、法务风险等隐患,与国产硬件匹配度差;仿制国外商业版缺乏面向未来的创新能力,产业生态难以做大;只有独立、自主、代码重构的数据库技术,才有发展前景,这其中则以openGauss 技术路线为代表。openGauss 是 一 个 全 面、友 好、开放的企业级开源关系型数据库社区,有望 在 未 来 自 主 可 控 数 据 库 市 场 胜 出。openGauss 的 源 代 码 放 在 中 国,获 取非常方便。相比
12、其他国际主流数据库,openGauss 不受美国 EAR(出口管制条例)管制,实现了完全的自主可控,具备独立演进的能力。在产业生态建设方面,它 根 植 于 中 国 数 字 经 济 的 沃 土,截 至2022 年 11 月 底,目 前 已 吸 引 超 过 200家头部企业加入,有 4200 余名开发者参与社区贡献,在各行业累计商用部署 1.5万多套。对于海量数据来说,我们的发展思路是“依托鲲鹏大生态、融入 openGauss中生态、打造 Vastabase 小生态”。在信创产业链上,海量数据作为首批加入openGauss 社区并推出商业发行版的厂商,产品耦合了多家国产芯片、操作系统、中间件的技术
13、与产品,深度匹配各行业应用场景,目前经历了政务、制造、金融、通信、能源、交通等全场景的检验,事实证明在所有行业中都可以实现成功应用。海量数据库 Vastbase G100 是一款纯国产自研的集中式关系型数据库,产品基于对 openGauss 核心架构的深刻理解和强大的源代码能力,具备了高性能、高并发、高可用、高安全、高兼容、多模态特性,是国产数据库的首选之一。从海量数据的企业发展路径借鉴,我们想阐明的是国产数据库厂商的建设思路,即一定要牢牢把握自主研发的“灵魂”,深深植根于行业中生命力最强的根技术,在此基础上再不断实现技术和应用的自我突破,才能走出行业里的一条康庄大道。“问渠那得清如许,为有源头活水来”,我认为只有当一个产业能够源源不断地注入“活水”,不断地接受新事物,才能保持产业的活力与进步。作为国产数据库领域,我认为“活水”指的就是产业生态,是自研的技术创新,是人才的汇聚。只有依靠不断强大的自主研发创新能力,才能实现产业最终的高质量发展。责任编辑:杜玢翰