数据库市场快速发展,信创助力国产厂商。
数据库发展历史悠久,国产数据库厂商初露锋芒。数据库发展大概分为三个阶段:早期的网状和层次数据库阶段、关系型数据库阶段、多元化数据库阶段。1964年查尔斯·巴赫曼开发了第一代网状数据库 IDS,是数据库产业的开端;1970年关系数据模型的发表,奠定了关系数据库的理论基础,具有标志性意义。随后IBM在该理论基础上,于 80 年代发布了 DB2 数据库系统。同时,Oracle,Sybase,Microsoft SQL Server、Informix、 PostgreSQL 等众多数据库进入各领风骚数的时代。从 2010 年前后开始,随着 Google 发布其GFS、MapReduce 和BigTable 技术,nosql、newsql、分布式数据库、云原生数据库等新技术创新不断,成为现在数据库产业发展的最新方向。在数据库发展历史上,主要是Oracle、微软等厂商或者开源社区引领,近年来随着国内厂商持续创新,在新型数据库市场中已经占据了一定市场份额。
数据库是 IT 产业最重要基础软件之一,产品方向百花齐放。数据库管理系统(DBMS)是“按照数据结构来组织、存储和管理数据的仓库”,是一种用于建立、使用、操纵和管理数据库的大型基础软件,是 IT 系统核心支撑之一。DBMS充当数据库与其用户或程序之间的接口,允许用户检索、更新和管理信息的组织和优化。数据库具有多种分类,按其管理的数据结构,可分为关系型数据库、非关系型数据库;按其设计架构可分为集中式数据库和分布式数据库;按其部署模式可分为本地数据库和云数据库;按其应用场景可分为 OLTP 事务型数据库、OLAP分析型数据库、 HTAP 混合型数据库;按其存储介质可分为磁盘数据库和内存数据库;按其商业模式可分为商业数据库和非商业数据库。

按数据存储方式分类:关系型数据库和非关系型数据库。关系型数据库(SQL数据库)是利用简单的二元关系模型组织数据,将数据以“行列”的形式储存起来。数据的处理是基于一张或多张表格。非关系型数据库(NoSQL 数据库)不再局限于 SQL 的二元模型,而是顺应互联网大规模各类型数据处理,产生了键值、文档、宽列、时序等非关系型数据库。虽然非关系型数据库在互联网、大数据领域取得广泛应用,保持较快增长;但是传统人类社会信息数据大多数仍具有模式明确、关联清晰的特征,因此关系型数据库长期并在可预期的未来仍保持主流数据库地位。目前全球三大商业关系数据库为 Oracle、SQLServer、DB2,两大开源关系数据库为 MySQL、PostgreSQL。
按应用类型分类:OLTP、OLAP 和 HTAP。OLTP 是事务型数据库,又被称为面向交易的处理系统,是传统的关系型数据库的主要应用。其特点是接受到用户数据后即使传输到计算中心进行处理,并在很短的时间内给出处理结果。例如日常业务系统 ERP、OA、CRM 主要依赖于 OLTP 数据库。OLAP 是分析型数据库,主要对长期数据的规则趋势进行分析,更多用于决策,而非实时事务处理。其特点是数据量大,适用于数据仓库、BI 等系统。而 HTAP(混合事务/分析处理)则是二者的结合,可以理解为 OLTP 和 OLAP 在统一的数据库系统中完成,可以实现同时高效地处理实时事务和复杂的数据分析查询。
按技术架构分类:集中式数据库和分布式数据库。集中式数据库是一种存储,定位以及仅在单个位置维护的数据库,将数据集中在一台机器上进行处理。分布式数据库由多个相互连接并分布在不同物理位置的数据库组成,不同位置的数据库通信由计算机网络实现,并达到轻松扩展的能力。
按部署模式分类:云数据库和本地数据库。相比于传统本地部署的数据库,云数据库采用了云计算基础设施作为承载数据库服务的基座,也可以划分为公有云部署和私有云部署模式。私有云模式仍需用户自建数据中心,商业模式也与传统类似。公有云模式具备更强的弹性伸缩能力,用户按需购买/租用所需服务(资源),在成本、可用性、易用性、扩展性和并行处理等多方面具备优势。
国内数据库市场保持快速增长,数据库数量体量庞大。根据信通院发布的《数据库发展研究报告(2023 年)》,2022 年中国数据库市场规模为59.7 亿美元(约合 403.6 亿元人民币),占全球 7.2%;预计到 2027 年,中国数据库市场总规模将达到 1,286.8 亿元,市场年复合增长率(CAGR)为26.1%。国内数据库市场快速发展的同时,也吸引了大量竞争者参与,国内数据库产品数量也快速增长。根据墨天轮最新数据,中国目前共有 318 个数据库产品,是美国三倍有余。而根据墨天轮排行榜数据库产品数量,近年来上榜产品持续增长,2024 上半年略有下降,数据库行业竞争激烈。
关系型数据库仍是主流,非关系型数据库增长更快。根据《数据库发展研究报告(2023 年)》数据,全球数据库产品数量分布来看,关系型数据库为309个,非关系型数据库数量达到 344 个,占比 52.7%。非关系数据库中键值数据库、时序数据库、图数据库数量较多。相比之下,我国关系型数据库为156 个,非关系型数据库数量达到 82 个,占比 34.5%。根据 Garter 关于2022 年全球数据库管理系统市场数据,非关系型数据库增长更快,增速达到26.8%,市场份额21%;关系型数据库增长 12.2%,市场份额 78%,仍占据市场主导地位。

OLTP 数据库占比高,但 OLAP 和 HTAP 需求快速增加。随着传统信息化逐步成熟,数据分析需求日益旺盛,推动了 OLAP 的增长。企业通常也会建设和维护两类不同数据库,但是 OLTP 与 OLAP 系统间存在较大的数据延迟,同时维护成本较高。因此能够统一支持 OLTP 和 OLAP 的数据库成为了众多企业的需求,产业界正基于创新的计算存储框架研发 HTAP 数据库,通过实现基于同一引擎同时支撑业务系统运行和分析决策场景的功能。以对数据库要求最高的行业之一金融业来看,报表类、分析类系统通常选择 OLAP 数据库,OLAP 和HTAP 应用需求不断增加;金融业的 OLAP 和 HTAP 数据库占比已超过 20%,尤其银行业和证券业趋势更为明显。根据墨天轮最新数据,OLAP 和 HTAP 数据库数量占比已达到27%和20%。
大数据推动分布式数据库发展,未来有望加速渗透。由于集中式数据库起步较早,根据亿欧智库数据,集中式数据库应用占比仍高达80%。但是随着系统数据量逐步扩大,分布式数据库依托通用硬件、高灵活性、可扩展性在支撑高并发、高吞吐的海量数据应用时更具成本优势。因此互联网、大数据的快速发展,例如金融业走在数字化前列,核心业务系统呈现由集中式走向分布式的发展趋势,市场对分布式数据库需求快速增长。根据赛迪顾问统计企业数据,已有40%的单位选择了集中式和分布式数据库的组合,其中部分是出于转型试探,部分是业务发展实际需要。另有 8.1%的单位选择直接部署分布式数据库。当下分布式数据库渗透率仍较低,结合当下云原生的发展,未来有望加速应用。
云数据库快速成长,亚马逊引领产业趋势。根据 Garter 预测,2023 年全球数据库市场规模将首次突破 1000 亿美元,其中云数据库市场比例达55%;预计到2027年云数据库占比将达到 70%。同时,根据《市场份额:2022 年全球数据库管理系统》数据,作为云厂商的 AWS 首次超越了老牌传统数据库厂商Oracle 和微软,份额达到 25.3%,位居第一。再加上 Oracle 和微软的份额后,前三名合计占据市场67.9%的份额。从 2011-2022 年数据库排名变化来看,AWS、谷歌凭借云的优势排名快速提升,国内的云计算巨头阿里和华为也是受益者,创新性的云数据仓库snowflake、分布式非关系型数据库 MongoDB 也保持了快速上升势头;相应的,Oracle、IBM、SAP 等传统数据库厂商份额均有下降。云原生数据库成为数据爆炸背景的产业趋势。
国内数据库产业与全球趋同,云原生、分布式、非关系型、HTAP 等均是产业方向。在全球 IT 云化的同时,国内云数据库也保持了较快增长,22 年公有云数据库市场达到 219.15 亿元,同比增长 51.6%;本地部署数据库市场为184.45 亿元,同比增长 14.4%;23 年预计公有云数据库占比将接近60%。根据信通院数据,互联网是云原生数据库使用最广泛的行业,占比超 55%,智能制造、传媒、金融等行业也是类似的基于云的大量数量处理场景。在数据库应用量最大的行业中,IT服务、金融、政府、制造排前四,已经展现了积极的新型数据库转型的态势。随着非结构化数据的海量爆发,非关系型数据库的应用,HTAP 更强的数据处理,云原生和分布式数据库共生部署共同为创新应用提供支撑,成为数据库发展方向。