2024年达梦数据研究报告:国产数据库中流砥柱,大数据时代奋楫争先

一、起步于华工数据库研究所,崛起于信创大机遇

1、40 余载久久为功,专注打磨核心国产数据库产品

起步于华工数据库研究所,崛起于信创大机遇,达梦数据 40 余载久久为功。达 梦数据起源于创始人冯裕才冯老师科技自立、产业报国之梦,从奋战 8 年开发出 我国第一个拥有自主版权的国产数据库管理系统原型 CRDS;到华中科技大学实 验室中迈向产品研究阶段;再到产品不断迭代升级,核心产品 DM7、DM8 陆续 面市,共享存储集群核心技术得以突破,达梦数据逐渐成长为国产数据库的中流 砥柱。而从 08 年左右国家电网国产数据库选型,到 19 年前后信创产业开展,信 创大机遇下公司迎来高速发展,产品得以全面推广应用,并逐步应用于金融等关 键行业核心业务系统。

(1)1980 年至 1990 年,达梦步入理论研究和原型探索阶段。期间,冯裕才编 著的《数据库系统基础》出版面世,成为研究我国数据库管理系统研制的重要教 材。1988 年,冯裕才团队开发出我国第一个拥有自主版权的国产数据库管理系 统原型 CRDS,达梦数据库的研究开始进入萌芽阶段。

(2)1990 年至 2000 年,达梦迈向产品研究阶段。1992 年,华中理工大学达 梦数据库与多媒体技术研究所成立,这意味着达梦数据库的研究开始向“产”转 型。这期间,达梦数据库管理系统 DM1、DM2 相继诞生,DM2 更是在中国电力 财务公司华中分公司实现了规模化应用。

(3)2000 年至 2008 年,从研究所走向市场,进入成果转化期。2001 年,公 司在上海成立研发中心。2002 年,在原华中理工大学达梦数据库与多媒体研究 所研制的 DM2 基础上,公司推出了通用关系型达梦数据库管理 DM3,并在中国 电子财务有限公司得到应用。2004 年达梦数据发布新一代企业级商用大型通用 数据库 DM4。2005 年和 2007 年,公司分别推出了 DM5 和 DM5.6。

(4)2008 年至 2012 年,核心产品不断成熟。2008 年开始,为满足客户的需 求,公司不断加大研发投入,新增了 DMETL、DMHS 等数据库软件配套工具, 布局大数据分析处理相关产品研发;在 DM4 的基础上进行精研与改进,推出了 DM6、DM7 数据库产品,其中 DM7 实现了在通用性、安全性、可靠性、高性能、 扩展性等数据库特性方面的重要改进,能够满足大、中型企业以及金融、电信等 行业核心业务系统的需要。

(5)2013 年至 2019 年,专注核心技术突破,打造核心竞争力产品共享存储集 群。2013 年至 2019 年,公司致力于数据库核心技术的突破,在总结 DM 系列 产品研发与应用经验的基础上,吸收借鉴先进数据库技术思想与主流数据库产品 优点,融合了透明分布式数据库、数据库弹性计算、行列融合 2.0 等技术架构的 优势,化繁为简,于 2019 年推出了新一代面向大数据与云计算的大型通用数据 库软件产品 DM8。此外,公司历经多年攻关,成功研发出数据库集群软件产品, 打破了国外的强势垄断,填补了国内同类产品的空白。

(6)2020 年至今,构建全栈数据产品解决方案,面向国民经济主战场,积极推 进国产信息化生态建设。2020 年以来,公司紧跟产业趋势,积极布局数据产业 链,各类产品及服务向标准化进一步推进,推出了图数据库、分布式数据库、云 数据库、云开放平台、大数据可视化系统、大数据分析系统等多类产品,覆盖数据全生命周期,构建了矩阵式的全栈数据产品解决方案。公司产品在金融、电力、 党政等多个重点领域得到了广泛的使用与推广。6 家国有大型银行中已有中国银 行、中国建设银行、交通银行和邮储银行使用达梦数据库,中信证券、银河证券、 国泰君安、中信建投证券、上交所、深交所等金融机构亦开始使用达梦数据产品。

2、以标准化产品达梦数据库为核心,覆盖全栈数据解决方案

基于达梦数据库管理系统,提供集群+解决方案+一体机等全栈数据解决方案。 公司向大中型公司、企事业单位、党政机关提供各类数据库软件及集群软件、云 计算与大数据产品、数据库一体机等一系列数据库产品及相关技术服务。

渠道销售为主。2018 年以来,公司为更加有序、高效开拓市场,积极与渠道商 签署经销框架协议,对其业务开展地区或行业领域作出约定。其中,公司与中建信息订立了《总经销商合作协议》,中建信息作为总经销商可以拓展并管理其开 拓的渠道客户。2023 年,公司与神州数码签署了《总经销商合作协议》。未来公 司计划设置多个具备行业影响力、具有较强渠道管理能力的总经销商,并逐渐减 少与总经销商之外的其他渠道客户直接签订销售合同。

3、创始人冯裕才实控,具有国资背景,员工高持股比例

创始人冯裕才实控。根据公司招股意向书,截至 2024 年 5 月 20 日,冯裕才直接持有发行人 580.67 万股股份,持股比例为 10.1872%,通过梦裕科技、曙天 云、得特贝斯、数聚云、惠梦源、数安科技、梦达惠佳和数聚通 8 家有限合伙企 业间接持有发行人 121.6299 万股股份,间接持股比例为 2.1339%,冯裕才直接 及间接持有发行人 12.3211%的股份(IPO 后稀释至 9.24%)。表决权方面,由冯 裕才担任执行事务合伙人并实际控制的梦裕科技、曙天云、得特贝斯、数聚云、 惠梦源、数安科技、梦达惠佳、数聚通分别拥有发行人首发前 8.9754%、4.5614%、 4.3304%、3.5767%、2.9163%、1.4281%、1.1509%、1.1456%的表决权,冯 裕才通过上述由其实际控制的合伙企业合计控制发行人 28.0847%的表决权。此 外,冯裕才通过与韩朱忠、周淳等管理团队的一致行动关系,实际控制发行人首 发前 2.2807%的表决权。综上,冯裕才合计实际控制发行人首发前股东大会 40.5527%的表决权(IPO 后稀释至 30.41%),对发行人股东大会决策构成重大 影响。 CEC 入股,注入国资力量。2008 年,中国电子 CEC 旗下中国软件投资入股达 梦,为公司的发展注入强心剂。自此达梦数据成为 CEC 旗下基础软件企业,为 网信产业自主创新体系建设、产业数字化转型做出重要贡献。 员工持股平台持股比例高达 21.06%。梦裕科技、惠梦源、曙天云、得特贝斯、 梦达惠佳、数安科技、数聚通、数聚云为员工持股平台,IPO 后合计持股比例高 达 21.06%,员工激励充分,利于公司长远发展。

4、迎信创东风规模迅速扩张,高毛利率彰显产品高成熟度

19-21 年迎党政信创东风公司规模得以迅速扩张。19-21 年公司营业收入 CAGR 高达 56.95%,扣非归母净利润 CAGR 高达 111.85%,一方面得益于公司核心数 据库产品逐步成熟,另一方面是由于党政信创工程加速推进,19-21 年公司党政 领域内的软件产品使用授权业务收入持续大幅增长,复合增长率达到 94.43%。 22-23 年行业信创发力,公司业绩展现韧性,营收与利润高质量增长趋势不改。 2022 年受党政等领域 IT 建设项目进程短期放缓及公司加大人员扩张力度影响, 公司业绩出现短暂下降。23 年受益于金融、能源等领域信息化建设的加速推进 及相关采购的增长(其中能源领域软件产品使用授权业务收入同比增长 56%),公司营业收入同比增长 15.44%,归母净利润同比增长 10.07%。我们认为公司 业绩长期呈现高质量增长趋势。

按产品拆分来看,软件产品使用授权为主要收入来源: (1)软件产品使用授权业务: 20-23 年收入 CAGR 为 25.4%,为公司收入的 最主要来源且占比持续提升,23 占整体收入比重提升至 91.65%。 (2)数据及行业解决方案业务:收入占比逐年下滑,原因在于:1)数据及行业 解决方案业务在实际开展过程中存在项目建设周期长、用户需求变化频繁等诸多 问题。出于提高经营效率的考虑,公司逐渐提高解决方案项目选择标准。2)在 公安、国土、政法委、检察院、司法等不同行业数据治理及数据全生命周期管理 相关经验积累与总结的基础上,公司逐步研发形成针对不同行业数据管理需求的 云计算与大数据软件产品。在部分行业应用项目中,公司可选择直接以云计算与 大数据软件产品进行交付。 (3)运维服务业务:总体上说公司运维服务业务量会随着公司软件产品使用授 权和数据及行业解决方案业务规模的扩大而增长。 (4)数据库一体机业务:2023 年实现销售收入 466.86 万元,占当期主营业务 收入总额的 0.59%。公司数据库一体机销售业务尚处于起步阶段,作为达梦面向 网信产业深水区的重磅产品,已在金融、财政、烟草等多个行业实现多个重大项 目的落地应用,收入有望在未来实现逐步提升。

按下游客户拆分来看,行业客户占比逐步提升: 软件产品使用授权业务终端用户主要集中于党政、能源和金融等领域。党政 方面,因 2022 年国内党政等领域的信息化建设项目进程出现短期放缓,公 司党政领域的软件产品使用授权收入金额及占比有所下降;能源方面,公司 数据库软件产品在国家电网的核心电力调度系统中得到广泛应用。随着公司 数据库软件产品向电网管理信息系统市场及风电、水电、核电等新能源市场 的进一步拓展延伸,2023 年度公司能源行业软件产品使用授权业务收入较 2021 年度实现 6,401.57 万元的增长,增长幅度达到 75.77%;金融方面, 2020 至 2023 年,公司金融行业软件产品使用授权业务收入 CAGR 达 162.26%;  数据及行业解决方案客户主要集中于党政领域。20-23 年公司在党政领域实 现的数据及行业解决方案业务收入金额占比分别为 98.56%、97.51%、86.01% 和 82.49%。 运维服务业务主要集中于党政、能源和金融等领域。 23 年数据库一体机业务客户均来自金融领域。

整体毛利率水平较高,彰显产品高成熟度、高标准化程度及高可用性。20-23 年 公司软件产品使用授权业务毛利占整体主营业务毛利比例分别为 90.88%、95.25%、94.80%和 95.60%,为公司主营业务毛利的主要来源;公司主营业务 毛利率分别为 90.27%、90.60%、94.11%和 95.84%,主要得益于公司在数据库 软件领域长期深耕,成功开发出成熟度高、市场竞争力强的数据库管理产品,从 而实现了良好的经营效益。 因人员扩张,整体费用率有所增加。2021 年因公司营收增长幅度较大,经营规 模效应凸显,各项期间费用率均有所下降。2022 年度,公司期间费用率较 2021 年度大幅提高,主要是因为公司 2022 年人员扩张、平均薪酬提高,故而人工成 本和期间费用金额有所增加。2023 年度,公司人员规模持续扩张、平均薪酬提 高故而人工成本和期间费用金额有所增加,期间费用率较 2022 年上升 3.87%。

二、奋楫当先,筚路蓝缕国产替代路

1、近六成市场仍待攻坚,国产替代是挑战亦是机遇

数据库关乎国生民计,实现全面国产化替代具备紧迫性。根据达梦数据招股意向 书,数据库管理系统是“按照数据结构来组织、存储和管理数据的仓库”,是一 种用于建立、使用、操纵和管理数据库的大型基础软件,既是业务数据的存储中 心,也是统计分析计算的基础,对 IT 核心系统起着关键性作用。在信息化、大 数据时代中,数据库软件已经深入渗透到关乎国计民生的各行各业,成为生产生 活不可或缺的基础设施,越来越成为保障经济发展、国家安全的战略性、基础性 和先导性产业。近年来,国际国内上发生了数次重大信息安全事件。为防范信息 泄露、规避潜在风险,关键的政、商等领域使用的数据库产品必须具备极高的安 全性,属于国家高度重视和重点支持的战略新兴行业。 六成市场尚未成功去“O”,国产数据库高端场景可用性有待验证。根据达梦数 据招股意向书,目前,Oracle、IBM 和 Microsoft 等厂商凭借其先发优势在国内 市场中占据了近六成的市场份额。在国产化浪潮的推动下,我们观察到党政机关 以及八大关键行业在非核心业务系统的数据库国产化进程中取得了显著进展。然 而,当涉及到金融等机构的核心业务系统时,国产化数据库的选型和推进遇到了 一些挑战。这些难点主要集中在以下几个方面:

1)我们认为,国内厂商与 Oracle 等海外数据库龙头的性能差异主要体现在业 务系统的兼容性:由于海外企业在关系型数据库长期霸主地位,已经形成行业标准,其他厂商会根据 Oracle 等数据库标准去做适配,国内厂商在兼容性与应用 性能方面仍有一定差距。 2)受限于产品成熟度不足,持久运行下的性能波动等问题难以短时间内验证, 是制约数据库国产化的重要原因之一。数据库在长时间高负荷运行下,性能可能 会产生波动,该指标难以做短期的测试分析,需要通过产品熟练度的提升去不断 优化。如 Oracle 和 IBM 分别在 1989 年和 1992 年便进入中国市场,已经积累了 大量案例与稳定运行时长,足以验证其产品长期运行下的稳定性能;而国产数据 库大部分起步于 2010 年之后,其产品在核心系统的稳定运行时长仍然较短,在 成熟度方面仍有较大差距,主要是缺少大量稳定运行积累、较为成熟的运行维护 体系、DBA 人才等,仍需要一定时间的积累去追赶,也是目前制约核心系统替 换的重要因素之一。 3)由于国产数据库产品技术特点各不相同,国产替代路径多样,也导致客户选 型难度有所提升。不同于传统数据库选型中,Oracle、DB2 等两三款数据库可以 覆盖几乎所有的业务场景,产品通用性很高。国产数据库方面,截至目前,国内 数据库企业有约 300 家,绝大多数基于 PG、MySQL 等开源数据库二次开发, 各家产品特点各不相同,主要体现在:数据库的架构类别多样;尚无成熟的替代 技术路径,众多产品都可选择,竞争较为激烈;各产品能力差异较突出,都有各 自的适应性场景。因此,现阶段国产数据库从选型、适配、迁移、到后期的运维 等方面难度更高,也对国产化推进造成一定难度。

是挑战亦是机遇,数据库仍有广阔国产替代空间。关于数据库国产替代,市场或 有悲观观点认为国产数据库与海外数据库仍有较大差距,替代周期漫长;亦有观 点认为国产数据库替换至今已经实现“应替尽替”,剩余空间有限。不同于市场 观点,我们坚定看好国产数据库的前景。

一方面,国产数据库性能提升显著,成功案例逐步落地,国产替代走向加速 是必然趋势。我们认为尽管国产数据库存在业务系统、生态等方面的替换难 点,但从目前国内数据库性能来看,高并发、吞吐量等方面整体已经与海外 产品接近,如根据中国电子技术标准化研究院赛西实验室《全国产化系统性 能对比测试检测报告》,在国产 CPU 与 Intel CPU 仍存在一定性能差距的情 况下,达梦数据库共享存储集群通过聚合多台国产 CPU 服务器计算资源,在整体系统层面对所测试应用场景取得良好性能水平,并发业务处理性能与 Oracle RAC 集群为代表的国外产品基本处于同一水平;而根据达梦数据关 于首轮审核问询函的回复意见,达梦数据 TPCC 达 228 万 tpmc,整体技术 水平达到国内领先、国际先进。此外达梦数据成功攻坚数据库共享集群技术, 高端场景替 Oracle RAC 有望,亦有华为、阿里、腾讯、中兴等厂商做出以 分布式替代集群的试点尝试,随国产数据库越来越多成功案例落地,生态、 稳定性等问题得到验证,我们认为数据库国产替代走向加速是必然趋势。

另一方面,数据库国产替代主要与业务应用系统的去 IOE 同频,生命周期 更靠后,存量替换+增量增长下替代空间仍十分广阔。从存量替换来看,我 们认为数据库国产替换生命周期更靠后,主要跟随应用软件实现逐步替换而 非硬件,渗透增长仍处在相对前期的阶段,分党政、电力、金融等行业可以 看出,下沉市场、核心业务领域仍有较大替换空间。从增量增长来看,根据 大数据技术标准推进委员会,2022 年全球数据库市场规模为 833 亿美元, 我国数据库市场规模(包含数据库服务、安全等周边生态)为 59.7 亿美元 (约合 403.6 亿元人民币),占全球 7.2%。预计到 2027 年,我国数据库市 场总规模将达到 1286.8 亿元,市场年复合增长率(CAGR)为 26.1%。根 据 IDC 数据,2023 年我国关系型数据库软件市场规模为 38.0 亿美元,同比 增长 10.8%,预计到 2028 年,我国关系型数据库软件市场规模将达到 98 亿美元,2023-2028 的 5 年市场年复合增长率(CAGR)为 20.9%。截至 27 年同时考虑数据库市场持续增大,以及国产数据库渗透率进一步提升, 国产数据库厂商可以预期仍有较为广阔的市场空间。

2、达梦在信创数据库市场优势突出

根据赛迪顾问《核心系统升级选型参考 2023》,用户在未来数据库选型方面需着 重考虑的选型因素主要覆盖数据、功能和效果三个层面。

分选型因素看,产品安全可靠性、兼容性、稳定性、双写回迁能力、核心代 码自主性为最重要的五个因素。1)安全可靠性:对于政府、金融等关键行 业来说,数据是单位最关键的资产,需要确保无故障安全运行,代码的核心 自主性(包括是否开源的考量)也是安全可靠性的关键考虑因素;2)稳定 性:在一个运行周期内、一定的压力条件下,系统持续操作时间内出错的概 率,通过 MTBF、MTTR、MTTF 等指标来衡量;在给定时间内系统可以正 常工作的概率,通常用 SLA 指标来衡量;3)兼容与迁移:兼容性高的数据 库能帮助用户有效降低数据迁移复杂度、节省更多迁移成本。

分下游行业看,以下三个行业对选择数据的考虑因素及需求较为明显:1) 金融行业:安全可靠性;数据迁移(双写、回迁)能力;产品数据的一致性。 2)政府:安全可靠性;核心代码自主性;上级单位直接指定。3)互联网行 业:厂商的服务效率和能力;产品的计算分析能力;产品的兼容性。

达梦数据整体匹配度前列,代码安全性、数据一致性、兼容与迁移、稳定性与可 靠性等方面均取得高分。根据赛迪顾问《核心数据库升级选型参考(2023)》,报告选取了 Oracle、MySQL、DM8、OceanBase、KingbaseES、GaussDB、 PolarDB 等数据库产品进行匹配度分析,主要考量的指标与此前提及的核心数据 库选型因素内容相对应,具体包括数据一致性、数据安全性、代码安全性、兼容 与迁移能力、事务处理能力、大数据实时处理能力、稳定性与可靠性、性价比等, 厂商产品与选型因素匹配度的高低结果呈现如下。达梦数据整体匹配度评分前列, 在代码安全性、数据一致性、数据安全性、稳定性与可靠性等方面均评分较高。

(1)坚持自主闭源路线,把握完全决策权

坚持自主闭源路线,把握完全决策权。相对于起步难度、技术复杂度相对较低的 开源软件和技术外购路线,达梦数据坚持选择原始创新的自主研发技术路线。公 司自主编写数据库产品核心源代码,掌握达梦数据库软件的全部实现原理和体系 框架,由此把握了自身产品技术发展方向的完全决策权。 根据赛迪顾问《核心数据库升级选型参考(2023)》,开源和闭源各自的优劣势 体现在:

走自主研发路线的厂商在研发方面的投入相对更高,一般不会基于任何开源 架构进行二次包装,拥有完全自主知识产权,能确保对自家产品每一行代码 的高度控制,并能对越来越多的市场主流数据库实现顺滑迁移,但产品的性 能表现往往需要一定的时间周期进行选代和优化。

基于成熟代码二次开发的厂商一般是在国外成熟产品架构思路的基础上进 行深度优化或本土化适配,具体是对原有架构进行一定比例的代码修改。在 这种情况下,厂商对自家产品底层代码的控制程度较低,但产品对用户原有 部署的相关商业或开源软件兼容性和可迁移性相对来说会更好。

(2)勇摘数据库技术“明珠”,Oracle 兼容性表现突出

一方面,达梦数据共享集群(DMDSC)实现了国产数据库在共享存储集群方面 零的突破,对标 Oracle RAC。根据达梦数据招股意向书,共享存储集群属于关 系数据库领域的技术皇冠,长期以来仅有 Oracle 公司推出此类软件产品并占据 我国数据库高端应用市场,形成了技术壁垒。DMDSC 的推出打破了国外厂商的 强势垄断,填补了国内同类产品的空白,为关键行业的核心业务系统提供了高可 用、高性能解决方案。在功能方面,DMDSC 完整支持原有数据库的特性,功能 完善。中国电子学会组织鉴定委员会对 DMDSC 鉴定为:“实现了国产数据库在 共享存储集群方面零的突破”。 Oracle RAC 存储集群解决了传统集中式资源浪费的问题,并大幅提升系统的可 用性:两个节点在传统的双机热备环境中,始终有一台机器作为备用机,只有当 主节点出现问题的时候才会切换到备用机上;如果主机一直没有出现问题,那么 备用机始终处于空闲状态,这在资源的利用上以及成本方面都是巨大的浪费。 RAC 是一种并行模式的架构,两个节点的集群节点间是一种并行运行的关系, 当一台机器出现问题,请求会自动转发到另一台机器,没有任何一台机器作为备 用机一直不被使用,这样就充分利用了服务器资源。同时,传统的双机热备构架 在出现问题时,常常需要数分钟的切换时间,而 RAC 在出现问题时,针对存在 的会话只需要数十秒的时间就可以完成失败切换过程,对新会话的创建不会产生 影响,在切换时间上也有比较大的优势。同时,不同于分布式系统,RAC 共享 一个完整的数据存储,可以保证数据高度一致性。

Oracle RAC 的硬件体系结构主要由节点、私有网格、共享磁盘 3 个部分组成, 具有高速缓存合并、共享磁盘、透明应用切换三大核心功能。节点之间通过私有 网络连接来进行数据交换,并分别与共享磁盘存储进行连接。高速缓存合并 (Database Cache Fusion)消除了多台服务器争用数据时产生的碰撞现象,极大 地提高了 RAC 集群系统的可扩展性。同时 Oracle RAC 采用共享磁盘方式使得 数据库的数据库文件、联机重做日志和数据库的控制文件都能为集群中的每个节 点所访问。透明应用切换是RAC 并行高可用性的体现,当一个节点发生故障时, 连接在该节点上的终端用户会被自动重新连接到其它正常的数据库节点上,无需 手工连接,应用端的应用及查询仍会继续执行,用户的注册信息得到保留,后续 客户端的连接也会被指到正常节点。 达梦共享存储集群 DMDSC 主要由数据库和数据库实例、共享存储、本地存储、 通信网络、以及集群控制软件 DMCSS 组成,具有缓存交换、动态节点恢复、应 用透明故障切换等功能。共享存储实现多个实例同时访问、修改数据, DMDSC 支持使用裸设备或 DMASM 文件系统作为共享存储。本地存储用来保存配置文件、本地归档日志、远程归档日志。DMDSC 集群中,网络分为内部网络和公共网络 两个部分,内部网络用于数据库实例之间交换信息和数据,公共网络用于对外提 供数据库服务。集群控制软件 DMCSS 专门负责监控集群中各个节点的运行状态。

另一方面,达梦数据深度兼容各大主流数据库,用户需要修改的代码量少。达梦 数据库具有强兼容性,可以兼容国内外主流 CPU 和操作系统,兼容原生数据库 的通信协议和操作命令。同时,达梦数据库在设计上采用了与 Oracle 类似的 SQL 语言,具有相似的数据类型、函数、存储过程和触发器等,可以快速替换 Oracle 数据库,实现了与 Oracle、MySQL、SQL Server 等当前主流数据库的功能特性 兼容。 提供柔性迁移方案,给予用户充分的数据库替换风险评估与控制周期。达梦柔性 迁移部署方案分三个阶段。第一阶段,通过 DMHS 实现当前国外数据库作为主 库向备库达梦数据库的实时数据同步;平稳运行一段时间后,主、从系统角色互 换,进入第二阶段:由达梦数据库作为主库支撑业务系统运行,通过 DMHS 将 数据实时向其他数据库传输;最后阶段,原数据库系统下线,完全由达梦数据库 独立支撑整个业务系统。在迁移过程中,达梦提供在线数据对比产品,可以在不 停止在线生产系统情况下,进行达梦数据库与其他数据库的数据比对,确保两边 数据完全一致,让客户直观看到数据同步的有效性,打消用户相关顾虑。

DMHS 是柔性替代的关键产品。达梦异构数据同步系统 DMHS 提供的实时同步 技术可以同时支持国外主流系统和国产系统,并支持双向切换。 DMHS 采用基 于日志的结构化数据复制技术,不依赖主机上源数据库的触发器或者规则,对主 机源数据库系统几乎无影响,能以极少的系统开销实现秒级数据实时同步复制。 DMHS 基于成熟的关系数据模型和标准接口,支持多种软硬件平台,能够灵活的 配置出一对一、一对多、多对一、多对多以及级联等多种形式的复制拓扑结构。

(3)电力等行业具备垄断性优势,高端场景案例积累丰富

市场份额优势:2020 年至 2023 年,达梦数据库凭借多年的市场积累,市场销售 额保持了快速增长,在国内处于领先地位。根据 IDC,在传统部署关系型市场中, 达梦 23 年和 22 年市占率分别为 7.45%和 6.63% ,在国产数据库厂商中位列第 二,仅次于华为。而根据赛迪顾问《2022-2023 年中国平台软件市场研究年度报 告》,22 年达梦在我国数据库管理软件市场市占率为 2.4%,在国产数据库中市 场占有率排名第一。

案例积累优势:国外数据库产品应用场景丰富,尤其在高端场景的应用广度和深 度上仍有优势,基于庞大的客户基数与运行时间所积累的技术改进与运维经验是 其数据库软件产品性能得以不断迭代、改进的重要因素。因此,对于国产数据库 而言,高端场景的案例积累是产品性能得以迭代的重要因素,亦是客户在数据库 选型时的主要参考。 分行业看,达梦在电力领域优势显著,基本处于垄断地位;在党政、金融等领域 均具备较强的竞争优势。

三、“老牌”但不“传统”,大数据布局星辰大海

达梦数据以集中式关系型数据库见长,大数据、云计算、非关系型、分布式等新 兴技术方向不断涌现的背景下,市场或担忧达梦在大数据时代缺乏竞争力,而我 们认为:(1)集中式、关系型且以本地部署为主的数据库目前仍是、并且长期会 是信创数据库国产替代的主战场,并且对比分布式数据库发展更为成熟、产品化 程度更高、现金流及收益更优;(2)达梦作为国内老牌数据库厂商,尽管并不以 非关系型、分布式、云部署等数据库被人所熟知,但其始终坚持奋楫迎新,在技 术架构维度的分布式数据库、数据模型维度的图数据库和时序数据库等非关系型 数据库、数据库一体机、人工智能等方向均有持续性的研发投入与产品布局。

1、信创数据库仍以集中式关系型为主战场

对于信创市场而言,集中式、关系型且以本地部署为主的数据库目前仍是、并且 长期会是信创数据库国产替代的主战场:

关系型 VS 非关系型:根据达梦数据《关于第二轮审核问询函的回复意见》, IDC 发布的《中国关系型数据库市场概览,2022H2》显示,2022 年我国关 系型数据库市场容量约 34.3 亿美元,非关系数据库市场容量约 4.07 亿美元, 分别占比 89%/11%。根据达梦数据招股意向书,21 世纪初期以来,尽管随 着大数据技术发展,键值、文档、宽列、时序等非关系型数据库在大数据、 互联网领域取得了较大范围的应用。但另一方面,人类社会经济活动所依赖 的重要数据信息,如交易数据、储蓄数据、出行数据、生产数据等,其表现 形式和访问方法天然具有模式明确、关联清晰的特征,符合关系型数据库的 特点,并已经形成了基于关系型数据库的庞大信息技术生态,这也是关系数据库长期并将在可预期的未来继续保持主流数据库地位的原因。

集中式 VS 分布式:根据达梦数据《关于第二轮审核问询函的回复意见》援 引赛迪顾问数据,2020 年,我国分布式数据库市场保持高速增长,市场规 模达到 28.5 亿元;我国集中式数据库市场规模约为 146.8 亿元。《金融业数 据库供应链安全发展报告(2022)》调研数据显示,集中式数据库在金融业 总体占比仍高达 89%,其中银行 80%,证券和保险业占比均超过 90%;《数 据库发展研究报告(2023 年)》指出,出于对数据安全等因素考虑,当前我 国电信行业几乎全部采用私有云或自有机房部署的方式。在数据库部署类型 方面,集中式数据库仍占据主导地位。

云部署 VS 本地部署:根据达梦数据《关于第二轮审核问询函的回复意见》, 据中国通信标准化协会大数据技术标准推进委员会测算,2022 年中国公有 云数据库市场规模为 219.15 亿元,较 2021 年增速 51.6%,本地部署数据 库市场规模为 184.45 亿元,较 2021 年增速 14.4%,公有云和本地部署模 式市场规模分别占总市场 54.3%和 45.7%,预计 2023 年公有云市场占比将 进一步扩大达到 59.8%,规模达到 323.16 亿元,本地部署模式市场增速达 到 17.8%,规模为 217.24 亿元。赛迪顾问发布的《“十四五”关键应用领域 之数据库市场研究报告》指出,2021 年,中国数据库市场产品部署方式以 公有云部署为主,达到 52.3%;但在金融、政府、运营商等关键应用领域中, 本地部署(含私有云)的优势较为明显,成为客户的首选;2021 年中国关 键应用领域数据库市场部署中(按装机量计算),本地部署(含私有云)占 比为 68.5%,公有云部署占比为 31.5%。尽管目前公有云部署数据库市场 增速较快,但重点领域客户出于可靠性、安全性等因素对本地部署模式仍有 较高青睐。

分布式与集中式的替代关系是市场关注度较高的问题,我们首先探讨为何部分核 心业务系统信创试点选择了分布式数据库? 一是与分布式架构自身的技术优势有关。根据赛迪顾问《核心数据库升级选型参 考(2023)》,对于传统集中式数据库在应用过程中存在的可扩展性差、海量数据 处理能力不足、中间件负担过重等问题,分布式数据库均能相应地给出更好的解 决方案,如高扩展性、高并发性、局部自治等,与大多数实际应用场景更匹配, 目前已经成为越来越多的单位愿意尝试的方向。而根据 OceanBase CEO 杨冰访 谈,传统集中式数据库依赖单机的处理能力,因而存在架构上的单点,随着摩尔定律的失效,依靠垂直扩展的集中式走到了尽头。而金融业务的发展要求数据库 具备海量数据下的高并发的事务处理能力,部分金融架构在转型中尝试中间件架 构的分布式,在国外开源数据库上做二次开发,并取得一定效果,但随着深入应 用依然出现瓶颈。为彻底解决海量数据、高并发场景的数据库的问题,原生分布 式数据库架构诞生。

二是国内独特场景(指互联网、金融场景数据处理需求十分复杂)倒逼分布式数 据库技术突破、创新和成熟。根据 OceanBase CEO 杨冰访谈,得益于中国独特 的场景,带来前所未有的对海量数据、高并发的数据处理需求,以及这些年大量 企业尤其是金融核心系统,带来复杂业务场景下的数据处理需求,倒逼分布式数 据库技术的再次突破、创新和成熟。以 OceanBase 的发展为例,根据金融时代 引用 OceanBase CEO 杨冰所撰写文章,作为一款国产自研数据库,OceanBase 的诞生是完全由业务驱动的结果。支付宝比很多公司更早遇到数据库的瓶颈。 2009 年是电商双 11 元年,随着成交额的指数级增长,支撑用户抢购的交易系统 也面临严峻挑战,原本的集中式数据库性能见顶。不仅需要应对流量峰值、保障 系统平稳运行,更要在降本增效的同时,更好地服务业务发展,就是在这样的背 景下,自研一款能灵活应对流量变化、性能可靠的国产数据库迫在眉睫。从 2010 年投入研发,OceanBase 从 0 开始写代码,从承担“双 11”10%的流量起步, 逐步支撑支付宝核心账务、核心支付系统,直至替换蚂蚁集团核心系统最后一个 Oracle 数据库。

针对市场担忧较多的分布式是否一定会完全取代集中式,我们认为答案是否定的, 一是分布式目前发展仍存在较多痛点;二是并非所有场景都适用分布式。 分布式自身架构存在数据节点不同步等痛点。分布式数据库受限于 CAP 理论, 需要在一致性与可用性之间权衡,其最大的挑战便是解决各个节点状态的同步问 题。根据分布式系统的“CAP 理论”,不存在一个分布式系统,既能保证数据一致 性(C),也能保证可用性(A),还能保证分区容错性(P)。在分布式系统中,由于网络可 能会出现延迟、丢包甚至中断等问题,导致分区容错性是必须要实现的,但是不同 的应用系统对一致性、可用性和性能的要求各不相同,因此企业需要在一致性和 可用性之间进行权衡。例如,很多互联网应用对一致性要求相对较低,但希望可 用性较高;而金融核心应用常常需要优先保证较高的一致性又要保证高可用性, 因此分布式数据库的开发难度要远高于集中式数据库。

当前分布式数据库产品在功能完备度方面距离通用数据库有较大差距,在标准化程度方面也有一定差距,可能存在替代周期长、改造量大、复用性较差等问题。 中国软件评测中心发布的《分布式数据库发展路径研究报告》指出:“在集中式 数据库中应用比较成熟的存储过程、触发器、视图、DBLink、外键约束等功能要 迁移到全局层面实现,实现难度较大。即使部分分布式数据库已经实现上述功能, 也可能是受限使用,并且执行效率低于集中式数据库”。该报告还指出:“相比于 集中式数据库,分布式数据库还处于发展的初期,自身的技术体系、标准规范尚 不健全,分布式数据库的优化器、数据类型、复杂查询、自定义函数、存储过程 等高级特性参差不齐,有待进一步提升”。根据金融电子报对中国邮政储蓄银行 首席信息官兼金融科技创新部总经理牛新庄的采访,邮储银行基于分布式高斯数 据库的新一代个人业务核心系统历经三年上线,自 2021 年 4 月开始,共计优化 数据库 117 个重点功能,提出关键功能需求 79 个;而根据 OceanBase CEO 杨 冰访谈,核心系统(含数据库)的整体升级大概需要持续需 2~3 年,时间窗口有 限,核心系统数据库的升级已经到了必须提上日程的时期。

集中式有其自身适用的、难以被取代特定场景。根据南大通用 GBase 8s 产品线 总经理崔志伟访谈内容,分布式数据库会并不会最终完全替代集中式数据库,原 因在于:(1)分布式数据库和集中式数据库的产生都是有特定的业务场景,既存 在互联网的海量数据场景,也存在中小银行的小业务场景,这些业务场景看不到 有消失或合并的趋势;(2)分布式数据库的出现还有一个机缘是国产硬件的性能 不足,用分布式数据库分工协作来解决问题。然而,国产的硬件设备也是在飞速 进步的,可以逐步解决性能不足的问题;(3)集中式数据库在特定的业务场景中, 仍然存在灵活、快速、简捷、强一致性等优势,分布式数据库遇到跨节点 join 的 时候依然吃力。

2、云与大数据完善布局,数据库一体机有望迅速放量

技术架构维度:分布式数据库亦有布局。根据达梦数据副总经理冯源访谈内容, 分布式方面,公司希望直接打造成 HTAP 型的分布式数据库,适用于大规模的数 据分析系统,同时会以事务处理系统进行产品打磨。根据达梦数据官方公众号, 达梦分布式数据库 DMDPC 具备迁移轻松、使用简单、自主研发、多副本等优势, 已经成功应用于福建移动 O 域系统等应用场景。 数据模型维度:顺应“大数据”主题发展,重视非关系型数据库研发。公司紧握 “大数据”发展脉搏,围绕达梦数据库管理系统软件,进一步研发扩充图数据库、 缓存数据库、时序数据库、多模数据库、文档数据库、云原生大数据平台等云计 算与大数据软件产品线,致力于成为以坚持自主研发为原则的全栈数据产品与解 决方案提供商。

数据库一体机:面向网信产业深水区的重磅产品。根据达梦在线服务平台官方号, 随着我国网信工作的深入开展,叠加各级政府、企业的数字化转型需求,传统的 IT 技术架构逐步地向云化、国产化演变。在整个产业生态升级的过程中,以达梦 数据为代表的一众国产基础软硬件厂商迎来了前所未有的机遇,也同时面临着来 自需求侧对高可用、高性能、高稳定性、弹性扩展等方面的挑战。纵向层面挑战 在基础零部件的核心竞争力,横向层面挑战在产品集成后的整体合力。达梦数据 库一体机 DAMENG PAI 正是在这样的背景下应运而生,它通过技术预研前置化, 集成标准化,调优精细化,集成数据库运行所需要的全部 IT 基础设备,向用户 交付开箱即用的整体解决方案。根据达梦数据副总经理邓亮,数据库一体机瞄准 的是国外一体机的存量市场和大型核心业务应用改造的增量市场,这两个市场大 部分都采用的私有化部署方案,面向的是企业重量级应用,所以达梦推出数据库 一体机,是对数据库产品家族的进一步完善,同时也是吹响向信创深入区进发的 号角。 一体机放量潜力大。公司数据库一体机销售业务尚处于起步阶段,2023 年实现 销售收入 466.86 万元,占当期主营业务收入总额的 0.59%,该业务销售收入有 望在未来实现逐步提升。达梦数据库一体机基于达梦数据库和高性能鲲鹏处理器, 打造了业内领先、软硬融合的整体解决方案,作为达梦面向网信产业深水区的重 磅产品,已在金融、财政、烟草等多个行业实现多个重大项目的落地应用。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告