数据库概念、分类、架构标准、产业链及发展对策建议有哪些?

最佳答案 匿名用户编辑于2024/11/25 10:03

数据库作为信息系统的核心,在计算机中扮演着承上启下 的作用,向下实现调动计算、网络、存储等基础资源,向上完 成支撑各种应用软件需求,是计算功能得以实现的基础设施底 座。

1.数据库相关概念

数据(Data):数据库中存储的基本对象,是描述实物的 符号记录。描述实物的符号可以是数字,也可以是文字、图形、 图像、声音、语言等,数据有多重表现形式,它们都可以经过 数字化后存入计算机。 数据库(DB):长期存储在计算机内的、有组织的、可 共享的、统一管理的大量数据的集合。数据库中的数据按一定 的数据模型组织、描述、存储,其特点是冗余度小,具有较高 的数据独立性、共享性和易扩展性。

数据库管理系统(DBMS):一种用于管理、维护和操纵 数据库的大型软件系统。它通过提供统一的管理和控制,保证 数据库的安全性和完整性,满足多个应用程序和用户在同一时 刻或不同时刻建立、修改和查询数据库。DBMS 主要由管理模 块、控制模块和各种数据库操作语言组成。

2.数据库分类

历经 70 年的不断发展,数据库已经衍生出多种技术路径 和方向。为了更清楚地掌握数据库之间的特性差异,数据库产 品可根据不同标准进行分类,常见的分类依据包括数据模型、 架构模型、业务负载特征、部署方式、适配硬件架构等,其中 数据结构类型是最常用的分类标准。 • 根据数据模型分类:关系型数据库、非关系型数据库。 • 根据架构模型分类:集中式数据库、分布式数据库。 • 根据业务负载特性分类:事务型数据库(OLTP)、分析 型数据库(OLAP)、混合型数据库(HTAP)。 现阶段,最常见的数据库模型是关系型数据库和非关系型 数据库,国内超过 90% 的数据库市场选择使用关系型数据库, 故本文将以数据结构为重点对数据库进行研究。

关系型数据库(RDB):一种采用关系模型来组织数据的 数据库,而关系模型是由二维表及其联系组成的数据组织。在 关系型数据库中,对数据的操作几乎全部建立在一个或多个关 系表格上,通过对这些关联表的表格进行分类、合并、连接或 选取等运算来实现数据的管理。

非关系型数据库(NOSQL):一种数据结构化存储方法的 集合,可以是文档或者键值对等。作为关系型数据库的一个补 充,能在特定场景和特点问题下发挥高效率和高性能。非关系 型数据库可以分为 key-value 型(针对高性能并发读写场景)、 文档型(针对海量数据访问场景)、列式数据库、图形数据库 四种类型。

3.数据库架构标准

产业数字化加速产生了诸如图、流、时序和地图空间等多 种数据类型的海量数据,计算机体系架构正从以 CPU 为中心 的架构向多样性算力协同的对等架构演进。在多模数据和多样 性算力双轮驱动下,数据库架构需要与时俱进,有效利用多样性算力,进行资源的集约化管理和调度,实现多模数据的高效 处理和数据价值挖掘。 数据库组件化架构标准以 SQL 标准作为应用接入的标准 界面,并进一步往下延伸,分层定义分发、执行、存储引擎的 交互接口,实现数据库架构的可组装可演进,打造面向未来的 数据库组件化技术生态。

SQL 标准定义了全 场景 SQL 标准;分发引擎实现 SQL 语句到执行计划的生成; 执行引擎实现高效数据处理;存储引擎实现对多模数据的管理; 存储层实现数据的透明化企业级存储能力;数据全生命周期管理平台实现智能运维、集群管理等公共能力。 组件化架构标准在每一层都提供了扩展协同接口,以支持 多样性的 SQL 接口、多模优化器、多模执行器、多模存储引擎。 同时在部署形态上,每一层既可以单机部署,也可以集群部署, 从而实现每一层基于业务负载的资源弹性伸缩。

4.数据库产业链

数据库与芯片、操作系统并列为全球技术三大件,也是企 业 IT 系统必不可少的核心技术。数据库上下游产 业链图谱中可以看到,产业链上游主要是以 CPU 厂商、服务器 厂商、网络设备厂商、存储厂商组成的网络和硬件厂商;中游 主要是以数据库、操作系统和中间件等组成的基础软件厂商; 下游主要是以各行业的集成商、开发商组成的应用开发厂商。 从产业链发展视角来看,数据库处在产业链中游枢纽位置, 向上承接各类硬件、网络服务资源,向下提供数据存储、管理 与分析服务,因此,数据库的地位和作用突显重要。

5.发展对策建议

在数字化快速发展的时代,发展国产数据库离不开政府部 门的统筹支持,同时也需要数据库厂商在技术、市场、生态等 方面联合起来协同推进发展。 (一)引导数据库技术路线收敛提升竞争能力 在当前复杂的国际形势和环境下,为进一步加快国产数据 库快速突围,改变当前国产数据库厂商“小、散、乱”的局面, 凝聚国内数据库行业力量的关键是“技术收敛”。对数据库技 术路线的支持应当坚持主流少数的原则。要立根铸魂,重点支 持 2-3 个技术路线,遴选较为成熟、创新能力较强、市场占有 率较高的国产数据库产品,从上游根社区开始做技术收敛统一, 减少碎片化和低水平重复开发,共同发挥国内各数据库厂商的 技术创新能力,将创新成果持续汇聚在国内数据库原生根社区, 为我国数据库产业发展增添新动能。

(二)强化存算分离 + 共享存储标准体系建设 新的存算分离数据库架构已成为趋势,在此基础上,政府 和行业机构需要统一制定新的标准规范,包括存算分离 + 共享 存储架构中数据库与存储的接口标准,建立业界认可统一的技 术规范,统一数据库厂商、计算及存储厂商的调用框架,更好 地指引数据库产业链发展方向,形成产业合力。 (三)出台专项政策支持首台套和规模化应用 数据库行业不能完全依靠市场的无序竞争,更需要政府出台指导性、专项政策。国家和地方各级政府要主动牵头,制定 系统完善的落地规划和免责机制,指导各行业和企业逐步使用 国产数据库,促进行业用户“愿用、敢用、用好”,通过 3-5 年逐步完成国产化迁移替代。同时要建立良好的服务机制,推 广国产数据库在金融、能源等重点行业的规模化应用,然后逐 步将国产数据库拓展应用到更多的领域和场景中,获取更多的 市场份额。

(四)强化数据库技术创新集聚全产业链资源 技术创新是源动力,国产数据库要坚持长期稳定的研发投 入,不断进行技术升级,深耕数据库根技术原始创新,将自主 安全可控作为重要目标,真正打造具有自主知识产权、安全可 控的数据库内核根技术和开发工具,具备可独立演进能力,推 出适应时代潮流、更加安全高效、性能稳定的国产数据库品牌。 同时要汇聚上下游产业链资源,在国内快速建立起更加专业的 技术支撑体系,打造更加完善的数据库服务工具和解决方案, 帮助客户更好地使用国产数据库产品。

(五)集中支持开源社区加大产业链生态建设 全力扶持国产开源数据库发展,提供能够促使其快速成长 的沃土。一是支持以 openGauss 为代表的开源社区发展,使之 成为具有国际影响力的数据库根社区;二是建立健全开源社区 运营模式,激励开发者加入社区,鼓励数据库厂商积极参与开 源社区共建,贡献开源力量,凝聚产业力量,构筑面向全球的 产业竞争力;三是加大与行业领袖的合作,构建完善的国产数据库应用生态;四是充分发挥行业协会的桥梁纽带作用,促进 政府、企业与市场的有效衔接;五是鼓励国产数据库企业开拓 海外市场,在成熟的欧美市场打造标杆客户,到东南亚国家布 局覆盖新兴市场,扩大国产数据库在全球的市场份额和影响力。