从需求的角度可将数据库分成以下两种——关系型数据库和非关系型数据 库、OLTP 数据库和 OLAP 数据库。
关系型数据库是一种典型的数据库类型,采用关系模型,常用行和列等二维的形式来 存储结构化数据,一系列的行和列被称为表,一组表组成了一个数据库。表的每一行称为 一个元祖(Tuple),代表了一组值之间的联系;每一列称为一个属性(Attribute)或字段 (Field),是对实体的具体描述,每一列的数据类型相同。关系模型凭借原子性、一致性、 隔离性和持久性的 ACID 特性,取代层次、网状模型成为当代主流数据模型。 非关系型数据库是用非关系模型,存储非结构化的如图像、音视频等类型数据的数据 库,分为列存数据库、键值数据库、文档数据库、图数据库等多种类别。随着 web2.0 的 兴起海量半结构化、非结构化数据出现,非关系型数据库应运而生。

OLTP(On-Line Transaction Processing,操作型数据库,又称联机事务处理)主 要关注一段时间内的实时数据,基本特征是接收的用户数据可以立即传送到计算中心进行 处理,并在很短的时间内给出处理结果,是对用户操作快速响应的方式之一。OLTP 主要 使用关系模型,用户多为一线业务人员,支持高并发、实时快速增删查改,典型应用场景 包括金融交易、互联网电商等。 OLAP(On-Line Analysis Processing,分析型数据库,又称联机分析处理)主要 是分析长期数据的规律走势,多应用于决策。OLAP 使用的数据对象不限于关系模型,用 户多为分析师或管理层,支持对于历史数据的分析操作,典型应用场景包括风险预警、商 业分析、辅助决策等。伴随企业信息系统大量业务数据的产生,从不同类型的数据中提取出对企业决策分析有用的信息这一需求日渐显现。
国外数据库厂商相对于国内厂商早起步 20-30 年。国内厂商中,如今占据 国内市场份额较多的达梦数据成立于 2000 年,南大通用成立于 2004 年,而国外的 IT 巨 头早在上个世纪便已经在这一领域进行研究发展,以 Oracle、IBM、微软为代表的海外 IT 巨头的相关产品于 20 世纪 80 年代末开始进入中国。先发优势带来的技术领先和客户粘性 是如今国外厂商仍然占据国内数据库市场主要份额的重要原因。
20 世纪 60-70 年代,关系模型快速发展,关系型数据库可解决数据存储的易用性、 抽象性、独立性等问题,拉开了关系型数据库软件革命的序幕。1970 年,IBM 公司的研 究员埃德加·科德在 Communications of ACM 上发表论文《A Relational Model of Data for Large Shared Data Banks》,在层次模型和网状模型的数据库产品在市场上占主要位置的时代,拉开了关系型数据库软件革命的序幕。 IBM 在 1973 年启动了 System R 项目来研究关系型数据库的实际可行性,各方关系 型模型支持者吸取该项目经验,进行关系型数据库研发。

1977 年,Oracle 创始人 Larry Ellison 与 Bob Miner 和 Ed Oates 在硅谷共同创办了一家名为软件开发实验室的计算机公 司(Oracle 前身),开始进行关系型数据库的研发,同时期 Berkeley 大学也在进行关系数 据库系统 Ingres 的开发。IBM 虽然 1973 年就启动了 System R 项目来研究关系型数据库 的实际可行性,但是并没有及时推出这样的产品,因为当时 IBM 的的 IMS(著名的层次型 数据库)市场较好,公司当时认为,如果推出关系型数据库,会是对另一款产品的颠覆。
80-90 年代,大量数据库公司吸取关系模型经验,逐步推出自己的产品。1983 年,IBM 发布商业版数据库 DB2。1984 年,Sybase 公司成立,创始人之一 Bob Epstein 是 Ingres 大学版(与 System R 同时期的关系数据库模型产品)的主要设计人员。1988 年,微软推 出 SQL Server,主要适配自身 Windows 生态,这个时期,Oracle 因为客户需求已经使用 C 语言开发出适用于多个系统版本的数据库产品。90 年代,MySQL、PostgreSQL 等开源 版本数据库陆续发布。