想了解更多相关内容,可以下载报告《非结构化数据管理知识与实践(2023版)》查看,以下内容都是根据该报告总结的,仅供参考。
数据管理的起始可以追溯到 20 世纪60 年代的数据库技术,当时计算机已经开始在商业环境下获得应用,文件是数据存储的主要介质。文件的存储和访问成为数据管理的核心需求,这也可以看作非结构化数据管理的最初阶段。
20 世纪 90 年代初期,随着无纸化办公技术的发展,传统纸质文档逐步转换为电子化文档,这个时期企业开始构建电子文档库、数字图书馆、数字档案馆,非结构化数据管理体现为对这些数字化文档的管理。
2000 年以后,随着互联网技术的发展,非结构化数据率先体现在以 WEB 网页为主的内容管理上,随着网站技术的发展,出现了网页内容管理(Web Content Management),这个时期电子商务、电子政务系统也随之快速发展。
2005 年以后,随着企业信息化的不断深入,非结构化数据融入到业务场景中,企业业务流程系统承载了大量文档、图表、报告、音频等形式的非结构化数据。对这类数据的管理需求促进了ECM企业内容管理(Enterprise Content Management)的出现,随着ECM的出现,非结构化数据开始与业务场景深度融合,发挥出了更大的价值。
2010 年以后,随着云计算,物联网、移动互联网和大数据的不断发展,非结构化数据呈现形式更为多样,如:影像文件、视频文件、工程电子文档、ISO 质量电子文档等,这个阶段ECM企业内容管理和非结构化数据应用的发展也越来越趋于规模化。2015 年以后,随着人工智能技术的成熟与普遍化,非结构化数据开始向着内容服务自动化、文本挖掘、语义分析等方向发展,并形成了非结构化数据管理体系下的内容服务中台化和内容服务智能化。
从上述非结构化数据发展历程可以收获以下几点:一、非结构化数据是随着计算机应用的发展不断丰富起来的,因此任何时代,技术发展都是动力。二、非结构化数据管理的发展历程是非结构化数据逐步从离散文件升级至内容,形成统一的内容服务平台,并进一步构建起融合业务的知识体系,其本质上大大提高了生产运营效率和业务创新能力;三、多层次的非结构化数据平台提供了更为上层的内容服务,屏蔽了下层的技术实现细节,能够更快速准确地响应业务场景化需求。
因此,随着数字数据管理的成熟,一股专注于非结构化数据管理的浪潮也在悄然崛起,以非结构化数据为研究与发展的重心,掀开了非结构化数据管理的篇章。
国际上,1990 年,Documentum 公司成立,成为了第一家利用标准关系型数据库技术以及面向对象方法提供企业级文档管理解决方案的公司;
2000 年左右,以电子商务和电子政务为代表的门户网站的发展带来了网页内容的指数级增长,促进了网页内容管理的成熟与发展; 2002 年,Documentum 公司正式发布ECM(企业内容管理)产品; 2006 年,微软发布 Sharepoint Portal Server;2010 年,OpenText 发布; 2010 年后,云计算、移动互联网、大数据的新技术改变了ECM的形式与内容,ECM 的内涵与外延不断更新。
放眼国内,从 2002 年起,航空、核电和工程领域的国际ECM一线厂商开始进入我国,在这些行业内,率先掀起了ECM的潮流:2008 年,上海鸿翼软件技术股份有限公司发布国内首款完整ECM 产品“鸿翼 edoc2 ECM”; 2009 年,拓尔思信息技术股份有限公司针对政府和金融领域推出 WCM 产品; 2010 年,信达雅系统工程股份有限公司在金融领域推出ECM影像管理产品;
2016 年之后,以联想企业网盘、石墨文档等为代表的应用层的网盘和功能更全面的 ECM 出现,ECM 系统中的文档协同和服务能力不断提升; 2017 年开始,人工智能(AI)逐渐开始与ECM系统进行融合,企业开始利用人工智能手段,赋能非结构化数据管理;2020 年开始,中国 ECM 行业产品平台化趋势显现,以鸿翼为代表的 ECM 平台开始成熟,基于平台的应用开始在各行业爆发式增长,是为“中国 ECM 元年”。