产业解析,纵观分布式存储产业进展 。
分布式存储市场呈现稳健增长,软硬一体比重持续上升。2022 年,经过中国信息通信研究院与分布式存储产业方阵的深入分析, 中国的分布式存储市场规模预计为 205 亿元,年复合增长率达到 15%, 随着经济回暖,市场增速未来将持续保持增长。其中,软硬一体的 存储解决方案占据了市场的 91.3%,厂商如华为、新华三及曙光等纷 纷推出相应的新产品,旨在满足 AI 大型模型和大数据湖等场景下的 非结构化数据需求。
中东部数字经济发达,分布式存储发展强劲。从 2022 年各省新 增分布式存储容量规模可以看出,我国分布式存储的发展与各区域 数字经济发展呈正相关。区域集中度较高,北京、广东、上海、山 东、江苏、浙江六省市作为数据生产大省,容量规模新增 5.6EB,占全国新增一半以上。其中,北上广新增达 3.9EB,约占全国新增容量 规模的 38%。东部、中部地区城市分布式存储发展势头强劲。
随着各行业数字化转型的持续推进,应用规模持续增长。根据 2021 年和 2022 年的数据对分布式存储在各行业的市场空间进行的观 察,中国分布式存储市场的前五大应用行业为政府、电信、金融、 教育和制造。2022 年,这五大行业在市场中的份额已占据了 69%, 特别是在电信、金融、教育、传媒和交通等数字化进展较快的行业, 其增长态势尤为显著。

新兴场景应用已渐成规模,分布式存储典型应用场景规模逐步 均衡。根据中国信息通信研究院和分布式存储产业方阵的市场调研 及分析,分布式存储应用场景发展迅速,已经由过去典型的五个传 统场景向更多的新兴应用场景发展。虚拟化/云计算、电子票据影像、 医疗影像、非线性编辑、视频监控五个传统应用场景正随着分布式 存储技术创新应用稳步增长。同时随着非结构化高价值数据快速增 长,非结构化数据分析、数据挖掘成为生产决策流程,AI 大模型、 高性能计算、大数据分析、海量数据备份归档、工业互联网等新兴 场景应用已经逐渐成规模,并快速扩大应用。
2022 年 2 月,分布式存储产业方阵联合产、学、研、用各界共 同发起编制国内首个分布式存储产业生态图景,2022 年 6 月,产业 生态图景(V1.0)完成编制工作。2023 年 10 月产业生态图景 (V2.0)刷新,生态图景共有五个维度,自下而上分别是:关键部 件、产品形态、服务类型、应用场景、应用行业,旨在为分布式存 储产业链企业及最终用户提供清晰的分布式存储生态图景,梳理产 业发展脉络,呈现不同领域的典型企业,展现分布式存储生态格 局。
从分布式存储全产业链发展的角度来看,无论是位于上游的 IT 基础设施提供商、存储关键部件提供商,还是面向客户和行业的解 决方案提供商、系统集成商,在以分布式存储为核心的生态圈中均 呈现规模增长。与此同时,不同企业在提供产品或服务时,基于各 家战略定位、商业决策以及运营模式的差异化,最终面向市场和用 户的产品形态及服务类型呈现多元化态势。此外,分布式存储的细 分赛道发展及不同行业的实际落地情况是分布式存储产业生态成熟 的标志,不同领域生态伙伴的密切合作将成为连接产业供需双方的 重要纽带。
分布式全闪存储 分布式全闪存储,作为分布式存储的一种新形态,完全采用闪 存技术,固态硬盘(SSD)作为主要存储介质。得益于闪存性能、 高速无损 RDMA 网络、压缩软件栈等全闪存化设计,能够提供稳定 的亚毫秒级访问性能。在过去一年间,业界多个厂商发布了自己的 分布式全闪存储新产品,并且已经在不同行业用户中落地应用。可 以看到,随着闪存价格的下降,分布式存储正在向匹配的应用场景 快速发展,作为一种新形态,分布式全闪存储已经开始进入加速发 展的快车道。
分布式融合存储 分布式存储具备块、文件、对象、大数据多种服务能力。为满 足海量数据数据共享、存算分离的需求,面向海量的非结构化数 据,分布式存储已经发展出分布式融合存储新形态,通过一套分布 式存储系统支持多种协议同时提供服务,并实现协议互通。 新时代的业务场景是复杂的、多流程的、多种类型的存储操 作,一种业务不再是简单的文件操作,变成了文件、大数据、对象 存储的多个程序混合操作。而这些业务要求的数据往往会依赖于上 个业务程序的处理结果,数据生产阶段使用文件协议把数据放入存 储,数据生产业务把数据放入大带宽、高性能的文件存储后,需要进行大数据分析工作,大数据分析工作需要使用到 Hadoop 集群,数 据需要从文件存储拷贝到 Hadoop 集群后使用,这需要耗费大量时 间。拷贝数据时间和数据量强相关,数据量越大对于用户业务影响 越大。数据处理完后需要通过对象存储进行发布,需要从 Hadoop 集 群把结果数据拷贝到对象存储,对于结果的实时发布造成影响。 这个过程需要经历多个集群,多次拷贝,每一次拷贝都意味着 业务速度的变慢,用户很难实时得到最终结果。特别是在能源勘探 领域、地震资料处理领域、AIGC 领域、自动驾驶领域,都需要多 协议、批处理的执行业务。 一套分布式系统同时提供文件、对象、大数据访问能力,系统 规模可以从 PB 级走向 EB 级,允许多云多业务共享存储系统的硬件 资源,提升资源利用率。通过多协议融合互通能力,一份数据无须 协议转换就能够被多种协议同时访问,解决业务流程中多环节多应 用访问相同数据的需求,减少数据搬迁和重复存储,提升 35%的数 据处理效率,降低约 20%能耗。