随着AI大模型训练进入“万卡集群”时代,传统基于电交换的网络架构正面临网络功耗高、带宽要求高的瓶颈。 网络功耗高:在万卡级GPU集群中,传统电交换网络的功耗可能占整个集群的30%以上。带宽瓶颈明显:随着 NVIDIA Blackwell 等新一代GPU支持1.8Tb/s的互联速率,传统电交换机面临物理极限。多级网络架构需要庞大的交换 设备数量,带来复杂的布线、高昂的成本和难以维护的系统。 OCS(Optical Circuit Switches)即光路交换机,一种在光域直接对光信号进行交换和路径重构的网络设备。其核 心在于建立端到端的纯光物理通道,全程无需光-电-光(O-E-O)转换。“全光交换”机制使其对信号速率、协议和 调制格式完全透明,能无缝承载400G至1.6T及以上速率的业务,从根本上保证了网络的极致带宽和前瞻兼容性。 OCS应用前景广泛。①超大规模AI训练是首要驱动力:其为微软、Meta等构建的下一代AI集群提供了关键支撑。 ②动态任务调度凸显其独特优势:能够按需(如All-to-All、Ring)重构网络,极大优化GPU利用率。③异构计算互联 则定义未来架构:为实现CPU、GPU、存储资源的池化与灵活调度提供了理想互联方案。
OCS 光交换机技术方案——MEMS方案
技术原理:MEMS(微机电系统)方案通过微机电系统的 镜片反射方式实现光路切换。其核心组件是一个大规模的 MEMS阵列芯片,包含多个镀金高反射率的镜片,通过转轴和 电压控制实现二维方向的灵活角度调整,从而完成光信号的切 换。每个MEMS小镜子均配备独立控制系统,包括四个电压焊 盘,用于分别调节两个转轴(X轴和Y轴)的运动。通过调整两 个MEMS反射镜的小角度变化,可以将输入路径引导至任意目 标输出位置。 MEMS方案是目前市场的主流,占比超过70%,尤其在谷 歌等企业中被广泛采用。谷歌自2022年起在其传统数据中心中 导入该技术,并于2023年应用于TPU V4,计划在2025年的TPU V5P中进一步推广。性能指标均衡,端口扩展能力可达320×320; 成本较低且切换速度较快;市场玩家较多,技术相对成熟。 MEMS芯片存在加工良率低的问题,制造难点主要集中在 其机械部分。例如,谷歌的一款MEMS芯片设计中包含176个小 镜子,其中40个因加工不良被屏蔽,实际有效端口数为128个。 随着芯片尺寸增加,加工良率会显著下降,同时制造工艺也面 临更多挑战。目前MEMS芯片单价约为1,500美元,每套系统需 使用两个,总计3,000美元。完整的OCS交换机售价约为五至六 万美元。
OCS 光交换机技术方案——硅基液晶方案
硅基液晶(DRC)方案采用全固态设计,无运动部件,通过对芯片施加电压以控制折射率变化,从而改变光路。 通过控制液晶分子结构变化实现光路折射,进而进行光交换。 技术优势明显:驱动电压很低,显著提高了可靠性和寿命;据称寿命可达到MEMS方案的十倍;成本略低于 MEMS,目前约为4万美元。 DRC在切换速度方面表现不佳,目前仍处于毫秒级别,从几十毫秒可能延长至几百毫秒。这种局限性使其在对切 换速率要求不高的应用场景中更具优势,但在需要高速切换的数据密集型场景中则存在天然劣势。 硅基液晶方案目前主要应用于AI数据中心内服务器与交换机之间连接等对切换时间要求相对不高的场景,在冗余 备份或系统维护等场景中更具优势。
OCS 光交换机技术方案——压电陶瓷方案
压电陶瓷方案:直接光束偏转(DLBS)光交换。它利 用压电陶瓷在电压控制下能够沿某一轴向发生尺寸变化的特 性,来驱动光束射向不同方向,从而实现光路的交换。具体 实现方式是将光纤准直器直接固定在压电陶瓷驱动器上,每 个准直器尾部与压电陶瓷连接,排列成二维阵列。将两个这 样的阵列面对面放置,就构成了一个光开关矩阵。最后利用 压电陶瓷的机电耦合效应,驱动准直器产生位移和角度偏转, 使两个阵列的对应端口能够精确对准,完成光路的连接与交 换。 技术特点:响应速度快、时延低,是当前OCS领域中的 性能标杆;最大端口数可达576×576;响应速度极快,适合 对性能要求极高的场景 该方案无法芯片化,每个模块需要精密组装,导致制造 成本极高。虽然原材料仅占总成本的10%,但精密组装过程 复杂且良率要求高。每台设备售价可达20万美元,相比其他 方案四五万美元的价格明显偏高。 目前该方案更多作为性能评估基准使用,例如谷歌和英 伟达均采购此类设备进行内部评估,但由于价格昂贵尚未实 现大规模商业化应用。
OCS 光交换机技术方案对比
根据QY Research,从产品类型来看,目前商用的全光交换(OCS)交换机按照技术方案主要分为MEMS方案和 DirectLight DBS方案。过去几年全光交换(OCS)交换机市场一直以MEMS方案为主流,2024年市场规模为192.36百万美 元,约占整个全光交换(OCS)交换机市场52.49%的份额,预计2031年将达到836.79百万美元,届时全球占比将减少至 41.38%。2025年之后DirectLight DBS方案将占据主导地位,同时DirectLight DBS方案也是增长最快的类型,2024年市场 规模为174.11百万美元,大约占据47.51%的份额,2020至2024年复合增长率(CAGR)为52.53%,预计2031年将达到 1,185.42百万美元,2025至2031年复合增长率(CAGR)为19.58%,届时份额占比将达到58.62%。
基于MEMS方案——Google
Google采用的是基于MEMS(Micro-Electro-Mechanical System)反射镜阵列实现的光路交换方案,OCS 的结构较为 简单,主要包含两套子系统: 子系统1:主要用于检测控制。由2个850nm激光发射模组、3个850nm激光可穿透的二向色镜、2个MEMS反射镜 阵列、2个摄像模组所组成,主要的功能是通过检测850nm激光在光交互通道中的传输状态,调整MEMS反射镜的相关 参数,从而实现路径上光信号损耗最小。 子系统2:光交换的实际链路。由2个136通道的光纤准直器阵列、3个二向色镜、2个MEMS反射镜阵列所组成, 通过MEMS反射镜的调整控制,实现经过两个光纤准直器所接入的光通路之间的互联互通。
基于DBS方案——Huber+Suhner
HUBER+SUHNER Polatis公司是全球光开关技术的领导者,成立于2000 年,一直专注于光交换产品的研发、生产, 其开关产品基于独特的DBS(DirectLight Beam-Steering)直接光束偏转全光交换专利技术,具有三个核心部件:①光纤 准直器(fiber collimator),②二维压电致动器 (2D PiezoActuator),③精确位置传感器(position sensor)。每个准直 器端口的转动位置,都是提前精确标定。通过压电效应产生的致动器二维伸缩位移,实现准直器的精确转动,并通过 位置传感器构成闭环反馈控制,将2个光纤准直器连成同一条直线。 HUBER+SUHNER Polatis 单模576 x 576矩阵光开关是Polatis全光开关在矩阵规模与交换性能方面的重大升级。作 为市场上最大的非阻塞光路交换机,它采用了全新的内部架构,旨在提高现场可靠性、可用性和可维护性,以及新的 光交换核心设计,实现更高的端口密度,节省宝贵的机架空间。Polatis 576还配备了现场可寻址的备用端口,以便将光 纤移动到备用端口并重新分配软件中的端口,从而快速解决端口的异常中断。576x576非阻塞矩阵光开关使运营商能够 以紧凑的形式远程控制更多光纤,非常适合网络安全和网络监控、测试实验室自动化、数据中心等应用。配有 MPO 连接器的 Polatis 576 型号仅占用 8RU,节省了宝贵的机架空间。
基于数字液晶技术方案——Coherent
公司新型OCS交换机斩获首个客户订单。Coherent公司的OCS基 于独特的数字液晶技术。与基于机械微机电系统(MEMS)的解决方 案相比,这一差异化平台为客户带来了巨大优势。在人工智能(AI) 集群的数据中心网络中,部署基于OCS的架构可大幅减少所需的电气 交换机数量,更重要的是,减少了这些电气交换机所需的昂贵的光电-光(OEO)转换。 在OCS中,数据信号在通过交换机时保持在光域,消除OEO转换 可显著节省成本和功耗。此外,与传统交换机不同,当AI集群在后续 升级配备更高速度的连接时,OCS无需升级,这为数据中心显著提高 了资本支出回报率。首个客户订单的达成,是对Coherent技术创新和 产品价值的有力认可,也标志着其在数据中心网络领域迈出了重要一 步。这项创新产品不仅有望打开公司在通信与数据中心业务中的全新 营收通道,也进一步巩固了Coherent在“数据中心光互联基础设施” 市场的竞争地位。 Coherent预计,随着AI模型的持续扩展和数据中心互联密度的急 剧提升,传统电子交换架构将难以应对未来算力基础设施的带宽和功 耗压力,光路交换将成为突破“瓶颈”的关键路径。



(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)