2025年电子行业专题报告:GTC大会召开,催生供应链新增量

Blackwell Ultra平台发布,测试时扩展推理能力优化

Blackwell Ultra于GTC大会发布,预计25年下半年出货

英伟达于GTC大会发布Blackwell Ultra平台,开启AI推理新时代。3月17日至21日美国加州圣何塞 举行GTC 2025大会,英伟达CEO黄仁勋发表主题演讲,发布Blackwell平台新一代产品Blackwell Ultra,该产品定位提升训练和测试时扩展推理能力,即通过在推理过程中增加计算量来提升准确 率,开启AI推理新时代。

基于Blackwell Ultra的产品预计将于2025年下半年出货。参考GB200时间线,GB200于GTC2024正 式发布后,同年四季度开始出货,25年一季度批量出货,GB300发布时间与GB200出货时间相隔仅 半年左右,预测GB300或于2025年下半年左右量产出货。

Blackwell Ultra计算性能提升,FP4 15 Petaflops。英伟达2025年下半年将逐步过渡升级至 Blackwell Ultra,Blackwell Ultra采用台积电N4P工艺,推理能力大幅优化,单卡FP4浮点运算 性能为15 PetaFlops,相较B200FP4的单卡算力9 PetaFlpos,Blackwell Ultra单卡FP4浮点运算 性提升50%以上。

Blackwell Ultra 存力显著提升,升级至288GB 12hiHBM3e。显存方面,Blackwell Ultra采用8 堆栈12层堆叠的HBM3e,B100、B200均为8层堆叠的HBM3e,Blackwell Ultra显存容量提升至 288GB,B200显存容量仅为192GB,相较提升50%。 Blackwell Ultra与上一代相同,支持NVLink v5,带宽1.8TB/s。

基于Blackwell Ultra的GB300 NVL72,专注大规模AI推理场景

基于Blackwell Ultra的GB300 NVL72,专注大规模AI推理场景。Blackwell Ultra包括GB300 NVL72机架级解决方案和HGX B300 NVL16系统。GB300 NVL72在单机架连接72个Blackwell Ultra GPU+36个基于Arm Neoverse架构的Grace CPU,有18个Compute Tray+9个NVLink Switch Tray组 成,专注测试时扩展的应用场景。

GB300 NVL72性能优化,为上代1.5倍。GB300 NVL72性能为GB200 NVL72的1.5倍,FP4推理浮点运 算能力达到1.1ExaFlops,GB200 NVL72 FP4为1440 PetaFlops,FP8训练运算能力达到0.36 ExaFlops;配备20TB内存,上一代内存为14TB,为上一代1.5倍;总带宽为576TB/s。HGX B300 NVL16相比Hopper系列,LLM推理速度增加11倍,计算性能增加7倍,内存容量增加4倍。

内存模组、网卡、光模块等配置均有升级

内存条预计引入LPCAMM模组。GB300的外部存储预计引入LPCAMM模块,GB200采用的方案是焊接 LPDDR5X,GB300外接存储器LPCAMM支持可插拔与扩展,带来灵活性提升。 网卡升级为CX8,提升一倍。GB300预计采用800G ConnectX-8,在GB200中网卡配置为400G ConnectX-7,CX8带宽较CX7提升一倍,带宽为14.4TB/s,传输速率更快。 单卡功耗提升,但整机柜能耗预计不变。GB300单卡功耗提升到1.4kW,相较GB200的单卡功耗 1.2kW,G300B单卡功耗提升约17%,而整体机柜能耗预计仍控制在132kW。

DGX SuperPOD赋能AI推理,助力企业快速部署

基于Blackwell Ultra的DGX SuperPOD赋能AI推理。DGX SuperPOD AI超级计算机采用DGX GB300和 DGX B300系统,集成NVQuantum-X800 InfiniBand或Spectrum-X以太网,助力企业快速部署。DGX SuperPOD提供FP4精度计算,大幅提升AI应用中Token生成速率。DGX GB300采用液冷架构,专注高 级推理模型的实时代理响应,DGX B300采用风冷架构,专注生成式和代理式AI。

Rubin Ultra NVL576性能大幅提升,“纵向扩展”推进

新继代Vera Rubin预计26年出货,配置全面更新

新一继代Rubin架构将于2026年发布。英伟达继Hopper、Blackwell之后的下一代Rubin发布,相较 Hopper、Blackwell的每两年发布新一代,Rubin Ultra将于预计2027年发布。Rubin架构基于台积 电3nm工艺,采用CoWoS-L封装。

Vera Rubin架构正式问世,配置全面更新。Rubin GPU FP4精度下达到50 petaflops,是 Blackwell Ultra 15 petaflops的3.3倍以上,推理能力大幅提升;配置8颗16层堆叠HBM4,容量 288GB。Vera CPU是基于英伟达自主架构Olympus的处理器,集成88个定制Arm核心,总线程数达到 176个,支持多线程技术,相较上一代Grace CPU为72核,仅支持单线程。Vera CPU通过NVLinkC2C与Rubin GPU链接,带宽达1.8TB/s。

Rubin Ultra NVL576性能突破性提升

Vera Rubin NVL144提供3.3倍NVL72性能。在Blackwell架构为双GPU架构,即1个Blackwell芯片上 集成2个GPU,并以Blackwell芯片数量计数,而从Rubin系列开始,英伟达将使用GPU die数量作为 计数,每个GPU die为一个GPU,每个NVL均连接到GPU,集成为Vera Rubin NVL144。VeraRubin NVL144将标配HBM4,带宽为13TB/s,FP4推理浮点运算能力达到3.6 ExaFlops,FP8训练运算能力 达到1.2 ExaFlops,是GB300 NVL72的3.3倍;配置Connect-X9,带宽为28.8TB/s,为上一代 Connect-X8的2倍;支持NVLink6,带宽为260TB/s,带宽提高一倍。

GB300&Rubin平台架构变化,催生供应链新增量

架构模块化,助力灵活配置需求

回归UBB+OAM架构,为客户提供灵活配置可能性。在GB200中,Compute Tray为集成了2颗GPU、1颗 Grace CPU、LPDDR5X等器件的Bianca主板;预计英伟达在GB300中将不再采用Bianca主板,而是采 用UBB+OAM模式,由英伟达提供GPU SXM Puck,客户配置更加灵活。

PTFE材料有望助力高传输低损耗的实现

PTFE具备超低介电损耗优势,Rubin有望引入PTFE背板架构。考虑到Rubin性能大幅提升,功耗随 之增加,Rubin系列中有望迎来架构调整。正交架构或成为机柜方案,从而提升传输效率。正交架 构需要高传输速率及低损耗,PTFE材料介电损耗仅为2.1,有望引入PTFE背板。

产业链相关公司:沪电股份

公司AI相关高端产能扩张,助力长期增长。公司聚焦高多层、高频高速板业务,下游覆盖AI服务 器、交换机等高增速行业,受益下游大客户需求增加,公司订单饱满。公司已在24年Q4规划新建 人工智能芯片配套高端印制电路板扩产项目,生产高层高密度互连积层板,以满足高速运算服务 器、人工智能等新兴计算场景对高端印制电路板的中长期需求,项目将分两阶段实施,投资总额 预计约为43亿元人民币,计划年产约29万平方米人工智能芯片配套高端印制电路板。

产业链相关公司:胜宏科技

公司在高阶HDI+高多层均有布局,有望迎来放量。公司深耕行业20余年,终端客户覆盖NVIDA、 AMD、Intel、Tesla、微软、谷歌、思科等行业头部企业,充分受益下游客户需求爆发。公司目前 在惠州、泰国和越南均有新的产能规划。惠州工厂会在现有产能基础上新扩50%HDI和30%高多层; 泰国目前以多层板为主,电源和汽车产线率先投产,后续结合HDI工艺的复合型高多层产能也将投 产。越南生产基地也在持续推进,规划布局HDI产品。

产业链相关公司:景旺电子

公司PTFE板业务进展显著,打开新增长曲线。在AI服务器领域,公司成功开拓软板和软硬结合板 在数据中心的应用产品,同时在高阶HDI、高多层PTFE板等产品上实现了重大突破。在通用服务器 领域,公司已实现EGS/Genoa平台高速PCB稳定量产,同时在Birth stream平台高速PCB等产品技术 上取得重大突破。高速通信领域,公司800G光模块、通信模组高阶HDI等产品实现批量出货,112G 交换路由PCB取得重大技术突破。

产业链相关公司:生益科技

国产高端CCL头部厂商,有望迎来放量。AI算力相关产品对信号传输速率和带宽形成新要求,承载 信号通道的覆铜板材料需要更低损耗,产品形态也同以往有线产品有较大差异,配合客户提出的 新架构和新的材料需求,在公司强大的管理体系,技术平台上,能够快速给予解决方案,在新品 验证上给予及时交付。公司正积极同国内外各大终端就GPU和AI展开相关项目开发合作,并已有产 品在批量供应。

报告节选:


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告