2025年GPU供电趋势专题报告：多相DrMOS价值量倍增

国泰君安证券2025/03/31
举报

1. AI 芯片功耗持续上升

1.1. 能耗攀升与供电压力

AI 芯片能耗日益攀升，供电网络架构重要性凸显。英伟达 H100 芯片热设计功耗（TDP）高达 700 瓦，与之相比，全球数据中心广泛部署的英特尔 Skylake/Cascade Lake 系列 CPU，热设计功耗尚不足 200 瓦。展望未来，下一代芯片为承载更高的计算密度，能耗需求将进一步提升。以英伟达（NVIDIA）为例，新一代的 GB200 架构中，NVL36 机柜功率密度为 72kW。伴随功耗上扬，诸多棘手挑战纷至沓来。其中尤为突出的是高功耗会致使电力传输与转换过程中的损耗大幅跃升，且损耗的增幅远超功耗增长比例。鉴于电力成本在数据中心运营成本中占据大头，降低电力损耗对于优化总体拥有成本举足轻重。有鉴于此，当下从机架层级到芯片层级的供电网络架构正在被重新规划与设计，力求攻克人工智能训练及推理等这类高耗能计算任务所衍生的电力难题。

2. 供电方案的演进

计算与存储芯片采用直流电供电，由电压调节模块（VRMs）把控输出电压，确保输出至芯片的电力参数匹配芯片需求。在电力系统中，电网以交流电形式承载并传输电力，其电压幅值可高达数十万伏特。然而，计算芯片与存储芯片作为现代电子设备的核心算力与数据存储载体，所适配的电力为稳定、纯净且呈低电压特性直流电。过高的电压输入会致使芯片内部精密且脆弱的电路结构因过载而遭受不可逆的损坏，而过低的电压则无法驱动芯片电路实现正常的逻辑切换与信号传导。因此在电力适配链路中，变压器承担着初次电压变换职能，依据电磁感应原理将电网高压交流电转换为适配后续环节的中间电压等级；电源供应单元（PSUs）则进一步整合、净化电源，为后续的精细调压做准备；最终，电压调节模块（VRMs）精准把控输出电压，确保输送至芯片的电力参数精准匹配芯片需求。

2.1. 从 12V 到 48V：效率突破

SoC 供电电压降低引发电流增大、电阻损耗剧增等效率问题，促使企业从传统 12V 供电转向 48V 供电网络，并通过靠近负载降压以降低整体电阻损耗。随着未来架构与工艺技术的演进， SoC 供电电压持续走低，为维持功率恒定，电流需依电压下降倍数相应增大。以 240W、工作电压 1.2 伏的 AMD CPU 为例，从 12 伏输入降至芯片所需的 1.2 伏（降压 10 倍），电流从 12 伏时的 20 安攀升至 1.2 伏时的 200 安（增加 10 倍）；700 瓦、工作电压 0.8 伏的英伟达 GPU，若将 12 伏输入降至 0.8 伏（降压 15 倍），电流会从 12 伏时的 60 安激增至 0.8 伏时的 875 安（增加 15 倍），相较于耗电量少的 CPU，GPU 电流高出许多，由公式可知，电流越大电阻损耗越大，降至 0.8 伏时，电流增大 15 倍，电阻损耗更是呈指数级飙升至 225 倍，凸显出近几代数据中心芯片的效率损耗已成大患，且随着工艺缩减、电压继续降低，以及先进封装技术使芯片封装变大、耗电量剧增，情况愈发严峻。长期以来， PSU 多以 12 伏直流电为标准，以往功率低时，效率损失微乎其微，如今低电压 SoC 对高功率需求渐长，反倒使效率遭受双重打击，相对廉价且常见的 12 伏组件优势不再。从 12 伏提升至 48 伏，所需电流减为四分之一，损耗随之降低 16 倍，这便是诸多公司转向 48 伏供电网络的缘由，虽说最终仍要降压至 1 伏左右，但将 48 伏电压尽可能靠近 SoC 处降压，走线长度缩短，电阻损耗减小，进而降低整体电阻损耗。

两阶段配电方案相较于现有的数据中心配电模式，在效率、可扩展性以及成本控制上优势尽显。谷歌的 48V 方案虽然有效解决了损耗和效率问题，却在提出初期面临了缺乏下游适配方案的问题。具体而言，就是缺少将 48 伏精准降至板载负载点（POL），以满足处理器、内存条及其他专用集成电路供电需求的有效方式。在此背景下，两阶段配电方案崭露头角。两阶段配电方案相较于现有的数据中心配电模式，在效率、可扩展性以及成本控制上优势尽显，既能巧妙化解不同负载对电压、电流差异化需求带来的配电难题，又能满足电路板对高效能、小尺寸元件的严苛要求，为优化数据中心电源架构，实现性能、成本与可扩展性的全方位跃升筑牢根基。

2.2. 4 8V至 12V：高效降压

第一阶段：48 伏直流电输入各计算托架（compute tray）后，首要任务是精准降压至 12 伏，以满足后续电子元件工作电压要求。该降压环节有两种主流应用模块。英伟达 DGX 服务器长期采用中间总线转换器（intermediate bus converter）模块实现 48 伏到 12 伏转换。传统 DGX 服务器每个计算托盘均匀配备 8 个 IBC 模块，单个模块功率约 1 千瓦，与 1 张通用并行图形处理器（SXM 模块，即 GPGPU）精准对应供电，保障其稳定运行。随着技术与服务器性能升级，英伟达 GB200 服务器改用配电板（power distribution board）模块降压，GB200 服务器每个计算托盘内集成 8 千瓦 PDB 模块，由两个 4 千瓦直流-直流转换器组成，协同将 48 伏直流电高效稳定转换为 12 伏，为元件供电。

第一阶段到第二阶段的链接：配电板从机架级母线获取 48 伏直流电，并将其降压至适用于比安卡（Bianca）板的 12 伏直流电。在 CPU 和 GPU 各自的电压调节模块（VRM）周围设有 4 个快速锁定 12 伏直流电源连接器和 4 个快速锁定接地（GND）电源连接器。这些 12 伏和接地电源连接器将连接至计算托架的配电板（PDB）。配电板将 48 伏直流电精准降至适配比安卡板运行的 12 伏直流电，传输到电压调节模块的电源连接器。

2.3. 12V 至 SoC：精准供电

第二阶段：电压调节模块（VRM）将 12 伏输入电压转换为适配 SoC 运行所需电压。在常规的硬件架构布局中，VRM 通常被安置于承载芯片的印刷电路板（PCB）之上，以实现对芯片供电的有效管控。就现代 VRM 的内部构造而言，其主要由三个核心部分协同构成：电容、电感以及功率级（power stage）。其中，电容用于存储及缓冲电能，接收输入电能后能以稳定速率释放，平抑输送至处理器的电力波动，保障供电稳定连续。电感则凭借自身特性抑制电流突变，抵抗电流尖峰脉冲，防止对处理器造成不可逆损坏，护航处理器安全稳定运行。功率级作为 VRM 架构中的重中之重，肩负着核心的电压转换。以常见的供电场景为例，接入 12 伏的输入电压后，功率级将依据处理器类型启动相应的转换机制。对于中央处理器（CPU）而言，鉴于其运行特性与功耗需求，传统上所需的供电电压范围通常处于 1.2 伏-1.8 伏区间；而在面向 GPU、FPGA、ASIC 或是人工智能加速器等对电压有着特殊要求的高性能芯片时，功率级则需将输入电压转换至 0.8 伏至 1.0 伏的适配区间。

3. 多相控制器+DrMOS：SoC 供电主流方案

3.1. 多相 Buck 电源架构优势

多相控制器与 DrMOS 的组合已成为第二阶段最主流的供电方案。这种方案通过多相电源的架构，能够有效满足 SoC、CPU、GPU 等芯片对大电流、高效率和快速瞬态响应的需求。多相 Buck 电源包含控制器和 DrMOS，是一种多路交错并联的同步 Buck 拓扑，每相 Buck 对应的半桥 MOSFET 可由包含驱动和温度/电流检测的 DrMOS 代替。由一个控制器采集反馈的电压、电流、温度/错误等信号，并发出各 PWM 波实现功率的闭环控制，提高了电源的功率密度，还在同等功率下有效降低了系统的发热量。控制器可通过特定协议的通信接口和信号指示 I/O 与系统上位机或负载处理器进行信号交互。

DrMOS 本质上是一种采用外部脉宽调制控制器且为降压配置的电压调节模块。与传统的降压式 DC-DC 转换器不同的是，DrMOS 将 MOSFET 驱动器与功率 FET 直接集成在芯片上。按照英特尔的规范，在现代应用中，这些芯片组的封装大多固定为 5mm×5mm，这使得电压调节模块能够被放置在距离负载更近的位置。这两个功率级部件的集成以及与负载的接近，减少了寄生元件和传导损耗，使得在优化的多相拓扑结构中，效率可提升至 95% 以上。在工作原理上，外部脉冲宽度调制控制器产生特定占空比的脉冲信号，该信号被传输至 DrMOS 内部的 MOSFET 驱动器，MOSFET 驱动器依据此信号精准地控制功率 FET 的导通和关断时间。当功率 FET 导通时，电流从输入电源流向负载，使负载电压上升；当功率 FET 关断时，负载通过续流回路放电，负载电压下降。通过不断调整 PWM 信号的占空比，持续调节功率 FET 的工作状态，从而实现对负载电压的精确调控，确保为负载提供稳定且符合要求的供电。

3.2. 核心壁垒在 BCD 工艺

DrMOS 核心壁垒在 BCD 工艺。BCD 工艺是 1986 年由 ST 首次推出的一种单晶片集成工艺技术，该技术在同一芯片上制作双极管 Bipolar，CMOS 和 DMOS 器件，大大减小了芯片的面积。BCD 工艺充分发挥了 Bipolar 驱动能力、CMOS 高集成度和低功耗、DMOS 高压大电流通流能力的优势。其中，DMOS 是提升功率和集成度的关键。随着集成电路工艺的进一步发展，BCD 工艺已经成为 PMIC 的主流制造技术。DrMOS 的性能优势得益于 BCD 工艺， BCD 工艺中 DMOS 器件的特性，使 DrMOS 具有低导通电阻和开关损耗，能够在开关模式下工作，功耗极低。此外，BCD 工艺减少了组件数量和内部互连长度，有助于 DrMOS 降低寄生电感，减少电磁干扰，提升稳定性。

BCD 未形成统一工艺标准，各厂家将自己研发的 BCD 工艺视为核心竞争力之一。由于不同应用场景对芯片的电压要求差异很大，如汽车电子可能需要几百伏的高压，而消费电子中的一些芯片则只需几伏到几十伏的低压。这使得晶圆厂难以制定统一的 BCD 工艺来满足所有需求。此外，在性能侧重上，如在电源管理芯片中，可能更注重低功耗和高效率；而在电机驱动芯片中，则更关注大电流驱动能力和开关速度等，不同的性能侧重导致工艺要求不同。相关芯片大厂均在发展自己的工艺。意法半导体作为 BCD 技术的发明者，在 BCD 工艺技术的开发方面一直保持领先，有先进 BCD、绝缘体上硅 BCD 和高压 BCD 等多种工艺平台。TI、ADI、安森美等也均有自己的 BCD 工艺技术，在相关市场中占据重要地位。

3.3. 应用场景：服务器供电

DrMOS +多相在不同类型服务器上的价值量存在明显差异。（1）通用服务器：一般用于常规的数据处理和业务运营，对电源的要求相对较低。在标准配置中，普通服务器通常搭载两颗 CPU。鉴于 CPU 运行时对供电的特定要求，需依据其功耗规格，精确匹配并部署多套多相电源系统。一套完整的多相电源由一颗多相控制器和 8 至 12 颗 DrMOS 构成，通过这种配置确保 CPU 能够获得稳定、高效的电力供应，以保障服务器的稳定运行，根据 MPS，单台通用服务器中电源管理芯片价值量约 80 美元，其中 DrMOS + 多相电源是主要组成部分。（2）AI 服务器：通常配备多颗高算力的 GPU 以及 1-2 颗 CPU，对供电要求极高。根据英飞凌，单张 AI 加速卡上电源芯片价值量为 50-200 美元，因此单台 AI 服务器多相电源芯片价值量相较于通用服务器有数倍提升。

以英伟达 H100 为例，根据测算，单颗 GPU 的 Drmos+多相的用量可以达到 50-60 美金。H100 的功耗为 700w，工作在 0.8v，由于为 CPU 与 GPU 供电的 Drmos 基本都工作在 33A，根据电功率公式计算，一颗 GPU 需要 27 颗 Drmos，考虑到实际情况下会涉及一定的备用和冗余，按照 0.8-1 倍的备用 Drmos 来计算，合计约 50-55 颗 Drmos，对应 5-6 颗多相。考虑一颗 DrMOS 或多相控制器的价格均为 1~2 美金（以 1 美金/颗进行测算），价值量约为 50-60 美金。

AI 服务器渗透率持续上升，相关电源管理芯片价值量上升。根据 TrendForce 的最新研究， 2024 年整个服务器行业的总价值达到 3060 亿美元。其中，与 AI 服务器相关的行业价值估计约为 2050 亿美元，与标准服务器相关的行业价值相比，增长更为强劲。展望 2025 年，由于需求持续旺盛且产品平均售价较高，预计 AI 服务器细分市场的价值将升至 2980 亿美元。此外，预计 2025 年 AI 服务器将占整个服务器行业总价值的 70% 以上。

3.4. 应用场景：PC 供电

大模型本地部署兴起，对 PC 硬件提出了较高要求。尤其是对于大模型版本，需要强大的 GPU 支持和足够的内存与存储空间。随着用户对更大模型的需求增加，PC 硬件的升级将成为必然趋势，以确保模型能够高效运行并发挥其最佳性能。

PC 硬件升级带来了功耗成倍增长，供电芯片价值量亦将成倍增长。普通办公 PC 以日常办公应用为主，硬件配置相对基础，运行常规办公软件时，功耗通常稳定在 15 - 30W，如联想小新在轻度使用时功耗 20-35W。游戏本为满足大型 3A 游戏、专业图形渲染等高负载任务需求，通常配备高性能处理器和独立显卡，例如联想拯救者 Y9000P 2024 在运行大型游戏时，功耗可达 180 - 210W 甚至更高，相比普通办公 PC，功耗呈数倍增长。功耗的大幅提升对电脑供电系统提出更高要求。供电芯片作为保障硬件稳定供电的关键部件，需具备更强的功率处理能力，以实现精准的电能调控，其价值量成倍增长。

随着大模型本地部署推动电脑配置升级需求，高配置 PC 出货占比有望持续上升。目前具备独立显卡的高配置游戏 PC 出货量占 PC 整体比重仍处于较低水平，2020-2023 年间占比在 12.7% - 17.96% 之间，2024 年占比达到 26.37%。随着大模型本地部署的推进，其对电脑配置的要求显著提升，将有力带动具备独立显卡的高配置游戏本电脑的销量增长，未来游戏 PC 出货占比有望持续上升。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）