中国目前无法通过官方渠道同步获得英伟达最先进的 GPU。
英伟达 GPU 芯片成为目前智算中心的主流算力硬件,占比 90% 左右。因此, 全球范围内芯片能效提升趋势相对明确,可预见的将来与英伟达 GPU 迭代周期 同步,未来有望一年一次更新。伴随着向更低精度的扩展,从 P100 到 B200 的 8 年间,训练同一个模型的能耗,理论上目前已经降至最初的 1/400 左右。 因此,导致各方预测结果分歧较大的原因,主要在于对AI算力增长的预期不一致。 这既取决于算力需求的增长,也取决于算力供给的增长,还取决于客户预算的 增长能否赶得上前两者的增长,以及电力电网建设的增长赶不赶得上前三者的 增长。不少年初的研究低估了去年英伟达 GPU 的出货量。此外,其中算力需求 的增长,既包括训练需求的增长,也包括推理需求的增长,两者都存在较高不 确定性。
因此,部分报告假定了不同的 AI 算力增长情景,也产生了不同的用电增长估算 结果。高盛认为届时美国 AI 用电占比约 20%,semianalysis 则认为可能超过 60%。在不同 AI 算力增速预期下,前者估算到 2030 年,美国数据中心用电占 比将从 2023 年的 3% 升至 8%,后者估算到 2028 年该占比将升至超过 14%。
对于中国而言,国产芯片的迭代速度与产能瓶颈,即芯片能效提升预期,以及 算力增长预期中的算力供给问题,才是最敏感的影响因素。因此,重估中国 AI 算力与电力在不同情景下的预期,主要从较不确定的芯片创新的角度,而非美 国的较确定的算力增长的角度。

中国目前无法通过官方渠道同步获得英伟达最先进的 GPU。美国降下的“硅幕”, 限制芯片设计、制造与流通的多个环节,试图将中国先进算力遏制在 A100 水平以下。但中国在从国际市场上获取符合美国出口禁令标准的芯片的同时,国 产芯片也在迅速补位,通过 DUV 多重曝光等技术制造的等效 7nm 芯片已获行 业验证,理论上这也适用于探索制造等效 5nm 芯片。接下去的问题就是良率提 升速度与产能爬坡速度,根本上取决于中国建立起一个基本替代西方先进制程 芯片的产业链,解决各个环节卡脖子问题。这需要时间和耐心。
保守来看,如果鸿沟短期内无法逾越,中国的 AI 算力长期依靠较低能效的芯片, 且芯片能效无法持续提升,那么相同算力规模的用电量需求就会大增。电力换 算力成为一种选择,以保证在 AI 领域的竞争力。但就总量而言,中国电力的装 机总量约为美国 2.4 倍,发电总量约为美国的 2.1 倍,其中,可再生能源发电新 增装机超过全球的一半,累计装机规模占全球比重接近 40%,绿色电力供给总 量不是问题。
乐观来看,如果中国能够突破封锁,建立起比较完整的芯片产业链,芯片技术 持续迭代升级,能效持续提升,那么,以中国制造“过剩”的能力,决定用电 量的将是算力需求而不是供给。中国三大城市群已出台的智能算力基建规划, 总规模早已超过全国。大模型最大的应用市场就在中国。