梯度分布,算力的终极呈现形式。
供给端 1:受到量子隧穿效应影响和商业化成本影响,硅基单核芯片制程将在 3nm 达 到极限。硅基芯片晶体管的栅长在低于 3 纳米时极易发生量子隧穿效应(其原理为,当 栅长缩小到一定程度的时候,即使没有加电压,源极和漏极都接近互通,晶体管便失去 了开关的作用,因而无法实现逻辑电路)。因此,通过更加先进的纳米制程工艺提升单核 芯片性能将面临技术上的严峻挑战。 由于量子隧穿效应的存在,3 纳米后,单芯片成本将会急剧上升,华为与罗兰贝格数据 显示,3 纳米制程手机端旗舰级 SoC 单芯片(以高通骁龙 855 为例)成本较 7 纳米显著 增加约 200 美元,高昂的成本将会极大程度制约终端客户需求,最终降低算力供给的增 加。
即使在能够接受较高成本的大型数据中心等用户中,处理器性能的提升依旧受到制约, 受存储、系统、软件限制(性能)和单位算力功耗显著上升(功耗)两大因素影响,芯 片核心数量将在 128 核达到上限。根据罗兰贝格数据,现有的冯·诺依曼架构下,通过 拟合不同核心数量的芯片计算能力样本数据,我们发现多核处理器随核数增长,算力增 长的倍数快速下滑:从 2 核增至 4 核时,总算力可提升 1.74 倍,而当核数由 128 核增 至 256 核时,总算力水平仅能提升已跌破 1.2 倍(1.16X),已显著丧失经济性。
在单核性能以及多核提升带来的双重压制下,大型数据中心带来的增量算力边际增量将 会迅速递减,而兴建大型数据中心需要的土地,人力,时间成本将在海量算力时代制约 “集中式”的算力发展。
供给端 2:算力爆发的背景下,网络性能限制和成本将会导致数据中心的算力难以满足 复杂场景下的需求。网络带宽及网络时延共同决定了网络信道的传输质量,影响到网络 算力的发挥。具体而言,“网络化”算力的使用需要经历终端与云端的数据双向传输过程, 这段过程是通过网关、基站、数据中心等不同网节点之间的信道所实现的,其中信道的 容量决定了传输的速率(带宽),信道的长度与材质决定了数据传输的时延,两者共同影 响了数据传输的效率。
即使随着当今 5G 网络加速完善,无论从时延以及容量都相较于 4G 网络出现了较大程度 提升,但相对于未来社会的海量数据需求来看,完全依靠 IDC 提供算力支撑仍是效率较 低的选择,无论是智能驾驶对于时延的要求,亦或是传输高清视频图像等带来的大额带 宽成本,都将进一步加剧“集中式”算力与“分布式”需求的错配。

供给端 3:算力高能耗与全球双碳目标之间的矛盾。 随着芯片制成逐渐接近量子隧穿效应发生的制程,当前主流芯片的能效比正在逐渐接近 极限。单位算力功耗在过去 10 多年间经历了显著下降,但随着硅基芯片工艺制程提升的 难度凸显,其进一步下探幅度有限,这意味着,等量算力的提升,即将对应等量能耗需 求的提升。面对未来百倍的算力需求,高能耗问题将成为人类算力发展过程中的重要瓶 颈。 同时,随着我国双碳目标的提出,对于数据中心的耗电量,PUE 值都提出了更严格的要 求,截至 2020 年底,中国数据中心耗电量已经突破 2000 亿千瓦时,能耗占全国总用电 量的 2.7%,随着数据中心进一步扩容,算力需求进一步提升,解决数据中心能耗问题的 需求也愈发迫切。在可见的未来,具备低时延特性的核心城市 IDC 供给将进一步被压 缩,如何通过有效的边缘侧处理手段,使得有限的核心城市算力资源得到充分利用,也 是本轮“算力革命”急需解决的难题。
需求端:智能化社会大潮下,对应百倍流量增长需求。随着以人工智能、物联网、区块 链、AR/VR 等关键信息技术逐渐成熟,社会中大量智能化场景将得到实现。根据罗兰贝 格报告,人工智能技术将推动无人驾驶、智能办公、智慧医疗等场景的有效落地,物联 网技术将推动智能消防、智慧工厂、智慧农场、智能家居等场景落地,区块链技术将推 动应用于数字证书、信息加密等场景落地,AR/VR 技术则可推动智慧商场、游戏、智慧 课堂等场景落地。这些场景未来将在产业领域实现跨越式发展、助力各产业创新、增强 产业数字化程度并增强市场活力,在政务领域帮助政府提升运行效率、提高城市管理水平、加强居民生活幸福度,在民生领域推动社会民生保障、创造宜居空间、实现可持续 化发展,共同推动社会向智能社会发展。
根据华为《泛在算力报告》,在人工智能、物联网、区块链、AR/VR 四大领域,到 2030 年,相比 2018 年,都将出现百倍到千倍的算力需求增长,同时对于网络的延迟也提出了 更高的要求。
从算力需求看,人工智能技术对于算力的核心拉动点在于未来各应用场景内单设备芯片 算力的增长和人工智能技术的行业渗透率的进一步提升,物联网主要通过低算力物联网 设备的普及、配套云端计算中心和边缘端计算单元的增加共同拉动算力增长,区块链因安全问题要求的算力持续增长和应用场景的快速普及将带动以云服务器为主的算力增长, VR/AR 设备的普及和普及需要的云计算中心和边缘计算设备算力配套将共同推动整体算 力的增长。 从时延要求看,L3 级别的自动驾驶对于传输时延的要求在 10-20 毫秒,在进入 L4&L5 级 别后,对于传输时延的要求进一步提高到 10 毫秒以下;使用物联网建设智慧工厂对车间 内部的局域网络带宽需要达到 Gbps 级别,最高时延须控制在 5ms-10ms 以内;在 VR/AR 游戏中,端到端的时延至少需要小于 20 毫秒,才能保证在使用过程中避免感知到明显的 图像滞后而导致的眩晕。
由此可见,供给端的单芯片制程、能源限制,传输费用,与需求端的降本,能耗,时延 所带来的供需错配,是算力走向泛在的核心因素。近年以来,我们也看到了中国为了解 决算力调度问题所作出的努力,其中最具代表性的便是“东数西算”与三大运营商所提 出的“算力网络”。 为什么要强调“东数西算”或者是“算力网络”的重要性,因为我们认为,脱离了“网 络”的边缘算力是没有意义的,未来的边缘算力一定是通过“算力网络”,与云端大算力 一起,实现智能融合与实时调度,边缘预处理的 token 通过算力网络,调用云端算力进 行 token,科研机构通过“算力网络”调度系统,实时分配与匹配各类不同的算力需求, 可以说,“算力网”的作用,在 AI 时代,重要程度将不亚于通信网络。