算力革命正在发生的原因是什么?

最佳答案 匿名用户编辑于2022/11/10 14:06

算力革命正在发生的原因是供需错配。

当下,国内投资者对于算力的认识尚处于较为初级的阶段,目光局限于“IDC”+“服务 器”两大产业链中,短期由于国内互联网产业“过冬”,2020 年 IDC 行业扩建等影响, 国内投资者对于“算力”过剩的担忧影响了对于“算力革命”迫切性的认识。我们认为, 一来算力并不能仅用大型 IDC 需求表征,其只代表集中式算力的规模;二来随着自动驾 驶,智能机器人,人工智能等新需求的快速成熟,边缘侧与终端侧算力需求涌现,全球 现有算力将快速进入“供不应求”的局面,算力革命已经迫在眉睫。

究其根本,“算力革命”爆发的根本原因在于“供需失衡”,供给方面主要受到 CPU 发展 极限、流量成本、碳排放等因素制约,集中式算力的边际性价比正在减弱。需求方面, 受到车联网、AI 等同时需要“海量数据处理”+“低延时”的行业带动,算力需求将在 未来呈现指数型爆发式增长。本篇报告,我们将从供需出发,分条阐述“算力革命”爆 发的必然性与急迫性,并给出相关的投资建议。

供给端 1:受到量子隧穿效应影响和商业化成本影响,硅基单核芯片制程将在 3nm 达 到极限

硅基芯片晶体管的栅长在低于 3 纳米时极易发生量子隧穿效应(其原理为,当 栅长缩小到一定程度的时候,即使没有加电压,源极和漏极都接近互通,晶体管便失去 了开关的作用,因而无法实现逻辑电路)。因此,通过更加先进的纳米制程工艺提升单核 芯片性能将面临技术上的严峻挑战。

由于量子隧穿效应的存在,3 纳米后,单芯片成本将会急剧上升,根据华为与罗兰贝格 数据显示,3 纳米制程手机端旗舰级 SoC 单芯片(以高通骁龙 855 为例)成本较 7 纳 米显著增加约 200 美元,高昂的成本将会极大程度制约终端客户需求,最终降低算力供 给的增加。

即使在能够接受较高成本的大型数据中心等用户中,处理器性能的提升依旧受到制约, 受存储、系统、软件限制(性能)和单位算力功耗显著上升(功耗)两大因素影响,芯 片核心数量将在 128 核达到上限。根据罗兰贝格数据,现有的冯·诺依曼架构下,通 过拟合不同核心数量的芯片计算能力样本数据,我们发现多核处理器随核数增长,算力 增长的倍数快速下滑:从 2 核增至 4 核时,总算力可提升 1.74 倍,而当核数由 128 核增至 256 核时,总算力水平仅能提升已跌破 1.2 倍(1.16X),已显著丧失经济性。

在单核性能以及多核提升带来的双重压制下,大型数据中心带来的增量算力边际增量将 会迅速递减,而兴建大型数据中心需要的土地,人力,时间成本将在海量算力时代制约 “集中式”的算力发展。

供给端 2:算力爆发的背景下,网络性能限制和成本将会导致数据中心的算力难以满足

复杂场景下的需求。网络带宽及网络时延共同决定了网络信道的传输质量,影响到网络 算力的发挥。具体而言,“网络化”算力的使用需要经历终端与云端的数据双向传输过程, 这段过程是通过网关、基站、数据中心等不同网节点之间的信道所实现的,其中信道的 容量决定了传输的速率(带宽),信道的长度与材质决定了数据传输的时延,两者共同影响了数据传输的效率。

即使随着当今 5G 网络加速完善,无论从时延以及容量都相较于 4G 网络出现了较大程度 提升,但相对于未来社会的海量数据需求来看,完全依靠 IDC 提供算力支撑仍是效率较 低的选择,无论是智能驾驶对于时延的要求,亦或是传输高清视频图像等带来的大额带 宽成本,都将进一步加剧“集中式”算力与“分布式”需求的错配。

供给端 3:算力高能耗与全球双碳目标之间的矛盾

随着芯片制成逐渐接近量子隧穿效应发生的制程,当前主流芯片的能效比正在逐渐接近 极限。单位算力功耗在过去 10 多年间经历了显著下降,但随着硅基芯片工艺制程提升 的难度凸显,其进一步下探幅度有限,这意味着,等量算力的提升,即将对应等量能耗 需求的提升。面对未来百倍的算力需求,高能耗问题将成为人类算力发展过程中的重要 瓶颈。 同时,随着我国双碳目标的提出,对于数据中心的耗电量,PUE 值都提出了更严格的要 求,截至 2020 年底,中国数据中心耗电量已经突破 2000 亿千瓦时,能耗占全国总用电 量的 2.7%,随着数据中心进一步扩容,算力需求进一步提升,解决数据中心能耗问题的 需求也愈发迫切。在可见的未来,具备低时延特性的核心城市 IDC 供给将进一步被压 缩,如何通过有效的边缘侧处理手段,使得有限的核心城市算力资源得到充分利用,也 是本轮“算力革命”急需解决的难题。

需求端:智能化社会大潮下,对应百倍流量增长需求

随着以人工智能、物联网、区块 链、AR/VR 等关键信息技术逐渐成熟,社会中大量智能化场景将得到实现。根据罗兰贝 格报告,人工智能技术将推动无人驾驶、智能办公、智慧医疗等场景的有效落地,物联 网技术将推动智能消防、智慧工厂、智慧农场、智能家居等场景落地,区块链技术将推动应用于数字证书、信息加密等场景落地,AR/VR 技术则可推动智慧商场、游戏、智慧 课堂等场景落地。这些场景未来将在产业领域实现跨越式发展、助力各产业创新、增强 产业数字化程度并增强市场活力,在政务领域帮助政府提升运行效率、提高城市管理水 平、加强居民生活幸福度,在民生领域推动社会民生保障、创造宜居空间、实现可持续 化发展,共同推动社会向智能社会发展。

从算力需求看,人工智能技术对于算力的核心拉动点在于未来各应用场景内单设备芯片 算力的增长和人工智能技术的行业渗透率的进一步提升,物联网主要通过低算力物联网 设备的普及、配套云端计算中心和边缘端计算单元的增加共同拉动算力增长,区块链因 安全问题要求的算力持续增长和应用场景的快速普及将带动以云服务器为主的算力增长, VR/AR 设备的普及和普及需要的云计算中心和边缘计算设备算力配套将共同推动整体算 力的增长。

从时延要求看,L3 级别的自动驾驶对于传输时延的要求在 10-20 毫秒,在进入 L4&L5 级 别后,对于传输时延的要求进一步提高到 10 毫秒以下;使用物联网建设智慧工厂对车间 内部的局域网络带宽需要达到 Gbps 级别,最高时延须控制在 5ms-10ms 以内;在 VR/AR 游戏中,端到端的时延至少需要小于 20 毫秒,才能保证在使用过程中避免感知到明显的 图像滞后而导致的眩晕。

随着人类对于 AI、智能价值、虚拟现实等超大算力、超低时延需求场景和应用的探索愈 发深入,当先算力的需求端将会出现指数型爆发,我们将在第五章更加深入的展开讨论 这些面向未来的场景需求和他们当下的发展情况。