为什么需要建设算力网络?

最佳答案 匿名用户编辑于2023/10/25 09:50

东西部算力供需错配,推动“东数西算”规划。

“东数西算”旨在将东部需求有序引导至可再生 能源丰富的西部,缓解东部运算压力及能耗需求。数据中心的建设需重点考虑土地、电力成本等 因素: 土地:数据中心的核心就是各类IT硬件设备,配套电力、安全监控、散热等设施也需要随之 部署。据数据显示,单个数据中心的面积达到了 60 个足球场的面积,对于土地资源紧俏的 东部地区,尤其是一二线城市进行建设,成本无疑十分高昂。相比之下,中西部、四五线城 市土地资源丰富,成本极低。

电力:数据中心作为“耗能大户”,电力成本占运营支出比例 60%-70%,而数据中心耗电 量占中国总耗电量的比例逐年持续上升。相比东部地区,中西部地区具备丰富的风电、光伏、 水电等清洁能源,且工业用电需求远小于东部城市,因此电价相对低。 气候:数据中心不但高耗能,而且在运转时会散发大量的热量,如果不能及时通过制冷、散 热系统将热量排除,会导致硬件设备宕机。数据中心在降温过程中所消耗的能量占到数据中 心总能耗的 40%之多。中西部地区,比如数据中心产业发展最好的贵州,全年平均气温为 14-16 摄氏度,气温低,更适合数据中心的建设。

“东数西算”规划全国性算力布局。2022 年 2 月,国家发改委、中央网信办、工信部、国家能源 局联合印发通知,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、宁夏等 8 地启 动建设国家算力枢纽节点,并规划了 10 个国家数据中心集群。根据相关统计,2022 年上半年, 我国算力规模已达到 150EFlops,规模世界第二,仅次于美国;同时建成多个数据中心、人工智能 算力中心,覆盖全国各地。东数西算的工程建设也在改变国家算力的分布,算力互联和高效调度 的重要性逐渐凸显。

另一方面,随着边缘计算的需求增长,算力出现向云-边-端三级架构演进的趋势。面对物联网数 据量的爆发,传统云计算弊端逐渐凸显,如无法满足海量数据处理诉求、无法满足实时数据处理 诉求等等。边缘计算的出现,可在一定程度上解决传统云计算遇到的这些问题,物联终端设备产 生的数据不需要再传送至遥远的云数据中心处理,而是就近在网络边缘侧完成数据分析和处理, 更加高效和安全。

分布式算力加大算力互联难度,中长距离场景下,网络时延较高,应用场景仍受限。根据业务对 网络时延的要求可将业务分成:热业务、温业务、温冷业务、冷业务。受限于物理规律,以目前 的传输速度,中长距离传输仍会产生较大时延。因此中长距离算力调度如“东数西算”中的应用 场景仍以网络时效性较低的场景如游戏影音制作、人工智能模型训练等冷、温数据为主。目前的 网络连接延迟主要由光纤延迟和路由、转发延迟造成。其中光纤延迟是因为光纤内玻璃折射而降 速为真空中光速的 1/3,约 5ns/m。前文讲到,算力、数据中心呈分布式布局,与用户的距离动辄 两三千公里,时延高达 20~30ms,难以满足时延敏感性业务的需求。根据鹏城实验室主任高文在 中国计算机大会 CNCC2022 上表达的看法,若算力只用作存储而无法处理热数据,其价值无疑会 很低。

网络互联效率成为算力提升瓶颈。在算力供给侧,数据中心存在“1+1 远小于 2”的业界难题。 由于大规模服务器集群依赖于网络实现互联,因此,当多台服务器向一台服务器同时发送大量报 文时,会导致报文数量超过交换机的缓存承受能力而产生丢包。而丢包造成的数据重传,又将极 大地影响计算和存储的效率。