算力网络概念及发展现状如何?

最佳答案 匿名用户编辑于2025/01/10 16:00

欧盟积极发展超级计算机,旨在整合欧洲内部算力,推动欧洲信 息技术发展。

当前,以信息技术为代表的新一轮科技革命和产业变革浪潮中, 数字产业化和产业数字化转型升级进度加快,特别是 5G、大数据、 人工智能等新兴技术快速普及应用,全社会数据总量爆发式增长,数 据资源存储、计算和应用需求大幅提升。以新材料、生物制药、基因技术、金融科技、深海空天等为代表的前沿科技和未来产业,对算力 基础设施提出了新要求,特别是对算网深度融合实现算力灵活调度、 高速数据传输的应用需求与日俱增。为回应产业需求,自 2019 年起, 我国三大运营商、通信设备厂商分别提出算力网络、算力感知网络、 计算优先网络等相关技术概念,开启了算网融合方向技术探索的新篇 章。 2021 年 7 月,由中国电信牵头制定的首个算力网络国际标准《算 力网络框架与架构》(Y.2501)在国际电信联盟电信标准化部门(ITUT)会议上审议通过,并于 9 月正式发布。标准中关于算力网络的定 义在业界基本形成共识,即算力网络是一种新型网络,通过网络控制 平台(如集中式控制器、分布式路由协议等)分发计算、存储、网络 等服务节点的资源信息,实现资源优化分配。算力网络中计算资源(如 CPU、GPU、FPGA 等处理能力)与通信网络深度融合,通过“算力大 脑”实现对网络中算力的统一感知、编排、调度。

政策方面,全球各国不断出台政策与投入资金支持算力网络产业 发展。2020 年 11 月,美国政府发布《引领未来先进计算生态系统: 战略计划》,计划构建覆盖政产学研的国家级算力体系。2024 年 7 月, 美国能源部(DOE)发布了一份征求意见书(RFP),计划投入 5 亿 美元开发一台名为 Discovery 的新型超级计算机,以替代当前全球最 快的超级计算机 Frontier。欧盟于 2021 年 3 月发布《2030 数字指南 针:欧洲数字十年之路》,拟到 2030 年累计部署 1 万个边缘计算节点,为 75%的欧盟企业提供云计算、大数据和人工智能服务,让所有 欧盟家庭实现千兆连接。日本 2014 年启动名为“富岳”(Fugaku)的 E 级(百亿亿次级计算)计划,旨在研制国家高性能计算基础设施。 产业方面,国外算力网络的形态主要包括先进计算生态系统、高 性能计算联盟、超级计算机能力网络、数据中心算力调度体系等,其 发展目标一般是为多样化的业务需求提供基础算力支持。

美国一方面由政府部门主导,采用政企合作模式,为各行业技术 创新提供共享的算力和数据资源,以促进相关技术的突破创新。如 2020 年 3 月,美国白宫科技政策办公室、能源部和 IBM 牵头成立新 冠肺炎高性能计算(HPC)联盟,汇聚来自领先科技企业(如亚马逊、 谷歌云)、国家级研究机构和政府组织(如美国宇航局),以及顶尖 学术机构(如麻省理工学院)的算力资源,为研究人员提供超级计算 能力,加速新冠肺炎疫情防控的进程。2024 年 1 月,美国国家科学基 金会(NSF)等 10 个政府机构携手谷歌、Meta、英特尔、英伟达等 25 家科技巨头,共同推出国家人工智能研究资源(NAIRR)试点计 划,为美研究人员和教育工作者提供先进计算、数据集、模型、软件、 培训等支持,推进研究基础设施共享。另一方面,在商业领域,云厂 商、数据中心运营商主导,在全球多地搭建数据中心,打造全球算力 调度体系,为客户提供更便捷的网络与算力服务。亚马逊、谷歌、IBM 等科技巨头均拥有各自的全球网络,如微软全球网络连接 61 个 Azure 区域中的数据中心,在全球范围内部署大型边缘节点网格,满足多样 化的用户需求。Equinix 建立网间互联平台 Platform Equinix、EquinixInternet Exchange 和 Equinix Cloud Exchange Fabric 等多种算力分配解 决方案,为客户建立起跨网络的私有连接,灵活分配算力。

欧盟积极发展超级计算机,旨在整合欧洲内部算力,推动欧洲信 息技术发展。2018 年 1 月,欧盟委员会发起“欧洲高性能计算共同计 划”(EuroHPC),选定了包括保加利亚的索菲亚、捷克的俄斯特拉发、 芬兰的卡亚尼等在内的 8 个国家和地区来建设世界级超级计算机中 心,目前位于芬兰、意大利、卢森堡的世界领先的超级计算机已部署 并投入使用,服务于科学研究、工业创新、公共服务等领域。2022 年, 欧盟对该计划进行升级,宣布投资 80 亿欧元,进一步推动下一代超 级计算技术(包括 E 级计算和后 E 级计算)的研发和应用。 另外,欧盟于 2020 年启动欧洲超级计算机能力网络(EuroCC) 项目,项目覆盖 33 个欧洲国家,旨在将欧洲内部现有的超级计算中 心连接起来,为整个欧洲提供计算能力。2022 年底 EuroCC 项目一期 结束,EuroCC 2 随即启动,继续推动欧盟高性能计算(HPC)、高性 能数据分析(HPDA)和人工智能(AI)发展。

EuroHPC 和 EuroCC 是欧盟在高性能计算领域两大互相关联、 互补的项目,两个项目在资源调度和规划上紧密相关。EuroHPC 提供 高性能计算的基础设施和技术开发,位于战略层,负责制定政策、分 配资金并主导关键技术研发和基础算力设施建设。而 EuroCC 则重 点推行高性能计算的应用推广和算力共享,位于实施层,负责在各成 员国落地高性能计算设施、推动各国技术能力均衡发展,帮助企业和 科研机构获得上述算力资源。EuroHPC 和 EuroCC 结合,形成从技术研发到技术普及的完整产业链,为欧盟高性能计算的发展奠定的基 础。

在国家政策大力支持下,算力网络逐步成为产业发展热点。由“东 数西算”工程牵引,我国已形成算力资源储备充足、算力调度初具规 模、算力交易初现雏形的算网服务体系。在算力基础设施方面,全国 数据中心建设步伐加快。截至 2024 年 6 月,我国在用算力中心标准 机架超过 830 万架,算力总规模达到 246 EFLOPS(FP32),位居世 界前列 1 。随着 8 大国家枢纽节点,10 大数据中心集群建设落地,算 力一体化格局已初步显现。同时,“IPv6+”“全光网”等相关产业快速发 展,我国算力承载网络基础不断夯实。在算力调度方面,算力调度平 台建设进展迅猛。作为算力网络建设的中坚力量,三大电信运营商高 度重视算力网络,积极开展算力网络技术研究,算网融合平台已经从 早期理论构想走向加速建设阶段。除电信运营商外,阿里云、腾讯云 等云厂商,华为、中兴、浪潮等数据中心服务厂商也积极参与算网融 合建设,推动算力网络关键设备研发,优化算网功能、性能。八大算 力枢纽节点均已开始建设各自的算力调度平台。同时,运营商也积极 开展算力调度平台建设,中国电信、中国联通相继发布算力调度平台 “息壤”“星罗”,中国移动牵头打造“百川”算力并网平台。在算力应用 方面,行业赋能效益日益显现。随着我国算力规模的持续扩大,互联 网、大数据、人工智能等与实体经济深度融合,算力应用的新业态、新模式正加速涌现,一方面算力正加速向政务、工业、交通、医疗等 各行业各领域渗透,成为传统产业智能化改造和数字化转型的重要支 点。另一方面,围绕“大算力+大数据+大模型”,智能算力成为全球数 字化转型升级的重要竞争力。

在算力网络技术方面,原创技术不断突破。中国移动突破算力路 由、算力原生、全调度以太网等原创技术,发布软硬一体计算架构、 天元操作系统、天池 SDN、全调度以太网(GSE)DPU 芯片等自主 创新成果。在 2024 年世界移动通信大会上,中国移动发布了全球首 台算力路由器(CATS Router),该路由器具备算力感知、通告、联合 路由功能,打破了传统互联网路由方式,在网络中引入算力因子,解 决算力和网络联合路由的问题,支撑 AR/VR、车联网、AI 推理等时 延和计算敏感型业务需求。中国电信创新算力网关,提出基于 BGP 的 算力网络核心协议 CP-BGP,通过物理硬件和网络操作系统(NOS) 的解耦,让标准化的硬件与算力网络相关协议进行组合适配,同时引 入了基础设施程序员开发工具包( Infrastructure Programmer Development Kit,IPDK)、数据平面开发套件(Data Plane Development Kit,DPDK)等软硬件产品与技术,实现了算力网关产品提供跨平台 的方案部署和性能加速,从而保证了现网可平滑引入算力网关设备。 中国联通提出 CUBE-Net3.0 网络创新体系,并以 CUBE-Net3.0 作为 未来 5~10 年网络转型的顶层架构设计,提出算网一体、云光一体、 确定性服务三大业务使命和一个基于 AI 和数据驱动的管控体系,布 局八大重点科研创新方向,开展自主创新和联合攻关,在此基础上,推出算网设备通用操作系统(CUNOS)、算网模块化交换机(CUSwitch)等技术成果,并持续推进产业链和创新链持续融合。华为 6G 研究团队率先提出基于端边云环境通算融合的移动算力网络架构及 关键技术,在 6G 网络架构的控制层面,引入通信与计算深度协同的 功能、接口和协议,直接通过未来 3GPP 标准化的信令来实现通算融 合甚至一体化,构建出一种开放的机制,整合网络内外的各类算力资 源,并基于网络架构内生的通算融合机制,为 6G 业务创新提供新型 的基础设施。

在算力网络标准方面,技术、安全等相关标准研制工作有序开展。 国标层面,2023 年 11 月,算力基础设施领域国家标准 GB/T 43331- 2023《互联网数据中心(IDC)技术和分级要求》正式发布。行标层 面,CCSA 各标准工作组已立项开展 70 余项算力网络相关标准文稿 和研究报告。算力网络技术方面,TC3 开展针对算力标识、算力路由、 算力度量、算网融合控制等算力网络关键技术的标准化工作,已发布 YD/T 4255-2023《算力网络 总体技术要求》、YD/T 6044-2024《算力 网络 算力度量与算力建模技术要求》、YD/T 6045-2024《算力网络 算力路由协议技术要求》、YD/T 6046-2024《算力网络 算网编排管理 技术要求》等技术标准;TC7 发布了 YD/T 6047-2024《算力网络 运 营管理技术要求》;TC13 研究面向工业互联网园区网络的算力网络 应用场景和部署技术要求。算力网络安全方面,TC8 开展了算力网络 总体安全、数据安全、计算节点安全、算网服务交易安全、算力并网 安全、典型业务安全等标准编制工作;TC5 对算力网络安全需求和关键技术开展相关研究,并印发 SR 434-2023《算力网络安全需求及关 键技术研究》报告。