云计算加速催生算力服务新范式。
(一)架构方面,云计算支撑算力服务以数据为中心。现阶段计算架构仍以 CPU 为中心,但在算力需求飞速增长与摩尔定律放缓的背景下,CPU 正面临算力算效进一步提升的瓶颈,与当前对其需求日益提升的矛盾逐渐显著,以数据为中心的理念应运而生。
以数据为中心的计算体系,面向管理流计算提供专用计算设备,将 CPU 从复杂的管理流数据处理中解放出来,以更好的让CPU在其擅长的计算领域发挥作用效能,从而实现整体算力提升。云服务商替用户完成管理流与数据流的计算分离,支撑以计算为中心向以数据为中心过渡。当前,产业各界逐渐开始探索以数据为中心的落地方案,如阿里云发布云基础设施处理器CIPU,并将其定位为代替CPU 承担云计算服务管理和加速的关键处理器;云豹智能发布云霄DPU,提出可编程通用 DPU 框架理念,并落地多个应用场景;中科驭数发布 DPU 芯片 K2,能够实现 1.2 微秒低时延和最高200G网络带宽。
以计算为中心向以数据为中心这一过渡变化,促使算力服务形成全新架构,体现在三个方面:一是调度对象方面,面向任务的调度逐渐取代面向资源的调度,用户的计算需求将贯穿算力服务始终;二是能力结构方面,算力管理与计算解耦,灵活性进一步提升,形成相辅相成、共同发展的局面;三是产业格局方面,算力服务生态进一步丰富,数据处理芯片等设备厂商的比重增大,为算力服务的发展注入新动能。
(二)功能方面,云计算持续驱动算力服务创新发展。算力服务中,算力资源从接入到分发给用户产生计算价值,已经形成较为清晰的算力分配链条。云计算的发展促进算力分发链条中感知接入、路由转发和融合调度等方面创新升级。
感知接入方面,云计算助推异构算力泛在接入,加速算力并网演进。随着应用场景的不断丰富,通用计算已难满足日益增长的用户诉求,智算、超算等异构资源需求高涨,如何实现广泛、高效地泛在异构资源调用,成为算力服务演进道路上亟需解决的新问题。在此发展趋势下,产业依托云计算技术加快发展算力并网,通过引入区块链等技术,开发统一规范化的资源接口,实现对于跨地域、跨服务商、跨层级的算力资源的全局纳管与感知接入,打破资源提供商之间的壁垒,形成算力资源一张网,有效促进算力资源的流动。
路由转发方面,云计算打破网络与应用的边界,支撑可编程网络实现算力路由的精准度量。当前,云网业务模式下的算力和网络仍然相对独立,无法完成统一交付,造成大量的资源浪费。以SRv6为代表的网络可编程路由技术能够将业务需求与算力信息随数据包携带进入网络,改变了传统网络只能基于IP 地址的转发模式,充分发挥网络在云边端多级算力资源分布环境下的调度优势,推动算网深度融合。一是提高网络调度精度,网络充分感知业务与资源信息,将需求解构匹配合适的算力资源节点,提高网络基于算力的度量精度;二是优化网络转发路径,结合 SDN 管控与编排能力制定基于全局信息的网络转发策略,实现网络路径可视、可管、可控,提升端到端的网络服务质量;三是增强网络内生算力,网络同时作为计算节点保障业务数据传递效能。网络可编程能力提高了网络计算的颗粒度,实现网络功能的快速调用,提高资源协同效率,支撑算网一体化编排调度。
融合调度方面,云计算屏蔽基础设施架构差异,促进算力服务实现单一资源调度跃升为跨资源协同调度。在全行业数字化转型的浪潮下,围绕单一类型资源提供的服务已经不足以满足企业的要求,算力服务也已经不仅仅局限于算力、网络、存储资源供给如何转变为服务供给,而是逐步发展为一个算力、网络、云计算相关软、硬件技术高度融合、协同运作的新形态。其发展分为两个阶段,第一阶段云计算技术实现了同类型资源内异构基础设施的统一输出,打破了软、硬件一体化的技术壁垒,支撑单一资源灵活调度;第二阶段算力服务以云计算技术为依托,综合考虑用户计算需求、算力、网络等多样资源状态,构建全域一体、算网融合的多要素融合编排体系,完成调度从单一资源到多样资源的跃迁,如中国移动“九天·算网大脑”通过对计算任务、算网资源状态等综合判断形成算网融合编排方案。
(三)模式方面,云计算重构算力服务供需新模式。传统云服务交易模式,主要以使用方与云厂商之间进行“一对一”租赁模式为主,在云计算演进过程中,这种模式的弊端逐渐显露。传统模式下,使用方依靠自身能力决定所选择的云服务类型,云服务商提供资源进行部署,使用方无法感知到周围可能存在的其他更加高效的算力资源。随着云计算的发展,资源提供方与使用方逐渐产生新的诉求,资源提供方更加关注如何使算力资源得到充分利用,而资源使用方则更加关注在多重诉求之下,获得最优算力资源。在此背景之下,全新的算力交易模式应运而生。
交易形式方面,多方参与带来全新交易业态。算力服务更需要一种能够集中各类算力资源并进行统一出售的平台来解决泛在算力资源无法提前感知的问题。平台需要负责多方算力资源的统一接入、编排调度、计费结算等核心环节,是云服务向算力服务演进过程中的全新角色。在此多方参与的模式下,算力交易产业链将会涉及更多的角色,除企业、服务商、个人等成为算力供给方或需求方之外,提供调度、安全、连接等能力的技术提供商也将参与进算力交易产业链中,为算力交易带来全新业态。
提供方式方面,编排调度技术成熟促进计费模式走向“后付费”。以往云服务交易方式多采用为使用者提供指定规格计算资源,使用者先付费购买,后进行使用,在此模式之下,由于资源使用者对云计算了解程度、使用程度参差不齐,易出现所购资源利用不充分,闲置资源不能及时释放、调度等问题,从服务质量方面来看,易导致使用成本高但使用效率低。随着云边端部署方式的发展,以及算力调度、资源弹性伸缩等技术的成熟,目前资源提供方式开始从提供固定规格计算资源的形式走向依据具体任务场景,灵活调整资源使用量的方式。并随之出现按照资源消耗量、资源占用时间、或当日当月峰值等进行计费结算的新型交易模式,此种模式更加关注资源的弹性伸缩与高效利用,能够有效提高算力基础设施的利用率。
交付内容方面,算力资源云化部署程度加深,促进交付内容由资源转变为结果。随着算力资源上云用云、云化部署程度加深,算力服务交付内容开始逐渐在交付算力资源的基础之上,转变至根据使用者的计算任务交付计算结果的新模式。算力交易平台通过对计算任务的拆解、标识、度量,对计算资源的感知、调度、池化等操作,能够将任务调度至目标算力节点完成计算,向使用者直接交付计算结果。在此模式之下,由算力交易平台完成任务度量、资源度量、资源匹配等操作。对于使用者来说,无需关注底层资源,交易过程更加直观便捷;对于资源提供方来说,算力资源释放回收更加及时,从多方角度都能够有效提升算力交易的服务质量与体验,促进算力交易商业模式走向智能化、合理化。