我将从以下几个方面对英伟达在 AI 芯片领域 的综合竞争力进行系统分析和探讨。
产品布局:端到端、训练推理一体、软件全栈。目前在 AI 领域,英伟达的对应业务 主要包括数据中心、自动驾驶两个领域,自动驾驶属于针对特定应用场景的边缘推理范畴, 我们暂不做讨论,我们主要聚焦于英伟达的数据中心业务。而在数据中心的业务布局,英 伟达基本遵从:端到端、训练推理一体、软件全栈的业务布局思路,相关产品从底层向上, 主要包括 AI 芯片(训练、推理)、网络(芯片互联、设备互联)、基础软件框架&应用软件 等。
AI 芯片:工艺、DSA、新数据精度类型等,实现系统级最优。目前 AI 模型对算力的 需求增速远远高于摩尔定律,以及芯片自身的性能提升速度,芯片的设计,是一个系统性 工程,需要算法模型、软件和硬件层面的共同协同,以实现系统效率的最大化。目前英伟 达 GPU 产品,从 2018 年的图灵、到 2020 年的安培,以及 2022 年的霍普,芯片架构保 持每两年一次的更新迭代节奏,并通过制程、DSA、新的数据精度引入等系列手段提升芯 片的计算性能。以英伟达 Hopper 架构为例:1)工艺提升带来计算频率提升,以及同等 Die 面积下计算单元数增加;2)领域专用架构(DSA)设计带来性能提升,Hopper 架构 引入 Transformer 计算单元;3)引入新数据精度类型,用低精度来代替高精度单元, 比 如 Hopper 引入 FP8 等。系列的举措亦使得英伟达芯片,无论是在训练,抑或是推理环节, 均在若干主流的基准测试中,性能参数持续领先主要竞争对手。

计算芯片组合:GPU+CPU+DPU。GPU 本身并非图灵完备的产品,需要依赖于和 CPU 等计算芯片的配合,目前全球主要逻辑芯片厂商(英特尔、AMD 等)均倾向于在数 据中心领域提供一体化的芯片解决方案,英伟达亦不例外。目前英伟达整合 Mellanox 技 术之后形成的网络芯片 DPU 已经量产上市,同时基于 ARM 架构的高性能计算 CPU(主 要和 GPU 配合使用)也有望在 2023H2 大规模量产上市,CPU+GPU+DPU 的产品组合, 叠加英伟达在网络、软件层面的突出优势,有望进一步强化英伟达在数据中心 HPC 领域 的竞争优势。
网络技术:NVLink、InfiniBand。面向复杂 AI 模型的训练、推理,需要更多依赖于 GPU 卡、硬件集群,因此,低延时&高速的芯片互联、设备互联显得尤为重要,在芯片互 联环节,英伟达具有引以为傲的 NVlink 技术,目前该技术已经进化到第四代,芯片间能够 实现超过 800GB/S 的数据吞吐。设备间互联部分,英伟达 2020 年完成对网络芯片&技术 提供商 Mellanox 的收购,Mellanox 作为全球 InfiniBand 网络的领导者,相较于以太网, IB 网络能够在数据中心内部实现设备间的高速、低延时互联,是 HPC 的最理想承载者。

软件堆栈:从底层框架到应用场景、训练推理一体。目前英伟达在软件领域中的产品 布局相对较广,涵盖了从最底层的驱动程序,到最上层的行业应用程序、算法库等。可简 单分类为:底层套件、应用工具&应用框架两大部分。1)底层套件,主要用于帮助用户降 低芯片&硬件使用门槛,提升易用性、通用性等,主要产品包括:面向 GPU 领域的 CUDA、 面向 DPU 领域的 DOCA 等,本身旨在提升芯片本身的通用性、易用性,同时在推理环节, 英伟达亦具有 tensorRT 等框架,实现训练、推理的端到端部署。2)应用工具,为英伟达 面向各细分领域、应用场景推出的应用解决方案,包括 Omniverse(元宇宙)、AI Enterprise (企业 AI 框架)、Drive(自动驾驶)等。CUDA 等构建的生态优势,以及从训练到推理的 端到端软件产品解决方案,预计中短期仍将持续构成英伟达最为主要的护城河之一。
英伟达有望在 AI 训练、推理(云端)环节持续保持主导性地位。依托产品性 能、芯片组合、网络技术、软件产品等层面的综合优势,以及由此形成的端到端、训练推 理一体、全栈式的解决方案,使得英伟达持续引领全球 AI 市场。据 Liftr Insights 数据,目 前在 AI 技术进展最为前沿的北美数据中心 AI 芯片市场,英伟达份额占比超过 80%,且在 训练、推理环节均保持持续领先。英伟达在训练环节的综合优势,市场本身没有太多分歧, 市场当前分歧主要在于推理环节,主要理由在于:1)推理环节相较于训练环节更低的门 槛,主要体现在计算精度、算力消耗量等方面;2)英伟达 GPU 本身在功耗、延时等层面 并不占优。AI 推理主要包括云端推理、边缘推理(边缘节点或终端)两种情形,英伟达在 边缘推理环节的确不具备压倒性优势,但在云端推理环节,从基本的认知逻辑出发,英伟 达大概率仍将是最具有竞争力的参与者。同时我们看到,在商业操作上,英伟达亦在采用 更为务实的策略,即通过和云计算厂商的合作,为企业客户提供 AI 算力服务,该种合作模 式类似于数据仓库领域的 Snowflake 和 AWS 等云计算平台的合作。