产品技术、软件生态等构筑英伟达 GPU 核心壁垒。
英伟达图形渲染领域:保持稳定、高频技术迭代,不断实现技术领先,例如 RTX&DLSS 等技术,并和开发者、应用厂商构成稳固的合作同盟。1)2020 年安培架构产品中,RTX 技术升级到第二代,并逐步向第三代 Tensor Core 技术推进,带动 RTX 系列显卡图像运算 能力的全面提升,而 DLSS、Reflex 等能力带动游戏体验的提升,DLSS 2.0 将 FPS 提升 近 30,Reflex 降低 50%的游戏延迟。对于超大型以及精品游戏的运行,大幅提升体验能 力。对于大型 3A 游戏,在高画质条件下需满足 45-90FPS,电竞场景下需要 120-140FPS。 在 GTX 的传统产品线中,开启 RT(光线追踪)之后,游戏帧数从 60 掉至不足 30 帧。但 在 RTX 产品中,可提升至 90FPS 以上。2)鉴于英伟达 GPU 在软件领域的优势显著,公 司 PC 用独显 GPU ASP 亦显著高于竞争对手 AMD。2016 年,英伟达 PC 用独显 GPU ASP 为 81.3 美元/个,AMD 对应 ASP 为 31.0 美元/个。2021 年,英伟达 PC 用独显 GPU ASP 为 163.2 美元/个,AMD 对应 ASP 为 86.6 美元/个。

英伟达数据中心领域:借助 CUDA 实现 GPU 从图形显示到通用计算的跨越,以及产 业生态壁垒的构建,并借助 DSA、NVlink 等架构创新、优化等实现持续性能领先。1)沿 着技术层面的核心差异,我们按照训练&推理、边缘&数据中心两个维度,梳理目前全球主 要的 AI 芯片参与者,整体而言,相较于全球其他主要竞争对手,英伟达在产品完整度、存 量市场份额等层面实现领先,同时我们判断这种领先优势长周期亦将大概率维持。2)从 公司的软件生态布局来看,英伟达构建了从底层到上游细分领域的应用开发软件,可大幅 降低开发者的开发周期。
产品丰富度&技术竞争力:英伟达系统级产品布局、在训练环节的突出表现&领 先优势已基本成为市场的共识,而在推理领域,伴随新一代安培架构、Hopper 架构的升级,以及由此实现的训练、推理的统一,以及对稀疏矩阵运算问题的良 好支持,目前在推理方面,英伟达最新的 A100 芯片的 Int 8 Tops 已经达到 1248, 较上一代提升超过 5X。同时在训练环节,根据 Mlperf 的评测,在图像识别、对 话式 AI、推荐系统等多个模型的对比评测中,英伟达芯片训练性能全面领先华为、 谷歌等主要竞争对手。基于技术层面的全面分析,我们判断英伟达有望在企业对 外服务(训练、推理)、企业内部服务(训练)环节保持持续领先,但在企业内 部服务(推理)仍面临延迟、功耗等层面的明显短板。而我们看到,英伟达在数 据中心市场的产品迭代节奏继续延续既有的习惯,即继续保持对芯片性能的狂热 追逐,以及每两年升级一次产品(CPU、DPU、GPU)的频率。
英伟达基于 CUDA 构建了丰富的软件生态,显著提升 GPU 的易用性。从软件技 术分类来看,公司在软件领域中的产品布局主要分为:基础架构、游戏与娱乐、 应用工具、应用框架四大部分。具体内容如下:(a)在基础架构方面,公司软件 产品主要围绕 AI&通用能力布局。其中 AI 主要包括边缘 AI、AI 垂直领域解决方 案、AI 推理等;通用领域则围绕 IO 传输、vGPU 等。(b)在游戏娱乐方面,公 司的产品布局主要包括 Geforce 云游戏平台、直播领域的 Broadcast App 和元宇 宙领域中的 Omniverse Machinima;(c)在应用工具方面,公司可面向不同的应 用场景(AI、数据分析、元宇宙等领域),提供不同的开发工具。如:在 AI 领域, 可提供加速 AI 部署与工作流程的 NGC 产品;在元宇宙领域,可提供 3D 虚拟协 作的 Omniverse 产品。(d)在具体应用框架方面,主要凭借公司 AI 与数据分析 能力,在自动驾驶、视频分析、推荐系统等各垂直领域提供具体应用框架,帮助 提高各行业运营效率。