英伟达全栈方案核心看点在哪?

最佳答案 匿名用户编辑于2025/10/22 15:17

从云端到边缘的物理AI 生态。

英伟达构建训练-仿真-部署的完整技术栈,推动物理 AI 规模化落地。云端训练:从世界基础模型到合成数据工厂。Cosmos 平台整合世界基础模型(WFM)和生成式 AI,生成符合物理规律的3D 环境。人形机器人和自动驾驶汽车等新一代 AI 机器人依赖于高保真、物理感知的训练数据。如果没有多样化且具有代表性的数据集,这些系统将无法获得适当的训练,并且由于泛化性差、对现实世界变化的影响有限以及边缘案例中的行为不可预测,因此会面临测试风险。收集大量真实数据集进行训练成本高昂、耗时费力,而且往往受限于各种可能性。NVIDIA Cosmos 通过加速世界基础模型(WFM)开发可加快合成数据的生成,并作为后训练的基础,以开发下游领域或特定任务的物理 AI 模型。 Cosmos Transfer WFM 根据结构化输入生成高保真世界场景,确保精确的空间对齐和场景构成。通过采用 ControlNet 架构,Cosmos Transfer 可保留预训练知识,从而实现结构化、一致的输出。它利用时空控制图来动态对齐合成和真实世界的表示,从而实现对场景构图、对象位置和运动动力学的精细控制。借助生成式 AIAPI 和 SDK,NVIDIA Omniverse 可加速物理 AI 仿真。开发者使用基于OpenUSD 构建的NVIDIA Omniverse 创建 3D 场景,以准确模拟现实世界环境,从而训练和测试机器人和自动驾驶汽车。这些模拟可作为 Cosmos Transfer 的真值视频输入,并与标注和文本指令相结合。Cosmos Transfer可在改变环境、照明和视觉条件的同时增强逼真度,从而生成可扩展的多样化世界状态。

GR00T 模型家族:英伟达开源的 GR00TN1.5 模型支持自然语言指令和环境自适应,其更新版GR00TN1仅需 36 小时即可完成训练(传统方法人工收集数据需 3 个月),在工业物料分拣中任务成功率提升至85%。GR00TN1 是全球首个通用人形机器人开放基础模型,标志着机器人和 AI 领域的重大突破。GR00TN1 基于受人类认知启发而构建的双系统架构,统一了视觉、语言和动作,使机器人能够理解指令、感知环境,并执行复杂的多步骤任务。

DGX 超级计算机:提供 PFlops 级算力,支撑多模态大模型训练,例如特斯拉 Optimus 的单一神经网络同时处理家务和工业搬运任务。NVIDIADGX™超级计算机采用 256 个 GH200 芯片的集成设计,为生成式AI等高复杂度计算任务提供大规模算力支持。搭载 Blackwell 架构的 Grace Blackwell 超级芯片,通过NVLink 技术实现 CPU+GPU 内存一致性,FP4 精度下推理性能提升显著,支持物理AI 系统的实时决策(如自动驾驶路径规划)和机器人运动控制(如毫秒级机械臂响应)。第二代Transformer 引擎优化多专家模型(MoE),加速复杂动作序列的训练与推理,例如在机器人抓取任务中,通过DGXStation 可将模型迭代周期从数周缩短至小时级。此外结合 Cosmos 世界基础模型和 IsaacGR00T 合成数据生成库,DGX 可模拟真实物理环境,生成包含视觉、触觉、运动学的多模态训练数据,例如通过Omniverse 构建工厂数字孪生,加速机器人避障算法的泛化能力。机密计算技术(TEEI/O)确保机器人在工业场景中处理敏感数据(如医疗机器人患者信息)时的安全性。在边缘端,DGX 提供云协同与生态支持:从DGXSpark(桌面级 2000 亿参数模型本地运行)到 DGX SuperPOD(支持万亿参数模型分布式训练),DGX提供从原型开发到大规模部署的全流程算力支持。全栈软件套件(如 NeMo 框架、NIM 推理微服务)和NGC目录中的预训练模型(如 GR00T 机器人控制模型),进一步降低开发门槛,实现从仿真到边缘部署的无缝衔接。在安全性与可靠性方面:智能 RAS 技术通过 AI 预测硬件故障,减少停机时间;机密计算功能在加密模式下吞吐量接近未加密水平,保护机器人模型和传感器数据的完整性。例如,医疗机器人在处理患者影像时,可通过 TEE 确保数据隐私,同时保持实时分析效率。

英伟达仿真验证方案可以实现物理精度与实时交互的完美结合。机器人策略训练面临两大关键挑战:收集真实世界数据的高昂成本和“现实差距”,即仅在仿真中训练的策略通常无法在真实物理环境中表现良好。仿真与现实协同训练工作流通过将少量真实机器人演示与大量仿真数据相结合来解决这些问题。这种方法有助于训练可靠的策略,同时有效降低成本并弥合现实差距。IsaacSim5.0:基于Omniverse的开源仿真框架,支持刚体动力学、传感器仿真和多机协同。例如,Agility Robotics 通过IsaacSim优化 Digit 机器人的物流搬运路径,效率提升 30%。Isaac Lab:开源机器人学习框架,简化强化学习、演示学习等工作流。例如,德国博世集团采用 Isaac Lab 将新产品装配的示教时间从40 小时缩短至4小时。Sim2Real 迁移技术:通过域随机化(Domain Randomization)和视觉风格迁移,缩小虚拟与现实的差异。

英伟达边缘部署方案:从 Jetson 到机器人本体的算力下沉。NVIDIA Jetson™平台提供用于开发和部署AI 赋能机器人、无人机、IVA 应用和自主机器的工具,助力这场变革。在边缘生成式AI、NVIDIA Metropolis 和 Isaac™平台的支持下,Jetson 提供可扩展的软件、现代 AI 堆栈、灵活的微服务和API、生产就绪型 ROS 软件包以及特定于应用程序的 AI 工作流。NVIDIA JetsonOrin™系列包含7 个具有相同架构的模组,可提供每秒高达 275 万亿次运算(TOPS)的算力,软件堆栈包含预训练的AI 模型、参考AI工作流和垂直应用框架,可加速生成性 AI 的端到端开发,以及边缘 AI 和机器人应用。

英伟达人形机器人三台计算机解决方案。一台 NVIDIAAI 超级计算机—NVIDIA DGX™搭载NVIDIA H100或B100 处理器—用于训练强大的生成式 AI 模型和机器人基础模型。一台 NVIDIA OVX™计算机,搭载NVIDIA RTX™GPU,用于合成数据生成、机器学习和仿真测试以及基于 NVIDIA Omniverse™构建的仿真框架,如 NVIDIA Isaac Sim™and Isaac™ Lab。一台安装在机器人本体上的实时计算机,比如NVIDIAJetson Thor™—构建于 NVIDIA Blackwell 架构之上—可以运行低延迟和高吞吐量推理。

物理 AI 正在重塑机器人训练的底层逻辑:从依赖真实数据的“经验主义”,转向基于物理规律的“理性主义”。英伟达通过全栈技术方案,构建了从云端训练到边缘部署的完整生态,推动物理AI 从实验室走向工业、医疗、家庭等场景。未来,随着具身智能大模型与边缘计算的结合,机器人将逐步渗透至人类活动的各个领域,最终实现“像人类一样思考,比人类更高效执行”的终极目标。这场物理与智能的融合革命,不仅是技术的突破,更是人类与机器关系的重新定义——机器人不再是工具,而是理解物理世界、解决复杂问题的合作伙伴。 综上所述,物理 AI 有望迎来技术突破、场景落地与生态协同的三重驱动,充分受益机器人训练规模化应用的确定性机遇。国内相关公司如索辰科技“天工・开物”物理 AI 平台融合CAE 仿真与数字孪生技术,可将机器人动作优化周期从数周缩短至小时级,同时通过并购力控科技打通“感知-模拟-决策”闭环。