2025年理想汽车研究报告:如何看待理想汽车在AI的布局?

1. 如何看待理想汽车在 AI 的布局?

李想在理想 AI Talk 中,表明理想汽车将 AI 作为未来的核心战略。李想认为,未来 的理想汽车要做的不仅仅是汽车的智能化,而是人工智能的汽车化。理想汽车将通过 自研的基座大模型,将理想同学和高阶智能驾驶作为实现空间智能的主要方式,拓展 智能商业和智能工业,同时为“硅基家人”这一命题做充分准备。 理想汽车的 AI 发展过程,主要分为三个阶段:增强能力阶段、成为助手阶段、硅基 家人(Agent)阶段。增强能力阶段,更注重于辅助性工作,尚无法对结果负责;成 为助手阶段,即可以接收多个连续任务,同时可以为结果负责;硅基家人阶段,不再 需要接收指令和任务,即可以完成对应的工作。

复盘智能手机的发展历程,用户体验成为智能化渗透率提升的核心变量。2010 年苹 果发布 iPhone4,iPhone4 首次采用了“玻璃+不锈钢+玻璃”的结构,“三明治结构” 的设计使得 iPhone4 外观更加方正、整齐,四角圆润过渡;硬件上,前视摄像头、A4 芯片、后摄像头像素升级等是 iPhone4 升级的主要改变;同时,iOS 正式发布,软件 定义能力和生态打通成为 iPhone4 成功的又一主要因素。总结来看,iPhone4 通过结 构创新、硬件升级和软件生态的配合,充分满足用户体验,开启智能机的浪潮。智能 机对传统手机的替换本质是用户体验的替换。AI 发展过程中,需要进入“Agent 阶 段”,体验升级带来用户体验的转变才会进入“iPhone 4 时刻”。理想汽车当前加速 布局 AI,希望在智能驾驶、空间智能等多维度提前获得“门票”。

1.1 智能驾驶:端到端+VLM 实现 L3,世界模型探索 L4

从理想汽车关于 AI 布局的三阶段来看,增强能力阶段、成为助手阶段、Agent 阶段 分别对应智能驾驶中的 L3/L4/L5 功能。理想汽车当前版本采用端到端+VLM 的双模型 架构,预计 2025 年完成 L3 智能驾驶功能的上车。未来,理想汽车有望将视觉语言模 型 VLM 部署到车端芯片,让自动驾驶具备了应对未知场景的逻辑思考能力,通过更 强的认知和思考能力实现 L4 智能驾驶。

当前车端模型:端到端+VLM 模型是 L3 主要解决方案。在计算过程中,端到端大模型 输入数据为传感器信息,输出结果为规划路线结果,在评价过程中难以确定模型学习 的准确性,即目前仍处在探索端到端大模型能力上限的阶段。理想汽车补充 VLM 模 型,通过收集 rule-based 成果,让端到端大模型有“参考答案”。VLM 模型架构与 rule-based 车端落地方式基本一致,将过去研发人员完成的规则制定装入模型中, 成为端到端大模型的“参考答案”。整体架构来看,双系统设计类似于人类大脑的慢 速和快速思维过程,类似于使用“参考答案”实现功能,可以有效地适应各种复杂的 驾驶场景。

L3 到 L4 升级的过程中,对MPI 要求更高,模型升级路径或放弃 Learning by Watching 的模式。目前处于 L3 到 L4 升级的关键节点。其中,MPI 数据的优化(Miles Per Intervention,每两次人工干预之间行驶的平均里程数)成为技术迭代的核心参数指 标,当下 MPI 仍处 200km 以下水平,仍需要较长的优化过程。MPI 的提升本质是安全 性的提升,在正常运行环境下需要保证接管次数的下降和执行效率的提升,同时极端 环境中仍需要保持稳定。对应路径来看,当下仍采用 Learning by Watching 的方式, 即模仿人类行为完成驾驶的高阶动作。Learning by Watching 存在几个缺陷:(1) 以行为为导向的学习模式,无法深入理解人类驾驶员思考和习惯,单纯的行为模仿或 无法形成逻辑和数据的闭环。(2)目前传感器数据无法达到人类对驾驶的判断,包括 听觉、平衡性感知等。(3)Corner Case 存在无限性,长尾数据无法充分识别并建立 对应的场景机制,车辆的思考能力是面对长尾数据的主要解决方式。(4)人类对智能 驾驶的需求是要超越人类的驾驶能力,而非简单模仿,同时要求智能驾驶在更复杂的 场景中实现更好的效果。

Learning by Practicing 或成为后续主要迭代方向,到 L4 车辆或具备“智能体”的 能力。Learning by Practicing 中,生成式的视觉模型是构建世界模型主要方法, 通过模型预测生成视觉方式完成车辆世界认知构建,并具备预测生成能力。车辆具备 对未来预测的能力和判断能力,在准确性提升后保持高阶功能的安全性。

世界认知模型:Learning by Practicing 主要训练方向,或成为实现 L4 的主要解决 方案。原始图像空间中学习世界模型并不适合自动驾驶,(1)交通灯、标识牌很容易 在预测图像中被遗漏;(2)数据转化需要较长的时间和过程。世界模型将世界建模与 模仿学习相结合,作为辅助任务实现数据集中样本复杂度的降低。同时,世界认知模 型通过分解的世界模型和奖励函数来丰富静态数据集的标签,通过动态规划优化标 签。世界认知模型可以认为是端到端大模型的“教材”,用标准化的内容帮助大模型 完成世界认知和数据信息的构建,成为智能驾驶端到端大模型迭代的核心一环。同时 在未来 Learning by Practicing 的训练模式中,通过世界模型提高模型的认知能力 或成为实现 L4 智能驾驶的关键。

1.2空间智能:Mind GPT 3.0 即将发布,理想同学多端应用

从理想规划的 AI 三阶段来看,增强能力阶段、成为助手阶段分别对应 ChatGPT 的 3.0 和 4.0 版本,ChatGPT 尚未达到 Agent 阶段。复盘 Chat GPT 的发展历程来看, 2018 年 ChatGPT 1.0 首发,基于 5000 万篇文章进行训练,参数规模 1.17 亿,可以 生成有一定质量的文本;2019 年 ChatGPT 2.0 发布,参数规模 15 亿,能够捕捉更复 杂的语言模式和结构;2020 年 ChatGPT 3.0 发布,参数规模 1750 亿,能够捕捉到语 言中的细微模式和复杂的结构,在语言任务中表现出色,能够处理包括文本生成、翻 译、摘要、问答等在内的多种语言任务,具备“增强能力”的特征。ChatGPT 4.0 预 计将在语言理解的深度上实现新的突破,能够更准确地捕捉语言的细微差别,包括语 境、语义和情感等复杂性。从行业进展来看,ChatGPT 3.0 发布带动了谷歌、百度、 英伟达、Meta 等优质科技企业推动自然语言大模型发展。

理想汽车 Mind GPT 多次迭代,目前预训练数据规模已达到 10 万亿 Token 级别,与 ChatGPT2.0 接近。理想 Mind GPT 共经历了三代。(1)第一代:2023 年 4 月,Mind GPT 1.0 发布。2023 年底随着 OTA 5.0 上车,是最早的车端语言大模型。(2)第二 代:2024 年中 Mind GPT 2.0 发布,模型效果、训练效率和推理效率均有提升。模型 架构上调整为 MoE(混合专家模型)加 Transformer 的结构,模型规模翻倍但推理成 本与 Mind GPT 1.0 基本保持一致。(3)第三代:Mind GPT 3.0。Mind GPT 3.0 强化 了语言模型。未来,Mind GPT 将有望从语音、视觉、语言等多模态实现融合,能够 理解不同的模态,在一个模型内完成从感知到认知再到表达的完整能力。

智能座舱:语言交互类大模型加速上车,充分补充语料库和自然语言处理能力。理想 同学扩展至手机端,具备知识问答、看世界、思考过程的能力,在空间智能领域和语 料库积累上逐步追赶华为、小米等手机厂商。

1.3 智能拓展:智能工业和智能商业有望持续扩张

智能工业:理想全栈自研了智能制造系统、视觉算法、设备、质量预测模型等,驱动 提高制造效率,快速迭代生产技术,达成更高生产效率和产品质量。以理想智能工厂为例,通过 Li-MOS 系统,理想汽车的生产系统与销售系统实现了紧密集成。当系统 接收到销售端的多车型整车订单及中长期预测后,便会自动排产,生成精确到工位、 细化到排序的整车生产计划,并通过 LI-SCM 系统自动向供应商发送物料采购计划。 从需求到采购订单全过程无需任何人为干预,在保证物料齐套的同时,大幅度提高业 务效率,MRP 准确率达到 100%。理想汽车工厂完成生产销量提升、产能稳定性升级, 同时缩减新建产能的时间和成本。

智能商业:理想通过大模型技术与商业领域数据和知识的深度结合,构建了一批具备 零售、营销、客服、金融反欺诈、财经分析等能力的 AI 助手。 从目前理想 AI 的进展来看,2025 年或全面进入增强能力阶段。理想空间智能、智能 驾驶即将进入增强能力阶段,同时智能工业有望为理想后续销量增长提供生产保证, 智能商业有望打开合作版图和合作空间。

2. 面对 AI,理想的机遇与挑战几何?

影响 AI 能力的三要素主要包括数据规模、算力规模、模型能力,我们将从这三个方 面观察理想汽车在不同发展阶段需要的战略资源,以及面向不同竞争对手,可能遇 到的机遇与挑战。Learning by Watching 阶段,AI 模型三要素中数据规模是影响模 型结果的主要变量。Learning by Practicing 阶段,由于世界模型需要更强的覆盖 面和认知能力,意味着车企需要更强的开发能力和模型设计能力。第一阶段,车企需 要完成算力、数据等基础能力建设,第二阶段,核心人才储备成为 AI 车企主要竞争 方向。同时,参考智能驾驶研发体系,在数据规模、算力规模、人才储备等核心要素 快速扩张过程中,研发支出或成为主要财务指标,同时盈利能力、经营性活动现金流、 Capex 等财务数据同样具有参考意义。

复盘历史来看,理想逐步将 AI 升级成公司核心战略。2018 年前后,理想则加快了在 AI 领域的布局。2020 年初,理想着手构建技术平台化,主要包括智能驾驶平台 AD 和 智能座舱平台 SS,推动人工智能技术的研发和应用。2022 年 9 月,理想将 AI 提升 至战略层,在内部将发展 AI 确立为战略核心,确定要把人工智能作为真正重要的方 向,成为未来研发关键。2023 年 4 月,理想智能战略随“双能战略”正式对外公布。

理想 AI 人才储备:郎咸朋、贾鹏等深度耕耘智能驾驶,陈伟负责 Mind GPT。郎咸朋 作为理想汽车智能驾驶副总裁,贾鹏作为理想智能驾驶技术研发负责人,在 2023- 2024 年完成有图智驾、先验信息 NPN、无图智驾、端到端架构等多维度的升级,同时 提出了端到端+VLM 架构的应用。陈伟作为理想汽车 AI 首席科学家,带领空间 AI 团 队实现了 AI 核心算法切换,并让理想同学成为空间交互的主入口。

2.1 高阶智驾:理想 AI 战略立身之本,处于相对领先地位

当前智能驾驶架构(Learning by watching 阶段)下,数据和算力规模是影响功能 的重要参数。车企智能驾驶端到端大模型作为智能驾驶行业未来发展的核心方向,一 方面,需要重点关注车企智能驾驶功能的迭代和测试的进展,消费者使用意愿和支付 意愿的加速或成为开启下一轮智能驾驶迭代的关键;另一方面,域架构/中央计算架 构车型保有量、算力建设情况、云端投入情况是重要的外部指标,充分佐证车企智能 驾驶端到端大模型的数据生产、存储和训练能力。同时,车企的研发支出(包括研发 费用和研发成本)成为端到端推进的重要保障。

理想汽车积极布局高阶智能驾驶,2023 年进入加速发展期,城市 NOA 覆盖数量快速 提升。同时从理想智算中心算力规模来看,在 2023 年 6 月至 2024 年 9 月的 15 个月 期间内,从 0.75eflops 提升至 5.39eflops,预计 2024 年度或超过 8eflops,实现 10 倍以上的增长。横向对比来看,理想汽车在车企中保持了算力规模的领先。

智能驾驶里程数据:新增智能驾驶有效里程=车型销量*智能驾驶付费率*单车单日行 驶里程数,理想在累计里程上保持国内领先。智能驾驶有效里程可以拆分为当前存量 数据和新增智能驾驶有效里程两部分。存量数据来看,特斯拉 33 亿公里数据领跑, 国内数据规模来看理想保持领先,截至 2024 年 7 月已超过 19 亿公里。

研发费用对比来看,理想国内 AI 车企保持领先。研发过程中,除去核心研发人员工 资,IDC/AIDC 投入是智能驾驶 AI 研发的关键。特斯拉、理想、小鹏、蔚来等 AI 车 企研发费用均保持较高水平,2023 年费用分别为 281.1/105.9/52.8/134.3 亿元,研 发费用率分别为 4.1%/8.5%/17.2%/24.1%。AI 车企需要未来通过多维度使用模型和 算法的训练成果实现研发费用的均摊,同时针对不同场景和新数据的泛化能力成为 研发的又一重点方向。

理想汽车搭载高阶智能驾驶的销量领先,占比显著提升。新势力车企 2024 年交付数 据来看,理想汽车交付 50 万辆,领跑新势力车企。从高阶智驾车型销量来看,理想 Max 版本车型自 2024 年 3 月起从 30.8%逐步提升,至 2024 年 10 月 Max 车型占比为 48.4%,高阶车型占比显著提升。

2.2 具身智能:扩大场景和用户基数,同时面临更强大竞争对手

理想 AI 第二阶段:具身智能,更多表现形式拓展使用边界和用户数量。 拓展世界模型的使用边界成为未来理想 AI 开发和应用的主要方向,通过应用场景、 适用范围的扩大实现使用人群的扩张。人形机器人和车具有数据互通性,从 Occupancy Network 的使用情况和应用效果来看,人形机器人和汽车均采用像素化模 式完成场景构建。世界模型完成构建后,通过泛化和场景区分有望实现人形机器人数 据与车端数据的打通,同样使用视觉生成模型、针对预测生成场景进行训练和迭代, 场景多元化和模型的泛化成为未来实现人形机器人大规模应用的核心驱动力。

边界拓展可以保证 Capex 和研发费用的摊薄,同时增加用户和端口数量保证使用人 数的增加,增强数据回收能力和数据类型。车端语言交互类大模型加速上车,充分补 充语料库和自然语言处理能力。车端应用情况来看,国内车企语言交互类大模型应用 领先,应用场景逐步实现车机系统/手机/AIOT 的打通,车企自然语言的语料库逐步 完善。

具身智能作为理想 AI 应用的第二阶段,竞争对手数量提升,能力边界差异明显。第 二阶段,理想需要面对更多 AIOT、整车厂、机器人等相关公司的竞争,竞争对手数 量和实力比智能驾驶阶段更强。

主要竞争对手中,包括华为、小米、百度、比亚迪等,从历史用户的积累、产品线的 布局等因素看,竞争能力更加强大。AIOT 方面,华为、小米、百度等互联网公司受 益于智能家居产品的布局和软件生态的完善实现数据规模和用户规模的领先。其中, 小米在全屋智能、语音控制等方面保持优势领先。比亚迪等传统整车厂具备强劲制造 能力,在后续规模拓展的进程中具备更强的产能优势和制造能力。

当前,理想同学 APP 的应用或成为理想增强数据流入的入口。手机 APP 的开发和应 用或成为内容和 Mind GPT 优质语料的主要来源。

2.3 AGI:更大的资本开支,向头部科技企业看齐

理想 AI 第三阶段:AGI,从使用者到研发者的转换,向领跑者看齐。 第三阶段,理想或需要面对海外和国内头部科技企业的直面竞争。海外企业包括 Meta、 微软、谷歌、亚马逊、苹果、特斯拉等,国内企业包括华为、字节、腾讯、阿里等。 从海外企业 2023 年资本开支及 2024 年预测来看,AI 支出仍保持较高水平。国内企 业字节跳动预计在 AI 基础设施上投入数十亿美元,以完成高阶功能的落地。第三阶 段,理想后续车型销量、在手现金情况及经营现金流情况将影响 AI 投入力度和进展。

日活用户数量成为 AGI 阶段重要参数指标。主要 AI 产品 MAU 均超过千万人,其中字 节的豆包、谷歌 Gemini、百度文小言等均有良好 MAU 表现。理想 AGI 竞争或存在较 大压力。

从国内外科技巨头的财务数据看,高收入、高盈利和高研发是共同特征。2023 年财务数据来看,国外科技企业收入超过 1000 亿美元,净利润均超过百亿美元。投入方 面来看,研发费用、CAPEX 均保持百亿美元以上规模。

AI 之于理想,挑战与机遇并存。理想 AGI 或成为车企差异化主要方向,有望重塑公 司商业模式,打开未来收入增长。当下时间点,我们认为理想需要:(1)车型销量稳 步向上,交互硬件数量持续增长;(2)理想同学 APP MAU 稳步增长,增加数据获取来 源和数据获取规模。在充分保证公司盈利能力、在手现金充裕的条件下,加速 AI 研 发投入,扩大/保留核心 AI 人才队伍,或实现 AI 业务三步走的稳步向前。 理想计划于 2025 年推出三款纯电 SUV,预计分别命名为 i7、i8、i9,以对应现有增 程产品序列的 L7、L8、L9,进一步完善中大型 SUV 产品矩阵。新车型预计采用 800V 架构,支持 5C 超充,为用户带来更加便捷的充电体验。

2024 年理想累计销量 50 万辆。随着 2025 年理想新车上市,我们预计 2025 年理想增 程平台车型销量有望突破 50 万辆,纯电平台受益于新车上市有望突破 15 万辆销量。 我们预计 2025 年理想实现销量或超过 65 万辆。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告