自动驾驶分类、发展历程、技术路线与商业模式分析 - 问答集锦

最佳答案由匿名用户编辑于2025/07/10 10:03

国内车企的端到端技术路线分为两大流派，分别是一段式端到端和分段式端到端。

1.自动驾驶的分类义

自动驾驶的分类：关于自动驾驶的分级，可以参考博世的这张图，它将自动驾驶划分为6个阶段：L0~L5，L0就是人类手动驾驶；L1是“脱脚”，比如定速巡航，可以辅助驾驶；L2是“脱手”，除了脱脚之外还可以脱手，实现部分自动驾驶；L3是“脱眼”，眼睛可以不关注路面，可以在车中玩手机；L4是“脱脑”，可以不用考虑驾驶这件事儿，可以坐在主驾，也可以坐在副驾，这是在限定场景下完成的；L5就是“无人驾驶”，没有方向盘和油门刹车等，在任何场景下都可以进行自动驾驶。

差异：国际标准严格区分自动化等级，将L3/L4直接绑定车企责任，强调企业主导；中国则明确驾驶员在L3/L4级别中的第一责任人地位，但在系统故障或缺陷导致事故时，责任可以向车企或运营主体追偿，更强调安全优先。

2.自动驾驶的历史今生

自动驾驶的关键节点：多传感器和视觉路线并行，L3和L4技术持续迭代。早期探索（2000年代初）：DARPA在2000年代初举办自动驾驶挑战赛，将自动驾驶概念首次转为现实，推动技术萌芽。初步发展（2009-2016）：谷歌2009年启动L4级别自动驾驶项目，特斯拉2016年发布自研Autopilot 2.0，自此形成多传感器和视觉双技术路线。技术突破（2021-2022）：特斯拉2021年推出BEV+Transformer架构，引发同行车企跟随。高速发展（2023-2024）：特斯拉2024年发布FSD v12，端到端架构引入Word Model，华为同年推出无图架构MapTR+Occupancy。未来展望（2025-至今）：理想引入认知模型，小鹏预计2025年年内实现L3上车，特斯拉计划2027年量产3万美元级无人网约车Cybercab。

3.自动驾驶技术路线

自动驾驶技术路线-三个技术层级和对应的技术方案和路线

感知端的技术路线：根据感知方案的分类，可分为以激光雷达为主的多传感器路线和纯视觉路线，算法架构从2D NCC到BEV-Transformer 。决策段技术路线：从规则算法到端到端算法，按照技术架构的不同可分为一段式端到端和分段式端到端。执行端技术路线：从传统执行系统到线控执行系统。

自动驾驶技术路线-感知端方案的分类

感知方案之争：自动驾驶领域的感知方案分类主要围绕传感器配置展开，分别是以激光雷达为主的多传感器路线和纯视觉路线。纯视觉路线主要系以算法突破降低硬件依赖，适合大规模普惠型智驾系统，比如：L3级更多应用于乘用车企业卖车模式，对成本较为敏感。多传感器融合方案以硬件冗余保障安全，适合高阶自动驾驶（L4+）或复杂场景，比如Robotaxi，无人物流这些出了问题会追责运营方的应用，对安全性要求较高。

自动驾驶技术路线-技术架构的两大流派

技术架构的选择：国内车企的端到端技术路线分为两大流派，分别是一段式端到端和分段式端到端。 “一段式”端到端，特点是感知、决策、规划全流程整合为单一神经网络，数据驱动效率高，但需要海量数据和高算力支撑。优势是能应对未定义障碍物，例如突然滚落的轮胎或异形物体，系统可自主生成避让策略。缺点是黑箱问题突出，调试难度大；算力成本高，例如特斯拉FSD V12训练成本达10亿美元。 “两段式”端到端，特点是感知与规控分阶段处理，模块化设计便于优化和验证。优势是降低开发复杂度，适合数据积累不足的车企快速上车。例如小鹏XNGP通过XNet（感知）、XPlanner（规控）、XBrain（认知）三模块协同，实现拟人化驾驶。部分车企（如蔚来）计划逐步从两段式过渡到一段式，通过云端算力提升模型整合能力。

自动驾驶技术路线-感知端的算法架构的重大变革

第一次变革：从2D CNN到BEV+Transformer。特斯拉在2021年首次将BEV+Transformer架构引入自动驾驶领域。BEV （Bird Eys View 鸟瞰图）指的是将摄像头采集的2D图像转换为3D鸟瞰图视角，这样可以让自动驾驶系统更好地理解道路场景。 Transformer是一种强大的神经网络架构，用于处理序列数据（比如时间序列的图像数据），可以帮助系统更好地理解场景中的动态变化。BEV+Transforme就是将BEV视角和Transformer架构结合起来，优势在于可同时融合多个传感器信息，时序信息（让模型有“记忆”），且可以构建一个实时建图能力，减少对高精地图的依赖。

2022年，特斯拉又提出OCC算法 (Occupancy Network, 占用网络)，将算法架构升级为BEV+Transformer+OCC架构。BEV的视角只能获取未知土体的占用方块面积， OCC 引入了高度的信息，可以在矢量空间中产生统一的体积占用数据，可以用来预测通用障碍物的位置。该架构的优点是可以规避一些未知的物体（不需要“认识” 即可“识别”），大幅提升了算法对障碍物体的感知能力，减少corner case。此外，OCC也是一个强泛化能力的算法，也可以用在人形机器人上。

第二次变革：从规则算法到端到端算法。2023年8月，马斯克在直播中首次提到了端到端算法（End-to-End），即把输入（传感器数据）直接到输出（车辆控制信号）的映射，通过神经网络来处理感知，决策，控制任务，减少对人工规则代码的依赖。最开始特斯拉只是将决策层的规则代码都替换成神经网络，直到2023年12月，特斯拉发布的FSD v12, 取消了大约30万行传统的 C++规则代码，完全依赖神经网络进行决策，实现了感知和决策层的端到端。端到端的优势在于减少了每个层级之间信息的损耗，减少人工成本和算力，还能提升算法自主学习能力。但端到端也有存在一些缺点，比如可解释力差（出了问题较难判断是哪个层级出现问题），且落地难度大（需要海量真实数据训练）。端到端算法逐渐形成两大落地形式：分别是显示端到端和隐示端到端。1）显式端到端将原有的算法模块以神经网络进行替代并拼接成端到端算法，是早期量产玩家最青睐的方向，代表的企业有华为、小鹏的分段式端到端。2）隐式即为采用单一神经网络，全流程采用一个多模态基础模型完成的一段式端到端，代表企业为特斯拉、Momenta、商汤科技。

4.自动驾驶商业模式

自动驾驶的商业模式-L3和L4的发展现状

现状：真L3/L4的里程碑：L3=允许驾驶员脱手脱眼，L4=无监控员的无人化运营。截至2025年6月，当前所处阶段而言，全球高阶自动驾驶行业处于L2+级别规模化落地( 真L3未落地）和L4级别限定场景落地（开放道路受限）并行的阶段，L5级别受限于法规和技术，还处在发展早期。

自动驾驶的商业模式-L4四大场景总概况

四大场景的核心需求系：海内外共同应对劳动力短缺（老龄化，少子化）和安全事故频繁问题。四大场景中，Robotaxi因技术门槛高、替代刚需市场（出行）空间最大，是最值得关注的市场；其次是市场空间大，但技术壁垒低，需要关注成本能力的Robovan市场。市场空间，技术，盈利情况排序如下： 1）市场空间排序：截至2030年，全球来看Robotaxi > Robovan > Robotruck > Robobus 2）技术壁垒排序：Robotaxi（城市复杂路况）＞Robotruck（开放场景碎片化）＞Robovan (成本敏感度高）＞Robobus 3）预计实现盈利顺序: Robotruck (封闭场景) > Robovan > Robotaxi > Robobus

自动驾驶的商业模式-L4四大场景技术壁垒

技术壁垒对比：Robobus和Robovan因场景简单，正向低线数激光雷达+纯视觉方案过渡；而Robotaxi和Robotruck因安全要求，激光雷达仍是刚需。激光雷达是否强制，算法和算力的要求也体现了四个场景技术壁垒的差异。

参考报告

海外自动驾驶行业专题：真L3加速推进与L4多场景爆发，海外自动驾驶投资风口.pdf
- 查看报告