2025年人形机器人行业专题报告：人形机器人赛道深度之运动控制，制约商业化落地进程的关键环节

西部证券2025/06/26
举报

人形机器人概述

人形机器人行业概述

定义：人形机器人，又称仿人机器人或类人机器人，是指具有仿人的形态和功能的机器人，具备一定的感知、学习和认知能力。特征：高度仿人的外形结构：拥有与人类相似的躯干、四肢和头部。腰部灵活，可轻松实现转身、弯腰等动作。手臂的肩部、肘部和腕部关节活动范围大，能完成复杂的伸展、抓取和操作任务；腿部的膝关节和踝关节使机器人能够稳健行走，步伐节奏与人类相近。手部通常具有多个灵活的手指，可实现精细的抓握动作。强大的环境感知能力：配备多种先进的传感器，包括视觉、听觉、触觉等，能够全面感知周围环境信息。智能决策与学习能力：借助计算机科学和人工智能技术，它们能够对感知到的大量环境信息进行快速分析和处理。当面对复杂的任务时，人形机器人会根据预设的算法和模型，结合实时的环境信息，制定出最优的行动方案。它们还能通过机器学习算法，从过往的经验中吸取教训，不断优化自己的行为。应用场景：当前人形机器人主要应用于医疗护理、家庭服务、教育娱乐、工业生产和公共服务等领域中，替代人类完成危险或重复性高的工作，进一步释放劳动力，提高社会生产力。

人形机器人产业面临的挑战

技术挑战：数据采集与标注复杂且成本高昂：特别是人类动作数据的收集，需要高精度的传感器和专业的标注团队来确保数据准确性。多模态信息融合鲁棒性与实时性不足：将视觉、听觉、触觉等多种信息有效融合以形成统一的环境认知，在鲁棒性和实时性方面仍有不足，尤其在复杂多变环境中，机器人难以准确理解和应对变化。自主学习与适应性不足：现有机器人虽能进行一定程度的自主学习，但在处理未知或复杂任务时，适应性和泛化能力不足。需要更有效的学习算法以从少量样本中快速学习并适应新环境。学习过程中的安全问题：需要确保机器人在学习过程中不会产生偏差或做出有害行为。能源效率与续航能力：尽管电动驱动系统有所改进，但如何进一步降低能耗、延长工作时间仍是亟待解决的问题。市场挑战：成本高昂、应用场景不明确、相关的法规政策有待完善、社会接受度有待提高。目前国内智能感知和运动控制等核心关键技术仍与国际存在较大差距，核心零部件尚不能完全自主生产。

人形机器人运动控制

人形机器人技术框架及软件架构

技术框架： a) 硬件层：机械结构（手臂、头部、腿部）、动力系统（伺服电机、液压）、传感器等。 b) 算法/软件层：运动控制（通信、操作系统、控制器）、环境感知（触觉、GPS、视觉）。

软件架构： a) 操作系统层：RTOS进行精密、及时的运动控制，处理高频传感器输入、协调多关节同步。开源框架ROS提供工具、库和组件间通信，实现通信、控制、感知。 b) 通信方案层：高性能工业以太网协议EtherCAT（主从式架构），实现了低延迟（微秒级刷新率）、分布式时钟同步（实现精确协调运动）、高可扩展性（支持数百设备）。 c) 硬件接口层：传感器节点（提供输入数据）、执行器（接收控制指令并执行）。

人形机器人运动控制系统框架

运动控制是人形机器人能够在复杂环境中灵活移动的基础。人形机器人运动控制系统一般可分为硬件和软件算法两部分。硬件部分：主要包括控制器、伺服驱动器和传感器。控制器：运动控制的核心部件，负责协调机器人的运动。驱动器：作为执行部件，负责接收控制器的指令并驱动机器人的运动。传感器：在运动控制中起到关键作用，它们负责监测机器人的运动状态和环境信息。软件算法部分：历经迭代，1）基于模型的控制算法；2）MPC+WBC融合控制；3）强化学习和模仿学习等AI技术引入。

人形机器人运动控制的典型方法

运动控制分类：人形机器人的运动控制领域可以分为基于模型的控制方法和基于学习的控制方法，每种方法都有其独特的优势，解决不同的控制问题。基于模型的运动控制方法：核心是平衡控制器，平衡控制器接收机器人的状态和用户的命令，以控制机器人的平衡。电机控制器将平衡控制器的输出动作转换为位置或扭矩，以控制机器人。基于模型的方法具有高可解释性等独特优势，但它们主要依赖于准确的建模和手动参数调整，这使得在多刚体规划和控制中优化变得复杂。基于学习的运动控制方法：是指利用数据驱动技术使机器人能够从经验中学习运动策略。基于学习的方法特别适用于传统模型可能难以捕捉与未结构化或不可预测地形互动复杂性的环境。

基于模型的运动控制：稳定性判据

稳定性判据(Stability Criteria)：定义了机器人在执行运动或与环境交互时如何维持平衡和避免跌倒的标准和方法。核心思想：将复杂的机器人动态平衡问题简化为一些可测量、可计算或可控制的指标。通过监控这些指标是否在安全范围内，或者通过控制策略主动使这些指标保持在安全范围内，来实现机器人的稳定运动。常见稳定性判据：零力矩点(Zero Moment Point - ZMP)：物体所受重力与惯性力的合力的延长线与支撑面的交点。如果ZMP始终保持在机器人的支撑多边形（通常是脚底形成的区域）内部，机器人就能在动态过程中保持平衡。捕获点(Capture Point)/捕获区域：如果机器人从当前状态开始不再施加任何额外的控制力（例如，关节力矩保持不变或为零），机器人质心(CoM)的水平投影最终会停止的点。如果捕获点在支撑区域之外，机器人将会跌倒。控制器通过调整落脚点或身体姿态，使捕获点始终保持在未来的支撑区域内。

基于模型的运动控制：全身控制

原理：全身控制(Whole-Body Control, WBC)是一类产生关节力矩、约束力和广义加速度的控制器，以实现给定的一系列期望动态任务。建模系统动力学和约束：建立机器人的全阶Euler-Lagrangian动力学方程，该方程关于决策变量(广义加速度q̈、外部力λ和关节扭矩τ)是线性的；定义与环境之间的物理接触约束。定义动态任务：获得所需的机器人行为或目标(如跟踪关节加速度、避免碰撞等)，将其表达为关于决策变量(q̈,λ,τ)的线性方程。 构建并解决控制问题：将系统动力学、接触约束和动态任务结合起来，形成一个数学问题来求解当前的决策变量(q̈,λ,τ)。有闭环形式方法和基于优化的方法。输出控制信号：输出计算得到的决策变量，发送到机器人的执行器，驱动关节运动。应用：通常接收MPC输出的操作空间任务(如质心/末端执行器轨迹)，也支持遥操作/VR界面生成动态任务(姿态、行走方向、抓取目标) 。优点：通常采用线性化动力学方程，计算高效；闭环形式的WBC计算成本较低；基于优化的WBC增强了灵活性，可以模块化地添加和移除动态任务，并能有效地处理不等式约束(如关节限制、障碍物避免)。缺点：依赖模型精度，WBC的性能很大程度上依赖于对机器人动力学模型的准确表示；将动态交互建模为外部力需要准确的力/扭矩感知或全身触觉感知。

基于学习的运动控制：基于学习方法和基于模型方法的混合学习

原理：基于学习方法和基于模型方法的混合学习，利用基于模型方法（如轨迹优化TO、模型预测控制MPC）生成高质量的参考轨迹或提供模型知识，以指导和加速基于学习的方法的训练过程。轨迹参考跟踪学习(Learning to Track Trajectory Reference)：由基于模型的方法（如MPC或TO）生成参考运动轨迹，这些轨迹随后被用作基于学习的方法（RL或监督学习）的模仿目标或奖励信号。在线RL跟踪离线轨迹的方法避免了在线计算MPC可能出现的训练时间过长或失败的问题。轨迹参考增强学习(Learning to Augment Trajectory Reference)：学习到的策略不是完全复制参考轨迹，而是在参考轨迹的基础上进行适应性的修改或残差增强。这允许策略在遵循基本指导的同时，根据实际情况进行微调。既利用了参考轨迹的指导作用，又通过学习增强项赋予了策略一定的适应性和对变化的鲁棒性。应用：在线 RL 跟踪离线MPC生成的轨迹已被证明对实现多功能双足运动有效；通过学习任务特定的力输出修改参考轨迹，实现了类人机器人的挥拍。优点：加速学习。参考轨迹为学习过程提供了明确的指导，显著加快了策略的收敛速度，避免了从零开始的低效探索。缺点：学习到的策略性能高度依赖于MPC或TO生成的参考轨迹的质量。如果参考轨迹本身次优或不适应所有情况，策略的上限会受限。

报告节选：

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）