2026 年央视春晚中,松延动力、魔法原子、宇树科技、银河通用四家企业登台演出。 通过舞蹈、小品、武术、微电影等节目展示了具身智能领域包括硬件本体、运控、群控、 灵巧操作、仿生等方面的前沿成果,呈现了我国机器人产业的技术实力。
一、高难度动作和零误差表演,背后是硬件本体和运控技术全面升级。 硬件本体和运 控算法是机器人完成任何动作的基础,本次春晚的机器人实现了硬件和软件的全方位迭代。 2025 年央视春晚中,宇树科技 H1 机器人表演了扭秧歌、抛手绢等动作,整体节奏较 慢,仅能缓慢移动变换队形,无空翻等高难度动作;而 2026 年央视春晚上,宇树科技 G1 机器人快速跑动变换队形,跑位速度提升至最快 4m/s,较 2025 年提升 5-10 倍;展示了 弹射空翻、连续翻桌、单脚连续空翻、两步蹬墙后空翻、空中大回旋七周半等复杂的、冲 击力强的高难度动作。针对弹射空翻等剧烈动作,机器人增加了冲击力吸收与释放装置, 避免腿杆、电池等部件因冲击力、电流骤增损坏,并对电机进行升级,提高其功率密度和 稳定性;机器人融合深度相机和激光雷达,实时处理环境信息,支撑自主集群跑位。 硬件的一致性和算法稳定性在批量生产阶段成为关键问题。机器人公司的同一套算法 需要提供给上百台甚至上千台机器人使用,需要每一台机器人都能够稳定输出,这对于机 器人的规模化量产至关重要,同时也是春晚数十台机器人整齐划一表演的基础。
另外在《智造未来》节目中,魔法原子的六台 MagicBot Z1 与两台 MagicBot Gen1 与艺人共同完成舞蹈,跟随音乐节奏,完成快速转向、跃动衔接与连续编排动作。这需要 机器人具备精准的全身协同运动与快速步态调整能力,从而保证动作的流畅和精准。
二、高动态、高协同的全自主集群控制技术是全球首次亮相。 24 台宇树科技 G1 自主完成武术演练与动态队形变换,背后是一套低延迟、高同步的 集群控制技术。即机器人通过机载传感器来实时感知环境。当机器人因武术动作幅度过大 导致位置偏移时,能够自主归位。春晚结束后,宇树科技发布视频呈现其集群快速调度系 统的技术,数十台机器人同步起跳和翻滚,动作整齐划一,并精准排列出“2026”等字样。 这意味着机器人群体从“单打独斗”迈向“集体作业”,凑够“执行编排”走向“自主协 同”。这一技术的突破,有望为机器人未来在工业制造、物流分拣、应急救援、国防军事 等集体作业场景中打下基础。

三、仿生人脸反映了微电机、结构件的高度集成,以及语言和表情等交互算法的进步。 小品《奶奶的最爱》节目中,松延动力展示的仿生机器人,其面部表情的细腻程度与 同步率达到了新高度。这背后是两项技术的集成突破:在硬件上,面部皮肤之下密布了数 十个微型伺服电机(舵机)与传动结构,在极小的空间内实现了眉毛、眼睛、嘴唇等多自 由度的独立驱动,材料学上则使用了高弹性、贴合性好的硅胶皮肤;在软件上,其采用了 先进的语音驱动面部动画技术,能够实时将语音信号分解为音素、情感等特征,并驱动面 部肌肉模型生成匹配的口型、眼神与表情,实现了高度拟人化的情绪表达。这一技术意味 着人机交互和陪伴服务机器人的技术取得重要进展。
四、任务执行和场景落地能力亦有呈现,背后是具身智能模型和数据的进步。 银河通用机器人在微电影《我最难忘的今宵》中,执行了一系列动作,包括货架取物、 清理碎片、整理环境、串烤肠、叠衣服等,体现了“感知-推理-决策-执行”的闭环能力。 这些能力源于“大脑-小脑-神经控制”一体化系统银河星脑 AstraBrain。该模型是一个四 阶段的具身学习框架——人类样本示范-仿真数据合成-强化学习试错-真机调微操,用仿真 解决数据规模问题,用强化学习优化动作质量,再用真实环境完成最终闭环。这套方法是 机器人可以各种复杂操作能力的方法论。
在四川宜宾分会场,魔法原子展现了人形机器人在餐厅的应用潜力。在表演中,机器 人 MagicBot Gen1 成为捞面师傅,完成了起面、控水、捞面等动作(难度在于面条属于 非刚性物体,没有固定轨迹),MagicBot Z1 将面条送至顾客的餐桌上(难度在于人来人 往,环境嘈杂),同时机器人还给桌上的客户倒酒(难度在于透明酒的识别和动态的控制 力)。机器人需要脑-眼-手三者高度协同,才能完成这一系列高难度动作。
五、灵巧手是实现机器人抓取精细操作的末端执行器。宇树科技的部分机器人 G1 搭 载灵巧手,用于抓握道具完成武术表演。银河通用的机器人则展示了更为精细和复杂的操 作,如盘核桃、捏取碎玻璃、抓取塑料瓶、叠衣服等,这需要灵巧手有高自由度的灵活控 制、触觉感知以及 手 指 关 节 级 微 调 控 制 的 “ 大 脑 ” ,也叫 手内操作( In-hand Manipulation),银河通过虚拟仿真环境训练+真实世界场景微调的方式解决。灵巧手技术 的突破,直接关系到机器人在工业装配、家庭服务、特种作业等领域执行任务的能力上限, 是技术制高点。
六、机器人行业的出货量已达到万台以上,量产交付和成本控制能力成为重要的竞争 要素。根据 IDC 报告及各公开新闻汇总,2025 年人形机器人国内出货量接近 2 万台。其中,宇树科技官网称 2025 年人形机器人出货量超过 5500 台。王兴兴预测 2026 年机器人 出货量合计将达到几万台,宇树科技的机器人出货量将达到 1-2 万台。当行业头部企业的 年度出货量进入万台门槛,意味着供应链管理、规模化生产、质量一致性控制与成本优化 已成为核心竞争力。成本的下探将直接加速机器人从实验室、特定场景向更广阔的商用和 消费市场渗透。

2.1 机器人如何实现舞蹈表演?
根据具身智能相关的公开论文总结,通常来说,人形机器人完成一套全新的舞蹈或者 武术表演,需要经历动作设计、数据采集、算法开发、仿真模拟、真实场景测试与调整、 集群协同控制等步骤。 1)动作设计与数据采集:首先设计整体表演框架,选择机器人要表演的动作;专业 的舞蹈/武术演员将这些动作表演多次,利用光学&动作捕捉系统将这些表演记录下来,获 取高精度关节角度、身体质心轨迹等时空数据。 2)动作命令生成与转换:从数据集中获取人类动作数据,将其 “重定向” 到适合机 器人执行的关节级动作,转换为机器人可执行的运动命令,这些命令包含每个关节的目标 位置或姿态变化,再生成用于训练的动作序列。 3)虚拟训练:把这些动作序列数据输入 MuJoCo、Isaac Sim 等仿真系统中,让机器 人进行持续不断的模拟训练,通过模仿学习或者强化学习算法,在仿真中自动调整轨迹参 数,在不断的试错中学习如何发力才能完美表现相关动作。春晚上的宇树科技设计了 100多个武术动作,利用仿真平台针对这些复杂武术动作进行多次训练(例如高空弹射,训练次 数高达上亿次)与流畅拼接,并且在这 100 多个动作中进行选择; 4)从模拟到现实(Sim2Real):将在仿真环境中学会的计算和输出每个关节扭矩的 策略在真实的机器人上进行测试和验证,机器人在真实场地上再进行最终微调,校准落地 点、适应地面摩擦力。 参考英伟达和 CMU 联合发布的论文《ASAP: Aligning Simulation and Real-World Physics for Learning Agile Humanoid Whole-Body Skills》,这篇文章开源了机器人学习 科比投篮的算法,我们用这套算法对以上过程进行说明。 算法整体框架为:a)运动跟踪预训练和真实轨迹收集:通过从人类视频中重定向人 形运动,预训练了多种运动跟踪策略,从而推算出真实世界的轨迹;b)增量动作模型训 练:该阶段基于真实世界的部署数据,通过最小化模拟状态 st 和真实世界状态 st 之间的 差异来训练增量动作模型;c)策略微调:该阶段冻结增量动作模型,将其合并到模拟器 中,从而将现实世界与物理进行对齐,然后微调预先训练的运动跟踪策略;d)现实世界 部署:最后,直接在现实世界中部署微调后的策略,而不需要增量行动模型。
将人类视频动作重定向到机器人动作的整体流程包括:a)从视频中捕捉人体动作;b) 使用 TRAM,按照 SMPL 参数格式重建 3D 人体运动;c)在仿真环境中训练强化学习 (RL)策略来跟踪 SMPL 运动;d)在仿真环境中,将学习到的 SMPL 运动被重定向到 Unitree G1 人形机器人上面;e)将训练好的 RL 策略部署在真实机器人上,在物理世界 中执行最终动作。该管道确保重定向的运动在物理上仍然可行,适合在现实世界中部署。
2.2 机器人距离自主干活还有多远?
硬件和运控是机器人自主运行的基础和前提条件。根据以上分析可以看出,机器人跳 舞表演主要是基于强化学习算法,是提前预设好的动作和环境;而机器人自主干活面临的 是未知的环境和动作,除了“小脑”外更需要“大脑”,即自主感知、识别、推理、规划 和控制能力。银河通用和魔法原子在春晚的表演表明人形机器人在生活场景工作的初步能 力,但泛化能力、稳定性依然是挑战。 机器人从从“跳舞”到“干活”,首先需要攻克技术问题,其次攻克成本和场景问题, 而技术问题目前聚焦于模型和数据两个层面: 1)数据问题是当前具身智能模型的核心瓶颈,与 AI 大模型不同,机器人大模型需要 的是海量的物理世界的数据,但目前真实机器人数据严重缺乏,采集的周期长成本高,且 采集的数据质量较差,需要严格清洗才能用于训练;模拟仿真环境生成的数据目前的模拟 精度无法完全匹配现实世界,与实物数据存在误差。 2)具身智能模型是机器人自主运行的核心技术,当前尚未完全突破。VLA 架构具备 端到端和泛化等特点,使其在机器人领域具备应用潜力,是现在的主流路线,各家公司的 VLA 模型存在多种技术路径和架构,其性能表现和得分正在日益提升。
展望未来,短期内“仿真+人工示范+特定场景真实数据”将持续一段时间。在制造业、 仓储等结构化场景中,数据问题相对可控,将率先实现数据闭环和商业落地。中期,随着 Sim2Real 技术成熟,更大规模、多任务的共享数据集将出现,推动通用技能模型发展, 推动具身智能模型的突破性进展,B 端有望看到大规模应用,C 端有望看到家用场景原型 机。长期来看,随着模型和数据形成飞轮效应,机器人有望具备通用常识和快速学习能力, 各类应用场景有望批量出货。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)