具身智能概念、核心要素、发展历程与驱动因素有哪些?

最佳答案 匿名用户编辑于2025/06/05 08:49

具身智能机器人是我国发展新质生产力的未来产业新赛道,集成了 AI、先进制造、新材料等先进技术, 将对社会产业变革和全球竞争格局产生颠覆性影响。

一、人工智能+机器人等物理实体

具身智能(Embodied Artificial Intelligence,EAI)是指有物理载体的智能体,在与物理世界的交互过程 中,通过感知、控制和自主学习来积累知识和技能,形成智能并影响物理世界的能力。 具身智能的实现方式多种多样,可以根据具体任务和环境需求选择合适的智能实体形态,其中人形机器 人作为具身智能的典型代表,被视为实现具身智能的最佳载体之一。

2、四大核心要素及应用体现

具身智能由四个核心要素组成:本体、智能体、数据和学习进化框架。具身智能指的是那些能够感知周 围环境、进行智能交流以及规划行动的智能系统。 从机器人的角度出发,具身智能在机器人上的应用体现可以划分为三阶段:感知、推理、执行。

(1)具身感知。机器人需要具备环境感知能力,依据感知对象的不同,可以分为四类:物体感知、场景感知、行为感知、 表达感知。

(2)具身推理。具身感知的过程主要包括以下几步:任务规划、导航、具身问答。 任务规划:任务规划(Task Planning)是具身智能的核心任务之一,将抽象的非可执行人类指令转换为 具体的可执行技能。这一步骤的完成需要两步:1)将人类指令分解为机器人可执行的技能,2)执行技 能。 结合大模型的任务规划:大模型作为转换器、大模型作为分解器。作为转换器:LLM+P,用 LLM 将状 态信息描述成 PDDL 语言再进行规划,取代以往需要人工针对实际问题书写 PDDL 语言对任务进行建 模;作为规划器:可以 zero-shot 进行任务规划。

具身导航(Embodied Navigation):智能体在 3D 环境中移动完成导航目标。 早期的具身导航,通过构建一系列基于规则的组件和算法,实现有效的环境感知、定位、路径规划和避 障。而基于学习的导航则利用深度学习与强化学习技术,提高模型对复杂环境和新场景的泛化能力。不 同于传统算法依赖预定义的规则和手工设计的特征,基于学习的导航算法从大量数据中学习环境特征和 导航策略,实现强自适应性和高灵活性。视觉导航:基于学习的导航的一个重要分支,它依靠计算机视 觉来理解环境信息并做出导航决策。视觉语言导航:通过自然语言指令和视觉图像进行导航的任务,其 目标是开发一种能够与人类进行自然语言交流并在现实 3D 环境中导航的具身智能体。1)大模型出现之 前:主要通过 RNN,LSTM,Transformer 等网络来提取命令中的语义信息;2)大模型出现后:利用 大模型作为辅助来帮助规划器输出规划或者大模型直接作为规划器来输出规划。

具身问答:机器人需要主动探索环境,定位目标物体或位置获取环境中的信息,然后基于获取的信息回 答问题。该任务可视为导航、VQA 任务的结合。相比于 VQA 等已有问答任务,具身问答的特点在于机 器人具有主动行动能力。

(3)具身执行。具身执行,就是把任务具体执行出来,其中最重要的环节就是技能学习。 技能学习:以技能描述、环境观察为输入,输出完成技能所需的 7Dof 轨迹(主要指人手腕或者机械臂 末端执行器的位置、朝向、末端状态)。技能学习主要有两类方法:模仿学习:收集专家演示数据,用 神经网络拟合。强化学习:设计奖励函数,机器人通过交互学习行为策略。两者的差别在于:模仿学习 是从样例中学习,机器人学习过程中不与环境进行交互;而强化学习从交互中学习,机器人学习过程中 与环境进行交互。

3、具身智能产业发展历程

具身智能经历 5 个发展阶段,正步入应用阶段;1950-1980 年,为具身智能概念萌芽阶段,图灵在其 论文中提出了人工智能可能的发展方向,为具身智能的概念奠定了基础。1980-1990 年,为早期探索 与理论发展,罗德尼·布鲁克斯和罗尔夫·普费弗等人的研究为具身智能提供了重要理论支撑。2000- 2010 年,为跨学科融合与技术突破阶段,具身智能研究开始融合跨学科的方法和技术,如机构学、机 器学习、机器人学等,形成了相对完整的学科分支。2011-2020 年,深度学习技术的快速发展为其注 入了新的发展动力。2021 年至今,为产业应用阶段。具身智能受到科技界和产业界的广泛关注,众多 科技巨头及高等学府纷纷投入相关研究。如今,具身智能作为人工智能的重要分支,正逐步走向产业应 用,推动专用机器人向通用机器人发展。

二、驱动因素

具身智能机器人是我国发展新质生产力的未来产业新赛道,集成了 AI、先进制造、新材料等先进技术, 将对社会产业变革和全球竞争格局产生颠覆性影响。 无处不在的应用潜力预示着庞大的市场需求、国家与地方长期的政策规划支持、核心零部件供应链完善 形成集群效应、以及健康良好的人才和创业生态,多方面因素推动我国成为具身智能技术发展的沃土。 当前,国内的高校院所、科技大厂、初创企业均在布局以 AI 大模型和人形机器人为代表的前沿领域, 我国在具身智能领域已经走在国际前列。

1、政策持续加码,“具身智能”首次出现在政府工作报告中

政府工作报告首提具身智能:2025 年 3 月 5 日,十四届人大三次会议开幕,国务院总理李强作政府工 作报告。在《2025 年政府工作报告》中提到,建立未来产业投入增长机制,培育生物制造、量子科技、 具身智能、6G 等未来产业。同时还提到,大力发展智能网联新能源汽车、人工智能手机和电脑、智能 机器人等新一代智能终端以及智能制造装备。具身智能和智能机器人是首次出现在《政府工作报告》当 中。

2、地方政府出台政策并成立产业创新中心

2023 年 11 月,工信部发布《人形机器人创新发展指导意见》,提出到 2025 年,人形机器人创新体系 初步建立;到 2027 年,综合实力达到世界先进水平,成为重要的经济增长新引擎。 2024 年 1 月,《工业和信息化部等七部门关于推动未来产业创新发展的实施意见》中,提出要突破人 形机器人等高端装备产品。突破机器人高转矩密度伺服电机、高动态运动规划与控制、仿生感知与认知、 智能灵巧手、电子皮肤等核心技术,重点推进智能制造、家庭服务、特殊环境作业等领域产品的研制及 应用。 多地开始打造人形机器人产业创新中心,推动具身智能基础模型、仿真应用等发展。

具身智能是上海“模塑申城”方案五大关键领域之一。2024 年 5 月,国家地方共建人形机器人创新中心 落地上海。在不到一年的时间里,已发布了全球首台全尺寸人形机器人公版机“青龙”,建立了 OpenLoong 人形机器人开源社区,联合 15 家企业构建了“十八金刚”人形机器人阵列,围绕人形机器人 场景应用、具身智能分级分类等领域,制定了全国首批团体标准,开设了全国首个异构人形机器人训练 场。同时,上海正在实施“模塑申城”方案,重点在智能终端、科学智能、在线新经济、自动驾驶、具身 智能等五大关键领域,对制造、金融、教育、医疗、文旅、城市治理等六大重点行业开展供需联合攻关, 以超级场景牵引应用迭代。