我们总结了特斯拉人形机器人主要具备以下几个优势:
1)外形:根据特斯拉22年AI DAY展示,首先从外形上擎天柱身高 173cm,体重 73kg,符合“人形”。2)价格:根据华尔街见闻,2022年特斯拉 AI DAY 马斯克表示,预计 Optimus 量产后价格在 2 万美元以内。我们认为如果在部分环节完全替代人工,这个价格对于工业和商业场景具备吸引力。3)商业定位准确:特斯拉的擎天柱从最初的定位就符合 PMF(Product / Market Fit)理论,这在成本端和设计理念已经体现。4)生态:特斯拉生态下,冲压机、FSD 自动驾驶系统、Dojo 计算机、D1 芯片,为机器人提供了有利条件。5)已有水平和发展速度:已具备的能力和发展速度优势,从 21 年概念图到23 年5 月能够完成复杂任务的完整机器人,仅一年半便完成了迭代。 相比之下,以当前运动性能最优的波士顿动力 Atlas 机器人为例,根据高工机器人网报道,Atlas 售价大约在 200 万美元,如此高昂的价格,注定无法在 C 端大面积铺开,而B端用户对于成本与价格的考量往往比 C 端用户更加理性且严格。波士顿动力公司在Atlas 的整个开发过程中一直明确表示,其人形机器人纯粹用于研发目的。
我们认为,从特斯拉人工智能生态的角度来看待,汽车、机器人和自动驾驶、DOJO超级计算机可以形成闭环,DOJO 和自动驾驶系统充当“大脑”,汽车和机器人则在物理空间中拓展认知,再反过来训练“大脑”。 根据我们总结,特斯拉生态具备:1)特斯拉制造汽车时引进了全球最大的压铸机,人形机器人有上千个零部件,未来也可能通过一体化的方式加快生产制造。2)纯视觉方案,可直接嫁接FSD 系统。Optimus 采用了跟特斯拉电动车相同的感知与计算单元,其中包括自研的芯片,以及三个自动辅助驾驶摄像头。3)Dojo 计算机训练 AI 模型。dojo 是特斯拉开发的一台超级强大的训练计算机,目标是接收大量图像和视频数据,并在无人监督的情况下自行学习。4)根据有驾网报道,D1是特斯拉自主研发的 AI 训练芯片,相比于业内其他芯片,同成本下性能提升4 倍,同能耗下性能提高 1.3 倍,占用空间节省 5 倍。目前 dojo 已用上自研 D1 芯片。5)商业模式上可直接延续电动车的“硬+软”收费模式。

21 年概念机到 22 年原型机再到 23 年 5 月完整机,Optimus 已经可以“自己造自己”了。根据特斯拉 2022 年 AI DAY 和 2023 年股东大会直播显示,22 年10 月Optimus 首次亮相无法自主行走需要人搀扶,23 年股东大会展示视频中 Optimus 已经可以在车间灵活行走、抓取物体,已经拥有环境探索与记忆、电机转矩控制能力、基于人类跟踪运动的 AI 训练以及物体操纵能力,且已打通了 FSD 底层模块,实现了一定程度的算法复用。根据新浪财经报道,2022 年马斯克接受采访时说道,机器人“擎天柱”预计明年底开始交付,目标量是 23 年 10 万台、24 年50 万台、25年100万台。2023 年 3 月马斯克表示,特斯拉机器人已经可以“自己造自己”了。
最新展示中 Optimus 电机可精准控制不打破鸡蛋,已经可以完成物品分拣的复杂工作。根据特斯拉最新在 23 年股东大会上发布的视频显示,Optimus 完成了一系列复杂任务如电机扭矩控制,力度控制更精确、环境探测与记忆等。例如特斯拉展示了 Optimus 电机转矩控制的能力,能做到精准控制力道不打碎鸡蛋。此外,Optimus 也展示了其基于端到端AI 学习人类行为的过程,对物体进行分类摆放等,还展示了其从一个容器中拾取物体并将它放入第二个容器中。
机器人四大核心组件:传感系统、控制系统、执行系统、驱动系统。根据优必选研究院,机器人主要由机械部分、控制部分和传感部分组成,其中机械部分是其它部分的重要基础。机械部分按系统分包括驱动系统和机械系统。人形机器人有 4 大核心组件,分别是传感系统(对应五官)、控制系统(对应大脑)、执行机构(对应四肢)和驱动系统(对应关节组织)。

根据 2023 年特斯拉股东大会直播显示,Optimus 视觉方面采用摄像头纯视觉方案,能量方面采用 2.3KWh 电池,可待机 20 小时,支持工作全天。特斯拉最新亮相的机器人身高173cm左右,体重 73kg,采用了三个摄像头,两个常规的摄像头分布在左右耳朵的位置,一个鱼眼相机分布在最前方,延续了电动车的纯视觉方案。大脑采用 Tesla SoC 可以进行视觉信息处理,动作决策、以及语音交流。电池部分采用了一块 2.3 kWh 的电池,电池包内带有充放电及电源管理芯片,可持续待机 20 小时,能支持机器人工作一整天。
特斯拉对机器人做了损害控制,保证位于胸腔的电池在机器人跌倒是不会爆炸。还对全身的结构件都做了相应的受力分析,出于成本考虑,为了适应量产没有选用重量轻、性能好的碳纤维复合材料,而是采用铝合金。特斯拉在汽车上有成熟的高压铸造铝合金的经验,在材料端对于机器人将来量产有较大帮助。
整机构型是大型仿人机器人机械部分的关键点之一,它与关节的数量及布置方式紧密相关。根据优必选研究院,人体有 206 块骨头,大的关节有 78 个,有六种类型关节。一般大型仿人机器人关节有 15-70 个,关节类型有三种,旋转(水平方向旋转)、偏移(垂直方向上下移动)、滑动(水平方向线性移动)。

特斯拉机器人躯干共有 28 个关节,旋转关节和直线关节各14 个,每个关节对应一个执行器,手部共 12 个执行器。根据 2023 年特斯拉股东大会直播显示,我们对28 个执行器位置和数量进行预计,28 个执行器分别为肩关节(单侧三自由度旋转关节)6 个,肘关节(单侧直线关节)2个,腕部关节(单侧 2 个直线+1 个旋转)6 个,腰部(二自由度旋转关节)2 个,髋关节(单侧1个直线+2 个旋转)6 个,膝盖(单侧 1 直线关节)2 个,踝部(单侧二自由度直线关节)4个。每个旋转关节用到一个谐波减速器,手部单手有 6 个执行器,11 个自由度,拇指方面由两个电机驱动,驱动拇指的空心杯电机均横置在手掌内,其他手指各一个。能拿起约9 公斤重物体,可以使用工具,实现精准抓取小部件。
通过仿真模拟,考虑成本和重量两个因素,选出每个关节执行器最优解。根据2023年特斯拉股东大会直播显示,在设计关节驱动器时,最重要的事情就是确定驱动器的工作范围。首先对于机器人的工况做了假设,针对这些工况进行了仿真,在仿真中模拟出了机器人在各种情景下关节的输出力矩。之后将输出力矩投影到了关节驱动器的效率图中,采用的是市面上可以买的标准品电机+减速机,之后根据不同的电机和不同减速比减速器组合,最终组合出十几万种结果,红色的曲线就是系统成本和重量的最优曲线,再选出最合适的电机与减速比方案。之后将全身所有关节都做这样的分析,可以得到全身关节的最优组合。
从局部最优进一步到整体最优,28 个躯干关节最终选出6 款执行器。为了降低生产成本,对执行器数量进行了精简,即从局部的成本与重量最优,到全身的成本与重量最优。最终特斯拉选择出了三款旋转关节,三款直线关节,旋转关节的扭矩为 20、110、180Nm,直线关节的推力为500、3900、8000N。
在高速端,旋转关节采用内转子电机+角接触轴承,并配有一个刹车装置,直线关节部分采用了内转子电机和普通的球轴承。在低速端,旋转关节采用了谐波减速机,并配有交叉滚子轴承,直线关节部分采用了行星滚柱丝杆,相比于传统的滚珠丝杆,可以承受更大的负载。在传感器方面,关节在高速端和低速端都配备了位置传感器以及力和力矩传感器。
根据中国新闻网报道,伺服电机、减速机、控制系统、驱动器与机器视觉等重要零部件占据人形机器人成本超过 70%。根据高工机器人网,人形机器人整体的自由度/关节数量通常为20个至 50 个,一个自由度对应一台伺服电机,国外电机价格通常为5000 至6000 元,甚至上万元,国产电机价格也在 2000 元以上。
根据优必选研究院,伺服驱动器工作原理:要实现机器人的精准运动,每个关节需要能产生精确的输出位置和力矩。每个舵机在接收到位置指令后,可以实时响应命令,多个舵机协调运行,就可以产生犹如人类一般灵活的运动。大型伺服驱动器有三种类型,分别为常规伺服驱动器、SEA伺服驱动器、本体伺服驱动器。常规伺服驱动器主要由力矩电机、谐波减速器、电机编码器、输出编码器、驱动板、制动器组成。
以特斯拉关节结构来看,旋转关节和直线关节结构类似,我们总结主要区别有三点:1)减速装置:旋转关节用的是谐波减速器,直线关节为滚柱丝杠。2)低速端传感器:旋转关节用的是角度编码器,直线关节是位置编码器。3)力传感器:旋转关节输出端由于是旋转运动,用的是力矩传感器,直线关节输出端是直线运动,用的是力传感器。

根据对人形机器人研究,我们认为在关节构成中,价值量最高、技术壁垒最高的两个环节是谐波减速器和无框力矩电机。 谐波减速器具备高精度、轻量化、小型化等优势,人形机器人通常采用谐波减速器。根据优必选研究院,减速器是一种动力传达机构,主要起着降低电机转速、提升扭矩的作用。仿人机器人常用减速器有精密行星减速器、谐波减速器、摆线减速器三种,回差是仿人机器人用精密减速器的关键性能指标之一,一般来说回差越小精度越高,谐波减速器满足高精度、小型化、轻量化、大减速比等特性,人形机器人一般采用谐波减速器。
机器人关节电机核心指标是功率密度,无框力矩电机由于体积小、重量轻,可满足高功率密度要求。根据《一种无框力矩电机的制作方法》,无框力矩电机没有外壳,可以提供更大的设备空间,中间是中空形式的,便于走线。在设计中,可以使整个机器体积更小,因此可以提供更大的功率密度比,同尺寸下可以提供更大的扭矩,可人形机器人轻量化和小型化的要求。功率密度=输出功率/质量,对于人形机器人关节来说,由于空间有限,功率密度是非常核心的指标,因此无框力矩电机优势明显。
机器人运动时膝关节受力最大,Optimus 使用了仿生四连杆结构,可平滑电机输出力保持效率最高区间。根据 2023 年特斯拉股东大会直播显示,特斯拉对于机器人的各种动作进行了模态分析并将其降入到控制系统中去来降低控制频率节省算力以及能源。膝盖是机器人运动时受力最大的关节,为了降低电机输出的力,膝盖处创新使用了仿生四连杆结构,这种结构相比于二连杆可平滑电机输出力,可以让电机的出力维持在一个恒定值上来让电机在效率最高的区间工作。