资料来源:天南AI茶馆
跟特斯拉不一样,Figure这次就是奔着C端走的。
本来说好的晚上10点发布,结果FigureCEO不守信用,还是提前半个小时在X上推送了视频,赶紧去学习了一下。
看完我只能说,比前几天看特斯拉Optimus功夫的视频要震撼的多,当Figure03拿起来笔记本电脑,整理床单、陪狗狗扔球的时候,我是真的感受到了人形机器人的时代要到来了。
更重要的是,他们CEO说,视频中展示的视频不包含任何遥控操作,都是通过VLA自主进行。
和特斯拉前几天视频最大的区别就在于:
特斯拉给我们传递了一种信号,他们在沿着宇树的大玩具的运动控制、强化学习的泛娱乐的思路进行。
而今天FigureAI给我们传递的是,我们的Figure03是真真正正能够走进你家为你洗衣服、收拾家务、陪孩子玩耍的实际体验。
今天结合他们的官方新闻稿以及最新的专家访谈,天南陪你一起来看下FigureAI视频中到底展示了什么样的能力和未来。
文章的最后也谈下与特斯拉optimus的竞争关系。
要点目录
一、充电不止一种方式
二、Helix 好强,完全自主
三、前代能力无缝迁移到新品上
四、自研指尖传感器
五、参数解释
六、机器人步态
七、机器人身体优化特点
八、机器人视频画面动作体现什么能力
九、机器人场景落地在哪里
十、机器人最快何时见到真机
十一、与特斯拉 Optimus Gen 3 的竞争对比
一、充电不止一种方式
从视频中可以看到多种充电方式。
1)快速充电:如果近距离看它的躯干下方能看到几个接口,它现在就是通过这种方式充电,属于快速充电。很多人形机器人充电接口多在肩部,而Figure 03的充电接口在躯干的腰部位置。
2)感应充电:主要会用在工厂场景,当它在运行过程中需要充电时,就可以踩在感应充电脚垫上补能。
就像我们用手机一样,如果有插头,想高效快速充电,就会用有线充电,不会选无线充电,道理是一样的。人形机器人通常会有两种充电方式。
二、Helix好强,完全自主
新品视频里展示长周期任务,比如机器人接到的指令是“清理客厅”,它确实在做清理工作——收拾笔记本电脑、玩具车以及其他杂物。
创始人之前接受采访时提到,这些操作都不是远程操控的,全是自主完成的,即Helix系统(大脑)。
视频中可惜的点是,背景音乐太大/没有人物语音指令,如果能听到有人说“嘿,清理一下客厅”,然后机器人就开始行动,并且是一镜到底的画面,会更有说服力。
顺便说一句,清理的杂物如爆米花之类的,处理得很到位。人形机器人深蹲幅度很大,不过没有看到拾取地面上的布料或者很薄的物品,也没看到它接触水的画面。
三、figure 02能力无缝迁移到figure 03上
2024年我们看到Figure 02在创始人家里洗衣家务,现在Figure 03能在同样的洗衣房完成任务,核心是“训练不需要从零开始”。
Figure 02的学习成果能迁移到Figure 03上,而且视频里展示完整的洗衣流程,包括放洗衣凝珠、按启动键等细节,这很有说服力。
这个对于人形机器人而言非常重要。你总不能说,你在前面几年训练的模型又放在新的机器人上无法使用了。这对于数据而言,是非常大的浪费。
四、他们自研了指尖传感器
在调研了现有市场产品后,Figure发现当前的触觉传感器存在固有局限性,无法承受现实场景的使用需求,因此自主研发了第一代触觉传感器。
看了下官方描述,每个指尖传感器能检测低至3克的压力——灵敏度足以感知手指上放一个回形针的重量。
这种设计能让Helix系统在物体即将滑落前,区分出“稳固抓握”和“即将滑落”的状态,从而对脆弱、不规则或移动的物体实现精细化、灵巧的控制。”
视频中没有提到剪切力,但推测,“防止滑落”的功能里应该包含了对剪切力的感知,这对抓取稳定性很重要。
视频中有它拾取卡片的画面,它用了一个技巧——先把卡片推到边缘,然后再拾取,要是手指没有敏感度,根本做不到这么精准,而且整个过程没有发生碰撞,这一点很出色。
视频展示的是折叠T恤,难度比毛巾大得多,因为T恤更柔软、形状更难固定。如果未来它能自己折叠床单,那就更厉害了。
布料不是刚性的,没有固定支撑,抓取和折叠的难度比刚性物体大得多,这一点很关键。
五、Figure03参数
03机器人身高5英尺6英寸,换算过来大约170厘米,可能略矮一点;负载能力20公斤;自身重量60公斤;续航时间5小时;
行走速度1.2米/秒。这个行走速度很接近人类的舒适步行速度,很理想。人类的平均行走速度大约是1.5米/秒,1.2米/秒属于很舒适的步行速度,完全能满足工厂场景的需求。
现在的世界变化快,但不管怎样,这个重量设计对家庭和商业场景都很友好。
六、步态
03行走姿态比之前的版本好多了,之前的机器人走路有点像“憋了尿的小孩”,总是蹲着走,现在已经直了很多,虽然还没达到完全直立的状态,但已经非常接近了。
在见过的人形机器人里,Figure 03的行走姿态算是很好的了。
Optimus 2.0或2.5版本的行走姿态还是有点奇怪,可能是因为手部动作不够自然。
但Figure 03的腿部动作很流畅,比如它把包裹放在前门外面时,没有完全蹲下去,我们之前把那种不自然的蹲姿叫“镜像站姿”,而Figure 03的腿部动作有细微差异,看起来更自然,很令人印象深刻。
就像Scott 2024年提到的,它的肩部设计也很自然,看起来像个身材修长的人。
七、身体优化
Figure 03在减少夹伤风险上做了很多努力,比如肘部等容易产生夹伤的部位都有布料覆盖,有缓冲空间,能减少碰撞伤害。
目前看起来臀部是最危险的部位,因为结构设计比较复杂,未来可能需要进一步优化。
不过现在视频里的机器人都是在公司员工周围运行,这些员工都经过专业培训,和普通用户的使用场景不同,未来面向普通用户时,安全设计可能还需要升级。
八、视频画面是慢动作
视频开头的画面大多是慢动作,有电影感,中间部分比如机器人翻转包裹、走路送货的画面,看起来是实时速度。
我和大家一样,希望能看到更多实时画面,而不是慢动作,这样才能更真实地了解它的运行状态,但目前展示的实时画面已经能说明它的能力了。
其实慢动作画面也不会影响对它能力的判断,如果它能在慢动作里展示出精准的动作,那正常速度下的表现只会更好,而且速度快一点会更令人印象深刻。
九、场景落地
场景——送快递:要是你们见过亚马逊快递员送货,就知道他们通常会把包裹扔在门口,Figure 03的放置动作已经比快递员更轻柔了,在进步。
场景——拆解电池箱:电池箱在海外运输时,每个箱子里大约0个电池,运到工厂后需要先拆解,视频里机器人做的就是拆解电池箱的工作,这些电池很可能是给BotQ工厂生产机器人用的,这算是一个“彩蛋”,暗示它未来会参与到自身的生产过程中。
电池拆出来后,第一步要做的就是电芯测试,每个电芯都要检测是否合格,然后根据测试结果匹配到对应的电池组里,确保电池组的性能稳定。
十、最快什么时候见到真机?
Figure公司有很多商业物业和住宅物业的合作资源,视频里展示的场景只是一部分。
Salesforce将在旧金山举办Dreamforce活动,他们已经计划让Figure机器人在活动中担任接待员,这可能是Figure 03首次在公共场合亮相。
十一、和特斯拉Optimus Gen 3对比
Figure和特斯拉最近一直在暗中竞争,而这次Figure的动作,显然是一个重要的信号,相当于在说“看看我们现在做到了什么”。
1)手部设计可能是特斯拉的优势领域,如果他们能展示出Gen 3的手部更先进的话。
Figure 03手部的动作、摄像头以及其他传感器确实有亮点,但就手部功能而言,和一些企业想要实现的目标相比,还是比较基础的。
2)Figure显然有更多需要证明的地方,他们必须展示出自己的实力;但特斯拉还能依靠“我们能比任何人更容易量产几十万台机器人”的理念——因为他们有制造经验,还有现成的供应链在等他们。
特斯拉确实是这么说的,他们追求的是大规模量产。而Figure在白皮书里提到的最终目标是生产10万台机器人,这个数量比特斯拉的目标少很多。
特斯拉说自己要生产100w台。
写在最后
跟特斯拉以及宇树这些国内的场景不一样,Figure这次就是奔着C端走的。
他们没有反复展示工业场景,可能是因为Figure 02已经在宝马工厂投入使用了,觉得没必要再强调。
从个人情感来说,确实更容易被家庭场景打动——比如看到它叠衣服,我会觉得“哇靠,这很有用,我想买一台”。
C端的万亿市场,这个深水区,没想到是FigureAI已经抢先特斯拉一步。
接下来,特斯拉怎么扳回这一局,期待下11月6日吧!