特斯拉再遭重创OpenAI的人形机器人可以完全自主执行现实世界任务

特斯拉再遭重创OpenAI的人形机器人可以完全自主执行现实世界任务-3

由OpenAI支持的初创公司Figure,致力于开发面向家庭和工厂使用的AI机器人,如约发布了其人形机器人的新一代产品——Figure 02。

由Vettery和Archer Aviation的创始人、企业家Brett Adcock于2022年成立的Figure,目标是将一款“商业上可行的通用人形机器人”推向市场。Figure AI得到了科技巨头杰夫·贝索斯、Nvidia、微软和OpenAI等重量级企业的支持,市值高达26亿美元。

目前,Figure 02仅向部分企业开放,相较于今年早些时候亮相、能进行简单家务并和指导者对话的初代Figure 01,新一代产品实现了显著升级。新版机器人展示了基于外骨骼结构的设计,使其能够更轻松地搬运重物。

Figure 02的亮点在于其增强的视觉推理能力,这相当于机器人的大脑,不仅帮助它学习任务,还能自我纠错。这一进步在AI人形机器人领域是一个巨大的飞跃,这个领域还有其他几家初创公司在探索,包括1X Robotics和Tesla。

新版Figure 02有哪些亮点?

初代Figure 01在设计上显得不够完整,电线和执行器裸露在外,虽然对话和推理流畅,但动作迟缓,运动受限。

新一代的Figure 02身高5英尺6英寸,体重132磅,采用了更加无缝的基于外骨骼的设计,外部皮肤承担负荷,内部布线更加紧凑,隐藏了电源和计算设备,手部设计也更加符合人体工程学,拥有16个自由度。

特别是手部的升级,为机器人提供了与人类相媲美的力量和灵活性,这些手部是公司内部设计的,以便机器人能够处理类似人类的任务,搬运重达44磅(约20KG)物体。

特斯拉再遭重创OpenAI的人形机器人可以完全自主执行现实世界任务-4

在演示视频中,Figure 02在宝马工厂中捡起零件并放置到位,辅助装配流程。公司CEO Brett Adcock表示,新一代人形机器人通过AI驱动的视觉系统来实现任务的可视化、理解和执行,该系统配备了六个RGB摄像头,分别位于其头部、前躯干和后躯干。

这六个RGB摄像头帮助人形机器人感知和理解物理世界,收集的数据会传送至内置的视觉语言模型,相当于机器的大脑,帮助机器人进行语义定位和快速的常识性视觉推理。

GPT式语音对话

新版Figure 02还保留了初代的语音对话功能,由与OpenAI合作训练的定制AI模型提供支持,使得人们可以口头给机器人下达任务,机器人结合语音和视觉推理来回复并采取行动,甚至能够自我纠错。

这是否意味着F.02机器人将成为一个既能分享你的烦恼和生活故事,又能在工作中与你轻松交谈的好朋友?有可能,但目前这可能不是主要的关注点——你最初可能会期待类似于GPT的交流体验。

计算推理能力提升3倍

尽管新机器人的具体性能尚待验证,但公司声称其计算和AI推理能力是初代的三倍,能够完全自主地执行现实世界任务,速度远超初代。续航时间也提升了50%,单次充电可工作5小时,确保机器人每天可运行长达20小时。

这款新型机器人在宝马位于南卡罗来纳州斯巴达堡的工厂经过了测试,展现出了将金属板精准放置到位的能力。身高5英尺6英寸、体重154磅的Figure 02,不仅能在工厂自如行走、放置汽车零件,还能自我纠错并与工人交流。

尽管Figure在设计和功能上取得了显著进步,但技术的硬件方面可能还需要进一步改进。目前,Figure 02的移动速度与人类平均步行速度相当,但在某些情况下可能需要更快的移动速度,这是公司希望改进的方向。

此外,扩大机器人的运动范围也是公司考虑的方向,以确保机器人能在更短时间内完成更多任务。这也是Boston Dynamics在其Atlas人形机器人系列中考虑的改进点。

在这个领域中,还有其他几家公司在竞争,包括同样获得OpenAI支持的1X Robotics、Elon Musk的Tesla、Agility Robotics、Apptronik、来自中国的傅立叶智能和宇树科技。许多这些公司甚至采用了Nvidia的多模态AI“Project GR00T”来增强其机器人的功能。

尽管有关机器人取代人类的担忧不断,但Figure AI明确表示,Figure 02特别适合执行体力要求高和风险较大的任务。此外,2022年的一项研究显示,全球超过半数的制造商认为机器人将辅助而非取代人类工作。Figure AI的长远规划也是让机器人成为人类的助手,填补劳动力缺口,而非完全替代。

特斯拉再遭重创OpenAI的人形机器人可以完全自主执行现实世界任务-5

THE END
分享
二维码
< <上一篇
下一篇>>