人形机器人+LLMs=? 答案就在这个2分钟视频里

机器之能报道编辑:Sia你可以用自然语言与机器人交谈,并要求它完成一项任务。未来对机器人的控制可能会像骑马,你可以把AI看作是骑手,机器人的物理智能就是马。当生成 AI 被植入数千个系统中时,迟早有一天也会来到人形机器人身上。不过,Agility Robotics CEO Damion Shelton 最初并不相信它们的双足机器人需要这玩意儿。就我们的用例而言,还没有让大型语言模型( LLM )控制机器人的需求。客户不需要和自己的机器人进行有趣的对话,他们需要借助机器人的物理原理替代重复性劳作。当亚马逊于 10 月

机器之能报道

编辑:Sia

你可以用自然语言与机器人交谈,并要求它完成一项任务。未来对机器人的控制可能会像骑马,你可以把AI看作是骑手,机器人的物理智能就是马。

图片当生成 AI 被植入数千个系统中时,迟早有一天也会来到人形机器人身上。不过,Agility Robotics CEO Damion Shelton 最初并不相信它们的双足机器人需要这玩意儿。就我们的用例而言,还没有让大型语言模型( LLM )控制机器人的需求。客户不需要和自己的机器人进行有趣的对话,他们需要借助机器人的物理原理替代重复性劳作。

当亚马逊于 10 月中旬开始测试 Agility Robotics 的双足机器人Digit 时,这位亮蓝色的自主「打工人」看起来也比实际情况更聪明。「现实是,机器人还没有自我意识,它们现在甚至没有使用大型语言模型,」 Damion Shelton 当时说道。仅仅两个月后,情况就发生了变化。在本周三发布的两分钟「Embodied AI」演示中,升级后的 Digit 顺利完成工程师随意布置的口头任务。

人形机器人+LLMs=? 答案就在这个2分钟视频里

我们很好奇,将这项技术集成到 Digit 中可以实现什么。为此,Agility Robotics 给 Digit 创建了一个演示空间。视频中,机器人前方排列了四个不同高度的编号塔,身后也有三个不同高度的编号塔。后面的三个编号塔上,各有一个由几个不同特征(颜色、图案还有数字)定义的盒子。工作人员给 Digit 编码了这些环境信息,但没有编码任何具体任务。接入能理解复杂自然语言命令的 LLM 后,Digit 能否顺利完成随机分配的任务?视频中,机器人被告知将「达斯维达的光剑」颜色的盒子放到前面最高的塔上。图片演示视频界面,左下角的叠加层显示了机器人的内心独白,右下角的叠加层显示了物理世界中3D 导航的情况。Digit 并没有瞬间完成任务,而是深思熟虑地、慢慢进行着。在 LLM (接受了流行文化参考资料的训练)赋能下,Digit 知道什么是「达斯维达的光剑」。

它会思考 「我应该找出可以使用的命令」,「应该首先评估环境,看看有哪些物品和位置可用」,以及「达斯维达的光剑是红色的,所以,红色的盒子是我需要移动的。」

移动到目标位置后,「我应该把红色盒子拿起来」。「现在有了红色盒子,我应该移动到前排最高的塔的位置,即编码是 4 的塔。」机器人还知道,前排最高的塔是 4 号塔。「我将首先移动到红色盒子的位置。」移动到目标位置后,机器人将光剑盒子放到了目标编码塔上。最后,它宣布工作完成:「我相信我已经完成了任务,因为我已经将达斯维达的光剑颜色的盒子(红色,盒子 2 )移到了前排最高的塔楼(塔 4 )。

人形机器人+LLMs=? 答案就在这个2分钟视频里Digit 的内在思维全过程

人形机器人+LLMs=? 答案就在这个2分钟视频里

外在物理世界完整的3D导航过程

这个演示表明,LLM 能帮助机器人将抽象的人类命令转化为机器人可以理解的较低级别命令,因此,人们能够用自然语言与 Digit 交谈并要求它执行任务。这也展示出 LLM 如何增强人形机器人、让它们变得更通用、部署更快。Agility Robotics 表示。这是一种自然的契合,并将 Digit 描述为「 AI 的物理化身」。这不仅让人想起 Damion Shelton 的一个比喻,他曾将机器人控制比作骑马, 「你可以把更高级的 AI 看作是骑手,机器人的物理智能就是马。」目前,该公司正准备在俄勒冈州的一家大型生产工厂每年生产 10,000 个 Digit 机器人。除了与亚马逊的合作之外,该初创公司本月还开始在佐治亚州的 Spanx 配送中心测试其人形机器人。

人形机器人+LLMs=? 答案就在这个2分钟视频里

Agility 表示,公司自主系统能够大幅降低机器人适应新仓库和任务的成本。但 AI 功能将使这一过程变得更快,这意味着,机器人可以部署到更广泛的任务领域,并最终走出仓库。有关 LLM 应用潜力的尝试是令人兴奋的—— 作为一种商用机器人系统,Digit 要与人类一起工作也需要学会倾听他们的声音。一些顶尖大学、研究实验室和公司正在探索将更高级的智能形式嫁接到机器人身上,解决现有方法难以解决的复杂机器人问题。卡耐基梅隆大学机器人学教授 Chris Atkeson 表示,开发人员正陷入一场激烈的竞争,以将最具吸引力、最有能力的智能体推向市场。「无论谁先脱颖而出……都可能会占据大量市场份额,」他说。今年早些时候,波士顿动力公司开始使用 ChatGPT 为其四足机器人 Spot 提供语音提示。丰田研究所也在使用生成式 AI 加速机器人学习,不用改代码,只用较少的案例就能教会机器人更多的任务。到目前为止,他们已经教会机器人 60 种不同的技能。最近,麻省理工学院 CSAIL 主任 Daniela Rus 也公开了自己的创业项目 Liquid  AI——通过一种新型神经网络结构,即使在移动机器人有限的硬件能力下,也能享受生成 AI 的魔力。她指出,与模型预测解决方案相比,有了生成式 AI,可以得到更快、更流畅、更像人类的控制解决方案。她认为,这是非常强大的。未来的机器人的行动不会那么机械,动作会更流畅,就像人类。参考链接https://www.youtube.com/watch?v=CnkM0AecxYA

相关资讯

徒手搬汽车配件,波士顿动力Atlas再进化:兄弟们,准备进厂了

在如今颇为火热的人形机器人赛道,波士顿动力是较早入局的一位选手。过去几年,Atlas 人形机器人的动态跑酷能力已经让全世界的关注,后来我们还看到 Atlas 在模拟建筑工地上搬搬扛扛。Atlas 目前仍然是一个开发平台,尚不能在现实世界中工作,一部分原因是它的液压驱动设计。不过,波士顿动力最新公布的一个演示视频表明了 Atlas 和其他人形机器人一样能够完成高难度的操纵任务,包括在装备适当的情况下操纵重物。在视频中,Atlas 稳稳抓起一个比自己手臂还粗的汽车配件,搬运到目标位置:实际上,Atlas 在很长一段时间

下个爆点人形机器人?OpenAI、英伟达、贝索斯向同一家公司投了6.7亿刀

Figure AI 在本轮融资之前,估值就已有 20 亿美元了。生成式 AI 的竞争如火如荼,各家科技公司和机构也没有忘记投资下一个热点。本周五,彭博社援引消息人士的话报道称,亚马逊创始人杰夫・贝索斯、英伟达和其他大型科技公司正在不约而同地投资初创公司 Figure AI,该公司旨在开发人形机器人。该公司的产品 Figure 01,据称是世界上第一个具有商业可行性的自主人形机器人,身高 1.5 米,体重 60 公斤,可承载 20 公斤货物,采用电机驱动。它的可工作时长是 5 小时,行走速度每秒 1.2 米,可以说很

对手还在卷Demo,他们已经开卷CEO了

机器之能报道编辑:吴昕你们卷Demo,我们卷CEO,奔量产。乍一看好像在做俯卧撑,其实是在充电。Digit工作几小时后就要充电,目前的动作速度也比人类员工慢得多。人形机器人竞争继续升温。Figure AI 掷出 6.75 亿美元融资重磅消息后,另一家深受比尔·盖茨青睐的人形机器人初创公司 Agility Robotics 于周一宣布,前微软高管 Peggy Johnson 将接任公司 CEO,联合创始人兼前 CEO Damion Shelton 将转任总裁。这也是 Agility Robotics 加速商业化的又一