智元发布家务机器人基座大模型 GO-1,成功率大幅提升

3月10日,智元机器人正式推出其首个通用具身基座大模型 ——Genie Operator-1(简称 GO-1)。 这一消息引起了广泛关注,特别是其在家庭服务机器人的潜力方面,似乎为未来的家务管理带来了新的希望。 根据智元机器人的官方介绍,GO-1大模型通过学习大量人类视频,展示了其在执行多项家务任务上的出色表现,如递送水杯、制作餐点和迎接客人等。

3月10日,智元机器人正式推出其首个通用具身基座大模型 ——Genie Operator-1(简称 GO-1)。这一消息引起了广泛关注,特别是其在家庭服务机器人的潜力方面,似乎为未来的家务管理带来了新的希望。根据智元机器人的官方介绍,GO-1大模型通过学习大量人类视频,展示了其在执行多项家务任务上的出色表现,如递送水杯、制作餐点和迎接客人等。

在技术性能方面,GO-1的表现相较于现有模型有显著提升,其平均成功率提高了32%。经过测试,GO-1在一些特定任务如倒水、清理桌面和补充饮料等方面,展现出了更加优异的能力。智元机器人表示,这一进展得益于新提出的 Vision-Language-Latent-Action(ViLLA)架构,这一架构能有效利用高质量数据集和大量视频数据,以增强模型的泛化能力。

image.png

此外,智元机器人去年底联合多个机构宣布开源百万级的真机数据集项目 AgiBot World,该数据集覆盖超过100种真实场景,其中40% 为家居场景,20% 为工业场景。这一数据集为训练和提升机器人能力提供了重要的基础。

智元机器人强调,GO-1大模型具备几大特点:一是能够从人类视频中学习,提升对人类行为的理解;二是具有强大的小样本快速泛化能力,可以在极少数据甚至零样本下适应新任务;三是可以在不同的机器人形态之间迁移,实现 “一脑多形” 的灵活应用。通过持续进化,GO-1能够从实际执行中获取数据,不断优化和提高自身能力。

智元机器人的这一发布,标志着家务机器人向具身智能的普及迈出了重要一步。根据信达证券的分析,AI 的进展正在从根本上推动人形机器人和自动驾驶等技术的发展,未来人形机器人产业化的前景值得期待。

相关资讯

稚晖君的「好东西」揭晓!首个通用具身基座模型,机器人告别「看得懂做不来」

上周五,稚晖君在微博上预告,「下周有好东西发布」。 还没进入「下周」多久,智元机器人的「好东西」揭晓了,还是双重惊喜:Vision-Language-Latent-Action (ViLLA) 架构和通用具身基座大模型 GO-1。 机器人训练,苦数据难久矣。

Nature子刊 | KAUST团队训练大语言模型,进行作为近似语义蕴涵的蛋白质功能预测

编辑 | 萝卜皮基因本体论(Gene Ontology,GO)是一种公理理论,目前拥有超过 100,000 条公理,描述了三个子本体中蛋白质的分子功能、生物过程和细胞位置。使用 GO 预测蛋白质的功能需要模型拥有学习和推理能力。科学家已经开发出多种方法来自动预测蛋白质功能,但有效利用 GO 中的所有公理进行知识增强学习仍然是一个挑战。阿卜杜拉国王科技大学(King Abdullah University of Science & Technology,KAUST)的研究人员开发了 DeepGO-SE,这是一种使用预

只需百行代码,让H100提速30%,斯坦福开源全新AI加速框架

提高 GPU 利用率,就是这么简单。AI 的快速发展,伴随而来的是大计算量。这就自然而然的引出了一个问题:如何减少 AI 对计算的需求,并提高现有 AI 计算效率。为了回答这一问题,来自斯坦福的研究者在博客《GPUs Go Brrr》中给出了答案。博客地址::一是硬件真正需要什么?二是如何满足硬件需求?文章用大量篇幅讨论了如何让 GPU 更快的运行,并发布了一个库 ThunderKittens,用户可以很容易地在 CUDA 上编写快速的深度学习内核。其具有以下特点:简单,ThunderKittens 写起来非常简单