智元发布家务机器人基座大模型 GO-1，成功率大幅提升

2025-03-10 04:59

3月10日，智元机器人正式推出其首个通用具身基座大模型 ——Genie Operator-1（简称 GO-1）。这一消息引起了广泛关注，特别是其在家庭服务机器人的潜力方面，似乎为未来的家务管理带来了新的希望。根据智元机器人的官方介绍，GO-1大模型通过学习大量人类视频，展示了其在执行多项家务任务上的出色表现，如递送水杯、制作餐点和迎接客人等。

在技术性能方面，GO-1的表现相较于现有模型有显著提升，其平均成功率提高了32%。经过测试，GO-1在一些特定任务如倒水、清理桌面和补充饮料等方面，展现出了更加优异的能力。智元机器人表示，这一进展得益于新提出的 Vision-Language-Latent-Action（ViLLA）架构，这一架构能有效利用高质量数据集和大量视频数据，以增强模型的泛化能力。

此外，智元机器人去年底联合多个机构宣布开源百万级的真机数据集项目 AgiBot World，该数据集覆盖超过100种真实场景，其中40% 为家居场景，20% 为工业场景。这一数据集为训练和提升机器人能力提供了重要的基础。

智元机器人强调，GO-1大模型具备几大特点:一是能够从人类视频中学习，提升对人类行为的理解;二是具有强大的小样本快速泛化能力，可以在极少数据甚至零样本下适应新任务;三是可以在不同的机器人形态之间迁移，实现 “一脑多形” 的灵活应用。通过持续进化，GO-1能够从实际执行中获取数据，不断优化和提高自身能力。

智元机器人的这一发布，标志着家务机器人向具身智能的普及迈出了重要一步。根据信达证券的分析，AI 的进展正在从根本上推动人形机器人和自动驾驶等技术的发展，未来人形机器人产业化的前景值得期待。

稚晖君的「好东西」揭晓！首个通用具身基座模型，机器人告别「看得懂做不来」

上周五，稚晖君在微博上预告，「下周有好东西发布」。还没进入「下周」多久，智元机器人的「好东西」揭晓了，还是双重惊喜：Vision-Language-Latent-Action (ViLLA) 架构和通用具身基座大模型 GO-1。机器人训练，苦数据难久矣。

3/10/2025 12:02:00 PM

机器之心

Nature子刊 | KAUST团队训练大语言模型，进行作为近似语义蕴涵的蛋白质功能预测

编辑 | 萝卜皮基因本体论（Gene Ontology，GO）是一种公理理论，目前拥有超过 100,000 条公理，描述了三个子本体中蛋白质的分子功能、生物过程和细胞位置。使用 GO 预测蛋白质的功能需要模型拥有学习和推理能力。科学家已经开发出多种方法来自动预测蛋白质功能，但有效利用 GO 中的所有公理进行知识增强学习仍然是一个挑战。阿卜杜拉国王科技大学（King Abdullah University of Science & Technology，KAUST）的研究人员开发了 DeepGO-SE，这是一种使用预

3/15/2024 3:13:00 PM

ScienceAI

只需百行代码，让H100提速30%，斯坦福开源全新AI加速框架

提高 GPU 利用率，就是这么简单。AI 的快速发展，伴随而来的是大计算量。这就自然而然的引出了一个问题：如何减少 AI 对计算的需求，并提高现有 AI 计算效率。为了回答这一问题，来自斯坦福的研究者在博客《GPUs Go Brrr》中给出了答案。博客地址：：一是硬件真正需要什么？二是如何满足硬件需求？文章用大量篇幅讨论了如何让 GPU 更快的运行，并发布了一个库 ThunderKittens，用户可以很容易地在 CUDA 上编写快速的深度学习内核。其具有以下特点：简单，ThunderKittens 写起来非常简单

5/13/2024 3:18:00 PM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ Haisnap横空出世，小白用户也能轻松打造AI应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 本地部署DeepSeek+DiFy平台构建智能体应用韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

智元发布家务机器人基座大模型 GO-1，成功率大幅提升

相关资讯

稚晖君的「好东西」揭晓！首个通用具身基座模型，机器人告别「看得懂做不来」

Nature子刊 | KAUST团队训练大语言模型，进行作为近似语义蕴涵的蛋白质功能预测

只需百行代码，让H100提速30%，斯坦福开源全新AI加速框架