全球首个:智元机器人宣布开源 AgiBot World 百万真机数据集,大幅超越谷歌 Open X-Embodiment

智元机器人将按计划在 HuggingFace、Github 以及 agibot-world.com 项目主页上分批上传数据。
感谢智元机器人今天宣布推出全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World

全球首个:智元机器人宣布开源 AgiBot World 百万真机数据集,大幅超越谷歌 Open X-Embodiment

智元机器人表示:“这一里程碑式的开源项目,标志着具身智能领域‘ImageNet 时刻’已到来。”

智元机器人将按计划在 HuggingFace、Github 以及 agibot-world.com 项目主页上分批上传数据,AI在线附地址如下:

  • HuggingFace:

https://huggingface.co/agibot-world

  • Github:

https://github.com/OpenDriveLab/agibot-world

  • 项目主页:

https://agibot-world.com/

智元机器人介绍称,AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集。相比谷歌开源的 Open X-Embodiment 数据集,AgiBot World 长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准

未来,智元机器人将陆续开源千万仿真数据,以支持更泛化和更通用的大模型训练;将发布具身基座大模型,可支持模型微调;发布全套工具链,实现采集、训练和评测闭环。

AI在线附官方介绍如下:

01、多样任务,十八般武艺样样精通

AgiBot World 数据集中涵盖的场景具备多样化和多元化特点,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等复杂动作,几乎涵盖了人类日常生活所需的绝大多数场景。比如,其中一个视频展示的是机器人在电脑主机中内存条的过程,这需要机器人毫米级精细控制,稍有不慎就可能导致设备损坏,其如神经纤维般灵敏的末端触觉传感器,助力机器人实现了精准的对接;还有试图教会机器人如何用洗碗机的视频 —— 在这条数据中,展现了厨房水池里勺筷碗盘层层堆叠,机器人将杂乱的餐具一一准确无误地整理至洗碗机相应卡槽中,操作流程长且动作十分繁琐。AgiBot World 数据集中收录了 80 多种日常生活中的多样化技能视频,让机器人能够“十八般武艺样样精通”。

02、全域场景,上得厅堂下得厨房

AgiBot World 数据集诞生于智元自建的大规模数据采集工厂与应用实验基地,空间总面积超过 4000 平方米,包含 3000 多种真实物品,一方面为机器人大规模数据训练提供场地,另一方面真实复刻了家居、餐饮、工业、商超和办公五大核心场景,全面覆盖了机器人在生产、生活中的典型应用需求。

全球首个:智元机器人宣布开源 AgiBot World 百万真机数据集,大幅超越谷歌 Open X-Embodiment

家居场景再现人类真实住宅布局,包括卧室、客厅、厨房、卫生间等核心空间,可以实现机器人家务清洁、物品整理和厨房任务等。工业场景模拟分拣与物流自动化,复刻工业仓库与生产线,包括分拣系统、打包设备、传输带等,可以实现物料分拣、包装打包、物流搬运等。通过多场景的高度还原与任务设计,AgiBot World 为机器人研发和测试构建了实现具身智能的必要条件。

像这样类似的真实场景 AgiBot World 百万真机数据集中有 100 多种,家居占 40%、餐饮 20%、工业 20%、商超 10% 以及办公场景 10%,其中 80% 的任务均为长程任务,任务时长集中在 60s-150s 之间,并且包含多个原子技能,长程数据是 DROID 和 OpenX-Embodiment 的 10 倍以上,3000 多种物品基本涵盖了这五大场景,同时还在不断丰富中。

全球首个:智元机器人宣布开源 AgiBot World 百万真机数据集,大幅超越谷歌 Open X-Embodiment

场景和任务分布

全球首个:智元机器人宣布开源 AgiBot World 百万真机数据集,大幅超越谷歌 Open X-Embodiment

各个场景物品分类

全球首个:智元机器人宣布开源 AgiBot World 百万真机数据集,大幅超越谷歌 Open X-Embodiment

数据集时长分布

03、全能硬件,没有金刚钻难揽瓷器活

机器人能够如此灵活智能、胜任多种任务和技能,也得益于智元对于机器人本体的迭代升级 —— 我们为机器人安装了 8 个环绕式布局的摄像头,让机器人可以实时 360 度全方位感知周围环境的动态变化;配备 6 自由度灵巧手,保障动作精准且灵活,同时末端还增加了六维力传感器和高精度触觉传感器,能够感知力的微小变化,做到“拿捏有度”;机器人全身拥有 32 个主动自由度,能够灵活应对多种复杂任务。

全球首个:智元机器人宣布开源 AgiBot World 百万真机数据集,大幅超越谷歌 Open X-Embodiment

04、质量把控,严师出高徒

同时,数据集的质量,也是决定机器人能否快速学习的关键。AgiBot World 中的数据,都需历经一套严苛的流程与验证链路。在项目之初,我们便邀请学界、工业界、消费者等多方介入提出建议,不断迭代流程设计规划;数据采集质量环节,无论是采集员还是采集质量,均由完善的管理体系和专业的管理团队全程保障;对于采集到的数据本身,将通过端、云两侧严格筛选,自动剔除不符合要求的数据,再由专业的审核员逐帧审核,确保每一个动作都符合任务标准;最后,这些数据还会通过算法进行二次验证,全方位筑牢数据质量防线。

全球首个:智元机器人宣布开源 AgiBot World 百万真机数据集,大幅超越谷歌 Open X-Embodiment

相关资讯

一年秀一次!稚晖君的人形机器人上新了,还有开源、免费彩蛋

一年一秀,稚晖君的第二代人形机器人来了。灵巧小手,正在麻将桌上叱咤风云:不对不对,让我们先看看整体气质:然后是常规家务,能看出来也是非常熟练:在大模型风靡的 2024 年,如果说 AI 领域什么最火,「具身智能」这个方向必定位列其中。视线放到国内,「智元机器人」这家具身智能公司备受瞩目。自 2023 年 2 月成立以来,「智元机器人」已马不停蹄地完成了 6 轮融资,迅速成为机器人创业圈的「顶流项目」。创业半年,稚晖君和团队就拿出了首款产品「远征 A1」。一出道,「远征 A1」的行走能力和人机互动就是业界领先水平。不

稚晖君来填坑:开源灵犀X1全套图纸+代码,复刻搞起来

稚晖君表示,这是 1024 的福利。 稚晖君将智元机器人灵犀 X1 的全套图纸 代码开源了。 在刚刚过去的一天,稚晖君表示,趁着 1024 程序员节,给广大网友发个福利,开源灵犀 X1 全套资料,也欢迎大家复刻。

智元机器人、穹彻智能获新一轮融资,数亿热钱涌入具身智能;xAI 模型将授权特斯拉并分享其收入?马斯克回应丨AI情报局

今日融资快报穹彻智能完成数亿元 Pre-A 轮融资穹彻智能完成累计数亿元人民币的天使轮和 Pre-A 轮两轮融资。 联合创始人卢策吾在斯坦福人工智能实验室的博士后期间,师从李飞飞教授和 Leo Guibas 教授。 现任上海交通大学教授,是国内最早研究具身智能领域的学者之一,因其在这一领域的杰出贡献,获得 2023 年科学探索奖。