字节跳动发布 GR-2 机器人 AI 大模型:任务平均完成率 97.7%,模拟人类学习处理复杂任务

字节跳动研究团队最新推出了第二代机器人大模型 GR-2(Generative Robot2.0),其亮点在于创新构建“机器人婴儿期”学习阶段,模仿人类成长学习复杂任务,具备卓越的泛化能力和多任务通用性。 GR-2 模型和其它很多 AI 模型一样,包括预训练和微调两个过程。在预训练阶段,GR-2“观看”了多达 3800 万个来自各类公开数据集的互联网视频以及 500 亿个 tokens,涵盖了家庭、户外、办公室等多种日常场景,让 GR-2 具备在后续策略学习中跨越广泛机器人任务和环境的泛化能力。在微调阶段,团队使用机

字节跳动研究团队最新推出了第二代机器人大模型 GR-2(Generative Robot2.0),其亮点在于创新构建“机器人婴儿期”学习阶段,模仿人类成长学习复杂任务,具备卓越的泛化能力和多任务通用性。

GR-2 模型和其它很多 AI 模型一样,包括预训练和微调两个过程。

在预训练阶段,GR-2“观看”了多达 3800 万个来自各类公开数据集的互联网视频以及 500 亿个 tokens,涵盖了家庭、户外、办公室等多种日常场景,让 GR-2 具备在后续策略学习中跨越广泛机器人任务和环境的泛化能力。

字节跳动发布 GR-2 机器人 AI 大模型:任务平均完成率 97.7%,模拟人类学习处理复杂任务

在微调阶段,团队使用机器人轨迹微调了视频生成和动作预测,展现出卓越的多任务学习能力,在超过 100 个任务中实现了平均成功率 97.7%。

字节跳动发布 GR-2 机器人 AI 大模型:任务平均完成率 97.7%,模拟人类学习处理复杂任务

此外,GR-2 在新颖、之前未见的场景中表现出色的泛化能力,包括新的背景、环境、物体和任务。

AI在线附上参考地址

GR-2: A Generative Video-Language-Action Model with Web-Scale Knowledge for Robot Manipulation

字节跳动推机器人大模型 GR-2 展现智能自主操作新高度

GR-2 登场!ByteDance Research 提出机器人大模型,具备世界建模和强大泛化能力

相关资讯

傅利叶发布新一代通用人形机器人 GR-2,CEO 顾捷称其有望三五年内迎来“GPT 时刻”

傅利叶智能今天发布了自主研发的新一代通用人形机器人 GR-2,官方称其产品愿景为“为 AI 打造最佳具身载体”,具备更灵活、更强劲、更开放的特性。 AI在线汇总该机器人主要信息如下:其外观沿用 GR-1 的仿生设计语言,升级后的身高达到 175cm,体重 63kg,全身共有 53 个自由度,单臂运动负载达 3kg,能够完成更复杂的操作。此外,该机器人搭载的新一代电池容量实现翻倍,续航时间延长至 2 小时。其在支持直充的基础上,还增加可拆卸换电方案,充分满足运动需求。该机器人还搭载了新一代灵巧手,单手自由度由初代的

字节具身智能新成果:用大规模视频数据训练GR-1,复杂任务轻松应对

如何利用大规模的视频数据来帮助机器人学习复杂任务?最近 GPT 模型在 NLP 领域取得了巨大成功。GPT 模型首先在大规模的数据上预训练,然后在特定的下游任务的数据上微调。大规模的预训练能够帮助模型学习可泛化的特征,进而让其轻松迁移到下游的任务上。但相比自然语言数据,机器人数据是十分稀缺的。而且机器人数据包括了图片、语言、机器人状态和机器人动作等多种模态。为了突破这些困难,过去的工作尝试用 contrastive learning [1] 和 masked modeling [2] 等方式来做预训练以帮助机器人更

GR-2登场!ByteDance Research提出机器人大模型,具备世界建模和强大泛化能力

最近,ByteDance Research 的第二代机器人大模型 —— GR-2,终于放出了官宣视频和技术报告。GR-2 以其卓越的泛化能力和多任务通用性,预示着机器人大模型技术将爆发出巨大潜力和无限可能。GR-2 官方项目页面: GR-2:百炼出真金和许多大模型一样,GR-2 的训练包括预训练和微调两个过程。如果把机器人和人做比较,预训练过程就好像是人类的 “婴儿期”。而 GR-2 的婴儿期与其他机器人截然不同。在预训练的过程中,GR-2 在互联网的海洋中遨游。它在 3800 万个互联网视频片段上进行生成式训练,