斯坦福最强家务机器人ALOHA 2来了，成本不到20万，联手谷歌DeepMind，完全开源

作者：机器之心

2024-02-08 05:00

可以想象，不断进化的双臂机器人未来将最大程度地「解放」人的双手。2023 年，斯坦福大学等机构推出了一个用于双机械手远程操作的低成本开源硬件系统 ALOHA，它可以远程操作并完成组装链条、托举乒乓球等复杂、丰富的任务。今年 1 月，谷歌 DeepMind 与斯坦福又联合推出了 Mobile ALOHA，同样可以进行远程操作并模仿双手操作，通过移动底座在大的空间范围内实现远程操作。这样一来，备菜、翻炒、出锅，洗衣、逗猫、浇花它是样样精通，名副其实的家务机器人火出了圈。今天，谷歌 DeepMind 联合斯坦福推出了 A

可以想象，不断进化的双臂机器人未来将最大程度地「解放」人的双手。

2023 年，斯坦福大学等机构推出了一个用于双机械手远程操作的低成本开源硬件系统 ALOHA，它可以远程操作并完成组装链条、托举乒乓球等复杂、丰富的任务。

今年 1 月，谷歌 DeepMind 与斯坦福又联合推出了 Mobile ALOHA，同样可以进行远程操作并模仿双手操作，通过移动底座在大的空间范围内实现远程操作。这样一来，备菜、翻炒、出锅，洗衣、逗猫、浇花它是样样精通，名副其实的家务机器人火出了圈。

今天，谷歌 DeepMind 联合斯坦福推出了 ALOHA 的增强版本 ——ALOHA 2。与一代相比，ALOHA 2 具有更强的性能、人体工程学设计和稳健性，且成本还不到 20 万元人民币。斯坦福最强家务机器人ALOHA 2来了，成本不到20万，联手谷歌DeepMind，完全开源并且，为了加速大规模双手操作的研究，ALOHA 2 相关的所有硬件设计全部开源了，并提供了详细的教程，以及具有系统识别功能的 ALOHA 2 MuJoCo 模型。

谷歌 DeepMind 放出了相关论文《ALOHA 2: An Enhanced Low-Cost Hardware for Bimanual Teleoperation》。

论文地址：https://aloha-2.github.io/assets/aloha2.pdf

项目主页：https://aloha-2.github.io/

我们先来一睹升级后的 ALOHA 2 能做些什么，比如将不同的玩具放进三个不同的碗里。

玩杂耍，你扔我接。

开可乐瓶并将可乐倒进别的杯子里、开酸奶盒。

给熊猫玩偶戴上美瞳。

更难以想象的是，它还能变身扒手，悄无声息拿走你的钱包，并给你放回去。

简直绝了！ALOHA 2 显著提高了一代 ALOHA 的耐用性，从而能够在更复杂的任务上进行大规模数据收集。

相较于一代，ALOHA 2 都升级了些啥

为支持对复杂操作任务的研究，在 ALOHA 平台上扩大数据收集的规模成为目标之一，包括使用的机器人数量、每台机器人的数据收集小时数以及数据收集的多样性。这一扩展过程改变了相对于第一代 ALOHA 平台的要求和范围。

对于 ALOHA 2，除了在 ALOHA 平台的基础上建设，研究者还针对以下领域寻求进一步改进：

性能和任务范围：增强 ALOHA 性能的关键组件，包括夹持器和控制器，以实现更广泛的操控任务。

用户友好性和人体工学：为了优化大规模数据收集，优先考虑用户体验和舒适度，包括改进用户界面系统的响应性和人体工学设计。

稳健性：增加系统的稳健性，最大限度地减少因诊断和维修造成的停机时间。这就需要简化机械设计，并确保更大规模的机器人队伍在整体上易于维护。

根据上述目标，ALOHA 2 的具体改进如下：

夹持器：研究者为领导机器人和跟随机器人的夹持器设计了新的低摩擦轨道。对于领导机器人，这改善了遥操作的人体工学和响应速度。对于跟随机器人，这改善了延迟和夹持器的力量输出。此外，他们还升级了手指上的抓胶带材料，以提高耐用性和抓取小物体的能力。

重力补偿：研究者使用现成的组件创建了一个被动的重力补偿机制，与 ALOHA 原有的抓带材料系统相比，这提高了耐用性。

框架：研究者简化了围绕工作单元的框架，同时保持了相机安装点的刚性。这些变化为人机协作者和机器人互动的道具提供了空间。

相机：ALOHA 2 使用更小的英特尔 RealSense D405 相机和定制的 3D 打印相机支架，以减小跟随臂的占地面积，从而减少对操作任务的阻碍。这些摄像头还具有更大的视场角、深度、全局快门和更多的定制功能。

模拟：研究者在 MuJoCo Menagerie 中的 MuJoCo 模型中模拟了 ALOHA 2 机器人的精确规格，从而改进了数据收集、策略学习和模拟评估，以应对具有挑战性的操纵任务。

夹持器

为了使遥控操作更顺畅，并改善人体工程学，本次采用了低摩擦轨道设计，降低了机械复杂性，从而取代了 ALOHA 原有的剪刀导轨式机械手设计。

研究者设计并制造了低摩擦随动机械手，取代了 ALOHA 最初的设计。较低的摩擦减少了领导机器人和跟随机器人夹持器之间感知的延迟，显著改善了远程操作期间的用户体验。

框架

研究者重新设计了支撑框架，并使用 20x20mm 铝型材将其制成。框架为领导机器人和重力补偿系统提供支撑，并为俯视摄像机和虫眼摄像机提供安装点。

与 ALOHA 相比，本次设计进行了简化，去掉了工作台与遥控操作员相对一侧的垂直框架。增加的空间使数据收集方式更加多样化。例如，人类协作者可以更轻松地站在工作区的对面与机器人互动，从而收集人机互动数据。此外，还可以在工作台前摆放较大的道具，让机器人与之互动。

模拟

研究者发布了用于 ALOHA 2 工作单元的 MuJoCo Menagerie 模型，它对于远程操作和模拟学习非常有用。

与之前发布的 ALOHA 模型相比，MuJoCo 的物理精度更高、视觉保真度更高，允许快速、直观、可扩展的模拟数据收集。

MuJoCo 模型渲染。

模拟远程操作任务。

以下为使用 Google Scanned Objects Dataset 与 MuJoCo 模型进行远程操作的示例（1 倍速度）：

更多细节内容请参阅原论文。

相关标签：

斯坦福大学谷歌 DeepMind MuJoCo ALOHA 2

相关资讯

斯坦福开源的机器人厨子，今天又接手了所有家务

斯坦福开源的机器人厨子，今天又接手了所有家务

机器人忙碌的一天。这年头，机器人真的要成精了，带回家后是个做家务的小能手。烹饪几道美食手到拈来，一会儿功夫速成大餐：滑蛋虾仁、蚝油生菜、干贝烧鸡，不知道的还以为是真人厨师做成的：备菜环节也是做的有模有样，只见它熟练的拿出一颗生菜切掉根部，然后轻轻的敲打鸡蛋放入碗中：打蛋环节还知道要把蛋壳丢到一边，看样子是个讲究的机器人，再也不怕吃煎蛋时意外吃到蛋壳的惊吓了：煎炒环节机器人进行不停地翻炒，以免糊锅：还不忘给蚝油生菜注入灵魂蒜末。这次咱不用菜刀拍蒜，普通的水果刀也能切出蒜泥来，可见刀功了得：最后将做好的酱汁淋到生菜上，

从ALOHA迈向Humanplus，斯坦福开源人形机器人，「高配版人类」上线

从ALOHA迈向Humanplus，斯坦福开源人形机器人，「高配版人类」上线

人形机器人的「Hello World」。说起前段时间斯坦福开源的 Mobile ALOHA 全能家务机器人，大家肯定印象深刻，ALOHA 做起家务活来那是有模有样：滑蛋虾仁、蚝油生菜、干贝烧鸡，一会儿功夫速成大餐：研究团队来自斯坦福，由三个人共同打造完成。Zipeng Fu 为项目共同负责人，他是斯坦福大学 AI 实验室的计算机科学博士生，师从 Chelsea Finn 教授；Tony Z. Zhao 也是斯坦福大学的计算机科学博士生，导师也是 Chelsea Finn。现在，继 ALOHA 之后，Zipeng F

翻车，才是斯坦福炒菜机器人学习人类的常态

翻车，才是斯坦福炒菜机器人学习人类的常态

Mobile ALOHA 也有翻车时刻。电视剧中角色的惊艳亮相不一定能打动你的心，但斯坦福全职管家兼御用大厨一定能拿下你对机器人的期待。你还记得斯坦福 Mobile ALOHA 的神操作吗？备菜、翻炒、出锅，洗衣、逗猫、浇花它是样样精通。不过它也并非一直如此优秀。人有失足，马有失蹄，ALOHA 也有翻车时刻。我们一起品鉴一下 ALOHA 的「报错」操作。原本是为了擦酒杯下的酒渍，或许是怕观众老爷看不出，只能多洒出来一点来引起注意。每个物品都是独立的个体，锅、油、虾、碟都将有属于自己的归宿。抓走物品旁边的空气，四舍五

资讯热榜

罗永浩 Jarvis 初创项目“J1 Assistant AI 助理”上线，利用语音与大模型互动突破非视距条件依赖！大规模区域、低成本的UWB-LiDAR标定与单次定位框架 SK 海力士宣布参展 CES 2025，将展示 122TB 企业级固态硬盘等产品类 Mac Mini 大小的个人 AI 超算：英伟达 Project Digits 发布，起价 3000 美元斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手从DeepSeek-V3发布谈大模型的技术突破与未来机遇别再将LLM当成数据库了 3 到 5 秒即可同声传译 40 余种语言，时空壶推出 W4 Pro 实时翻译耳机

标签云