RT-H - AI在线

谷歌具身智能新研究：比RT-2优秀的RT-H来了

RT-H 在一系列机器人任务中的表现都优于 RT-2。随着 GPT-4 等大型语言模型与机器人研究的结合愈发紧密，人工智能正在越来越多地走向现实世界，因此具身智能相关的研究也正受到越来越多的关注。在众多研究项目中，谷歌的「RT」系列机器人始终走在前沿（参见《大模型正在重构机器人，谷歌 Deepmind 这样定义具身智能的未来》）。谷歌 DeepMind 去年 7 月推出的 RT-2：全球第一个控制机器人的视觉 - 语言 - 动作（VLA）模型。只需要像对话一样下达命令，它就能在一堆图片中辨认出霉霉，并送给她一罐可乐