CMU&ETH实现突破：机械狗点满迅速值天赋，超高速穿越妨碍，速率与危险兼备！

应用
2月5日
编辑

机器之心

足式机械人范围又一次迎来翻新！CMU 与 ETH Zurich 团队联合研发了一个名为「迅速但危险」（ABS，Agile But Safe）的新框架，为四足机械人在复杂情况中实现高速疏通提供了解决方案。ABS 不仅在避免碰撞方面展现出高效能力，还在极速上达到了前所未有的 3.1 米秒！在高速机械人疏通范围，实现同时兼顾速率和危险一直是一大挑战。但现在，卡内基梅隆大学（CMU）和苏黎世联邦理工学院（ETH）的研究团队带来了突破性进展。他们开发的新型四足机械人算法，不仅能在复杂情况中高速行进，还能巧妙避开妨碍，真正做

足式机械人范围又一次迎来翻新！CMU 与 ETH Zurich 团队联合研发了一个名为「迅速但危险」（ABS，Agile But Safe）的新框架，为四足机械人在复杂情况中实现高速疏通提供了解决方案。ABS 不仅在避免碰撞方面展现出高效能力，还在极速上达到了前所未有的 3.1 米秒！

在高速机械人疏通范围，实现同时兼顾速率和危险一直是一大挑战。但现在，卡内基梅隆大学（CMU）和苏黎世联邦理工学院（ETH）的研究团队带来了突破性进展。他们开发的新型四足机械人算法，不仅能在复杂情况中高速行进，还能巧妙避开妨碍，真正做到了「迅速而危险」。

CMU&ETH实现突破：机械狗点满迅速值天赋，超高速穿越妨碍，速率与危险兼备！

论文地址: https://arxiv.org/pdf/2401.17583.pdf

在 ABS 的加持下，机械狗在各种场景下都展现出了惊艳的高速避障能力：

妨碍重重的狭窄走廊：

CMU&ETH实现突破：机械狗点满迅速值天赋，超高速穿越妨碍，速率与危险兼备！

凌乱的室内场景：

CMU&ETH实现突破：机械狗点满迅速值天赋，超高速穿越妨碍，速率与危险兼备！

无论是草地还是户外，静态或动态妨碍，机械狗都从容应对：

CMU&ETH实现突破：机械狗点满迅速值天赋，超高速穿越妨碍，速率与危险兼备！

遇见婴儿车，机械狗灵巧躲闪开：

CMU&ETH实现突破：机械狗点满迅速值天赋，超高速穿越妨碍，速率与危险兼备！

警告牌、箱子、椅子也都不在话下：

CMU&ETH实现突破：机械狗点满迅速值天赋，超高速穿越妨碍，速率与危险兼备！

对于突然出现的垫子和人脚，也能轻松绕过：

CMU&ETH实现突破：机械狗点满迅速值天赋，超高速穿越妨碍，速率与危险兼备！

机械狗甚至还可以玩老鹰捉小鸡：

CMU&ETH实现突破：机械狗点满迅速值天赋，超高速穿越妨碍，速率与危险兼备！

ABS 突破性技术：

RL+ Learning model-free Reach-Avoid value

ABS 采用了一种双政策（Dual Policy）设置，包括一个「迅速政策」（Agile Policy）和一个「回复政策」（Recovery Policy）。迅速政策让机械人在妨碍情况中快速移动，而一旦 Reach-Avoid Value Estimation 检测到潜在危险（比如突然出现的婴儿车），回复政策就会介入，确保机械人危险。

CMU&ETH实现突破：机械狗点满迅速值天赋，超高速穿越妨碍，速率与危险兼备！

翻新点 1：怎么训练一个迅速政策 Agile Policy？

迅速政策的翻新之处在于，与以往简单地跟踪速率指令分别，它采用目标达成（position trakcing）的形式来最大化机械人的迅速性。这一政策训练机械人发展出感知疏通技能，以在没有碰撞的情况下达到指定目标。通过追求基座高速率的奖励条件，机械人自然学会在避免碰撞的同时实现最大迅速性。这种方法克服了传统速率跟踪（velocity tracking）政策在复杂情况中可能的保守限制，有效提高了机械人在妨碍情况中的速率和危险性。Agile Policy 在实机测试中极速达到了 3.1m/s

CMU&ETH实现突破：机械狗点满迅速值天赋，超高速穿越妨碍，速率与危险兼备！

翻新点 2：进修 Policy-conditioned reach-avoid value

「达防」（Reach-Avoid, RA）值进修的翻新之处在于，它采用了无模型的方式进修，与传统的基于模型的可达性分析方法分别，更适合无模型的强化进修政策。此方法不是进修全局 RA 值，而是使其依赖于一定政策，这样可以更好地预测迅速政策的失败。通过简化的观测集，RA 值网络可以有效地概括并预测危险风险。RA 值被用于指导回复政策，帮助机械人优化疏通以避免碰撞，从而实现在保证危险的同时提高迅速性的目标。

下图展现了针对一定妨碍物集合进修到的 RA（达防）值。随着机械人速率的变化，RA 值的分布景观也相应变化。RA 值的符号合理地指示了迅速政策的危险性。换句话说，这张图通过分别的 RA 值展现了机械人在分别速率下，面对一定妨碍物时的危险风险程度。RA 值的高低变化反映了机械人在分别形态下执行迅速政策时可能遇到的危险风险。

CMU&ETH实现突破：机械狗点满迅速值天赋，超高速穿越妨碍，速率与危险兼备！

翻新点 3：用 Reach-Avoid Value 和回复政策来拯救机械人

回复政策的翻新之处在于，它能使四足机械人快速跟踪线速率和角速率指令，作为一种备用保护政策。与迅速政策分别，回复政策的观测空间专注于跟踪线速率和角速率命令，不需要外部感知信息。回复政策的任务奖励专注于线性速率跟踪、角速率跟踪、保持存活和保持姿势，以便平滑切换回迅速政策。这种政策的训练同样在仿真情况中进行，但有一定的域随机化和课程设置，以更好地适应可能触发回复政策的形态。这种方法为四足机械人提供了在高速疏通中快速应对潜在失败的能力。

下图展现了当回复政策在两个一定情况（I 和 II）下被触发时，RA（达防）值景观的可视化展现。这些可视化展现是在 vx（沿 x 轴的速率）与 ωz（绕 z 轴的角速率）平面以及 vx 与 vy（沿 y 轴的速率）平面上进行的。图中显示了搜索前的初始旋转形态（即机械人基座当前的旋转形态）和通过搜索得到的命令。简单来说，这些图表展现了在一定条件下，通过回复政策搜索得到的最佳疏通指令，以及这些指令如何影响 RA 值，从而反映机械人在分别疏通形态下的危险性。

CMU&ETH实现突破：机械狗点满迅速值天赋，超高速穿越妨碍，速率与危险兼备！

鲁棒性测试

作者在「12kg 负载 / 篮球撞击 / 脚踢 / 雪地」的四个场景下测试了 ABS 框架的鲁棒性，机械狗都从容应对：

CMU&ETH实现突破：机械狗点满迅速值天赋，超高速穿越妨碍，速率与危险兼备！

研究团队

这项研究是由 CMU 和 ETH 的研究团队共同完成。团队成员包括 Tairan He, Chong Zhang, Wenli Xiao, Guanqi He, Changliu Liu 和 Guanya Shi。他们的合作不仅在机械人技术范围取得了重大突破，更开启了四足机械人新的应用可能。这项技术的成功展现了四足机械人在高速移动和危险避障范围的巨大潜力。未来，这种高速且危险的四足机械人有望在搜救、探险甚至是家庭服务等多个范围发挥重要作用。 CMU&ETH实现突破：机械狗点满迅速值天赋，超高速穿越妨碍，速率与危险兼备！

给TA打赏

共{{data.count}}人

人已打赏

卡内基梅隆大学苏黎世联邦理工学院

“女巴菲特”惊人预测人形机器人将于2030年进入家庭，通用AI出现，赞中国开源力量

2024-2-5 14:37:00

2亿参数时序模型替代LLM？google突破性研究被批「犯新手错误」

2024-2-5 14:56:00

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

TOP1

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新
12月16日
TOP2

ChatGPT遇到这些人名开始自闭，OpenAI回应了
12月4日
TOP3

平安人寿ChatBI：大模型智能化报表的深度实践
12月4日
字节跳动豆包 AI 文生图“喜提新技能”：App 可生成带有指定文字的图片
12月5日
超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~
12月12日
OpenAI 从谷歌 DeepMind 挖角三名高级工程师，专注于多模态 AI 研发
12月4日
腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践
12月11日
实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！
12月16日

❯

个人中心

今日签到

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

我的优惠劵

_￥_优惠劵
使用时效：无法使用
使用时效：
之前
使用时效：永久有效

优惠劵ID：
×
限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]
所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×
删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部