足式机械人范围又一次迎来翻新!CMU 与 ETH Zurich 团队联合研发了一个名为 「迅速但危险」(ABS,Agile But Safe)的新框架,为四足机械人在复杂情况中实现高速疏通提供了解决方案。ABS 不仅在避免碰撞方面展现出高效能力,还在极速上达到了前所未有的 3.1 米秒!
在高速机械人疏通范围,实现同时兼顾速率和危险一直是一大挑战。但现在,卡内基梅隆大学(CMU)和苏黎世联邦理工学院(ETH)的研究团队带来了突破性进展。他们开发的新型四足机械人算法,不仅能在复杂情况中高速行进,还能巧妙避开妨碍,真正做到了「迅速而危险」。
论文地址: https://arxiv.org/pdf/2401.17583.pdf
在 ABS 的加持下,机械狗在各种场景下都展现出了惊艳的高速避障能力:
妨碍重重的狭窄走廊:
凌乱的室内场景:
无论是草地还是户外,静态或动态妨碍,机械狗都从容应对:
遇见婴儿车,机械狗灵巧躲闪开:
警告牌、箱子、椅子也都不在话下:
对于突然出现的垫子和人脚,也能轻松绕过:
机械狗甚至还可以玩老鹰捉小鸡:
ABS 突破性技术:
RL+ Learning model-free Reach-Avoid value
ABS 采用了一种双政策(Dual Policy)设置,包括一个「迅速政策」(Agile Policy)和一个「回复政策」(Recovery Policy)。迅速政策让机械人在妨碍情况中快速移动,而一旦 Reach-Avoid Value Estimation 检测到潜在危险(比如突然出现的婴儿车),回复政策就会介入,确保机械人危险。
翻新点 1:怎么训练一个迅速政策 Agile Policy?
迅速政策的翻新之处在于,与以往简单地跟踪速率指令分别,它采用目标达成(position trakcing)的形式来最大化机械人的迅速性。这一政策训练机械人发展出感知疏通技能,以在没有碰撞的情况下达到指定目标。通过追求基座高速率的奖励条件,机械人自然学会在避免碰撞的同时实现最大迅速性。这种方法克服了传统速率跟踪(velocity tracking)政策在复杂情况中可能的保守限制,有效提高了机械人在妨碍情况中的速率和危险性。Agile Policy 在实机测试中极速达到了 3.1m/s
翻新点 2:进修 Policy-conditioned reach-avoid value
「达防」(Reach-Avoid, RA)值进修的翻新之处在于,它采用了无模型的方式进修,与传统的基于模型的可达性分析方法分别,更适合无模型的强化进修政策。此方法不是进修全局 RA 值,而是使其依赖于一定政策,这样可以更好地预测迅速政策的失败。通过简化的观测集,RA 值网络可以有效地概括并预测危险风险。RA 值被用于指导回复政策,帮助机械人优化疏通以避免碰撞,从而实现在保证危险的同时提高迅速性的目标。
下图展现了针对一定妨碍物集合进修到的 RA(达防)值。随着机械人速率的变化,RA 值的分布景观也相应变化。RA 值的符号合理地指示了迅速政策的危险性。换句话说,这张图通过分别的 RA 值展现了机械人在分别速率下,面对一定妨碍物时的危险风险程度。RA 值的高低变化反映了机械人在分别形态下执行迅速政策时可能遇到的危险风险。
翻新点 3:用 Reach-Avoid Value 和回复政策来拯救机械人
回复政策的翻新之处在于,它能使四足机械人快速跟踪线速率和角速率指令,作为一种备用保护政策。与迅速政策分别,回复政策的观测空间专注于跟踪线速率和角速率命令,不需要外部感知信息。回复政策的任务奖励专注于线性速率跟踪、角速率跟踪、保持存活和保持姿势,以便平滑切换回迅速政策。这种政策的训练同样在仿真情况中进行,但有一定的域随机化和课程设置,以更好地适应可能触发回复政策的形态。这种方法为四足机械人提供了在高速疏通中快速应对潜在失败的能力。
下图展现了当回复政策在两个一定情况(I 和 II)下被触发时,RA(达防)值景观的可视化展现。这些可视化展现是在 vx(沿 x 轴的速率)与 ωz(绕 z 轴的角速率)平面以及 vx 与 vy(沿 y 轴的速率)平面上进行的。图中显示了搜索前的初始旋转形态(即机械人基座当前的旋转形态)和通过搜索得到的命令。简单来说,这些图表展现了在一定条件下,通过回复政策搜索得到的最佳疏通指令,以及这些指令如何影响 RA 值,从而反映机械人在分别疏通形态下的危险性。
鲁棒性测试
作者在「12kg 负载 / 篮球撞击 / 脚踢 / 雪地」的四个场景下测试了 ABS 框架的鲁棒性,机械狗都从容应对:
研究团队
这项研究是由 CMU 和 ETH 的研究团队共同完成。团队成员包括 Tairan He, Chong Zhang, Wenli Xiao, Guanqi He, Changliu Liu 和 Guanya Shi。他们的合作不仅在机械人技术范围取得了重大突破,更开启了四足机械人新的应用可能。这项技术的成功展现了四足机械人在高速移动和危险避障范围的巨大潜力。未来,这种高速且危险的四足机械人有望在搜救、探险甚至是家庭服务等多个范围发挥重要作用。