CVPR 2022 | 多机器人协同主动建图算法

本文是 CVPR 2022入选论文《Multi-Robot Active Mapping via Neural Bipartite Graph Matching》的解读。该论文由北京大学陈宝权研究团队与山东大学、腾讯AI Lab、清华大学、斯坦福大学合作,将传统方法与机器学习相结合,提出了多机器人协同主动建图算法 NeuralCoMapping,实现了室内场景完整地图的高效构建。 实验证明,相比于其他多机协同建图算法,NeuralCoMapping 在时间效率上具有显著优势,而且在多种未知场景和不同数量机器人上表现出卓越的泛化能力。

CVPR 2022 | 多机器人协同主动建图算法

论文地址:

https://fqnchina.github.io/QingnanFan_files/cvpr_2022_mapping.pdf

01 研究背景

构建室内场景的二维或三维地图是计算机视觉和机器人领域中的一项重要任务。机器人导航、增强现实等前沿应用都离不开场景地图的构建。在这个问题上,最原始的方法是派出技术人员,使用手持或车载传感器设备对场景进行人工扫描,随后将采集的数据合成成为场景地图。然而这样的方法严重依赖于技术人员的操作,很快被机器人自动建图的方法所取代。

主动建图(Active Mapping),即机器人在未知场景中主动地移动和采集数据从而自动化地构建场景地图的过程。该任务的难点在于如何高效地探索未知环境并构建完整的场景地图。传统算法大多基于贪心策略,因此效率有限;近几年基于机器学习的算法注重效率,然而无法保证地图的完整性。因此,我们将传统算法和机器学习相结合,同时吸取了传统算法地图完整度高和机器学习方法全局效率高的优点,提出了 NeuralCoMapping 算法。

02 本文方法

NeuralCoMapping 算法由四个模块组成:建图模块(Mapping Module),全局规划器(Global Planner),局部规划器(Local Planner)和动作控制器(Action Controller)。

CVPR 2022 | 多机器人协同主动建图算法

图1. 算法流程

首先,各个机器人的传感器采集当前时间步的深度图(Image)和位姿数据(Pose),建图模块(Mapping Module)根据这些数据更新障碍物地图(Occupancy Map)。随后,障碍物地图被传入到局部规划器中。一同传入局部规划器的还有每个机器人的目标位置(Global Positions),这些目标位置由全局规划器(Global Planner)每隔一定时间进行全局规划得到。局部规划器根据每个机器人的当前位置和目标位置,在地图上计算出移动路线(Moving Trajectories),然后动作控制器(Action Controller)根据移动路线计算出当前时间步机器人应该采取怎样的动作(前进、左转或右转)。最终机器人采取动作控制器给出的动作,并等待下一个时间步的数据采集。

全局规划器的规划算法在主动建图中起到决定性作用,也是我们算法设计的核心部分。这一部分算法根据当前地图和机器人位置,决定每个机器人在下一次全局规划之前需要前往的目标位置,从而逐步探索场景并更新地图。

CVPR 2022 | 多机器人协同主动建图算法

图2. 全局规划算法

具体地,我们首先从地图中提取两类节点,机器人位置(robots)和前沿点位置(frontiers)。前沿点也叫做边境点,指地图中位于已探索无障碍物区域和未探索区域的分界线上的点。基于这两类节点,我们将全局规划抽象成二分图匹配问题:为每一个机器人分配一个前沿点作为目标位置。以前沿点作为目标,机器人总是会向未知区域前进。当地图中不再有前沿点时,我们就得到了完整的场景地图。

为了实现全局规划之间的连续性,我们额外加入了两类辅助节点,历史机器人位置(history robots)和历史目标位置(history goals)。通过多路图神经网络(Multiplex Graph Neural Network),我们提取机器人和前沿点之间的距离代价,作为二分图匹配的关联矩阵(Affinity Matrix)。基于关联矩阵,我们使用线性分配层(Linear Assignment Layer)进行可微匈牙利算法(Differentiable Hungarian Algorithm),从而得到二分图匹配,即每个机器人分配一个前沿点作为目标位置。

03 实验结论

CVPR 2022 | 多机器人协同主动建图算法

图3. 时间效率实验结果

我们在 iGibson 模拟器使用 Gibson 和 Matterport3D 数据集进行实验。具体地,我们在 Gibson 数据集随机选取9个场景进行训练,把剩余场景和 Matterport3D 数据集的场景用作测试。结果表明,与其他多机协同算法相比,我们提出的 NeuralCoMapping 在全局时间效率上具有显著优势。测试场景面积越大,NeuralCoMapping 表现出来的优势越明显。在 Matterport3D 场景中的测试结果也表明 NeuralCoMapping 对不同类型场景有很好的泛化性。

CVPR 2022 | 多机器人协同主动建图算法

图4. 泛化性能实验结果

此外,NeuralCoMapping 在不同机器人数量上也表现出很好的泛化性。在三个机器人之上训练的模型,仍然能够直接应用在二或四个机器人之上(附加材料包含了多至九个机器人的泛化性实验),这归功于我们算法的层次设计:我们将复杂的全局规划问题抽象为对机器人数量不敏感的二分图匹配问题,从而能够利用多路图神经网络,使算法运行在任意数量的机器人上。

综上,我们将传统算法与机器学习相结合,提出了一种高效的多机协同算法 NeuralCoMapping,实现了对未知室内场景的自动化探索和完整地图构建。该方法对于多种未知场景和不同数量机器人具有卓越的泛化能力。

图文 | 叶开

Visual Computing and Learning (VCL)

相关资讯

长城科技节开场要点:魏建军的「唯一机会」、华为与高德的「减法思考」,以及李克强提出的「发展束缚」

在今日开幕的第8届长城科技节上,魏建军发布了长城汽车的2025战略——到2025年,实现全球年销量400万辆,其中80%为新能源汽车,营业收入超6000亿元。同时,长城汽车轮值总裁孟祥军也指出,长城正加速企业低碳智能升级,并计划2045年全面实现碳中和。为了实现这些目标,长城将在未来五年累计研发投入将达到1000亿元。这些投入,将集中在纯电动、氢能、混动等新能源领域,同时也将着力在低功耗、大算力芯片和碳化硅等第三代半导体关键核心技术,以及现代传感、信息融合、人工智能等方面,做好软件和硬件的交互融合。魏建军表示,中国

LoD-Loc:利用城市白模进行无人机六自由度定位!

论文信息论⽂全称:LoD-Loc: Aerial Visual Localization using LoD 3D Map with Neural Wireframe Alignment录⽤会议:NeurIPS 2024论⽂地址::: 基于三维城市⽩模地图(LoD 3D Map) 的⼀种使⽤神经线框对⻬进⾏空中视觉定位的新⽅法论⽂概要:LoD-Loc 基于城市⽩模模型Level of Detail 3D Map (LoD 3D Map)提出⼀种城市⽆⼈机空中定位新范式。 区别于基于SfM / SLAM / Mesh等复杂三维地图的传统定位⽅法 ,LoD 三维地图具有储存容量低 ,能提供隐私保护等优点。然⽽ , 由于 LoD 地图缺乏纹理,使⽤之前传统定位基线进⾏ LoD 地图空中定位并不简单。

300多篇相关研究,复旦、南洋理工最新多模态图像编辑综述论文

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]该文章的第一作者帅欣成,目前在复旦大学FVL实验室攻读博士学位,本科毕业于上海交通大学。他的主要研究方向包括图像和视频编辑以及多模态学习。前言本文提出了解决一般性编辑任务的统一框架!近期,