武大等开源大幅面高清卫星印象数据集:涵盖 21 万 + 地舆指标,复杂地舆空间场景知识精准生成

AI 卫星印象知识生成模型数据集稀缺的问题,又有新解了。来自武汉大学、上海 AI 实验室、西工大等 9 家机构共同推出了该领域的大型数据集,涵盖了 21 万个地舆指标和 40 万个指标-瓜葛三元组。而且像机场、港口、立交桥等这样复杂地舆空间场景,也都包括在了数据集当中。具体来说,该数据集名为 RSG,主要面向卫星印象中的指标检测(OBD)和场景图生成(SGG)任务。SGG 有助于促进模型对地舆空间场景从感知到认知的智能理解,但一直缺乏大幅面、超高分辨率的卫星印象数据。而 RSG 的出现很好地填补了这一空白,一同提出

AI 卫星印象知识生成模型数据集稀缺的问题,又有新解了。

来自武汉大学、上海 AI 实验室、西工大等 9 家机构共同推出了该领域的大型数据集,涵盖了 21 万个地舆指标和 40 万个指标-瓜葛三元组。而且像机场、港口、立交桥等这样复杂地舆空间场景,也都包括在了数据集当中。

武大等开源大幅面高清卫星印象数据集:涵盖 21 万 + 地舆指标,复杂地舆空间场景知识精准生成

具体来说,该数据集名为 RSG,主要面向卫星印象中的指标检测(OBD)和场景图生成(SGG)任务。

SGG 有助于促进模型对地舆空间场景从感知到认知的智能理解,但一直缺乏大幅面、超高分辨率的卫星印象数据。

而 RSG 的出现很好地填补了这一空白,一同提出的还有鉴于上下文感知的逐级认知(CAC)框架,以及配套的 SGG 工具包

有关论文已经在 arXiv 公开发布,相应的数据集和工具包也已经开源。

大幅面超高分辨率卫星印象数据集

在卫星印象(SAI)领域当中,场景图生成(SGG)技术可以促进对地舆空间场景从感知到认知的智能理解。

在 SAI 中,地舆指标的尺度和纵横比变化大,地舆指标之间(甚至是空间不相交的地舆指标之间)存在丰富的关联,这使得 SGG 有必要在大幅面超高分辨率卫星印象中整体进行。

然而现实情况是,大幅面超高分辨率卫星印象的 SGG 数据集比较缺乏,这无疑限制了 SGG 在 SAI 中的进展。

又由于大幅面超高分辨率卫星印象的复杂性,挖掘指标-瓜葛三元组 <指标 1, 瓜葛,指标 2> 严重依赖于远程上下文推理,传统为小幅面自然图像设计的 SGG 模型,不能直接适用于大幅面卫星印象。

注:下图是大幅面超高分卫星印象中的 SGG 示意图,其中第一行分别展示了大幅面超高分卫星印象的指标检测和场景图生成结果,第二行为对应的局部细节展示。在第二行末尾图中,黑色箭头表示仅依赖于孤立指标对可展望的瓜葛,而红色箭头表示需要借助上下文推断的复杂瓜葛。

武大等开源大幅面高清卫星印象数据集:涵盖 21 万 + 地舆指标,复杂地舆空间场景知识精准生成

于是,为了解决数据集稀缺问题,研究团队构建了首个面向大幅面超高分卫星印象的大规模场景图生成数据集 RSG。

该数据集印象幅面跨越 512×768 到 27,860×31,096 像素,包含超过 21 万个地舆指标和超过 40 万个指标-瓜葛三元组

武大等开源大幅面高清卫星印象数据集:涵盖 21 万 + 地舆指标,复杂地舆空间场景知识精准生成

▲ RSG 数据集中指标分布 (a) 和瓜葛分布 (b) 统计

内容上,RSG 收集了空间分辨率为 0.15-1m 范围的卫星印象,涵盖了全球范围内与人类活动密切相关的 11 类复杂地舆空间情景

这些场景包括机场、港口、核电站、火电站、风力发电站、水坝和服务区、立交桥、水面桥、施工工地和体育运动场景等。

武大等开源大幅面高清卫星印象数据集:涵盖 21 万 + 地舆指标,复杂地舆空间场景知识精准生成

▲ RSG 数据集中印象采样的地舆分布和示例

在遥感领域专家的指导下,研究团队将所有地舆指标划分为 48 个细粒度类,并使用定向边界框(OBB)进行精确标注,所有瓜葛按照 8 个大类、58 个细粒度类进行标注。

武大等开源大幅面高清卫星印象数据集:涵盖 21 万 + 地舆指标,复杂地舆空间场景知识精准生成

提出上下文感知框架

为了进一步实现大幅面超高分卫星印象中的 SGG,研究团队还提出了一个鉴于上下文感知的逐级认知(CAC)框架。

该框架从三个层面深入理解卫星印象 —— 指标检测(OBD)、指标对剪枝和瓜葛展望:

在指标检测上,团队提出了“能够灵活集成多尺度上下文的整体多类指标检测收集(HOD-Net)”,可以检测大幅面超高分辨率卫星印象中的指标;

在指标对剪枝方面,作者则设计了“鉴于对抗生成的候选对生成(PPG)收集”,来筛选包含高价值瓜葛的指标对;

在瓜葛展望任务中,团队又提出了“带有上下文感知消息传递(RPCM)的瓜葛展望收集”来展望候选对的瓜葛类型。

武大等开源大幅面高清卫星印象数据集:涵盖 21 万 + 地舆指标,复杂地舆空间场景知识精准生成

在 RSG 测试集上的结果表明,在指标检测任务中,无论是鉴于水平框(HBB)还是有向框(OBB)的检测器,团队提出的 HOD-Net 框架都取得了总成绩和多个单项的 SOTA。

武大等开源大幅面高清卫星印象数据集:涵盖 21 万 + 地舆指标,复杂地舆空间场景知识精准生成

注释:

1.表格中,b_b 为 boarding_bridge, l_t 表示 lattice_tower, s_l 为 ship_lock, g_d 为 gravity_dam。

2.所有实验都鉴于标准的“1x”(12epochs) 训练设置。

3.†表示主干收集为 Swin-L,其他的主干收集都为 ResNet50。

4.下划线表示下方的法子使用该模型作为基础检测器。

同时测试结果还表明,HOD-Net 法子也优于一些其他的训练方式。

武大等开源大幅面高清卫星印象数据集:涵盖 21 万 + 地舆指标,复杂地舆空间场景知识精准生成

下面的图更加直观地展示了不同指标检测策略的可视化结果。

武大等开源大幅面高清卫星印象数据集:涵盖 21 万 + 地舆指标,复杂地舆空间场景知识精准生成

剪枝任务上,团队提出的 PPG 策略也在多个模型上运行的测试中超越了传统法子。

武大等开源大幅面高清卫星印象数据集:涵盖 21 万 + 地舆指标,复杂地舆空间场景知识精准生成

生成情景当中,团队设计的的 RPCM 收集在鉴于 HBB 和 OBB 检测器的所有指标上,同样优于先前的主流 SGG 法子。

武大等开源大幅面高清卫星印象数据集:涵盖 21 万 + 地舆指标,复杂地舆空间场景知识精准生成

下图是不同 SGG 模型在 RSG 数据集中情景生成结果的可视化展示。

武大等开源大幅面高清卫星印象数据集:涵盖 21 万 + 地舆指标,复杂地舆空间场景知识精准生成

此外,为了促进大幅面超高分辨率卫星印象中 SGG 的发展,研究团队还发布了面向大面超高分辨率卫星印象的 SGG 工具包(其中包含约 30 种 OBD 法子和 10 种 SGG 法子),并鉴于 RSG 数据集进行了的全面基准测试。

武大等开源大幅面高清卫星印象数据集:涵盖 21 万 + 地舆指标,复杂地舆空间场景知识精准生成

数据集和相关工具包都已开源,可到项目主页中了解详情。

论文地址:

https://arxiv.org/abs/2406.09410

项目主页:

https://linlin-dev.github.io/project/RSG

GitHub:

https://github.com/Zhuzi24/SGG-ToolKit

给TA打赏
共{{data.count}}人
人已打赏
AI

最火 AI 角色扮演流量已达google搜索 20%:每秒处理两万推理要求,Transformer 作者公开优化窍门

2024-6-21 13:23:22

AI

阿里云推出首个 AI 程序员,具备架构师、开发 / 尝试工程师等岗位技能

2024-6-21 13:39:41

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索