NeurIPS 2023 | 「解释一切」图像概念解释器来了，港科大团队出品

作者：机器之心

2023-10-25 11:38

Segment Anything Model（SAM）首次被应用到了基于增强概念的可解释 AI 上。你是否好奇当一个黑盒深度神经网络 (DNN) 预测下图的时候，图中哪个部分对于输出预测为「击球手」的帮助最大？香港科技大学团队最新的 NeurIPS2023 研究成果给出了他们的答案。论文：： Meta 的分割一切 (SAM) 后，港科大团队首次借助 SAM 实现了人类可解读的任意 DNN 模型图像概念解释器：Explain Any Concept (EAC)。你往往会看到传统的 DNN 图像概念解释器会给出这样的解

Segment Anything Model（SAM）首次被应用到了基于增强概念的可解释 AI 上。

你是否好奇当一个黑盒深度神经网络 (DNN) 预测下图的时候，图中哪个部分对于输出预测为「击球手」的帮助最大？

NeurIPS 2023 | 「解释一切」图像概念解释器来了，港科大团队出品

香港科技大学团队最新的 NeurIPS2023 研究成果给出了他们的答案。

NeurIPS 2023 | 「解释一切」图像概念解释器来了，港科大团队出品

论文：https://arxiv.org/abs/2305.10289

项目代码：https://github.com/Jerry00917/samshap

继 Meta 的分割一切 (SAM) 后，港科大团队首次借助 SAM 实现了人类可解读的任意 DNN 模型图像概念解释器：Explain Any Concept (EAC)。

你往往会看到传统的 DNN 图像概念解释器会给出这样的解释 (SuperPixel-Based)：

NeurIPS 2023 | 「解释一切」图像概念解释器来了，港科大团队出品

但这类输出通常不能完整地将 DNN 对于输入图像里概念的理解表达给人类。

港科大团队首次将具有强大的概念抓取力的 SAM 和博弈论中夏普利公理 (Shapley Value) 结合起来，构建了端对端具有完整概念的模型解释器，并呈现了非常令人惊叹的结果！！

NeurIPS 2023 | 「解释一切」图像概念解释器来了，港科大团队出品

现在，用户只需要将任意 DNN 接入该解释器的 API，EAC 就可以精准地解释出图中哪些概念影响了模型最终的输出。

算法原理

如下图所示，解释一切 EAC 的算法流程图可大体分为三个阶段：1）SAM 概念抓取，2）利用 Per-Input Equivalence (PIE) 模拟目标 DNN 模型，3）通过计算出 PIE 的夏普利公理值得出近似原目标 DNN 的最终概念解释输出。

NeurIPS 2023 | 「解释一切」图像概念解释器来了，港科大团队出品

夏普利值实现

在博弈论中，夏普利公理的地位举足轻重。基于它，研究人员可以推算出图片里每一个概念对目标模型输出的贡献值，从而得知哪些概念对于模型预测的帮助最大。不过计算夏普利值所需要的时间复杂度为 O (2^N)，这对于几乎任何一个成熟的深度学习模型是灾难性的计算量。

本文为了解决这一问题提出了 Per-Input Equivalence （PIE）轻量型框架。PIE 希望通过一个 surrogate model f' 将原目标 DNN 模型 f 做局部拟合。

PIE 的完整表达式为 NeurIPS 2023 | 「解释一切」图像概念解释器来了，港科大团队出品。这里 f_fc 完全保留了原模型的全连接层，h 是一层线性权重用于模拟 f 的特征提取器，输入 b 为一维 one-hot 对一张目标图片里的概念集 C（由 SAM 生成）的编码。算法通过对 PIE 进行蒙特卡洛估算，就可得出 f^' 对于 f 的近似夏普利值。

文章指出 PIE 的运算十分轻量。在 COCO 标准测试集上，将目标模型设为 ResNet50，平均解释时间仅约为 8.1 秒 / 一张图片。

实验结果

通过给每张测试图逐一添加（Insertion）/ 删除（Deletion）最重要的概念 patch，这两项实验研究者可以直接评估任意解释器在解释目标 DNN 时的表现。

EAC 同时在「添加」和「删除」两项实验中实现了比较优秀的解释效果。

NeurIPS 2023 | 「解释一切」图像概念解释器来了，港科大团队出品

以下是 EAC 效果展示和 baseline 对比：

NeurIPS 2023 | 「解释一切」图像概念解释器来了，港科大团队出品

在文章的最后，团队表示有了 EAC 这项技术，医疗影像，智慧安防等重要的可信机器学习商用应用场景会变的更准确，更可靠。

相关标签：

DNN Explain Any Concept

相关资讯

分割一切「3D高斯」版来了：几毫秒完成3D分割、千倍加速

分割一切「3D高斯」版来了：几毫秒完成3D分割、千倍加速

有了上海交大和华为提出的 SAGA，辐射场中的交互式 3D 分割任务实现起来会更快、效果更好。今年 4 月，Meta 发布「分割一切（SAM）」AI 模型，这项成果不仅成为很多 CV 研究者心中的年度论文，更是在 ICCV 2023 上斩获最佳论文提名。「分割一切」实现了 2D 分割的「既能」和「又能」，可以轻松地执行交互式分割和自动分割，且能泛化到任意新任务和新领域。现在，这种思路也延展到了 3D 分割领域。辐射场中的交互式 3D 分割一直是个备受关注的课题，在场景操作、自动标注和 VR 等多个领域均有潜在应用

Adobe 推出 AI 头脑风暴工具：激发无限灵感，让创意自由飞翔

Adobe 推出 AI 头脑风暴工具：激发无限灵感，让创意自由飞翔

科技媒体 Maginative 昨日（10 月 14 日）发布博文，报道称在年度 MAX 会议上，Adobe 预览推出了 Project Concept 项目，是一款基于 AI 的创意头脑风暴工具。该工具的目标是生成更快速、更富想象力和更具协作性的创意，让设计师能够专注于探索更广泛的创意可能性。该项目是为每个创造性旅程的早期时刻打造的，设计师能够快速生成创意、混合资产、转换特定区域以及重新混合风格和元素。

只需一行代码，即可轻松驱散基因组分析中DNN产生的数字噪音

只需一行代码，即可轻松驱散基因组分析中DNN产生的数字噪音

编辑 | 白菜叶人工智能已经进入我们的日常生活。它可以是 ChatGPT，也可以是人工智能生成的比萨饼和啤酒广告。虽然我们不能相信人工智能是完美的，但事实证明，有些时候我们根本无法相信人工智能。冷泉港实验室（CSHL）西蒙斯定量生物学中心的助理教授 Peter Koo 发现，在分析 DNA 时，使用流行的计算工具来解释 AI 预测的科学家会收集到太多的「噪音」或额外信息。他找到了解决这个问题的方法。他的团队确定了一个以前被忽视的归因噪声源，该噪声源源于深度神经网络（DNN）如何处理单热编码 DNA。研究人员证明这种

资讯热榜

罗永浩 Jarvis 初创项目“J1 Assistant AI 助理”上线，利用语音与大模型互动 SK 海力士宣布参展 CES 2025，将展示 122TB 企业级固态硬盘等产品阿里云与黑芝麻智能完成大模型车载芯片级适配突破非视距条件依赖！大规模区域、低成本的UWB-LiDAR标定与单次定位框架清华大学推 AutoDroid-V2：AI 离线在线协同，优化移动端自动化 GUI 控制啥玩意值8499元？马斯克在线打call，国产AI威震天秒售罄斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手 AI模拟细胞，走向全新虚拟生命，斯坦福团队呼吁是时候走出全新的一步了

标签云