零样本 | ZeroDiff:扩散模型助力零样本学习,打破数据限制,实现高效泛化

一眼概览ZeroDiff 提出了一种基于扩散模型的生成式零样本学习(ZSL)方法,提升数据利用效率,实现类别级和实例级的增强。 在多个ZSL基准数据集上,ZeroDiff 取得了显著的性能提升,特别是在数据稀缺情况下仍保持稳健。 核心问题零样本学习(ZSL)试图在无训练样本的情况下识别新类别,主要依赖于已知类别的语义信息。

1. 一眼概览

ZeroDiff 提出了一种基于扩散模型的生成式零样本学习(ZSL)方法,提升数据利用效率,实现类别级和实例级的增强。在多个ZSL基准数据集上,ZeroDiff 取得了显著的性能提升,特别是在数据稀缺情况下仍保持稳健。

2. 核心问题

零样本学习(ZSL)试图在无训练样本的情况下识别新类别,主要依赖于已知类别的语义信息。然而,现有方法高度依赖于已有类别的数据量,忽视了实例级数据有效性的问题。当训练样本不足时,现有生成式方法(如GANs)容易崩溃,导致性能下降。因此,如何在有限训练数据下仍能有效生成逼真的类别特征,是本研究的核心问题。

3. 技术亮点

  • 扩散噪声增强实例级数据利用效率:利用前向扩散链将有限数据转换为扩增的带噪数据,从而增强泛化能力,避免生成模型过拟合。
  • 双分支扩散生成结构:结合扩散特征生成器(DFG) 和 扩散表示生成器(DRG),分别学习交叉熵特征分布和对比学习表示,协同增强类别级生成能力。
  • 多判别器+互学习损失:引入三种判别器,从不同角度评估生成特征,并设计基于Wasserstein距离的互学习损失,实现不同判别器的知识传递,提升生成质量。

4. 方法框架

ZeroDiff 通过以下关键步骤进行零样本学习:

  • 特征提取与预训练

a.采用ResNet-101提取视觉特征,并进行交叉熵(CE)和监督对比(SC)学习。

  • 扩散表示生成(DRG)

• 训练基于扩散的表示生成器,学习潜在语义表示并冻结模型,为后续特征生成提供支持。

  • 扩散特征生成(DFG)

 通过扩散模型生成具有噪声扰动的特征,并利用判别器进行质量评估。

  • 训练最终分类器
  • • 结合生成特征进行ZSL/GZSL分类,评估ZeroDiff的泛化能力。

5. 实验结果速览

基准测试对比

AWA2、CUB、SUN 三个数据集上,ZeroDiff 取得了新的SOTA性能:

• ZSL (Top-1 Accuracy):

AWA2: 86.4%(提升10.5%)

CUB: 87.5%(提升1.7%)

SUN: 77.3%(提升0.1%)

• GZSL (Harmonic Mean H):

        AWA2: 79.5%(领先于次优方法 73.7%)

        CUB: 81.6%(超过次优方法 81.1%)

训练数据不足情况下的对比

当仅有10%训练数据时:

• 传统GAN-based方法(如f-VAEGAN)精度大幅下降,而ZeroDiff 仍能保持较高准确率(83.3%)。

• t-SNE可视化显示,ZeroDiff 生成的未见类别特征保持稳定,而f-VAEGAN 出现崩溃现象。

6. 实用价值与应用

ZeroDiff 在以下数据有限的任务中具有广泛应用潜力:

  • 计算机视觉:目标检测、图像分类任务中的零样本泛化。
  • 医学影像分析:处理稀缺病症数据,提高诊断模型的泛化能力。
  • 自动驾驶:在低数据场景下增强目标识别能力。
  • 自然语言处理:结合文本生成,实现更高效的跨模态学习。

7. 开放问题

  • ZeroDiff 在更复杂的真实世界数据(如长尾分布数据)下表现如何?
  • 能否结合大规模预训练扩散模型,如Stable Diffusion,提升ZSL能力?
  • 该方法是否可以推广到跨模态生成任务,如文本到图像生成?

相关资讯

NeurIPS | 对比采样链:让扩散模型更快、更准、更清晰的秘密武器

论文 Contrastive Sampling Chains in Diffusion Models 的精炼解读。 一眼概览该论文提出了一种 对比采样链(Contrastive Sampling Chains, CSC) 方法,通过对比损失和得分匹配相结合,优化扩散模型(DMs)的采样过程,从而 减少离散化误差,提高生成图像的质量,同时提升采样速度。 核心问题扩散模型在使用数值求解方法进行采样时 不可避免地引入离散化误差,导致生成样本与真实数据分布之间存在偏差。

GCD-DDPM:用扩散模型重塑变化检测,精准捕捉细粒度变化

一眼概览GCD-DDPM 提出了一种 基于差分特征引导的去噪扩散概率模型(DDPM) 进行 变化检测(CD) 的方法,采用 生成式方式 直接生成变化检测(CD)图,而非传统的判别式分类方式。 在四个高分辨率遥感数据集上,该方法展现了优越的检测性能。 核心问题目前主流变化检测(CD)方法大多依赖 CNN 或 Transformer 进行判别式特征学习,但它们在 同时捕获局部细节信息和长距离依赖关系 方面存在局限,导致 变化检测精度不足,尤其是对于 复杂场景的细粒度变化 无法精准捕捉。

图生成扩散模型综述:算法与在分子和蛋白质建模上应用

论文简要回顾了扩散模型在图数据上的算法及相关应用的若干研究。论文链接::(Graph-based Data)可以保存现实世界实体(节点)之间丰富多样的关系信息,包括实体间的关联联系、属性特征、以及拓扑结构,已经在社交网络分析、推荐系统、生物信息学等领域有广泛的应用。图生成模型旨在理解和学习现有的图数据分布,并合成新的图样本。这对于研究图数据中潜在的图结构关系,理解现有数据中的模式、关联和隐藏的信息具有重要的意义。生成模型可以用于探索图数据不同尺度的关系、发现社区结构、预测节点属性等。主要的图生成范式分为两类:自回归