扩散

GCD-DDPM：用扩散模型重塑变化检测，精准捕捉细粒度变化

一眼概览GCD-DDPM 提出了一种基于差分特征引导的去噪扩散概率模型（DDPM）进行变化检测（CD）的方法，采用生成式方式直接生成变化检测（CD）图，而非传统的判别式分类方式。在四个高分辨率遥感数据集上，该方法展现了优越的检测性能。核心问题目前主流变化检测（CD）方法大多依赖 CNN 或 Transformer 进行判别式特征学习，但它们在同时捕获局部细节信息和长距离依赖关系方面存在局限，导致变化检测精度不足，尤其是对于复杂场景的细粒度变化无法精准捕捉。

3/4/2025 4:00:00 AM

萍哥学AI

零样本 | ZeroDiff：扩散模型助力零样本学习，打破数据限制，实现高效泛化

一眼概览ZeroDiff 提出了一种基于扩散模型的生成式零样本学习（ZSL）方法，提升数据利用效率，实现类别级和实例级的增强。在多个ZSL基准数据集上，ZeroDiff 取得了显著的性能提升，特别是在数据稀缺情况下仍保持稳健。核心问题零样本学习（ZSL）试图在无训练样本的情况下识别新类别，主要依赖于已知类别的语义信息。

2/6/2025 11:25:50 AM

萍哥学AI

NeurIPS | 对比采样链：让扩散模型更快、更准、更清晰的秘密武器

论文 Contrastive Sampling Chains in Diffusion Models 的精炼解读。一眼概览该论文提出了一种对比采样链（Contrastive Sampling Chains, CSC）方法，通过对比损失和得分匹配相结合，优化扩散模型（DMs）的采样过程，从而减少离散化误差，提高生成图像的质量，同时提升采样速度。核心问题扩散模型在使用数值求解方法进行采样时不可避免地引入离散化误差，导致生成样本与真实数据分布之间存在偏差。

2/3/2025 10:04:47 AM

萍哥学AI

OpenAI 公布新型 AI 文生图方案“sCM”，号称效率是传统扩散模型 50 倍

OpenAI 本周公布了一款名为 sCM（Continuous-Time Consistency Model）的新型 AI 文生图方案。与传统的扩散模型相比，sCM 仅需两个步骤即可生成高质量样本，号称能够将文生图效率提升约 50 倍，且生成的样本质量能与“业界较强的扩散模型”相比较，为 AI 文生图提供了新的方案。目前业界通常使用扩散模型生成图片及音视频，但传统扩散模型的取样过程通常缓慢，通常需要数十到数百个逐步降噪的过程才能生成高质量样本（例如小伙伴们使用 SD“炼丹”绘图就需要等待特别长的降噪时间），这使得相应模型效率低下，不适合商业化应用。

10/27/2024 3:18:03 PM

漾仔

智谱开源文生图模型 CogView3-Plus，相关功能上线智谱清言 App

感谢智谱技术团队今天宣布开源文生图模型 CogView3 及 CogView3-Plus-3B ，该系列模型的能力已经上线“智谱清言”App。据介绍，CogView3 是一个基于级联扩散的 text2img 模型，其包含如下三个阶段：第一阶段：利用标准扩散过程生成 512x512 低分辨率的图像。第二阶段：利用中继扩散过程，执行 2 倍的超分辨率生成，从 512x512 输入生成 1024x1024 的图像。

10/14/2024 11:13:47 AM

清源

值得你花时间看的扩散模型教程，来自普渡大学

Diffusion 不仅可以更好地模仿，而且可以进行「创作」。扩散模型（Diffusion Model）是图像生成模型的一种。有别于此前 AI 领域大名鼎鼎的 GAN、VAE 等算法，扩散模型另辟蹊径，其主要思想是一种先对图像增加噪声，再逐步去噪的过程，其中如何去噪还原图像是算法的核心部分。而它的最终算法能够从一张随机的噪声图像中生成图像。近年来，生成式 AI 的惊人增长为文本到图像生成、视频生成领域等许多令人兴奋的应用提供了支持。这些生成工具背后的基本原理是扩散的概念，这是一种特殊的采样机制，克服了以前的方法中被

4/6/2024 11:45:00 PM

机器之心

生成的分子几乎 100% 有效，用于逆向分子设计的引导扩散模型

编辑 | 绿萝「从头分子设计」是材料科学的「圣杯」。生成深度学习的引入极大地推进了这一方向，但分子发现仍然具有挑战性，而且往往效率低下。以色列理工学院（Technion-Israel Institute of Technology）和意大利威尼斯大学（University Ca’ Foscari of Venice）的研究团队，提出一种用于逆向分子设计的引导扩散模型：GaUDI，它结合了用于属性预测的等变图神经网络和生成扩散模型。研究人员通过将单目标和多目标任务应用于生成的 475,000 个多环芳香族系统数据集，

10/24/2023 11:26:00 AM

ScienceAI

Midjourney 迎来最强对手，种子轮融资大佬云集，测试版让马斯克一「键」穿越

机器之能报道编辑：SIA一直以来，Midjourney 稳坐 AIGC 文生图的王座，少有威胁，直到这家公司的出现。8 月 23 日，生成式人工智能创业公司 Ideogram AI 正式官宣：「我们正在开发最先进的人工智能工具，使创意表达变得更容易、更有趣、更高效。」官网写道。团队核心成员也是谷歌大脑 Imagen 团队主要成员， Ideogram AI 也被认为试图将 Imagen 发扬光大：Mohammad Norouzi（CEO ）、Jonathan Ho (联合创始人）、 William Chan 和 C

8/24/2023 5:35:00 PM

机器之能

图生成扩散模型综述：算法与在分子和蛋白质建模上应用

论文简要回顾了扩散模型在图数据上的算法及相关应用的若干研究。论文链接：：(Graph-based Data)可以保存现实世界实体（节点）之间丰富多样的关系信息，包括实体间的关联联系、属性特征、以及拓扑结构，已经在社交网络分析、推荐系统、生物信息学等领域有广泛的应用。图生成模型旨在理解和学习现有的图数据分布，并合成新的图样本。这对于研究图数据中潜在的图结构关系，理解现有数据中的模式、关联和隐藏的信息具有重要的意义。生成模型可以用于探索图数据不同尺度的关系、发现社区结构、预测节点属性等。主要的图生成范式分为两类：自回归

6/30/2023 6:29:00 PM

ScienceAI

图神经网络的困境，用微分几何和代数拓扑解决

微分几何和代数拓扑在主流机器学习中并不常见。在本系列文章中，作者展示了如何使用这些领域的工具重新解释图神经网络并解决一些常见困境。

3/27/2022 12:46:00 PM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ Haisnap横空出世，小白用户也能轻松打造AI应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 本地部署DeepSeek+DiFy平台构建智能体应用韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练