麻省理工学院携手 Adobe 演示 DMD AI 技术：每秒可生成 20 幅图像

2024-03-27 01:48

主流文生图模型固然已经能生成非常逼真的图片，但通常渲染时间非常缓慢。麻省理工学院携手 Adobe 公司近日研发了 DMD 方法，在尽量不影响图像质量的情况下，加快图像生成速度。DMD 技术的全称是 Distribution Matching Distillation，将多步扩散模型简化为一步图像生成解决方案。团队表示：“我们的核心理念是训练两个扩散（diffusion）模型，不仅能预估目标真实分布（real distribution）的得分函数，还能估计假分布（fake distribution）的得分函数。”研究

主流文生图模型固然已经能生成非常逼真的图片，但通常渲染时间非常缓慢。麻省理工学院携手 Adobe 公司近日研发了 DMD 方法，在尽量不影响图像质量的情况下，加快图像生成速度。

DMD 技术的全称是 Distribution Matching Distillation，将多步扩散模型简化为一步图像生成解决方案。

团队表示：“我们的核心理念是训练两个扩散（diffusion）模型，不仅能预估目标真实分布（real distribution）的得分函数，还能估计假分布（fake distribution）的得分函数。”

研究人员称，他们的模型可以在现代 GPU 硬件上每秒生成 20 幅图像。在上面的视频短片重点介绍了 DMD 与 Stable Diffusion 1.5 相比的图像生成能力。标清每幅图像 Stable Diffusion 1.5 需要 1.4 秒，而 DMD 只需几分之一秒就能生成类似的图像。

麻省理工学院携手 Adobe 演示 DMD AI 技术：每秒可生成 20 幅图像

IT之家附上参考地址

One-step Diffusion with Distribution Matching Distillation

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上运行的版本

今天凌晨，大新闻不断。一边是 OpenAI 的高层又又又动荡了，另一边被誉为「真・Open AI」的 Meta 对 Llama 模型来了一波大更新：不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型，还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此，Meta 还正式发布了 Llama Stack Distribution，其可将多个 API 提供商打包在一起以便模型方便地调用各种工具或外部模型。此外，他们还发布了最新的安全保障措施。真・Open AI

SD WebUI 中也能用上实时绘画了！支持接入PS/Blender 等设计工具

大家好，这里是和你们一起探索 AI 绘画的花生~ 之前为大家介绍过 AI 绘画工具 Krea，它可以根据手绘的草图实时生成完整的画面，可以让我们更精准地控制图像效果，对电商、产品、游戏概念等设计领域来说非常有帮助。之前为大家推荐过一种在 ComfyUI 中免费实现 AI 实时绘画的方式，今天就再为大家推荐另一种在 Stable Diffusion WebUI 中实现实时绘画的方法。一、插件简介 SD WebUI 的实时绘画功能需要借助一个插件实现，这个插件是上周由 B 站 AI 绘画博主@朱尼酱推出，支持文生图、图

写给小白的大模型入门科普

什么是大模型？大模型，英文名叫Large Model，大型模型。早期的时候，也叫Foundation Model，基础模型。

资讯热榜

罗永浩 Jarvis 初创项目“J1 Assistant AI 助理”上线，利用语音与大模型互动 SK 海力士宣布参展 CES 2025，将展示 122TB 企业级固态硬盘等产品突破非视距条件依赖！大规模区域、低成本的UWB-LiDAR标定与单次定位框架阿里云与黑芝麻智能完成大模型车载芯片级适配类 Mac Mini 大小的个人 AI 超算：英伟达 Project Digits 发布，起价 3000 美元清华大学推 AutoDroid-V2：AI 离线在线协同，优化移动端自动化 GUI 控制斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手 AI模拟细胞，走向全新虚拟生命，斯坦福团队呼吁是时候走出全新的一步了

标签云

麻省理工学院携手 Adobe 演示 DMD AI 技术：每秒可生成 20 幅图像

相关资讯

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上运行的版本

SD WebUI 中也能用上实时绘画了！支持接入PS/Blender 等设计工具

写给小白的大模型入门科普