最强开源模型来了！一文详解 Stable Diffusion 3 Medium 特点及用法（附模型资源包）

人人好，我是花生~ 备受期待的 Stable Diffusion 3（以下简称 “SD3”）终于向公众开放了，作为 Stability AI 迄今为止最先进的文本到图象开源模型，SD3 在图象品质、文本实质生成、复杂提醒理解和资源效率方面有了显著提升，今天就为人人详细介绍一下 SD3 的特点以及如何在 ComfyUI 中利用它。相关推荐：一、SD3 简介此次开放的模型准确来说是 Stable Diffusion 3 Medium，蕴涵 20 亿参数，具有体积小、适合在消费级 PC 和笔记本电脑上运行的优点，所以

人人好，我是花生~

备受期待的 Stable Diffusion 3（以下简称 “SD3”）终于向公众开放了，作为 Stability AI 迄今为止最先进的文本到图象开源模型，SD3 在图象品质、文本实质生成、复杂提醒理解和资源效率方面有了显著提升，今天就为人人详细介绍一下 SD3 的特点以及如何在 ComfyUI 中利用它。

一、SD3 简介

此次开放的模型准确来说是 Stable Diffusion 3 Medium，蕴涵 20 亿参数，具有体积小、适合在消费级 PC 和笔记本电脑上运行的优点，所以普通人也可以将其部署到自己的电脑上利用。SD3 Medium 的优点包括：

① 图象品质整体提升，能生成照片般细节逼真、色彩鲜艳、光照自然的图象；能灵活适应多种风格，无需微调，仅通过提醒词就能生成动漫、厚涂等风格化图象；具有 16 通道的 VAE，可以更好地表现手部以及面部细节。

最强开源模型来了！一文详解 Stable Diffusion 3 Medium 特点及用法（附模型资源包）

② 能够理解复杂的自然语言提醒，如空间推理、构图元素、姿势动作、风格描述等。对于「第一瓶是蓝色的，标签是“1.5”，第二瓶是红色的，标签是“SDXL”，第三瓶是绿色的，标签是“SD3”」这样复杂的实质，SD3 依旧能准确生成，而且文本后果比 Midjourney 还要准确。

最强开源模型来了！一文详解 Stable Diffusion 3 Medium 特点及用法（附模型资源包）

③ 通过 Diffusion Transformer 架构，SD3 Medium 在英文文本拼写、字距等方面更加正确合理。Stability AI 在发布 SD3 民间公告时，头图就是直接用 SD3 生成的，后果非常惊艳。

最强开源模型来了！一文详解 Stable Diffusion 3 Medium 特点及用法（附模型资源包）

另外此次 SD3 Medium 模型的授权范围是开放的非商业许可证，也就是说没有民间许可的情况下，模型不得用于商业用途，这点是需求人人注意的。

二、在 ComfyUI 中利用

SD 3 Medium 模权重已经在 huggingface 上放出了，我们可以在 ComfyUI 部署歇息流来利用它，具体操作如下：

① 将 ComfyUI 更新到最新版本，以支持 SD3 的顺利运作。

② 下载模型权重： https://huggingface.co/stabilityai/stable-diffusion-3-medium （下载时需求先填写一份表格，保证自己不会将模型用于商用用途；可以直接在文末的百度云盘内下载）。民间提供了 4 种大模型文献：

sd3_medium：4.3G，独立主模型，不蕴涵文本编码器（clip 模型）；
sd3_medium_incl_clips.safetensors：5.97G，蕴涵 clip_g 和 clip_l 编码器；
sd3_medium_incl_clips_t5xxlfp8.safetensors：10.9G，蕴涵 clip_g、clip_l 和 t5xxl_fp8 编码器；
sd3_medium_incl_clips_t5xxlfp16.safetensors：15.8G，蕴涵 clip_g、clip_l 和 t5xxl_fp16 编码器。

最强开源模型来了！一文详解 Stable Diffusion 3 Medium 特点及用法（附模型资源包）

③ 另外还有 4 个 Clip 文献和 3 种歇息流。大模型的安装位置为根目录的 comfyui/models/checkpoints 文献夹，Clip 模型的安装位置为 comfyui/models/clip 文献夹。实际应用中不需求每一个模型都下载，后面会为人人介绍目前利用较多的 2 种歇息流，可以看完之后再确定下载哪些文献。

最强开源模型来了！一文详解 Stable Diffusion 3 Medium 特点及用法（附模型资源包）

SD3 歇息流 ①

这个利用的是民间提供的 basic 基础歇息流，可以在 comfyui_example_workflow 文献加中下载利用。这个歇息流需求用的模型文献有 4 种：sd3_medium、clip_g、clip_l 和 t5xxl_fp8。这是最完整稳健的一种歇息流。

最强开源模型来了！一文详解 Stable Diffusion 3 Medium 特点及用法（附模型资源包）

SD3 歇息流 ②

这个歇息流可以在云盘内下载，它只利用了一个模型文献 sd3_medium_incl_clips_t5xxlfp8.safetensors。这个模型已经融合了 3 种 clip 模型，所以不再需求 clip loader 这个节点，用起来更简单。

最强开源模型来了！一文详解 Stable Diffusion 3 Medium 特点及用法（附模型资源包）

利用 SD3 时，还有 2 个小技巧可以帮我们提升出图品质：

① 是在生成写实照片以及人物面部的，可以将 cfg 参数参数调低至 2-3 之间，细节和品质会更好；蕴涵文本时，还是利用 cfg 4.5 或者 5 时后果会更好。人人也可以多探索一些其他 cfg 参数能产生的后果。

② SD3 模型更适合自然语言提醒词，而不是标签式的提醒词，你可以详细描述你需求的画面实质、构图、色彩、氛围，即使提醒词很长，SD3模型也能处理的很好。

最强开源模型来了！一文详解 Stable Diffusion 3 Medium 特点及用法（附模型资源包）

三、SD3 存在的不足

虽然 SD3 在图象品质、细节、对提醒词的理解、文本实质生成能力上有了明显提升，但是也存在一些不足，比如在生成手部的时候依旧会出现错误，以及在生成 “lying（躺）” 这个姿势时，人物会出现严重的崩坏。有人推测是因为 SD3 对实质安全有严格审查，导致相关实质受到影响。

最强开源模型来了！一文详解 Stable Diffusion 3 Medium 特点及用法（附模型资源包）

不过总体上来说 SD3 在图象生成品质以及整体性能上都比之前的 SD1.5、SDXL 提升很多。虽然有 Midjourney V6 以及 sdxl 微调模型珠玉在前，让 SD3 显得没有那么惊艳，但是作为一个免费的模型能达到这样的后果已经非常惊人了。

之前 SD1.5、SDXL 模型的直出图象品质一直也不太行，但是在开源社区的努力下，各种衍生模型的品质一直都非常不错，甚至超过了一些闭源模型。所以我们可以期待一下 SD3 未来的生态发展，等各种微调模型以及 Controlnet、IP-Adapter 这些的配套模型都跟上之后，SD3 肯定还能给我们带来新的惊喜。

最强开源模型来了！一文详解 Stable Diffusion 3 Medium 特点及用法（附模型资源包）

以上就是本期为人人介绍的最新开源文生图模型 SD3 的相关实质。模型资源以及歇息流文献都在文末的百度网盘实质，有需求小伙伴记得下载。

ComfyUI 的学习门槛比较高，如果你想掌握它，建议先从 Stable Diffusion WebUI 开始，它更适合初学入门，学会后也能有助于我们快速掌握 ComfyUI 的用法。我最新制作的《零基础 AI 绘画入门指南》是一门面向 AI 绘画零基础人群的系统课程，蕴涵 Stable Diffusion WebUI 全面细致的用法教学，并提供配套资源，能帮你快速掌握这款目前最热门的 AI 绘画工具。

{{userData.name}}已认证

最强开源模型来了！一文详解 Stable Diffusion 3 Medium 特点及用法（附模型资源包）

一、SD3 简介

二、在 ComfyUI 中利用

三、SD3 存在的不足

苹果的 Apple Intelligence，重新定义 AI 交互体验！

全世界科技巨擘集体「卷」AI，华为又在憋什么大招？

刚刚，AI颠覆物理模拟：一句话精准仿真，学术圈半壁江山联手耗时24个月研究成果

历时2年，华人团队力作，震撼开源生成式物理引擎Genesis，可模拟世界万物

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

2024年AI 编程现在可以做到什么程度？

超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践

抢跑OpenAI！谷歌Gemini 2.0震撼登场：全面转向Agent，多模态输入输出，免费随便玩

实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！