AI绘画神器Stable Diffusion模型再升级!新版亮点全面盘点!

大家好,这里是和你们聊设计的花生~ 之前为大家对比了 6 款在线 AI 绘画软件在不同主题上的图像生成效果,最终是 Midjourney 的整体表现最好,而 Stability AI 官方模型 Stable Diffusion v2.1 则表现不尽如人意。最近 Stability AI 又推出了一个新模型 Stable Diffusion XL,参数是 SD v2.1 的 2.5 倍,那这个新模型的图像生成效果如何呢?今天就继续来测试一下。 往期回顾:Stable Diffusion XL 简介 DreamStud

AI绘画神器Stable Diffusion模型再升级!新版亮点全面盘点!

大家好,这里是和你们聊设计的花生~

之前为大家对比了 6 款在线 AI 绘画软件在不同主题上的图像生成效果,最终是 Midjourney 的整体表现最好,而 Stability AI 官方模型 Stable Diffusion v2.1 则表现不尽如人意。最近 Stability AI 又推出了一个新模型 Stable Diffusion XL,参数是 SD v2.1 的 2.5 倍,那这个新模型的图像生成效果如何呢?今天就继续来测试一下。

往期回顾:

Stable Diffusion XL 简介

DreamStudio - SD XL:梦幻工作室 (dreamstudio.ai) (新用户有 200 点免费生成额度) Clipdrop - SD XL:ClipDrop - Stable Diffusion (目前免费生成)

此次 Stable Diffusion XL 一共更新在两个平台上,一是 Stability AI 官方 AI 绘画软件 DreamStudio,另一个则是之前被 Stability AI 收购的 AI 图像处理平台 Clipdrop。二者的区别在于 DreamStudio 上有很多的可调节参数,比如画面比例、图像数量等,Clipdrop 是统一的 1:1 的画面比例,一次生成 4 张,单张图像放大后可达到 1024*1024px。

AI绘画神器Stable Diffusion模型再升级!新版亮点全面盘点!

据 Stability AI 官网介绍,SD XL 模型支持用更短的提示创建描述性图像,并在可以在图像中生成文字,模型增强了图像的构图和脸部生成能力,使画面更加逼真和美观。

AI绘画神器Stable Diffusion模型再升级!新版亮点全面盘点!

SD XL 生成的图像

生成准确的文字和画手一样,一直是 AI 绘画中的难题,直到 Controlnet 插件出现 ,我们才能在 SD WebUI 中通过轮廓检测功能固定文字外形,从而生成精准的文字内容,而此次 SD XL 模型可以生成文字无疑是又是 AI 绘画的一大进步。我分别在 Midjourney 和 SD XL 中用文本提示词进行测试,结果是 SD XL 的文字生成效果的确比 Midjourney 好。

AI绘画神器Stable Diffusion模型再升级!新版亮点全面盘点!

接着继续用和之前一样的主题进行图像生成测试。首先是人像,可以看出 SD XL 比 v2.1 的效果要好很多,构图正确,人物面部没有扭曲变形,整体质感也好很多,质量看起来并不比 Midjourney 差,说明 XL 模型在照片真实性上有进行专门的优化 。

AI绘画神器Stable Diffusion模型再升级!新版亮点全面盘点!

然后是动漫风,XL 生成的图像在画面整体质量有明显提升,应该是对数据集进行了优化,但是有一个非常大的缺点就是五官和四肢不正常,在生成的 2 批 8 张图像中,每一张都有五官四肢不正常的情况,图像可用率极低。

AI绘画神器Stable Diffusion模型再升级!新版亮点全面盘点!

而在 3D 风格上 XL 模型还是有比较明显的进步的,无论是人物精细度还是画面整体美感都比之前的 v2.1 要好,不过和动漫风一样存在四肢不正常的情况,下面是我从生成的 4 张图像中挑出的双手看起来比较正常的一张,感觉 XL 模型在这一块的训练没做好。

AI绘画神器Stable Diffusion模型再升级!新版亮点全面盘点!

最后再看一下矢量扁平插画和概念场景的表现 ,同样都有非常明显的美感提升,不过也能看出 SD XL 在文本提示的理解上还有缺陷,在扁平插画的测试中它忽略了“白色背景”这一关键词;而由于 SD XL 目前还是测试版,画面尺寸不能做到 16:9,这也让图像的表现性受限。

AI绘画神器Stable Diffusion模型再升级!新版亮点全面盘点!

通过上面的图像生成测试可以看出,Stable Diffusion 的 XL 模型 比 V2.1 在质量上有了明显进步,特别是在人像质量上,虽还不能达到 midjourney V5 的水平,但是在目前的 AI 绘画工具总也算表现比较好的;新增的文字生成功能也是比较独特的,除了接入 Controlnet 的 SD WebUI,其他 AI 绘画工具目前都还没有生成准确文字内容的能力。

同时 Stable Diffusion XL 的缺点也是比较明显的,即人物的四肢不正常,这点在动漫和 3D 风格中尤为突出;模型对提示文本的理解能力也有缺陷,会漏掉一些关键词语,期待 Stability AI 在后续的更新中能进一步优化现在这些问题。

相关资讯

Stable Diffusion XL 1.0 来了!零门槛免费使用,附详细教程!

期待已久的 SD XL 1.0 来了!国内也可以访问,不用部署本地,复制链接打开「即时灵感」,选择「传统模式 - 通用智能」即可 0 门槛体验超强的全新模型!免费不限次,还能下载高清原图~用超简单的描述词 控制生成任何你能想象到的风格 释放你的无尽创意吧! 网址:,为了生成一张复杂、精致、细腻的作品,你可能需要加上一大堆关键词,例如:最高画质、杰作、大师作品、4k、超高分辨率……林林总总一大段,加起来比你描述画面主体内容的部分还要多。 但现在,你只需要按照下面这个公式,输入简单的几个词就能生成同样精致的效果。 主体

出图质量升级! 5款优质 SDXL 模型推荐

大家好,这里是和你们一起探索 AI 绘画的花生~ 上周为大家推荐了 SDXL1.0 的相关资源,不知道大家体验过它的生成效果没有?SDXL 1.0 模型除了本身的图像生成性能比之前的 SD 模型有了极大的提升,更重要的是可以促进更多优质的风格大模型和 Lora 模型的出现。SDXL 1.0 从发布到现在不过半个月,已经有不少基于它训练的新模型出现了,今天就为大家推荐其中 5 款优质的大模型和 lora 模型~ 上期回顾:一、DreamShaper XL1.0 熟悉 SD WebUI 的小伙伴应该对 DreamSha

万字干货!超全面的Stable Diffusion学习指南:模型篇

本文用7个章节,帮你完整掌握 Stable Diffusion 模型的分类和使用方法。 上期回顾:一、模型的概念 先来看看模型在 Stable Diffusion 中到底是什么概念?在维基百科中对模型的定义非常简单:用一个较为简单的东西来代表另一个东西。换句话说,模型代表的是对某一种事物的抽象表达。 在 AIGC 领域,研发人员为了让机器表现出智能,使用机器学习的方式让计算机从数据中汲取知识,并按照人类所期望的方向执行各种任务。对于 AI 绘画而言,我们通过对算法程序进行训练,让机器来学习各类图片的信息特征,而在训