AI图画神器Stable Diffusion模型再升级!新版亮点全面盘点!

大家好,这里是和你们聊设计的花生~ 以前为大家对比了 6 款在线 AI 图画软件在不同主题上的图象生成成果,最终是 Midjourney 的团体表现最好,而 Stability AI 官方模型 Stable Diffusion v2.1 则表现不尽如人意。最近 Stability AI 又推出了一个新模型 Stable Diffusion XL,参数是 SD v2.1 的 2.5 倍,那这个新模型的图象生成成果如何呢?今天就继续来尝试一下。 往期回顾:Stable Diffusion XL 简介 DreamStud

AI图画神器Stable Diffusion模型再升级!新版亮点全面盘点!

大家好,这里是和你们聊设计的花生~

以前为大家对比了 6 款在线 AI 图画软件在不同主题上的图象生成成果,最终是 Midjourney 的团体表现最好,而 Stability AI 官方模型 Stable Diffusion v2.1 则表现不尽如人意。最近 Stability AI 又推出了一个新模型 Stable Diffusion XL,参数是 SD v2.1 的 2.5 倍,那这个新模型的图象生成成果如何呢?今天就继续来尝试一下。

往期回顾:

Stable Diffusion XL 简介

DreamStudio – SD XL:梦幻工作室 (dreamstudio.ai) (新用户有 200 点免费生成额度)
Clipdrop – SD XL:ClipDrop – Stable Diffusion (目前免费生成)

此次 Stable Diffusion XL 一共更新在两个平台上,一是 Stability AI 官方 AI 图画软件 DreamStudio,另一个则是以前被 Stability AI 收购的 AI 图象处理平台 Clipdrop。二者的区别在于 DreamStudio 上有很多的可调节参数,比如画面比例、图象数量等,Clipdrop 是统一的 1:1 的画面比例,一次生成 4 张,单张图象放大后可达到 1024*1024px。

AI图画神器Stable Diffusion模型再升级!新版亮点全面盘点!

据 Stability AI 官网介绍,SD XL 模型支持用更短的提醒创建描述性图象,并在可以在图象中生成笔墨,模型增强了图象的构图和脸部生成能力,使画面更加逼真和美观。

AI图画神器Stable Diffusion模型再升级!新版亮点全面盘点!

SD XL 生成的图象

生成准确的笔墨和画手一样,一直是 AI 图画中的难题,直到 Controlnet 插件出现 ,我们才能在 SD WebUI 中通过轮廓检测功能固定笔墨外形,从而生成精准的笔墨内容,而此次 SD XL 模型可以生成笔墨无疑是又是 AI 图画的一大先进。我分别在 Midjourney 和 SD XL 中用文本提醒词进行尝试,结果是 SD XL 的笔墨生成成果的确比 Midjourney 好。

AI图画神器Stable Diffusion模型再升级!新版亮点全面盘点!

接着继续用和以前一样的主题进行图象生成尝试。首先是人像,可以看出 SD XL 比 v2.1 的成果要好很多,构图正确,人物面部没有扭曲变形,团体质感也好很多,品质看起来并不比 Midjourney 差,说明 XL 模型在照片真实性上有进行专门的优化 。

AI图画神器Stable Diffusion模型再升级!新版亮点全面盘点!

然后是动漫风,XL 生成的图象在画面团体品质有较着提升,应该是对数据集进行了优化,但是有一个非常大的缺点就是五官和四肢不一般,在生成的 2 批 8 张图象中,每一张都有五官四肢不一般的情况,图象可用率极低。

AI图画神器Stable Diffusion模型再升级!新版亮点全面盘点!

而在 3D 风格上 XL 模型还是有对照较着的先进的,无论是人物精细度还是画面团体美感都比以前的 v2.1 要好,不过和动漫风一样存在四肢不一般的情况,下面是我从生成的 4 张图象中挑出的双手看起来对照一般的一张,感觉 XL 模型在这一块的训练没做好。

AI图画神器Stable Diffusion模型再升级!新版亮点全面盘点!

最后再看一下矢量扁平插画和概念场景的表现 ,同样都有非常较着的美感提升,不过也能看出 SD XL 在文本提醒的理解上还有缺陷,在扁平插画的尝试中它忽略了“白色背景”这一关键词;而由于 SD XL 目前还是尝试版,画面尺寸不能做到 16:9,这也让图象的表现性受限。

AI图画神器Stable Diffusion模型再升级!新版亮点全面盘点!

通过上面的图象生成尝试可以看出,Stable Diffusion 的 XL 模型 比 V2.1 在品质上有了较着先进,特别是在人像品质上,虽还不能达到 midjourney V5 的水平,但是在目前的 AI 图画工具总也算表现对照好的;新增的笔墨生成功能也是对照独特的,除了接入 Controlnet 的 SD WebUI,其他 AI 图画工具目前都还没有生成准确笔墨内容的能力。

同时 Stable Diffusion XL 的缺点也是对照较着的,即人物的四肢不一般,这点在动漫和 3D 风格中尤为突出;模型对提醒文本的理解能力也有缺陷,会漏掉一些关键词语,期待 Stability AI 在后续的更新中能进一步优化现在这些问题。

给TA打赏
共{{data.count}}人
人已打赏
应用

拒绝贩卖焦虑!为什么AIGC不可能更替计划师?

2023-4-18 6:35:00

应用

交互计划师如何用 AI 提高处事效率?来看大厂高手的总结!

2023-4-19 7:47:12

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索