大家好,这里是和你们一起探索 AI 绘画的花生~
备受期待的 Midjourney V5 在上周四终于上线了,而且一发布就引起了不小的轰动,因此这次 V5 模型的图像生成效果“太惊人了”,无限逼近真实照片,让人难辨真假。下面是我从 Midjourney 官方社区中收集的一些用 V5 模型生成的图像,大家可以先感受一下。
内容来源:Midjourney 官方社区 https://www.midjourney.com/app/
还不了解 Midjourney 和 AI 绘画?看这里:
如果不事先告诉大家这些图像都是 V5 生成的,是不是很容易就认为它们就是摄影照片?从这些图像中我们很难看出之前 Midjourney 容易犯的错误,比如不自然的面部、错误的手部或四肢细节、头发衣物纠结吧不清、虚假不自然的光影细节等,一切都非常的自然和谐。
我特意用了同样的提示词和种子值在 V3/V4/V5 中各生成了一张图像,比较它们之间的不同,可以看出相比前面的版本,V5 无论是在人物形象、光影细节还是画面质量上都有明显进步,好像更能“理解”和“贴近”人们想要效果。
而且上面的对比图还体现了 V5 的一个重要的突破 —— Midjourney 好像会画手了。之前Controlnet 的出现让 Stable Diffusion 有了可以精准控制人体姿势和手部细节的能力,当时就有人说如果 Midjourney 不尽快跟进很可能会丧失竞争力,看来 Midjourney 也的确有意识到这一点。
内容来源: https://twitter.com/dreamingtulpa/status/1636123584174120960
但之所以加一个“好像”,是因为目前这个功能并不稳定。虽然不少网友都晒出自己用 V5 生成正常手部姿势的图像,但也仍然有一些不正常的结果,不知道是不是因为提示词使用不当的原因,不过总体来说还是比 V4 要好很多。
V5 在生成不同角度的手部姿势上有明显进步。图片来源: https://twitter.com
但是不稳定。图片来源: https://twitter.com/JoaoSan89/status/1636345950099718147/photo/1
除了上面两点,V5 对提示词的敏感度也比之前更高。生成的图像与提示词保持高度一致,减少了 AI 自由发挥的成分,让用户可以更好地控制画面细节。有网友发现 V5 可以非常逼真地表现出“玻璃上的反光”,这在之前是无法做到的。
V5 生成的带有玻璃反光的图像,图片来源: https://twitter.com/
Midjourney 常用后缀参数知识:
V5 在后缀参数上也有一些调整,包括:
恢复了 V4 中被停用的 --tile 无缝纹理功能和 --iw 图片权重功能 --ar 画面宽高比支持比1:2更大的数值,目前没有限制 --s 风格化选项有了更好的表现,低风格化更接近摄影照片,高风格化有更强的艺术性,整体表现比 V4 更生动鲜明。 V5 目前没有升频器 Upscaler,因为他默认的生成分辨率已经提升了2倍,和V4升频后是一样的,所以生成速度比之前慢了一些,点击 U 选项会立马发送给你已经生成的那张图片。其中画面宽高比例的放宽让用户有了更自由的创意发挥空间,我们可以用它生成了一个突破天际的“千层汉堡”或,也可以用来生成和电影荧幕和全景图一样的超宽图片。
使用 midjourney V5 生成的全景图,图片来源: https://twitter.com/GuyP/status
使用 Midjourney V5 生成的超高图片,宽高比可以达到 1:5,图片来源:midjourney 官方社区
Midjourney V5 在生成质量和自由度上的全面提升,让我们看到了人类利用 AI 工具进行创意工作的更多可能性,官方在发布公告中表示 V5 目前只是一个 alpha 测试版本,在未来正式更新的时候会可能会有“完全不同”的表现,让人更加期待后续的更新了。
V5 模型的启用方式和之前一样,在提示词末尾加上 --v 5 参数,或者使用 /setting 命令开启 V5 模式,感兴趣的小伙伴赶快试一试吧~
Midjourney 官网: https://www.midjourney.com/ (需要魔法)