大家好,这里是和你们一起探索 AI 绘画的花生~
备受期待的 Midjourney V5 在上周四终于上线了,而且一发布就引起了不小的轰动,因此这次 V5 模型的图象生成效果“太惊人了”,无限逼近真实照片,让人难辨真假。下面是我从 Midjourney 民间社区中收集的一些用 V5 模型生成的图象,大家可以先感受一下。
内容滥觞:Midjourney 民间社区 https://www.midjourney.com/app/
还不了解 Midjourney 和 AI 绘画?看这里:
如果不事先告诉大家这些图象都是 V5 生成的,是不是很容易就认为它们就是拍照照片?从这些图象中我们很难看出以前 Midjourney 容易犯的错误,比如不当然的面部、错误的手部或四肢细节、头发衣物纠结吧不清、虚假不当然的光影细节等,一切都非常的当然和谐。
我特意用了同样的提醒词和种子值在 V3/V4/V5 中各生成了一张图象,比较它们之间的不同,可以看出相比前面的版本,V5 无论是在人物形象、光影细节还是画面质量上都有明显进步,好似更能“理解”和“贴近”人们想要效果。
而且上面的对比图还体现了 V5 的一个重要的突破 —— Midjourney 好似会画手了。以前Controlnet 的出现让 Stable Diffusion 有了可以精准控制人体姿式和手部细节的能力,当时就有人说如果 Midjourney 不尽快跟进很可能会丧失竞争力,看来 Midjourney 也的确有意识到这一点。
内容滥觞: https://twitter.com/dreamingtulpa/status/1636123584174120960
但之所以加一个“好似”,是因为暂时这个功用并不稳定。虽然不少网友都晒出自己用 V5 生成正常手部姿式的图象,但也仍然有一些不正常的结果,不知道是不是因为提醒词使用不当的原因,不过总体来说还是比 V4 要好很多。
V5 在生成不同角度的手部姿式上有明显进步。图片滥觞: https://twitter.com
但是不稳定。图片滥觞: https://twitter.com/JoaoSan89/status/1636345950099718147/photo/1
除了上面两点,V5 对提醒词的敏感度也比以前更高。生成的图象与提醒词保持高度一致,减少了 AI 自由发挥的成分,让用户可以更好地控制画面细节。有网友发现 V5 可以非常逼真地体现出“玻璃上的反光”,这在以前是无法做到的。
V5 生成的带有玻璃反光的图象,图片滥觞: https://twitter.com/
Midjourney 常用后缀参数知识:
V5 在后缀参数上也有一些调整,包括:
恢复了 V4 中被停用的 –tile 无缝纹理功用和 –iw 图片权重功用
–ar 画面宽高比支持比1:2更大的数值,暂时没有限制
–s 风格化选项有了更好的体现,低风格化更接近拍照照片,高风格化有更强的艺术性,整体体现比 V4 更生动鲜明。
V5 暂时没有升频器 Upscaler,因为他默认的生成分辨率已经提升了2倍,和V4升频后是一样的,所以生成速度比以前慢了一些,点击 U 选项会立马发送给你已经生成的那张图片。
其中画面宽高比例的放宽让用户有了更自由的创意发挥空间,我们可以用它生成了一个突破天际的“千层汉堡”或,也可以用来生成和电影荧幕和全景图一样的超宽图片。
使用 midjourney V5 生成的全景图,图片滥觞: https://twitter.com/GuyP/status
使用 Midjourney V5 生成的超高图片,宽高比可以达到 1:5,图片滥觞:midjourney 民间社区
Midjourney V5 在生成质量和自由度上的全面提升,让我们看到了人类利用 AI 工具进行创意工作的更多可能性,民间在发布公告中表示 V5 暂时只是一个 alpha 测试版本,在未来正式更新的时候会可能会有“完全不同”的体现,让人更加期待后续的更新了。
V5 模型的启用方式和以前一样,在提醒词末尾加上 –v 5 参数,或者使用 /setting 命令开启 V5 模式,感兴趣的小伙伴赶快试一试吧~
Midjourney 官网: https://www.midjourney.com/ (需要魔法)