大家好,这里是和你们一起探索 AI 图画的花生~
OpenAI 新发布的文生图模型 DALL·E 3 已经在 ChatGPT Plus 中推出一段时间了,网上玩 AI 图画的大神们对它的图象生成功能给出了很高的评价,并且分享了一些很棒的运用思路,对于我们做设计来说也很是有帮助,今天就一起来看看 DALL·E 3 的一些进阶用法。
上期回顾:
在 DALL·E 3 还未正式上线之前,我已经写文章给大家介绍过了它的一些优势,比如可以精准生成提示词中提到的所有细节、生成正确的文本内容以及保持图象中人物的一致性等,这些优势的真实性和稳定性在用户运用的过程中已经被证实,并且给实际的设计带来的很大的帮助。下面是我用 DALL·E 3 生成的分别类型的图象,可以看到图象质量都很是高,并且在分别风格上的表现并不逊色于 Mijourney 和 Stable Diffusion 这样的主流 AI 图画工具。
Miniature, an autumn rice field, two farmers harvesting, northeast China, sunshining, highly detailed
微型画,秋天的稻田,两位农民在收割,中国东北,阳光普照,高度精细
9 different stickers featuring Halloween pumpkin lights, bats, castles, witches, skeletons, with vibrant colors and white borders on a minimal background.
9 种分别的贴纸,以万圣节南瓜灯、蝙蝠、城堡、女巫、骷髅为特色,色彩鲜艳,白色边框,背景极简。
Knolling photo of aVR game player, surrounded by the things he or she needs to be on the platform, arranged neatly.
一张虚拟现实游戏玩家的照片,周围是他或她在平台上所需的物品,摆放整齐。
A creative logo for a reading app, green and blue gradient, light and pale color, Minimalistic and flat, Square icon, black background
阅读应用程序的创意徽标,绿色和蓝色渐变,浅色和淡色,极简主义和平面,方形图标,黑色背景
a happy woman jogging with a orange t-shirt, flat simple vector illustrations style, vibrant colors, nature, white background
穿着橙色 T 恤慢跑的快乐女子,平面简约矢量插画风格,色彩鲜艳,自然,白色背景
a round flat podium, product display, with Guest-Greeting Pine and rockery and chinese ancient architecture on it, minimalist chinese background wall,studio lights, 3D, rendering, super detailed
圆形平面平台,产品展示,有迎客松、假山和中国古建筑,简约的中国背景墙,工作室灯光,3D,渲染,超详细
强大的细节塑造能力和正确的文本生成能力让 DALL·E 3 能够做到“让创意落地”,如果你有做微信公众账号或微博等自媒体,告诉 GPT-4 你的文字内容和需求,它就能用 DALL·3 为你生成合适的封面和文章配图;稍微复杂一些的 Banner、 海报、Logo、产品样机等设计项目,DALL·3 也能处理地很好,生成的图象甚至无需修改可以直接运用。
用 DALL·E 3 生成的游戏宣传 Banner, 图片来源:Twitter @Proper https://twitter.com/ProperPrompter/status/1712843528525459875
用 DALL·E 3 生成的电影海报,构图和标题设计都很是不错。图片来源:Twitter @leonalia Balaxia @Koldo Huici @AlexandrIA https://twitter.com/techhalla/status/1712591761774690616
DALL·E 3 另一个很是值得注意的点就是它保持人物一致性的能力。目前主流的 AI 图画工具中,Midjourney 虽然可以在一定程度上保持复现人物的特征的,但很是不稳定,一旦场景或表情上有变化,人物形象就明显变得不一样了;而在 Stable Diffusion 中虽然可以借助 Controlnet 进行控制,但又容易变得死板,调整各种参数也很是麻烦。
而在 ChatGPT 中,用户仅需以自然语言描述自己的需求,就能实现控制人物形象一致性的目的。下图是网友 @Borriss 分享的在 DALL·E 3 中保持脚色形象一致性的方法:首先是详细描述脚色的各种特征,并给脚色取一个名字,然后描述脚色在分别环境中的分别行为,DALL·E 3 就能依照你之前规定的特征生成同一脚色的分别图象。
图片来源:twitter @Borriss https://twitter.com/_Borriss_/status/1713172267805417969
这种控制人物一致性的方式更轻松,准确度也不错,并且对各种风格的图象都有作用,比较稳定。下图是网友 @Anu Aakash 利用 DALL·E 3 控制真人图象的效果图,不仅可以生成同一人物在分别年龄段的图象,还能按需求改变人物的动作姿势,效果令人惊叹。
图片来源:twitter@Anu Aakash: https://twitter.com/anukaakash/status/1710094929354183142
如果你也想体验 DALL·E 3 的图象生成能力,可以尝试以下 3 种方式:
①开通 ChatGPT Plus 会员后获取,费用是 20 美元 / 月。这是最佳的用法,因为可以借助 GPT-4 强大的语言理解能力,以交谈的方式轻松生成并修改图象,但是获取比较困难。
②运用 New Bing 的聊天机器人。它可以免费运用,目前内置的也是 GPT-4 和 DALL·E 3 的模型,但是效果不及 ChatGPT Plus 好。运用时额可以选择“更有创造力”的模式,AI 机器人会给你提供更多的灵感。
③Microsoft Bing 还有一个专门的 AI 图画像网站 Image Creator (图象创建器),可以通过文本提示词生成图象,目前内置的也是 DALL·E 3 模型,可以免费运用。
链接直达:来自 Microsoft 必应的图象创建器 (bing.com)