一、智言川语
这款 AI 绘画软件 Ideogram,我认为是设计师、运营、自媒体从业人员需要重视起来的,如果你不会或者是不了解它,那么这一篇文章你一定要认真研读一下。
为什么我会说这款软件很重要?答案是它在做设计上真的太好用了,一键出海报、网页、logo、徽章……
而且是如 Midjourney 一样,一款轻量化 AI 绘画工具,不受设备的限制,网页登录即可使用。对比起 SD、MJ,它更适合设计师们日常使用。
下面将由我为大家介绍 Ideogram 这款软件,并系统的教会你如何使用它。
二、基础介绍
1. Ideogram 介绍
Ideogram 最初是在 2023 年 8 月由 AI 初创公司 Ideogram AI 宣布推出其图像生成模型的 v0.1 版本,其创始团队成员包括前谷歌 AI 研究员。
2023 年 8 月-2024 年 8 月期间,Ideogram 升级过多个版本,但其生图效果表现一般,所以没有如 Midjourney 一般大众熟知。直到 2024 年 8 月 22 日,官宣发布 Ideogram 2.0 版本,因其恐怖的文本理解能力,信息嵌入能力让 AI 绘画圈再次“狂热”。这也是继 Flux 模型发布之后,能与 Midjourney 对标并在文本信息领域对其降维打击的模型。
2. 会员价格
免费版本:支持文生图功能,每天送 10 个慢速积分,大约生成 40 张图片;
基础版本:年费价格 7 美元/月,每月 400 个快速积分,每天 100 个慢速积分,开放部分功能;
Plus 版本:年费价格 16 美元/月,每月 1000 个快速积分,无限慢速生图,开放大量功能;
Pro 版本:年费价格 48 美元/月,每月 3000 个快速积分,支持低阶版本的全部功能。
总结:该款软件可每天白嫖使用基础的文生图功能。Plus 版本可以无限出图,支持图生图、图像搜索、图像放大等核心功能。如果你想要续费,购买 Plus 版本即可,同样该软件可以类似 MJ 一样,拼团使用,每月几十元的价格。
3. 基础功能
Ideogram 与 Midjourney 网页版类似,通过账号登陆即可使用。
软件地址: https://ideogram.ai/t/explore
映入眼帘的是顶部的生图功能区及下方的社区图片展示区域。
免费版账号支持社区图片的筛选,基础版以上的账号则可以享受图片搜索功能。目前主要分为 4 大类型,分别是写实、设计、3D、动漫。
如何查看自己生成的图片,可以通过点击“My images”功能查看。
总体来说,Ideogram 的界面还算简洁,但是我想吐槽的就是这个搜索的功能,竟然需要付费才能使用……
三、功能介绍
1. 文生图功能
如图所示,Ideogram 生图功能区介绍,大家打开该网站后,通过浏览器插件翻译一下,很容易理解。
接下来我会通过案例实操的方式来介绍这些功能。
Ideogram 并没有像 Midjourney 那样分为 V 系列模型和 Niji 系列模型,最新版本的 Ideogram 2.0 模型是一个通用的文生图模型。
① 风格设定功能
控制生图风格除了可以添加提示词以外,还可以在功能区设置风格。如图所示,保持其他参数不变,提示词为:a girl 所生成的不同风格效果。
② 魔法提示词功能
有不少 AI 初学者不会写提示词的问题,也被这款软件解决了。也就是这个「Magic prompt」功能,翻译中文叫「魔法提示词」。
官方介绍:Magic Prompt enhances your initial prompt to improve image variety and richness. lt can also translate to English
魔术提示增强您的初始提示,以提高图像的多样性和丰富性。它也可以翻译成英语。
一句话总结就是:自动增加额外的提示词,并且可以自动翻译成英文。
我们只需要将「Magic prompt」开启(On),即可生效。比如我输入“一个中国女孩”点击生成,它就会自动帮我把这组关键词翻译成英文,并自动添加额外提示词生成。
就凭这个自动翻译功能,我愿为它鼓掌。
③ 图片尺寸功能
图片尺寸没什么好说的,但是让我吐槽的是,部分尺寸比例和自定义尺寸需要开通会员才能设置。其实常用的尺寸都能设置,不影响正常生图,但是这个设定却让我有点无语,要么就完全不开放尺寸设置,要么就大方点……
④ 调色板功能
Visibility:生成图片是否展示到社区(会员才能设置不公开)。
Model:模型选择,目前最好的模式就是 2.0,保持默认 2.0 模型即可。
下面这个调色版就有点意思了,它可以设定初始颜色,来影响生图的色调,我演示几个案例你就明白了。
示例 1:A photo of the moon rising above the tree line near a lake at night. The moon is partially obscured by clouds. A wooden cabin islocated near the lakeshore. The lake is calm, reflecting the sky and the trees. The ground is covered with pine needles. The background contains mountains.
夜晚,月亮从湖边的林木线上方升起。月亮有一部分被云遮住了。湖边有一间木屋。湖面平静,倒映着天空和树木。地上满是松针。背景包含山脉。
示例 2:A dynamic abstract expressionist painting of a mother and child embracing. The mother and child’s forms are overlapping brushstrokes, inspired by expressive painting techniques. The background is a radiant glow with vibrant warm hues. The painting exudes profound nurturing love.
一幅动态的抽象表现主义绘画,描绘了母亲和孩子的拥抱。母亲和孩子的形式是重叠的笔触,灵感来自表现力的绘画技巧。背景是充满活力的暖色调的光芒。这幅画流露出深沉的养育之爱。
该功能针对 Plus 和 pro 版本订阅用户,可以创建自定义调色板。那么可以怎么用呢,来看看这个案例:
A minimalist single-line cat design in gold on a black background
一个极简的单线猫设计在黑色背景上的金色
也就是说, 调色板不仅可能会影响整体颜色,还会影响生成图像的视觉外观和构图。这个功能确实挺不错的,可以看得出,Ideogram 在控制生图上花了不少心思。
⑤ 微调渲染功能
这个功能是设置生图渲染的时间:
Fast-快速(大约 5 秒):快速生成图像,当你想要快速查看图像的构图时,可以使用该模式。
Default-默认 (大约 12 秒):默认生图模式,一般生图使用这个。
Quality-质量(大约 20 秒):在默认生图的基础上提高图片质量,相对应生图时间会增加。
用几组案例来展示这几个渲染模式的生图效果:
⑥ 种子固定功能
就这个 seed 功能,我希望隔壁的 Midjourney 好好学学。
Midjourney 网页版我没找到有这个功能,Discord 虽然有,但是非常之难用。看看 Ideogram 是怎么用的吧:
种子(seed)相信大家都不陌生了,它是将每一张生成的图片打上一个编号(相当于取名)。在 Ideogram 中查看种子,只需要点击你所生成的图片,进入图片的信息页后你就能找到它。
点击 seed 值旁边的加号,可以将 seed 值快速发送到参数设置区中。
来个案例看看效果(只修改颜色单词,seed 值为 504389590):
蓝色小鸟提示词:
A blue bird with a yellow beak is perched on a branch. The branch is bending slightly under the bird’s weight. The background is a dark blue gradient.
一只长着黄嘴的蓝鸟栖息在树枝上。树枝在鸟的重量下微微弯曲。背景是深蓝色渐变。
红色小鸟提示词:
A red bird with a yellow beak is perched on a branch. The branch is bending slightly under the bird’s weight. The background is a dark blue gradient.
一只长着黄嘴的红鸟栖息在树枝上。树枝在鸟的重量下微微弯曲。背景是深蓝色渐变。
紫色小鸟提示词:
A purple bird with a yellow beak is perched on a branch. The branch is bending slightly under the bird’s weight. The background is a dark blue gradient.
一只长着黄嘴的紫色鸟栖息在树枝上。树枝在鸟的重量下微微弯曲。背景是深蓝色渐变。
这些图片按照我的要求修改了小鸟的颜色,尽管这些图片还是会有细微的不同,但它们具有相同的构图和相似外观,这个功能其实可以常用起来,很好用。
它还可以结合上面的微调渲染功能使用,比如我想追求生图速度,那就可以先设置为「fast」,然后抽出满意的图片后固定 seed 值,用「Default」或「Quality」优化。
仔细观察是可以看到细节上的变化,「Quality」渲染模式的图片细节、质量都会比前面两种优秀。
⑦ 负面提示词功能
这也是 Midjourney 没有的功能,也很容易理解。不需要哪些元素,就在这里写下提示词。
An assortment of colourful candies like Smarties or M&Ms, neatly arranged on a rustic wooden table.
各式各样的五颜六色的糖果,像 Smarties 或 m&m,整齐地摆放在一张质朴的木桌上。
添加负面提示词:green, green color, green candies,
可以看到,添加负面提示词后,绿色和绿色的糖果就消失了。
2. 图生图功能
① 图片上传功能
这里上传图片有两种操作方式。第一个就是点击图片上传按钮,第二种是将图片复制粘贴上传。操作都比较简单,试一下即可明白。
上传一张图片后,图片下方会出现三个按钮,分别是 Describe、Remix、Upscale。
Describe(描述):根据上传的图片,反推提示词,生成的提示词会自动填充进描述框内。
Remix(混音):根据上传的图片,反推提示词,并自动将生成的提示词和上传图片填入描述框内。
Upscale(高档):放大功能,将上传的图片进行高清放大。
下面我将通过案例挨个来讲解这些功能的使用方式。
② 图生文功能
以这张蒙娜丽莎肖像为例,上传图片后点击「Describe」,会为我生成一组提示词并自动填充进描述框内。
A portrait of a woman, presumably Mona Lisa, set against a scenic backdrop of mountains, a body of water, and a sky with clouds. The woman has a serene expression, long brown hair, and is draped in a dark, flowing dress. Her hands are folded over her lap, and she rests her chin on her hands. The painting is characterized by its meticulous detailing, especially in the facial features and the intricate background landscape.
一个女人的肖像,大概是蒙娜丽莎,背景是风景优美的山、水和天空的云。这个女人有着平静的表情,棕色的长发,披着一件黑色的飘逸连衣裙。她双手交叉放在腿上,双手托着下巴。这幅画的特点是细节细致,特别是在面部特征和复杂的背景景观上。
根据图生文生成的图片如下,反推提示词生成的图片效果还是比较准确的,这个可能是蒙娜丽莎这组肖像太出名了。
接着,我上传了一张带有文字信息的海报:
神奇的一幕出现了。它将海报中的文字信息提取了出来,并且生成与我上传图类似的海报。这难不成才叫做真正的“洗稿”?
③ 垫图功能
还是以这张图片为例,上传图片后点击「Remix」,它会自动将原图+反推的提示词填入描述框中。
而在图片编辑这里还有几个选项,如图所示。其中图片权重比较常用,如果想让生成图更接近原图,那就将该参数设置大一点,默认为 50。
我测试了 20、50、100 的图片权重,可以发现权重为 100 的图片与原图非常相似。
给它上点难度,权重设置为 60,我要求生成类似的海报图。
这是它给我的,我靠?莫不是用到了 Controlnet 模型,这文本理解能力属实太强了。
④ 高清放大功能
这个功能可以将 Ideogram 生成的图片,或者是用户上传的图片放大 2 倍或者 3 倍。上传图片后点击「Upscale」按钮,可以选择性的输入提示词,不输入也可以。
在右侧会有针对该图片的设置功能,「Resemblance」的意思是与原图的相似度,一般进行放大处理会设置 100。
「Detail」的意思是为该张图片增加细节,类似 SD 中的 Tile 模型。
这样一看,好像没什么区别,因为相似度参数设置的是 100,所以细节的变化不大。
我上传的图片尺寸是 512*768,它根据 2:3 的比例给我放大了 3 倍,可以在图片信息页查看。同时也可以开启「对比滑杆」,观察原图与放大图的细节变化。
⑤ 绘图功能
再看看一个特别有意思得绘图功能。在提示词输入的右侧有一个“画笔”图标,这个就是进入绘图功能区的入口。
然后在绘图区画板上,简单的画一个物体,比如我画的是一杯橙汁。点击“save”按钮后,会将所画图片上传为图生图的图片。
重点来了,它会根据你所画的图片生成一组关键词,比如我这里生成的:
A simplistic drawing of a beverage container, possibly a glass or a cup. The container is filled with a yellow liquid, possibly juice or a soft drink. There’s a pink straw protruding from the top, indicating that the beverage can be consumed using it. Adjacent to the straw, there’s a yellow object, possibly a lemon slice or a piece of fruit, resting on the rim of the container.
一个简单的饮料容器,可能是玻璃杯或杯子。容器里装满了一种黄色液体,可能是果汁或软饮料。顶部有一根粉红色的吸管伸出来,表明饮料可以用它来喝。在吸管旁边,有一个黄色的东西,可能是一片柠檬片或一片水果,放在容器的边缘。
然后我根据它生成的关键词,将第一句提示词改成了:There’s a picture of a glass of orange juice on the beach table(在沙滩的桌子上有一杯橙汁的照片)。
最终生成了一组这样的图片,尽管效果不咋样。但是朋友们,这只是我随手画的一张简笔画,如果你是插画师,认真绘制一下呢?
我其实对上面的图片不是很满意,于是我调整了图片权重 30,让 AI 发挥想象来创作。
最终我得到了这组图片,这下效果好多了。
操作我教给你们,至于怎么玩它,如何带入工作流生图,这还得我们一起研究。
四、案例欣赏
以上就是 Ideogram 的学习教程了,各位想必也看累了吧。下面跟我一起欣赏 Ideogram 生成的优秀案例,这或许是你在 Midjourney 社区中从未看到过的。
1. 勋章设计
2. 创意文字设计
3. LOGO 设计
4. UI 界面设计
5. 网页设计
6. 文字海报设计
7. 插图设计
8. 创意海报设计
五、结语
本篇教程到此结束,自 Ideogram 2.0 发布至今,我一直在体验这款产品。给我的整体感觉就是,Ideogram 是一个比较干净的模型,不像 MJ 那样会给图片增加滤镜以及你都说不出来的细节。
并且 Ideogram 的优势在于它拥有超强的文字嵌入功能,对文本的理解也够精确。Flux 也有相同的能力,但是它的运行所要求的配置实在太大了,而 Ideogram 却如 Midjouney 一样,可以网页端登录即用,我相信未来一定是属于轻量化工具的时代。AI 绘画界的战争还远未结束,到底谁能成为杀手级应用,我们拭目以待。