大家好,这里是和你们一起探索 AI 绘画的花生~
图象提醒词,也就是垫图,是 midjourney 中一项非常重要且实用的功效,它可以提炼一张图象的格调、颜色、构图等特色,生成类似的图象,在制作格调化头像、生成 B 端 3D 图标等设计素材上用途广泛。最近我也对垫图功效进行了大量测试,摸索出不少实用小技巧,今天分享给大家~
了解垫图应用方式:
一、内容形式要一致
应用垫图时,垫图在宽高比、内容形式等方面要与你最终想要的结果一致,这样才能最大限度地还原垫图所蕴涵的特色。
例如你想将真人照片变成格调化的头像,那么上传的图象就应该符合“头像”的形式——人物头部或者上半身的正面特写,内容清晰,面部没有被其他物体遮挡等。应用全身照、头部角度不对或宽高比不一致等问题都可能会扰乱图象生成的质量。
二、用文本描述强调画面内容
上传图象后,我们还需要在文本提醒中,详细描述所有我们想要的画面特色,如画面的格调、人物的衣着/表情、物体的材质/颜色,背景、环境等。如果没有具体指定,遗漏的部分就会被 AI 自由发挥,导致与垫图不像。
三、尝试不同的 –iw 参数
–iw (image weight 图象权重)参数可以调节垫图与文本提醒之间的权重比例,默认值是 1,可用数值范围是 0-2,数值越高,结果图越贴近垫图;数值越低,结果图越贴近文本提醒词。推荐在 0.5 -1.5 之间进行尝试,获取多种生成结果,再从中挑选最合适。
在 –iw 参数之外,还可以再添加 –s (stylize 格调化)参数,丰富画面细节,提升的整体质感。它的默认值为 100,可用范围是 0 -1000,数值可以在 250-750 之间尝试。
四、用 –no 参数去除隐藏的扰乱项
以下图为例,将真人图象转为怀旧动漫格调时,虽然在文本提醒词中用“动漫、怀旧插画、卡通插画”等关键词对格调进行了强调,但生成的图象仍有比较明显的立体感,不符合怀旧动漫二维扁平的特色。
这是因为 Midjourney 在处理垫图时,会蕴涵一个类似「describe 功效」的过程,即它会先识别垫图的图象特色,包括人物、物体、格调、颜色、环境、材质等,用这些关键词形成一组提醒,与我们写的文本提醒词相结合,共同引导新图象的生成,也就是一个“图象→文本→图象”的过程。
在这个过程中,如果垫图所蕴涵的一些格调、材质、色彩上的特色,与我们最终想要的图象结果相反,它被 midjourney 提炼为关键词后,就会影响图象的生成结果。就像上面的例子一样,因为垫图应用的是“写实真人图象”,里面蕴涵一些潜在的关键词就会扰乱“怀旧的动漫插画”的生成结果。提炼潜在扰乱关键词方式有以下 2 种:
直接根据垫图与结果图之间的差异进行判断。垫图用的是摄影照片,那么其中照片、摄影(photo\photograph)等关键词,或者近似的 3D、3D 渲染等提醒词,都可能会扰乱“二维动漫插画格调”的形成。
应用「describe 功效」提炼垫图的相关提醒词,从中寻找可能的扰乱项。
然后我们就可以应用 –no 参数,去除垫图中潜在的扰乱性词语,图象生成的结果就会在一定程度上得到改善。
除此之外,我们也可以再灵活调整 –iw 的数值,进一步优化图象结果。或者再搭配更多不同的参数一起应用,说不定能探索出一种新的图象格调。
了解 –no 参数的应用方法:
五、记得多生成几次
Midjourney 不是设计工具,设置了数值就会立即看到对应的结果,而是具有很大的随机性。所以对于一组提醒词,至少要刷 3-5 遍图,才能比较全面地了解稳定的出图结果。在此基础上,才能完整地了解目前图象存在的不足,方便我们后续进行有针对性的修改。
所以在用 Midjourney 出图时,一是要有耐心,多刷图;二是要思路清晰,每次修改提醒词的时候,都先确定是为了解决什么问题,再准确地修改对应的部分。胡乱改动只会让出图结果越来越偏离我们我们原本的目标,效率会很低下。