本文分享3个超好用的 Midjourney 新能力和我的研究经验:
可通过上传图片生成提醒词 prompt
开启了全新的 Niji 5 形式
批处理功用(仅限于 60$的用户,这里就不做过多介绍了,感兴趣的可以去民间通告处了解)
这里顺便教大家如何看民间第一手更新资料。可以进到民间 Midjourney 群组,找到 announcements 通知消息这里,有最新功用民间都会在这里发布。很多最新更新的内容并没有写到民间文档里,属于测试功用,也就意味着还需要我们自己去挖掘它的潜力。所以这些第一手的资料,要学会自己去看。
一、可通过上传图片生成提醒词
通过民间通知,可以看到这个功用是 4 月 4 号更新的。所以还是很新的能力,暂时还没有太多资料,我第一时间研究了下,分享一些我的经验。
这个新功用的作用是为了解决图片提醒词的问题。以前我们需要自己去想如何描述一张图,并且要便于 AI 绘画理解,这其实对不少人来说还是有难度的。但有了这个新功用后,你只需要把自己想参照的图片发给它,它就能自动帮你生成 4 个不同的符合这张图片的关键词,非常实用的功用。
具体用法:
1)输入/describe
Midjourney 会让你添加一张图片,你可以上传任何你想参照的图片(最近民间貌似升级了违禁图片范围,很多图片上传上来会显示不符合社区规定,解决办法就是换一张图,或者把图片违规的地方改动好)
2)生成 4 组提醒词
图片上传完按回车后,Midjourney 会返回你 4 组关键词,比如我是海贼迷,上传了一张索隆的帅图,它就会很快生成 4 组符合这张图特征的关键词,可以看到第 4 组关键词居然还能识别出 one piece。那我就先选择关键词 4 生成,看它会给生成什么样的成效。
3)提醒词调整
当你选择 4 之后,它会有一个弹窗出来,其实是给你改动提醒词的机会。如果你有改动的需要,可以在这里填新的关键词。
4)生成结果
先看看在不改关键词的情况下它会画出什么样?可以看到成效还是非常不错的,但会发现跟原图关系没那么大,只能说保留了一些角色主体+部分物件特征。
5)支持基于提醒词的反复改动
我觉得对于索隆来说,绿藻头是一个非常明显的特征,所以我再次选择 4(可以反复选这个按钮,然后改动关键词),然后加入 hair is green,style by Hayao Miyazaki,(绿色头发,宫崎骏气概)看看成效。会发现想要的特征可以通过关键词的改动得到更多保留。
一个疑惑以及我的实验思路。
我当时第一次用这个新功用时,有好奇一个点是,这 4 组关键词到底与原图存在什么样的关联性?相互之间又有什么样的侧重?为此,我做了一个小实验,传了一张我快到账的电脑主机图,生成了 4 组关键词,我分别都让它们出图,对比了下,每组关键词都分别有侧重。
1)提醒词 1:the lenovo gaming pcs is seen, in the style of panel composition mastery, color splash, darksynth, sparklecore, blurry details, hyper-realistic water, frequent use of diagonals, striking use of color –ar 16:19
2)提醒词 2:an image of an pc with a colorful panel on it, in the style of dynamic energy, loish, light black and crimson, sparklecore, monsù desiderio, minimalist sets, scoutcore, luxurious –ar 16:19
3)提醒词 3:the pc with its bright lighting and neon lights on it, in the style of hyper-realistic water, loish, light black and maroon, vibrant color blocks, laborwave, panel composition mastery, precisionist, use of ephemeral materials –ar 16:19 –v 5
4)提醒词 4:h-series dual core pc build review – gpu, memory, drives, case, fans, power supply, in the style of vibrant color gradients, realistic hyper-detailed rendering, multi-layered compositions, unreal engine, vibrant colorist, light black and pink, playful elegance, explosive and chaotic –ar 16:19 –v 5
会发现这 4 组关键词都能抓住主体特征,图片比例可以保持原图大小,不同的地方看起来像是给了不同的气概化程度。
但我目前没太能找到规律,写上面这个实验过程主要是想和大家分享我在学习新知识时的研究思路:一旦碰到好奇不解的地方,赶紧做些实验测试,说不定就会有新的发现了。
这里我虽然没有得到进一步的结论,但希望能抛砖引玉,看看有没有哪位大佬也与我有同样的好奇点,然后有结论了,欢迎在评论区和大家分享。
我现在对它生成的 4 组关键词的用法就是去仔细阅读,看看哪个更符合自己的需求,然后就用它去生成后续的图。
二、开启了全新的 Niji 5 形式
上周还更新了 Niji 5 形式,之前的 Niji 形式一直都是擅长画二次元的图,这次更新之后,能二次元画面能画的更细腻,更容易出成效。
如何开启它呢?有 2 个方法:
一个是输入/settings,选择 Niji version5,这样每次写关键词就不需要再写–Niji 5 了
当然如果你不需要一直用这个形式,只是偶尔用一下,那么可以通过在关键词后面加 –Niji 5,也可以临时启用,直接在提醒词加后缀是可以覆盖默认设置项的。
这里简单说下新形式下的几个特点:
1)支持了气概化参数
在之前的 Niji 4 版本,不能使用气概化参数。
而新的 Niji 5 就能使用气概化参数,气概化参数值在 0-1000 之间,数字越大,气概化自由度越大。多了一个可用的参数,相当于提供了更大的发挥空间。
2)画日漫气概
比如我写一段提醒词,用到了气概化参数:
pixel art, kitsune girl, hugging her tail, cute, bright and colourful, Japanese city background –ar 9:16 –niji 5 –s 500
能看到新的形式,画这种插画真的很容易出成效。
也可以尝试结合一些气概偏向,比如我想给画面增加一些赛博朋克的味道,加一个气概词即可。
Cyberpunk, kitsune girl, hugging her tail, cute, bright and colourful, Japanese city background –ar 9:16 –niji 5 –s 500
3)画写实插画风
除了能画这种特别日漫的气概,它对偏写实的画风也很擅长。
比如我想画福音战士女主绫波丽,用超写实的画风画出来,但用的也是 Niji 5 的形式,可以发现画得也是非常棒。
ayanami rei anime waifu with luxury body suit, wallpaper, anime screenshot, hyper realistic, pale skin, beautiful face,extreme detail, detailed drawing, trending artstation, hd, fantasy, realistic rim lighting, sharp focus, backlit, attack on titan, split screen borders, photorealism –ar 3:2 –q 2 –niji 5
我觉得左 2 不错,放大细节后会发现一些光影细节画得特别棒
4)画 3D 写实照片
实验发现,用 Niji 5 模型来画照片并结合模型自身的卡通气概优势,成效很不错。这里我用一张照片作为参照。
我先把这张照片用/describe 命令,获得关键词描述,然后再用 Niji 5 模型生成。
提醒词:
图片链接,the actress is posing posing with her hand on the chin, in the style of gongbi, light gray and light bronze, photo-realistic techniques, serene faces, soft hues, dotted, symmetrical harmony cartoon,by Disney style:: 2,3D,octane render,extreme detail,HD,8K –ar 31:46 –q 2 –s 200 –niji 5
此时,我觉得只能说有些神似,但还希望能更像照片一些,毕竟有些朋友就是想拿来做自己的头像啥的,我懂你。我的方法就是给参照图加权重 –iw 2,这个知识点之前的文章讲过,这里不再赘述。
提醒词:
图片链接 the actress is posing posing with her hand on the chin, in the style of gongbi, light gray and light bronze, photo-realistic techniques, serene faces, soft hues, dotted, symmetrical harmony cartoon,by Disney style:: 2,3D,octane render,extreme detail,HD,8K –ar 31:46 –q 2 –s 200 –iw 2 –niji 5
这回发型和姿势果然更像原图了一些
当然你也可以再换其他气概,喜欢谁的画风,就在关键词中加上 by xxx 气概即可。
5)垫多张图
如果你还希望能更像一些,我发现有一个方法就是垫多张图,你可以喂给它多张图来参照。这些图可以是不同角度的,背景尽量干净一些。最终出来的图会融合多张图的特征进行生成。
比如下面这张图就是我用了 4 张图垫出来的
用到的图片
提醒词:
图片链接,图片链接,图片链接,图片链接,full-length portrait, Goddess like young female angel with kind smile, charming pose in the realitic, Innocent girl, short pink skirt, light pink swimsuits, photography, light from front, intricate details, highly detailed, insanely detailed, 8K, hd, lighting from front, sharp focus, realistic 8k ,Random short outfits that emphasize femininity –ar 1:2 –q 2 –s 750 –v 5
AI 生成的成效
6)一个公式
如果你想用这个形式画出比较好的成效,还需要注意以下几点,尤其是对人物来说,描述词越准确,成效越好,公式是:
年龄+服装+表情+发质+皮肤+灯光+背景+画质+身材+视角+气概
关键词参照,可以看看之前的教程,都有写,这里不再赘述了。我写的教程要认真看,都是你需要的,如果没找到,那就多看几遍。
最后
这里多提一句,也是不少人问到的,如果你希望画出来的图更加可控,更好地用在自己的实际工作中,那么建议用 stable diffusion 吧。虽然因为参数多,它的上手难度略大一些,但正因为如此,它的可控程度也是更好的,比如像什么换脸,换装之类的非常方便。我的 4090 电脑快要到了,到时候会跟大家分享经验,保持关注吧。