一、前言
由于在工作中,经常会涉及到使用人物素材完成 Banner 设计的工作,于是最近开始探索关于 Midjourney 进行 AI 人物生成的相关测试,同时将这一段时间的经验分享出来。
基础教程看这篇:
刚开始接触和使用 Midjourney 的时候,最大的问题在于生成的人物图片无法保证人物位置的大小和视角,想要固定某一种动作,只能通过垫相同动作的图片的这种方式去解决。
后来经过一些了解照相的朋友,通过他们了解到这些都是可以通过照相的知识来补充的这方面短板的。
后来我去咨询了 ChatGPT,它确实给了我一些很有用的方向。
根据 ChatGPT 的建议,我这里将生成 AI 人物类型图片的方向确定为一下 7 方面:
人物构图的视角挑选
人物角度的挑选
人物距离的挑选
人物脸色的挑选
人物氛围感的挑选
人物装束的挑选
人物风格的挑选
通过这 7 个方向,我们来进行了实验。
二、人物构图的视角挑选
视角可以按照相机相对于被拍摄东西的位置,分为正面、背面和侧面。
当然,拍摄角度不仅限于这三个方向,还可以有更多不同的角度挑选,这需要根据被拍摄东西和拍摄需求来挑选合适的角度。
测试:不加入关键词的 AI 生成的图片会是什么样子?
生成思绪:年青的女孩
生成咒语:young girl, –ar 16:9
通过随机生成的 8 张来看,由于没有其他关键词的约束,目前随机出来默认的人物形象偏欧美风,人物视角的比例偏差也都保持在了正面和侧面,那么我们现在可以通过增加构图视角的关键词来限定人物呈现的视角。
我们来看看增加不同视角之后的样子吧。
1. 正视角
正视角是指在人像构图时,拍摄东西正对着相机的姿态,使人像呈现出正面的视角。
咒语关键词:Front view
生成思绪:正视角的年青女孩
生成咒语:young girl, front view, –ar 16:9
通过随机生成的图片来看,由于受到正视角关键词的约束,目前随机出来人物都是偏正面的,结果相对来说是较好的,那么我们就继续来看一看其它的视角。
2. 后视角
后视角是指从被摄东西的背后拍摄的视角,也就是以被摄东西的背部为主要构图元素的拍摄方式。
这种视角可以营造出一种神秘或者引人遐想的氛围。
咒语关键词:Back view angle & Back angle
生成思绪:后视角的年青女孩
生成咒语:young girl, back view angle, –ar 16:9
通过随机生成的图片来看,通过后视角关键词的约束,目前随机出来人物都是展现人物背面的,结果相对来说是较好的,那么我们就继续来看一看其它的视角。
3. 侧视角
侧视角是指观察或拍摄物体或场景时从侧面的角度观察。
在视觉艺术中,侧面视角可以用于展示物体的形状和轮廓,或者创造深度和距离的感觉,同时可以用于捕捉被摄东西的侧面,特出其特征和特点。
咒语关键词:Side view & Shoulder level view
生成思绪:侧视角的年青女孩
生成咒语:young girl, Side view, –ar 16:9
通过随机生成的图片来看,通过侧视角关键词的约束,目前随机出来人物也都是侧面的形象,结果相对来说也是较好的,那么我们就继续来看一看其它的视角。
4. 仰视角
仰视角是指观察或拍摄物体或场景时从底部的角度观察。
在人物构图中,仰视角可以用于捕捉俯瞰等场景,或者特出被摄东西的底部特征,这个视角每每会让物体看起来更为庞大和高大,具有一定的视觉冲击力和震撼效果。
咒语关键词:Bottom view & Low angle view
生成思绪:仰视角的年青女孩
生成咒语:young girl, low angle view, –ar 16:9
通过随机生成的图片来看,通过仰视角关键词的约束,目前随机出来人物的形象,结果看起来确实是仰视角,但是从照相角度来看的话,只有第三、第四张照片构图会符合大众审美以外,其它图片的角度的图片都是有一定问题存在的,那么是什么问题造成的呢?我们一会儿深究!现在先继续来看一看其它的视角。
5. 俯视角
是指摄像机的视线从上方向下拍摄被拍摄东西,这种角度每每可以让拍摄者更好地捕捉到人物的身体语言和动作,通过强调身体语言和动作、放大视觉效果。
咒语关键词:Bird’s-eye view
生成思绪:俯视角的年青女孩
生成咒语:young girl, lbird’s-eye view, –ar 16:9
咦!这个生成的结果跟上面仰视角度的结果一样,生成的图片好像确实没有什么很大的问题,但是又有一种明显不对的感觉。
于是我又咨询了一下那位玩照相的朋友,他看完之后告诉我,很多时候除了视角需要保证之外,还需要考虑人物在画面之中的位置以及拍摄的高度来呈现的视觉效果的,也就是说还需要考虑人物的角度和人物的距离,那我们接下来看看,到底是不是如此。
还有其它特殊视角,大家可以根据关键词自由尝试,例如:
自由视角(Free camera)
固定视角(Fixed camera)
运动视角(Dynamic)
透视视角(Perspective)
三、人物角度的挑选
什么是人物的角度挑选呢?通俗来说就是拍摄的高度。
不同的拍摄角度可以呈现出不同的情感和视觉效果,可以通过挑选合适的拍摄角度可以特出被拍摄东西的特点,提高照片的表现力。
一般常用的有这 3 种角度
高角度:位于被拍摄东西的上方,适合拍摄俯视角度的场景,可以特出被拍摄东西的大小和高度。
低角度:位于被拍摄东西的下方,适合拍摄仰视角度的场景,可以特出被拍摄东西的高度和威严感。
平视角度:与被拍摄东西在同一高度,适合拍摄平面场景,可以特出被拍摄东西的水平线和平衡感。
1. 低角度
位于被拍摄物体的下方,可以强调物体的高度感,适用于拍摄建筑物、树木等。
咒语关键词:Low angle view
生成思绪:低角度的年青女孩
生成咒语:young girl, low angle view, –ar 16:9
这次配合使用角度生成的结果的确也比之前单纯使用仰视角生成的结果要好很多了,没有出现人物对镜头的感觉了,图片整体实现的结果还是比较和谐的,那我们继续看一看其它的角度。
2. 高角度
位于被拍摄物体的上方,可以强调物体的底部,适用于拍摄人群、城市等。
咒语关键词:High angle view
生成思绪:高角度的年青女孩
生成咒语:young girl, high angle view, –ar 16:9
从这次的生成结果上来看用俯视角+高角度生成的图片,要比单纯使用俯视角生成的结果更自然,更符合人物照相的特征。
3. 平视角度
位于被拍摄物体高度相同,呈现出一种中性的视角,适用于拍摄人像、风景等。
咒语关键词:Eye level view
生成思绪:平视角度的年青女孩
生成咒语:young girl, eye level view, –ar 16:9
四、人物的距离挑选
接下来我们继续看看人物距离的挑选,在人物构图时,可能需要挑选合适的焦点来特出人物,可以根据下面 6 种距离方式来确定人物的位置。
1. 局部特写
这里的特写一般是指拍摄人物头像照片的视角,每每是拍摄人物的头部和肩部,使其成为画面中的主体,其目的是展示被摄者的面容和特征。
这种构图每每采用近距离的拍摄,与头像类似,脸部镜头每每侧重于展示被摄者的面容和特征,但相比头像更注重脸色、眼神和情感的表达,主要会展示人物的整张脸部。
咒语关键词:Extreme closeup (ECU)
生成思绪:特写距离的年青女孩
生成咒语:young girl, extreme closeup, –ar 16:9
2. 头部以上
每每是将被摄者的脸部特写拍摄得非常近,以便特出细节和脸色。
咒语关键词:Headshort
生成思绪:头部以上位置的年青女孩
生成咒语:young girl, headshort, –ar 16:9
3. 胸部以上
每每是从腰部或腹部到头部的拍摄方式,可以特出被摄者的胸部线条和脸部脸色。
咒语关键词:Chest shot
生成思绪:胸部以上位置的年青女孩
生成咒语:young girl, chest shot, –ar 16:9
4. 腰部以上
每每是从腰部到头部的拍摄方式,可以特出被摄者的腰部线条和脸部脸色。
咒语关键词:Waist shot & bust portrait
生成思绪:腰部以上位置的年青女孩
生成咒语:young girl, waist shot, –ar 16:9
5. 膝盖以上
每每是从膝盖到头部的拍摄方式,可以特出被摄者的腿部线条和脸部脸色
咒语关键词:Medium full shot
生成思绪:膝盖以上位置的年青女孩
生成咒语:young girl, medium full shot, –ar 16:9
6. 全部身体
每每是将被摄者的全身拍摄在画面中,可以特出被摄者的身体线条和装束风格。
咒语关键词:Full length shot
生成思绪:全部身体的年青女孩
生成咒语:young girl, full length shot, –ar 16:9
五、人物脸色的挑选
不同的人物脸色可以传递出不同的情感和意境,对于人物脸色,可以挑选合适的脸色来表达所想要的情感和意境。
这里在「Midjourney 关键词」表格中选取几个常用脸色示例一下,其它的大家可以自己挑选关键词进行 AI 生成。
1. 高兴的
咒语关键词:Smiling
生成思绪:正视角下高兴的年青女孩
生成咒语:young girl, smiling, front view, –ar 16:9
前面 4 张是使用 Smiling 生成出来的,可以看出来,只是在脸部脸色上有一些细微的变化,后面 4 张是使用 happy 生成出来的,可以看出来,结果除了脸部脸色还包含着一些动作上的变化。
可以看出不同的咒语表达出来的结果也是不同的,所以有时候在没有达到我们想要的结果的时候,可以尝试换一个咒语。
2. 生气的
咒语关键词:Angry
生成思绪:正视角下生气的年青女孩
生成咒语:young girl, angry, front view, –ar 16:9
3. 哭泣的
咒语关键词:Crying
生成思绪:正视角下哭泣的年青女孩
生成咒语:young girl, erying, front view, –ar 16:9
从生成的结果上来看,只有少数结果中在哭泣的状态下有泪水的状态,说明这种脸色还需要其它更多修饰性的咒语来辅助完成,才能达到一个理想的状态。
当然除了以上这些常见的脸色之外,还有像更多其它类型的脸色,比如:害怕的(Afraid)、嫉妒的(Jealous)、困惑的(Confused)、自信的(Confident )、厌恶的(Disgust )、厌恶的(Surprise )等等一些脸部情绪上的表达都可以使用,这些大家可以自行去探索。
六、人物氛围感的挑选
曾经听那位热爱照相的朋友经常经常说:“掌握了灯光,其他一切都水到渠成。”
确实合理利用光线可以创造出丰富的表现效果,增强照片的立体感,让人物更有表现力和氛围。
这里要说明一下,我不是专业的照相师,灯光属于照相这门学科里的是比较重要的课程,这里的灯光的使用,只适合在 midjourney 的关键词内作为参考使用,不能作为实际拍摄中的参考。
在 AI 里面来说,一般不写灯光的描述,AI 出图也不会差到哪去,所以新手大多数人会忽视灯光这个参数。
这里我们在自己收集的「Midjourney 关键词」库中选取几个有代表性的灯光参数,来观察一下不同灯光在五官上的作用。
1. 暖光源
暖光源每每指发出较为偏黄或橙色色调的光源。
这种色调的光源每每具有较低的色温,它们能够让照片呈现出一种温暖、柔和的感觉。
咒语关键词:warm light
生成思绪:在暖光源下,一个穿着皮夹克的男人
生成咒语:1 man in leather jacket, [warm light] :: 10, –ar 16:9
这里测试了暖光源下权重为 10 和权重为 1 的画面效果,可以看出这种光线权重越高的暖光源生成的画面更加有光源的质感。
有很多人习惯直接使用 warm light 的咒语也是可以的,但通过权重去控制光源的强度会是一种比较合适的做法。
2. 柔光源
柔光是指通过一种柔和的方式来照亮被拍摄物体的光线。
这种光线每每是通过对光源进行漫反射处理来实现的,使光线变得柔和、均匀和没有硬边缘。
咒语关键词:Soft light
生成思绪:在柔光源下,一个穿着皮夹克的男人
生成咒语:1 man in leather jacket, [soft light] :: 5, –ar 16:9
这里测试了柔光源下权重为 10 和权重为 5 的画面效果,可以看出这种光线并不是权重越高生成的画面更加合适,反而适中的权重,画面更加有质感。
3. 轮廓光源
轮廓光源是指用于在照片中产生明亮边缘或轮廓的一种照明技术。
它每每是在被摄物体的背景或侧面照明上使用的,以使物体与周围环境产生对比。
这种技术每每需要一个强而集中的光源,如聚光灯或反射板,并且需要将光源放置在物体的背面或侧面。
咒语关键词:Rim light
生成思绪:在轮廓光源下,一个穿着皮夹克的男人
生成咒语:1 man in leather jacket, [rim light] :: 5, –ar 16:9
轮廓光其实和边缘光(Edge light)很像,这两种光方便在大场景下人物能从背景里分离出来,更特出。
像很多电影海报,人物拍摄两边或者一边都会加点轮廓光。
4. 霓虹光源
Midjourney 中一种可玩性比较高的光源,经常看到大多数作品中出现这种光源,因为这个光源色彩的多样性和不规则状态,让画面中的主体可以反射出夺目的色泽。
咒语关键词:Neon light
生成思绪:在红色霓虹光源下,一个穿着皮夹克的男人
生成咒语:1 man in leather jacket in red thriller, [neon light] :: 5, –ar 16:9
从生成的结果上可以看出,这种光源的权重越高,画面更有质感。
5. 伦勃朗光
勃朗光是一种经典的照相和绘画技巧,得名于荷兰画家伦勃朗。
它是通过在主体的一侧投射强烈的光线,并在另一侧形成阴影,以强调主体的轮廓和脸色的一种技术。
这种技术可以让照片或绘画更具有戏剧性和立体感。
咒语关键词:Rembrandt light
生成思绪:在伦勃朗光下,一个正视角穿着装带着微笑的女孩
生成咒语:1 Smiling girl dressed in professional attire, front view, in [rembrandt light] :: 10, –ar 16:9
七、人物装束的挑选
装束要想玩的细致,也是需要了解很多装束相关的知识点,不过这里可以使用一个万能固定句式来尝试
「主题」+「风格」+「材质」+「元素」+「玄学佐料」
主题:汉服、长羽绒服、连衣裙、礼服裙…
风格:简约、现代、复古、朋克、英伦亚文化、文艺复兴、洛可可、超现实主义…
材质:棉布、羊毛、丝绸、皮革、工艺…
元素:形状、纹理、颜色、细节、图案、配件…
感觉要学习的知识有好多好多….
装束示例
咒语关键词:Chinese dress
生成思绪:一个穿着中国清代宫廷刺绣旗袍,宽袖渐变红色加上刺绣雪纺面料,镶钻工艺,上面还有金丝雀和白玫瑰元素等刺绣元素
咒语:1 girl, she was wearing a Chinese dress, wide sleeves gradient red x embroidered chiffon fabric, qing dynasty palace embroidery, canary and white roses element, embroidered hosta, x diamond-encrusted craftsmanship, elegant, fairy air, digital rendering, super lifelike, super detailed, luxury, movie lighting, super clear details, super clear materials, close-up, complex textures, octane rendering, Zbrush, 8K, Vray super lifelike,–ar 9:16
前面 4 张只使用了 Chinese dress 生成后,装束比较素也没有颜色,装束的细节也比较少。
后面 2 张添加了材质装饰细节之后,装束就比较精致。
大家可以通过这个万能的固定句式去尝试一下关于装束的细节。
八、人物风格的挑选
风格类型的绘制其实是比较复杂的,因为全世界那么多艺术家的风格和流派各式各样,而且各种风格在 AI 里都是可以相互融合的,这个需要大家懂得基本的绘画风格,提高艺术鉴赏能力,才能创造更多的无限可能。下面分享一些常用好看的风格。
1. 写实人物
咒语关键词:90s Hong Kong-style street
生成思绪:一对情侣在 90 年代的香港街头
生成咒语:A couple taking street snaps in a 90s Hong Kong-style street, Eye level view, Waist shot, detailed face, detailed eyes, beautiful, –ar 3:4