由于在工作中,經常會涉及到使用人物素材完成 Banner 設計的工作,于是最近開始探索關于 Midjourney 進行 AI 人物生成的相關測試,同時將這一段時間的經驗分享出來。
基礎教程看這篇:
剛開始接觸和使用 Midjourney 的時候,最大的問題在于生成的人物圖片無法保證人物位置的大小和視角,想要固定某一種動作,只能通過墊相同動作的圖片的這種方式去解決。
后來經過一些了解攝影的朋友,通過他們了解到這些都是可以通過攝影的知識來補充的這方面短板的。
后來我去咨詢了 ChatGPT,它確實給了我一些很有用的方向。
根據 ChatGPT 的建議,我這里將生成 AI 人物類型圖片的方向確定為一下 7 方面:
- 人物構圖的視角選擇
- 人物角度的選擇
- 人物距離的選擇
- 人物表情的選擇
- 人物氛圍感的選擇
- 人物服裝的選擇
- 人物風格的選擇
通過這 7 個方向,我們來進行了實驗。
視角可以按照相機相對于被拍攝對象的位置,分為正面、背面和側面。
當然,拍攝角度不僅限于這三個方向,還可以有更多不同的角度選擇,這需要根據被拍攝對象和拍攝需求來選擇合適的角度。
測試:不加入關鍵詞的 AI 生成的圖片會是什么樣子?
生成思路:年輕的女孩
生成咒語:young girl, --ar 16:9
通過隨機生成的 8 張來看,由于沒有其他關鍵詞的約束,目前隨機出來默認的人物形象偏歐美風,人物視角的比例偏差也都保持在了正面和側面,那么我們現在可以通過增加構圖視角的關鍵詞來限定人物呈現的視角。
我們來看看增加不同視角之后的樣子吧。
1. 正視角
正視角是指在人像構圖時,拍攝對象正對著相機的姿態,使人像呈現出正面的視角。
咒語關鍵詞:Front view
生成思路:正視角的年輕女孩
生成咒語:young girl, front view, --ar 16:9
通過隨機生成的圖片來看,由于受到正視角關鍵詞的約束,目前隨機出來人物都是偏正面的,結果相對來說是較好的,那么我們就繼續來看一看其它的視角。
2. 后視角
后視角是指從被攝對象的背后拍攝的視角,也就是以被攝對象的背部為主要構圖元素的拍攝方式。
這種視角可以營造出一種神秘或者引人遐想的氛圍。
咒語關鍵詞:Back view angle & Back angle
生成思路:后視角的年輕女孩
生成咒語:young girl, back view angle, --ar 16:9
通過隨機生成的圖片來看,通過后視角關鍵詞的約束,目前隨機出來人物都是展現人物背面的,結果相對來說是較好的,那么我們就繼續來看一看其它的視角。
3. 側視角
側視角是指觀察或拍攝物體或場景時從側面的角度觀察。
在視覺藝術中,側面視角可以用于展示物體的形狀和輪廓,或者創造深度和距離的感覺,同時可以用于捕捉被攝對象的側面,突出其特征和特點。
咒語關鍵詞:Side view & Shoulder level view
生成思路:側視角的年輕女孩
生成咒語:young girl, Side view, --ar 16:9
通過隨機生成的圖片來看,通過側視角關鍵詞的約束,目前隨機出來人物也都是側面的形象,結果相對來說也是較好的,那么我們就繼續來看一看其它的視角。
4. 仰視角
仰視角是指觀察或拍攝物體或場景時從底部的角度觀察。
在人物構圖中,仰視角可以用于捕捉俯瞰等場景,或者突出被攝對象的底部特征,這個視角通常會讓物體看起來更為龐大和高大,具有一定的視覺沖擊力和震撼效果。
咒語關鍵詞:Bottom view & Low angle view
生成思路:仰視角的年輕女孩
生成咒語:young girl, low angle view, --ar 16:9
通過隨機生成的圖片來看,通過仰視角關鍵詞的約束,目前隨機出來人物的形象,結果看起來確實是仰視角,但是從攝影角度來看的話,只有第三、第四張照片構圖會符合大眾審美以外,其它圖片的角度的圖片都是有一定問題存在的,那么是什么問題造成的呢?我們一會兒深究!現在先繼續來看一看其它的視角。
5. 俯視角
是指攝像機的視線從上方向下拍攝被拍攝對象,這種角度通常可以讓拍攝者更好地捕捉到人物的身體語言和動作,通過強調身體語言和動作、放大視覺效果。
咒語關鍵詞:Bird's-eye view
生成思路:俯視角的年輕女孩
生成咒語:young girl, lbird's-eye view, --ar 16:9
咦!這個生成的結果跟上面仰視角度的結果一樣,生成的圖片好像確實沒有什么很大的問題,但是又有一種明顯不對的感覺。
于是我又咨詢了一下那位玩攝影的朋友,他看完之后告訴我,很多時候除了視角需要保證之外,還需要考慮人物在畫面之中的位置以及拍攝的高度來呈現的視覺效果的,也就是說還需要考慮人物的角度和人物的距離,那我們接下來看看,到底是不是如此。
還有其它特殊視角,大家可以根據關鍵詞自由嘗試,例如:
- 自由視角(Free camera)
- 固定視角(Fixed camera)
- 運動視角(Dynamic)
- 透視視角(Perspective)
什么是人物的角度選擇呢?通俗來說就是拍攝的高度。
不同的拍攝角度可以呈現出不同的情感和視覺效果,可以通過選擇合適的拍攝角度可以突出被拍攝對象的特點,提高照片的表現力。
一般常用的有這 3 種角度
- 高角度:位于被拍攝對象的上方,適合拍攝俯視角度的場景,可以突出被拍攝對象的大小和高度。
- 低角度:位于被拍攝對象的下方,適合拍攝仰視角度的場景,可以突出被拍攝對象的高度和威嚴感。
- 平視角度:與被拍攝對象在同一高度,適合拍攝平面場景,可以突出被拍攝對象的水平線和平衡感。
1. 低角度
位于被拍攝物體的下方,可以強調物體的高度感,適用于拍攝建筑物、樹木等。
咒語關鍵詞:Low angle view
生成思路:低角度的年輕女孩
生成咒語:young girl, low angle view, --ar 16:9
這次配合使用角度生成的結果的確也比之前單純使用仰視角生成的結果要好很多了,沒有出現人物對鏡頭的感覺了,圖片整體實現的結果還是比較和諧的,那我們繼續看一看其它的角度。
2. 高角度
位于被拍攝物體的上方,可以強調物體的底部,適用于拍攝人群、城市等。
咒語關鍵詞:High angle view
生成思路:高角度的年輕女孩
生成咒語:young girl, high angle view, --ar 16:9
從這次的生成結果上來看用俯視角+高角度生成的圖片,要比單純使用俯視角生成的結果更自然,更符合人物攝影的特征。
3. 平視角度
位于被拍攝物體高度相同,呈現出一種中性的視角,適用于拍攝人像、風景等。
咒語關鍵詞:Eye level view
生成思路:平視角度的年輕女孩
生成咒語:young girl, eye level view, --ar 16:9
接下來我們繼續看看人物距離的選擇,在人物構圖時,可能需要選擇合適的焦點來突出人物,可以根據下面 6 種距離方式來確定人物的位置。
1. 局部特寫
這里的特寫一般是指拍攝人物頭像照片的視角,通常是拍攝人物的頭部和肩部,使其成為畫面中的主體,其目的是展示被攝者的面容和特征。
這種構圖通常采用近距離的拍攝,與頭像類似,面部鏡頭通常側重于展示被攝者的面容和特征,但相比頭像更注重表情、眼神和情感的表達,主要會展示人物的整張臉部。
咒語關鍵詞:Extreme closeup (ECU)
生成思路:特寫距離的年輕女孩
生成咒語:young girl, extreme closeup, --ar 16:9
2. 頭部以上
通常是將被攝者的面部特寫拍攝得非常近,以便突出細節和表情。
咒語關鍵詞:Headshort
生成思路:頭部以上位置的年輕女孩
生成咒語:young girl, headshort, --ar 16:9
3. 胸部以上
通常是從腰部或腹部到頭部的拍攝方式,可以突出被攝者的胸部線條和面部表情。
咒語關鍵詞:Chest shot
生成思路:胸部以上位置的年輕女孩
生成咒語:young girl, chest shot, --ar 16:9
4. 腰部以上
通常是從腰部到頭部的拍攝方式,可以突出被攝者的腰部線條和面部表情。
咒語關鍵詞:Waist shot & bust portrait
生成思路:腰部以上位置的年輕女孩
生成咒語:young girl, waist shot, --ar 16:9
5. 膝蓋以上
通常是從膝蓋到頭部的拍攝方式,可以突出被攝者的腿部線條和面部表情
咒語關鍵詞:Medium full shot
生成思路:膝蓋以上位置的年輕女孩
生成咒語:young girl, medium full shot, --ar 16:9
6. 全部身體
通常是將被攝者的全身拍攝在畫面中,可以突出被攝者的身體線條和服裝風格。
咒語關鍵詞:Full length shot
生成思路:全部身體的年輕女孩
生成咒語:young girl, full length shot, --ar 16:9
不同的人物表情可以傳遞出不同的情感和意境,對于人物表情,可以選擇合適的表情來表達所想要的情感和意境。
這里在「Midjourney 關鍵詞」表格中選取幾個常用表情示例一下,其它的大家可以自己選擇關鍵詞進行 AI 生成。
1. 高興的
咒語關鍵詞:Smiling
生成思路:正視角下高興的年輕女孩
生成咒語:young girl, smiling, front view, --ar 16:9
前面 4 張是使用 Smiling 生成出來的,可以看出來,只是在面部表情上有一些細微的變化,后面 4 張是使用 happy 生成出來的,可以看出來,結果除了面部表情還包含著一些動作上的變化。
可以看出不同的咒語表達出來的結果也是不同的,所以有時候在沒有達到我們想要的結果的時候,可以嘗試換一個咒語。
2. 生氣的
咒語關鍵詞:Angry
生成思路:正視角下生氣的年輕女孩
生成咒語:young girl, angry, front view, --ar 16:9
3. 哭泣的
咒語關鍵詞:Crying
生成思路:正視角下哭泣的年輕女孩
生成咒語:young girl, erying, front view, --ar 16:9
從生成的結果上來看,只有少數結果中在哭泣的狀態下有淚水的狀態,說明這種表情還需要其它更多修飾性的咒語來輔助完成,才能達到一個理想的狀態。
當然除了以上這些常見的表情之外,還有像更多其它類型的表情,比如:害怕的(Afraid)、嫉妒的(Jealous)、困惑的(Confused)、自信的(Confident )、厭惡的(Disgust )、厭惡的(Surprise )等等一些面部情緒上的表達都可以使用,這些大家可以自行去探索。
曾經聽那位熱愛攝影的朋友經常經常說:“掌握了燈光,其他一切都水到渠成。”
確實合理利用光線可以創造出豐富的表現效果,增強照片的立體感,讓人物更有表現力和氛圍。
這里要說明一下,我不是專業的攝影師,燈光屬于攝影這門學科里的是比較重要的課程,這里的燈光的使用,只適合在 midjourney 的關鍵詞內作為參考使用,不能作為實際拍攝中的參考。
在 AI 里面來說,一般不寫燈光的描述,AI 出圖也不會差到哪去,所以新手大多數人會忽視燈光這個參數。
這里我們在自己收集的「Midjourney 關鍵詞」庫中選取幾個有代表性的燈光參數,來觀察一下不同燈光在五官上的作用。
1. 暖光源
暖光源通常指發出較為偏黃或橙色色調的光源。
這種色調的光源通常具有較低的色溫,它們能夠讓照片呈現出一種溫暖、柔和的感覺。
咒語關鍵詞:warm light
生成思路:在暖光源下,一個穿著皮夾克的男人
生成咒語:1 man in leather jacket, [warm light] :: 10, --ar 16:9
這里測試了暖光源下權重為 10 和權重為 1 的畫面效果,可以看出這種光線權重越高的暖光源生成的畫面更加有光源的質感。
有很多人習慣直接使用 warm light 的咒語也是可以的,但通過權重去控制光源的強度會是一種比較合適的做法。
2. 柔光源
柔光是指通過一種柔和的方式來照亮被拍攝物體的光線。
這種光線通常是通過對光源進行漫反射處理來實現的,使光線變得柔和、均勻和沒有硬邊緣。
咒語關鍵詞:Soft light
生成思路:在柔光源下,一個穿著皮夾克的男人
生成咒語:1 man in leather jacket, [soft light] :: 5, --ar 16:9
這里測試了柔光源下權重為 10 和權重為 5 的畫面效果,可以看出這種光線并不是權重越高生成的畫面更加合適,反而適中的權重,畫面更加有質感。
3. 輪廓光源
輪廓光源是指用于在照片中產生明亮邊緣或輪廓的一種照明技術。
它通常是在被攝物體的背景或側面照明上使用的,以使物體與周圍環境產生對比。
這種技術通常需要一個強而集中的光源,如聚光燈或反射板,并且需要將光源放置在物體的背面或側面。
咒語關鍵詞:Rim light
生成思路:在輪廓光源下,一個穿著皮夾克的男人
生成咒語:1 man in leather jacket, [rim light] :: 5, --ar 16:9
輪廓光其實和邊緣光(Edge light)很像,這兩種光方便在大場景下人物能從背景里分離出來,更突出。
像很多電影海報,人物拍攝兩邊或者一邊都會加點輪廓光。
4. 霓虹光源
Midjourney 中一種可玩性比較高的光源,經常看到大多數作品中出現這種光源,因為這個光源色彩的多樣性和不規則狀態,讓畫面中的主體可以反射出奪目的色澤。
咒語關鍵詞:Neon light
生成思路:在紅色霓虹光源下,一個穿著皮夾克的男人
生成咒語:1 man in leather jacket in red thriller, [neon light] :: 5, --ar 16:9
從生成的結果上可以看出,這種光源的權重越高,畫面更有質感。
5. 倫勃朗光
勃朗光是一種經典的攝影和繪畫技巧,得名于荷蘭畫家倫勃朗。
它是通過在主體的一側投射強烈的光線,并在另一側形成陰影,以強調主體的輪廓和表情的一種技術。
這種技術可以讓照片或繪畫更具有戲劇性和立體感。
咒語關鍵詞:Rembrandt light
生成思路:在倫勃朗光下,一個正視角穿著裝帶著微笑的女孩
生成咒語:1 Smiling girl dressed in professional attire, front view, in [rembrandt light] :: 10, --ar 16:9
服裝要想玩的細致,也是需要了解很多服裝相關的知識點,不過這里可以使用一個萬能固定句式來嘗試
「主題」+「風格」+「材質」+「元素」+「玄學佐料」
主題:漢服、長羽絨服、連衣裙、禮服裙...
風格:簡約、現代、復古、朋克、英倫亞文化、文藝復興、洛可可、超現實主義...
材質:棉布、羊毛、絲綢、皮革、工藝...
元素:形狀、紋理、顏色、細節、圖案、配件...
感覺要學習的知識有好多好多....
服裝示例
咒語關鍵詞:Chinese dress
生成思路:一個穿著中國清代宮廷刺繡旗袍,寬袖漸變紅色加上刺繡雪紡面料,鑲鉆工藝,上面還有金絲雀和白玫瑰元素等刺繡元素
咒語:1 girl, she was wearing a Chinese dress, wide sleeves gradient red x embroidered chiffon fabric, qing dynasty palace embroidery, canary and white roses element, embroidered hosta, x diamond-encrusted craftsmanship, elegant, fairy air, digital rendering, super lifelike, super detailed, luxury, movie lighting, super clear details, super clear materials, close-up, complex textures, octane rendering, Zbrush, 8K, Vray super lifelike,--ar 9:16
前面 4 張只使用了 Chinese dress 生成后,服裝比較素也沒有顏色,服裝的細節也比較少。
后面 2 張添加了材質裝飾細節之后,服裝就比較精致。
大家可以通過這個萬能的固定句式去嘗試一下關于服裝的細節。
風格類型的繪制其實是比較復雜的,因為全世界那么多藝術家的風格和流派各式各樣,而且各種風格在 AI 里都是可以相互融合的,這個需要大家懂得基本的繪畫風格,提高藝術鑒賞能力,才能創造更多的無限可能。下面分享一些常用好看的風格。
1. 寫實人物
咒語關鍵詞:90s Hong Kong-style street
生成思路:一對情侶在 90 年代的香港街頭
生成咒語:A couple taking street snaps in a 90s Hong Kong-style street, Eye level view, Waist shot, detailed face, detailed eyes, beautiful, --ar 3:4
通過咒語的結果可以看到,這種風格不需要設定特殊的風格關鍵詞,屬于默認生成的類型,只需要描述好人物和場景,在加入一些鏡頭的參數即可生成比較有質感的圖片。
2. 丙烯酸繪畫
咒語關鍵詞:Acrylic painting
生成思路:一個丙烯插畫風格的抬頭微笑的可愛女孩,有熒光色系的未來感,2d 和 3d 的結合,色彩角度不常規。
生成咒語:acrylic painting,illustration, futurism, NFT art, Fluorescent color, Laser color, A cute girl who looks up and smiles, Combination of 2d and 3d, solid color background, cel shading, Tindal effect, Non-photorealistic rendering, Transparency, Color Slant, animation, blender, geometry art。
這類型的風格就是疊加各種色彩豐富的藝術風格。
3. 輕質感 3D
咒語關鍵詞:Popmart blind box
生成思路:一個穿著黃色連帽衫和帽子的非常可愛的女孩正在熱帶雨林中探索和奔跑,帶一點粘土性質的泡泡瑪特風格,三維渲染
生成咒語:popmart blind box, clay masterial, A very cute girl wearing a yellow hoodie and a hat is exploring and running in a tropical rainforest, 3D rendering, c4d, Octane rendering, Pixar trend, animation lighring, depth of field, ultra detailed, Hyper realistic, --ar 3:4
從生成的結果上看,盲盒感即時就有了。
4. 水墨風
咒語關鍵詞:Ink painting
生成思路:使用水墨風的插畫方式,融合一種藝術家的風格以及粗曠的筆觸,生成一張正視角的金剛狼形象,在白色背景下,有紅色黃色。
生成咒語:Ink painting, illustration, Wolverine, front view, white background, Yoji Shinkawa style, bold brushstrokes, Concept art, red black yellow and white, stylize, --ar 3:4
水墨風搭配藝術家風格,是不是很有意思呢。
5. 國風插畫
咒語關鍵詞:Extremelybold outline
生成思路:一個穿著中式傳統服裝、手持紙扇、黑發棕眼、花卉裝飾、紅色背景、鮮艷色彩的女王形象,用極粗的線條描邊,插畫風格
生成咒語:llustration, extremelybold outline, A queen dressed in Chinese traditional clothing and holding a paper fan, black hair, brown eyes, floral, red background, vivid color, acrylic painting, pixiv8kbest quality, ultra detailed, --ar 3:4
這類型的風格一定要盡可能多的中國元素,對于國風來說,畫風反而是最重要了,這種風格如果缺少中國元素,最后會變成二次元,所以需要加一點國畫水墨水彩來進行強調。
6. 像素藝術
像素藝術最早出自二十世紀中后期電腦應用程式的圖像(Icon),以及早期的 8 位元(8-bit)電子游戲。
后來像素風格逐漸演變成了一種獨立的數字藝術創作風格。
廣義上的像素藝術還包括立體像素藝術(對,就是樂高那種)。
咒語關鍵詞:Pixel art
生成思路:一家像素藝術風格的餐廳
生成咒語:[16-bit pixel art]:: 10, illustration, cozy cafe, china, --ar 3:4
不過,從結果上看 Midjourney 目前并不能創建真正的像素藝術,因為用 Midjourney 你無法獲得純凈的矢量圖像,知識將 Midjourney 圖像“像素化”的像素藝術。
好了,人物篇就暫時寫到這里了,生成一張滿意的人物類型的圖片我們需要輸入的文字越精準,才能到越合心意的圖片。
這里我們總結一下關于生成人物的萬能固定句式,一個越和心意的人物結果需要包含「人物的客觀描述」+「視角」+「角度」+「距離」+「表情」+「服裝」+「風格」+「光源」這些內容,當然你也可以只取其中部分的也會得到一個還不錯的結果。
同時,Midjourney 要想達成自己期望的效果,可能不是只用一段魔法就能達成效果,可以多次逐步完成自己的效果,以前總想著一步達成目標,就去堆積好多的關鍵詞在一段魔法里面,很多生成的結果很多次都不盡人意,嘗試分步驟拆開之后,結果就好很多。
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
熱評 早上起來擁抱太陽