大家好,我是言川。
Midjourney 在近期終于迎來了新的圖像模型的發布,這是自V6模型以來長達一年多的時間首次重大更新(Midjourney V6 模型于2023年12月21日發布)。
最新發布的模型也是大家期待已久的 V7 模型,但注意,這個模型是 V7 Alpha 版本,Alpha 表示的是測試版本。
感覺像是被 GPT-4o 逼著提前發布的,而 Midjourney 官方也表示,在未來兩個月內,他們將每周或每兩周更新一次新功能。
那本篇文章,我將深入測評 Midjourney 在本次更新的內容。此外,我還會將 GPT-4o 模型與 Midjourney V7 Alpha 進行對比測試,看看到底現階段哪個圖像模型更適合我們使用。
這也是“自回歸模型”和“擴散模型”之間的 PK。
首先,Midjourney 在本次更新中,主要焦點是新的 Midjourney V7 Alpha 模型。除了模型本身的更新,還新增了三項功能:個性化功能、草稿模式以及運行模式,咱們挨個嘮。
1. 全新模型(V7 Alpha)
V7 Alpha 模型在圖像質量方面有了進一步的提升,主要體現在細節處理、場景理解和藝術風格上。生成的圖像在人物、手部和物體細節上更加連貫自然,材質紋理和光影效果表現更精細。
下面我測試了幾組 V6.1 模型和 V7 Alpha 的效果圖,大家可以對比著看一下。
提示詞:寫實風格的年輕女性人物,穿著簡約的白色襯衫,坐在窗邊,陽光透過窗戶灑在她的臉上,背景是模糊的城市景觀,頭發自然垂落,面部表情安靜,眼神溫柔,光線柔和,細節清晰,焦距為 50mm,光圈 f/1.8,快門速度 1/200 秒,ISO 100,突出溫暖與寧靜的氛圍。相機使用全畫幅傳感器,拍攝角度為正面,景深淺,背景虛化,人物清晰可見。
提示詞:電影質感的男性人物大片,穿著深色西裝,站在昏暗的街道上,霓虹燈在背景中閃爍,街道上有輕微的雨水反射,燈光在濕漉漉的地面上形成美麗的光斑,面部表情堅定且深邃,眼神銳利,背景虛化,突出人物的孤獨與決絕感,焦距為 50mm,光圈 f/1.8,快門速度 1/160 秒,ISO 400,低光環境下拍攝,深景深效果,光影對比強烈,充滿電影感的氛圍。
提示詞:一張低角度拍攝的照片,展示一輛堅固的越野 SUV,配備大型全地形輪胎,在泥濘的森林小徑上行駛,車輛覆蓋著一層薄薄的泥土,背景是樹木和山脈,SUV 配備了車頂行李架和后部安裝的備胎,展現出堅韌和冒險的外觀,電影級光線,高細節,使用大疆 Mavic Air 2 無人機,廣角鏡頭,大地色調。
提示詞:一只超可愛的貓娘,采用中國風,穿著古代服飾,佩戴華麗的頭飾和耳環,擬人化程度極高,粉色的面容,頭部有白虎紋理,融合中國元素,使用 ZBrush 制作,淺紅色調,細致的面部特征表現,白色背景,盲盒藝術風格,粘土材質,工作室燈光,Octane 渲染。
提示詞:網絡漫畫故事板,Shiniez 風格,21 歲的前衛亞洲女孩,現代風格但帶有賽博朋克氛圍,頭發上有彩色高光和太空包發型,坐在她發光的電腦屏幕前,雙腿盤坐在臥室里,房間里充滿了毛絨玩具和科技小物件,面部表情自信,屏幕的光反射在她大而富有表現力的眼睛里。
2. 個性化功能
Midjourney V7 Alpha 版本引入了個性化模型功能,可根據用戶的個人審美偏好,提供更加精準和個性化的圖像生成。
個性化功能是在首次使用 V7 Alpha 時必須進行的步驟,并且, 隨著使用時間的增加,模型會不斷學習和優化,生成效果會逐漸貼近你的審美和創作風格。
我建議大家認真選擇下,因為你所選擇的結果,會影響你后續的生圖效果。
比如,我在選擇時,比較偏向藝術類、油畫類的圖像,在開啟個性化功能后,Midjourney 會將我所描述的寫實風格圖像,生成的偏向于藝術類的效果。
提示詞:超寫實女性肖像,身著優雅晚禮服,站在經典室內場景中,背景有柔和光線和精致裝飾。她的表情溫和而自信,發型精致。光滑的皮膚,復雜的光影和陰影,豐富的細節,銳利的焦點,展現柔和溫暖的色彩搭配。
當然,如果你不想讓它影響你的生圖結果,嚴格遵循提示詞的描述,也可以關閉該功能。
3. 草稿模式
Midjourney V7 Alpha 引入了全新的草稿模式,使圖像渲染速度提升至標準模式的 10 倍,同時成本降低 50%。需要注意的是,草稿模式下生成的圖像分辨率相對較低,適合快速生成初步草圖。
草稿模式有兩種使用方式,分別是通過文字指令生成和語音指令生成。
文字指令:開啟“Draft Mode”功能后,輸入提示詞指令(支持中文輸入)。注:此處的指令可以是自然語言。
比如:生成一張照片,照片的內容是一位年輕女性,穿著現代休閑服飾,站在城市街頭。
Midjourney 會根據指令自動優化提示詞,并快速生成。
生成的提示詞:young woman, modern casual attire, standing on a city street, vibrant urban background, natural lighting, realistic style
中文提示詞:年輕女子,現代休閑裝,站在城市街道上,充滿活力的城市背景,自然采光,寫實風格。
并且,該功能支持多輪對話,類似于 GPT-4o 的多輪對話修改圖像。
比如:讓她的服飾更加時尚,換上一件流行的外套,背景加一些街頭藝術壁畫。
草稿模式下,還有個“Enhance”功能。這個功能的作用就是將這組提示詞生成的圖像,以正常的 V7 Alpha 生圖的速度和質量重新生成。
也就相當于,你在進行多輪對話修改圖像后,覺得這組提示詞所生成的圖像效果符合你的要求,那么就轉換到正常生圖的步驟,這樣生成的圖像質量會更高、效果更好。
最后生成的結果如圖所示:
語音指令:通過自然語言處理技術來理解和解析用戶所發出的指令,從而生成圖像。
錄了一段通過語音來控制生圖的視頻,可以播放看看。
下面通過文字描述的方式來解析下這段操作:
如圖所示,在功能區的頂部開啟草稿模式后,再點擊語音功能。
然后用電話聊天的方式,輸出需要生成的圖片,比如:幫我生成一張電影感十足的真實感照片,場景設定在日落時分的巴黎街頭。
生成的結果如圖所示:
繼續多輪對話修改圖像,比如:在照片中添加一位時尚的美女,她手上拿著咖啡杯,站在咖啡館門口。
繼續,語音下達指令,如:我想讓照片變成黑白風格,營造出一種懷舊的電影效果。
繼續第四輪對話,如:在背景中添加一輛經典的老式汽車,停靠在街邊,增強畫面的時代感。
最后,你還可以結合 Midjourney 的其他功能來優化圖片,比如:我覺得第二張圖片效果不錯,幫我放大。
以上就是草稿模式的全部內容,總的來說,草稿模式就是讓你能快速的生成草圖,只需要你不斷地發揮創意、想象,而設計、創造圖像的工作,交給 Mijdourney 就好。
但目前我測試下來,發現該功能不是特別穩定,特別是在多輪對話時,會出現斷層,還有其他的小 BUG,我的體驗感不是特別好......
4. 運行模式
最后一個更新的功能,就是運行模型的選擇了。V7 Alpha 目前支持兩種運行模式:Turbo 和 Relax,在頂部的功能設置區中可以找到。
Turbo 模式:提供更快的圖像生成速度,但生成所消耗的成本是 V6 模型的 2 倍(Fast 模式)。
Relax 模式:在生成速度和成本之間提供平衡。
以上是官方的介紹,但嚴格意義上說,V7 Alpha 是支持 4 種運行模式的,另外兩種就是草稿模式和 Fast 模式。
Fast 模式:快速模式,僅次于 Turbo 模式的生成速度。
草稿模式:圖像渲染速度提升至標準模式(Relax)的 10 倍,成本僅為標準模式的一半。
當然,除了草稿模式外,Relax、Fast、Turbo 模式在圖像生成質量上并無差異,僅體現在速度和生圖成本上。
上面就是 Midjourney 更新的全部內容了,主要亮點就是這個新模型 V7 Alpha,作為擴散模型的老牌大哥,也終于是在“自回歸模型” GPT-4o 的強勢崛起下,再次站了出來!
但是,V7 Alpha 模型到底能不能與 GPT-4o 模型相媲美,現在還不能下結論,我們得來測評對比下。
本次測評主要聚焦于三個關鍵領域:提示詞的遵循性、文本渲染效果以及風格的多樣性。
這些領域是我近期在撰寫測評文章時發現的共同點,無論是新模型還是舊模型,它們的優化基本都會圍繞著這三個核心要素進行。而這三個領域也恰恰可以體現模型的性能,所以還是比較嚴謹的......
1. 提示詞遵循
在這一部分,我們得先關掉 Midjourney 的個性化功能,避免它影響我們生成的風格偏向個性化所篩選的圖像。
讓 Kimi 幫我寫了一段復雜的提示詞,將提示詞的結構分為前景、中景以及后景,看看這兩模型是否準確的依照提示詞的描述生成。
提示詞:生成一張寫實電影風格的圖像,畫面分為前景、中景和后景。
前景是一個沙灘,沙灘上散落著各種貝殼和海星,貝殼有螺旋形的、扇形的,顏色包括白色、粉色和淡黃色。海星呈橙紅色,有五個觸角,觸角上有細小的顆粒。沙灘上有幾塊光滑的鵝卵石,大小不一,顏色從淺灰到深褐不等。沙灘上有一雙白色的涼鞋,涼鞋旁邊有一個裝滿海水的小水坑,水坑中倒映著天空和周圍的景物。
中景是一棵高大的椰子樹,樹干彎曲,樹葉茂密,呈扇形展開。椰子樹下有一張木質的沙灘椅,沙灘椅上鋪著一條藍白條紋的沙灘巾。沙灘椅旁邊有一把遮陽傘,傘面是紅色的,傘桿是白色的,傘下有一張小桌子,桌子上放著一杯裝有冰塊的藍色飲料,飲料上漂浮著一片檸檬。
后景是一片蔚藍的大海,海面波光粼粼,有幾艘白色的帆船在海面上航行。海天相接處有幾座連綿的山脈,山脈頂部被云霧籠罩。天空中有幾只白色的海鷗在飛翔,翅膀展開,姿態優雅。天空呈現出漸變的藍色,從淺藍到深藍,云朵潔白且蓬松,分布在天空的不同位置。 整體畫面采用寫實電影風格,注重細節的細膩表現和光影效果的自然過渡,色彩自然且和諧,畫面質感豐富,具有電影般的沉浸感。
首先來看下 GPT-4o 模型所生成的效果:
生成的結果真的很讓我驚訝,如果你對照提示詞挨個去檢查圖片中的細節元素,你會發現,非常精準。
再看看 Midjourney V7 Alpha 生成的結果,不是想故意抹黑它。生成了非常多組圖片,發現沒一個與提示詞對上的,哪怕只是前景(一般前景的內容在圖像生成時,是最不容易出錯的)。
這回合,Midjourney V7 Alpha 完敗。提示詞遵循度在我看來,是商業化生圖場景中非常重要的能力,這是平衡 AI 自主發揮創意和讓 AI 聽話的關鍵。
然而,Midjourney 模型一直以來都沒優化這個能力,或者是不夠重視這個功能。Midjourney 模型讓 AI 自主發揮的權重遠遠大于人類所下達的指令。
2. 文本渲染
在上篇 Idegram 3.0 的測評文章中,有展示大量的文本渲染的案例,而 Idegram 3.0 所表現出來的能力也非常強(英文)。
在本章節,我們就用 Idegram 3.0、GPT-4O、Midjourney V7 Alpha 這三個圖像模型來進行測試對比下。
提示詞:一張復古風格的星際迪斯科活動海報設計。畫面中央是一張漂浮在宇宙場景中的巨大黑膠唱片。
背景是橙紅色漸變的天空,點綴著白色的輕薄云朵和星星。在畫面的上部,一個紫色和藍色的彎月散發著光芒。場景設置在粉色網格地板上。
頂部用白色字母顯示“INTERSTELLAR GROOVE”,兩側分別標注“05.11”和“10PM”。底部用白色文字顯示場地名稱“THE DOLPHIN”,下方依次用較小的文字標注“DISCO ? HOUSE ? COSMIC FUNK”和“MUSIC BY ED CHRISTOF”。
整個設計被一個裝飾有紅色加號的黑色邊框包圍。整體色彩以紅色、橙色、紫色和黑色為主,營造出復古未來主義的美學風格。作品采用數字插畫風格,具有光滑的漸變和干凈的線條。
GPT-4o 生成的結果如圖所示,沒什么問題,文本渲染能力其實也是與提示詞遵循能力掛鉤的。
再看看 Midjourney 所生成的結果,海報中的元素設計的比較混亂,文字部分對比 GPT-4o 有明顯的差距。
最后,Ideogram 3.0 模型生成的效果,在文本渲染方面不輸 GPT-4o 模型,至于海報設計的美感方面,我認為是略高于 GPT-4o 模型。
我們再來看看中文的渲染能力吧,但結果其實都能預料到,這些都是海外的圖像模型,除了 GPT-4o 是大語言模型,有中文語料作為支撐以外。
提示詞:生成一個四宮圖,風格為漫畫風格,分為四個場景:
發現小貓:小明站在操場上,手指著草叢,表情驚訝。草叢中露出一只小貓的頭部,小貓看起來很警惕。背景是學校的操場,有籃球架和跑道。文字:“小明發現操場有貓。”
試圖接近:小明彎著腰,慢慢向小貓靠近,表情小心翼翼。小貓蹲在草叢中,耳朵向后貼,顯得有些害怕。背景是學校的操場,陽光灑在草地上。文字:“小明輕手輕腳靠近。”
小貓逃跑:小貓快速跑開,小明愣在原地,表情驚訝。背景是學校的操場,小貓跑向教學樓的方向,小明站在原地,手還保持著指向的姿態。文字:“小貓突然跑開了。”
成功互動:小明蹲在地上,手里拿著一塊面包,表情溫柔。小貓慢慢靠近,聞著面包的氣味。背景是學校的操場,陽光明媚,其他同學在遠處活動。文字:“小明用食物吸引小貓。”
GPT-4o 所生成的中文字,雖然字形會有問題,但文字信息其實是可以被識別的。
Midjourney V7 Alpha 和 Ideogram 3.0 模型所生成的中文字完全無法識別。
綜合來看,在文本渲染方面,還是 GPT-4o 表現最優。
3. 風格多樣性
最后,我們再來看下 Midjourney V7 Alpha 模型在圖像生成的風格方面表現如何,這也是 Midjourney 長期以來的強項。
本章節,我們劃分為四大風格場景進行測評對比,分別是寫實風格、插畫風格、3D 風格以及超現實主義風格。
① 寫實風格
寫實風格的特點是以精細的細節、真實的質感和自然的光影效果,精確還原現實世界的視覺特征。
提示詞:在一個昏暗的酒吧里,四個年輕人站在一起。兩名男性和兩名女性,具有不同的發型和風格。第一名男性有卷曲的頭發和輕微胡須,穿著條紋的米色夾克和淺綠色的 T 恤。第二名男性有短小的卷發和胡子,穿著一件簡單的棕色毛衣。第一名女性有長而波浪狀的淺棕色頭發,穿著一件米色的超大外套。第二名女性有及肩的直發,深棕色,穿著一件米色的上衣和休閑夾克。背景是溫馨的酒吧,貨架上擺滿了酒瓶,暖黃色的燈光營造出輕松的氛圍。人物面部表情平靜自信,背景的柔和燈光突出了他們的面容,創造出一種親密的氛圍。
提示詞:創作一位年輕女性的正面肖像,穿著寬松的白色連帽衛衣,戴著大號圓形黃色漸變太陽鏡。她的頭發是淺色的,松散地扎成一個高馬尾,微微朝前看,展現出自信和活力。她一只手輕觸著太陽鏡的一邊,面部表情自然且輕松。背景是藍紫色的,燈光呈現霓虹效果,藍色和紫色的光交織,給人物增添未來感。整體氛圍現代、時尚,注重光影和色彩的搭配。
提示詞:創作一幅描繪一只興奮的白色小型犬在跳傘的畫面。狗狗穿著橙色的跳傘服,表情歡快,舌頭伸出,笑容燦爛。它的毛發被風吹得蓬松,眼睛明亮,顯得十分開心。背景是湛藍的天空和飄動的白云,下面的地面清晰可見。使用魚眼鏡頭拍攝,視角夸張,狗狗的面部在鏡頭中放大,四周的云朵呈現彎曲效果,增強了飛行的動感和俯瞰視角的效果。整體畫面呈現出高寫實風格,細致展現狗狗的毛發、表情和飛行中的動感,陽光透過云層照射在狗狗身上,營造出一個興奮、刺激且歡樂的場景。
提示詞:創作一幅寫實風格的照片,展示一個寧靜的海灣景色。畫面中的海水湛藍清澈,與白色的沙灘相接,周圍有壯麗的巖石峭壁,巖石表面呈現金色和棕色的溫暖色調,局部有綠色植物點綴。遠處的海面與藍天相接,天空中有飄動的白云。畫面呈現出柔和的陽光,水面上反射著溫暖的光線,營造出寧靜、放松的氛圍。拍攝使用 Canon EOS 5D Mark IV 相機,搭配 24-70mm f/2.8 鏡頭,使用 f/8 光圈,快門速度 1/200 秒,ISO 200,捕捉到清晰的海灣細節和層次感,畫面深度和細膩的光影效果。
② 插畫風格
插畫風格的特點是通過藝術化的線條、色彩和構圖,以夸張、簡化或抽象的方式表達創意和情感,具有強烈的視覺沖擊力和藝術感染力。
提示詞:創作一幅吉卜力風格的動畫場景,畫面中的女孩穿著紅色外套,背著棕色背包,手中拿著一束黃色的野花。她站在陽光明媚的田野中,四周是金黃色的秋季樹木和綠意盎然的草地,天空中有幾朵白云,陽光灑在她的臉上,女孩的表情充滿好奇和喜悅,眼神溫柔。背景中有幾座小木屋,整體畫面充滿溫馨、寧靜的氛圍。畫面采用吉卜力風格,細致地描繪了女孩的服裝、花束、草地、樹木和天空中的細節,色彩鮮明,光影效果自然,人物的表情和動作生動,呈現出濃厚的手繪動畫風格,創造出一幅溫暖、清新的鄉村風光。
提示詞:創作一幅 2D 動漫風格的插圖,描繪一位女孩面部有紫色淚水流下,淚水在光線下反射出迷人的光澤。女孩的眼睛閃爍著紫色的光芒,表情顯得憂傷而柔弱,淚水沿著她的臉龐流下,帶有神秘和悲傷的氛圍。背景使用深紫色和藍色的色調,增強光澤感和反射效果,突出女孩的頭部。畫面中的光線和反射效果增強了角色的情感表達,整體氛圍充滿夢幻與憂傷,呈現出強烈的視覺沖擊感。
提示詞:創作一幅描繪一位可愛女孩的插圖,她戴著眼鏡,手里拿著一朵玫瑰。女孩穿著白色的長袖衣服,頭發扎成一個松散的發髻,整體畫面呈現出一種簡潔、優雅的風格。背景是柔和的淺綠色,散發出溫暖、浪漫的氣氛。插圖具有亞洲風格的美學,畫面采用類似浪漫漫畫的風格,強調人物的柔和線條和精致的細節。整體風格融合了浪漫學術氛圍,突出人物的純凈和優雅,帶有一種夢幻般的浪漫氣息。
提示詞:一幅充滿活力的插畫,描繪馬尼拉市區的街道,采用粉紅色、粉藍色和粉黃色的色調。圖像從鳥瞰視角呈現,街道兩旁是多層建筑,商店門面和街道充滿生動的顏色。車流在街道上行駛,行人散步,電線與建筑之間交錯。天藍色的背景上點綴著幾朵白云,整個畫面具有復古、低飽和的色調,充滿了都市氣息和日常生活的氛圍。
③ 3D 風格
3D 風格的特點是利用立體建模和光影渲染技術,創造出具有深度、空間感和真實感的三維視覺效果,常用于虛擬場景和動態表現。
提示詞:正面視角,3D 風格的卡通男孩,穿著可愛的白色毛衣和綠色圍巾,圍巾呈明亮且鮮艷的綠色,呈現強烈的發光效果。角色的身體部分發出光芒,展現出一種機械精密感,穿著造型獨特的可愛靴子,整體呈現出非常“kawaii”風格。色調豐富且充滿活力,采用包豪斯風格的設計,且充滿了現代感和未來感。使用電影級光照,細節呈現數字藝術風格,粘土風格的質感,背景為全黑色。使用 C4D Octane 渲染,Blender 制作,高清細節。
提示詞:Jellycat 風格的毛絨玩具,外形是一個星巴克咖啡杯,上面有奶油,眼睛像小豆子,微笑的表情。背景簡潔,顏色鮮艷,腳部是纖細的棕色小腳,材質使用毛線,呈現出柔軟的質感。3D 渲染效果,采用 Jellycat 風格,毛絨玩具的面料充滿質感,輕松的背景與自然光照亮整個玩具,呈現出高質量的前視角產品攝影,極致的細節,柔軟蓬松的紋理。
提示詞:一幅迪士尼皮克斯風格的場景,展現了一對年輕情侶在日落時分自拍,站在一座俯瞰遠處城市的風景小山上。男孩有著淺金色的刺猬頭發,明亮的藍色眼睛和俏皮的微笑,穿著休閑的白色 T 恤。女孩的頭發是柔和的淺棕紅色,及肩,她對著鏡頭溫暖地微笑,穿著帶有白色花卉圖案的綠色連衣裙。天空充滿了橙色和粉色的鮮艷色調,太陽在他們身后落下,灑下溫暖的金色光芒。背景是遠處的城市,周圍被綠色的山丘環繞,捕捉到了一個寧靜又充滿歡樂的瞬間。
④ 超現實主義風格
超現實主義風格的特點是打破現實邏輯,通過扭曲、變形和重組現實元素,創造出夢幻、荒誕且富有想象力的視覺效果,營造出神秘而獨特的藝術氛圍。
提示詞:一幅超現實且細膩的插畫,描繪了一位擁有藍色眼睛的亞洲女性面孔,長長的鼻梁,周圍環繞著粉色的房屋,風格類似 K-pop。背景是開闊的自然景觀,有山脈、河流、建筑、街道場景、汽車、花朵、樹木,以及穿著女孩裝扮的角色。整體采用粉彩色調,并融入幾何形狀。插畫的分辨率極高,呈現 3D 效果,并以鳥瞰視角呈現。這是一幅超現實主義藝術作品。
提示詞:展現大自然的壯麗與黃金天國的力量,畫面中有美麗的天堂大門,金色的塔樓和城堡熠熠生輝。遠古文明的痕跡散落在這片奇幻的景觀中,城市金光閃耀,氣氛寧靜而神秘。畫面中的白色身影緩步走向那道通往永恒的門戶,象征著通往未知的旅程。場景充滿了幻想藝術風格,細節繁復且精致,所有元素以超現實的方式呈現。整體風格受約瑟芬·奧維爾(Josephine Owell)影響,呈現出宏偉與神秘并存的氛圍。
提示詞:一張色彩斑斕的迷幻風格女性面部圖像,面部被打破的玻璃片覆蓋,碎片反射出鮮艷的光芒,創造出一種超現實的氛圍。整體風格為超現實主義,高分辨率和高細節,強烈的對比度,明亮的色彩,展現出碎片間的光影變化,反射與折射的美感。采用廣角視角,展現女性的面部特征與玻璃碎片的結合,創造出既夢幻又充滿張力的視覺效果。
案例展示至此,大家對于 Midjourney V7 Alpha 模型的表現有何看法?與 GPT-4o 模型相比又如何?
來分享一下我的觀點:
Midjourney V7 Alpha 模型在圖像的藝術性和創意性方面表現出色。雖然 GPT-4o 模型生成的效果也非常好,特別是在人物生成的真實性上,但它缺少了 Midjourney 所生成的藝術感效果。
特別是在超現實主義風格這種純藝術、純想象力的作品上,Midjourney V7 Alpha 模型具有絕對優勢。
以上就是本篇文章的全部內容了。
Midjourney 的此次更新,在我看來,就是雷聲大雨點小。它們的 CEO 在 GPT-4o 剛發布時曾對后者進行過吐槽,并宣稱 Midjourney V7 將更勝一籌。然而,從目前的情況來看,這次的更新與之前的 V4 到 V6 的升級頗為相似,主要還是在圖像效果上進行了提升。
至于新推出的草稿模式和個性化功能,我用起來感覺沒什么卵用,甚至是副作用......
比如,開啟個性化功能后,即使我在提示詞中明確要求生成寫實風格的圖像,它還是給我生成插畫風格的圖像,曾一度讓我崩潰。而草稿模式,說實話,我可能在寫教程會為了演示用下,之后大概率不會用。
除非,草稿模式能升級成類似 GPT-4o 這種獨立的對話框,可以進行多輪對話修改圖像,且不會被中斷。
不過,V7 Alpha 模型在生成寫實人物方面確實給我留下了深刻的印象,生成的人物形象逼真至極。所以,在接下來的兩個月內,Midjourney 的更新還是值得期待的。
樹欲靜而風不止,這句話很適合 Midjourney 近 1 年的“不作為”。
好了,以上純屬我胡說八道,僅供參考,有不同意見的寶可以在評論留言,咱們下期再見~
如果你想學習 AIGC,可以加入我主理的《優設 AI 俱樂部》,俱樂部內沉淀有 2000+ 優質 AI 學習資料,涵蓋 AI 繪畫、AI 視頻、AI 提示詞、AI 工具庫、AI 商業設計案例、研究報告......
也可以點擊鏈接: https://wx.zsxq.com/group/15288828142182
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
發評論!每天贏獎品
點擊 登錄 后,在評論區留言,系統會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯系我們
AI輔助海報設計101例
已累計誕生 737 位幸運星
發表評論 為下方 17 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓