Midjourney 和 Stable Diffusion 都是目前流行的 AI 圖像生成工具,它們能夠根據文本描述生成高質量的圖像。都是基于深度學習技術的文本到圖像生成模型,但它們各自基于不同的大模型。
但最近推出了一款比前兩者更強大,生成圖像更加逼真,在細節上更符合現實世界的模型,就是 FLUX!
Flux AI 是由 Black Forest Labs 推出的一款最新的文本生成圖像模型,這個團隊是由從 Stable Diffusion 離開的原班人馬,創立的全新用于 AI 繪圖的大模型。Flux AI 模型以其卓越的視覺質量、精確的提示詞遵循、多樣化的風格和復雜場景生成能力而著稱。它包含三個版本:FLUX.1 [pro]、FLUX.1 [dev]和 FLUX.1 [schnell],分別針對不同的使用場景和需求。
FLUX.1 Pro
是專為商業用途設計的閉源模型,提供最先進的圖像生成性能。
FLUX.1 Dev
是一個開源的引導蒸餾模型,適用于非商業應用。
FLUX.1 Schnell
是專為本地開發和個人使用設計的快速版本。
Flux AI 模型采用了創新的混合架構,結合了多模態處理能力和并行擴散機制的 Transformer 技術,并擴展至高達 120 億個參數。這些模型在訓練生成模型的方法上采用了流匹配技術,這種方法不僅通用性強,而且概念簡潔,特別適用于包括擴散過程在內的各種情況。
官方網站: https://blackforestlabs.ai/
官網展示圖片樣例:
以下是 Flux、Midjourney 和 Stable Diffusion 模型的對比:
圖像質量
Flux: 不需要其他插件的參與,本身就擅長生成高分辨率、細節豐富的圖像,特別是在復雜場景和人體解剖學方面表現出色。
Midjourney: 以其藝術風格和高質量輸出聞名,尤其在藝術性和風格多樣性上有優勢。
Stable Diffusion: 能夠生成逼真的圖像,適合需要真實感輸出的項目。
速度和效率
Flux: 提供快速的圖像生成,特別是 schnell 變體,適合需要快速原型制作和迭代設計的過程。大多數情況下不需要額外的下載風格模型,即可輸出各種風格的圖片。
Midjourney: 未明確提及速度,但通常商業模型可能會在云服務器上運行,可能存在排隊等候的情況。
Stable Diffusion: 生成速度較慢,但在圖像優化過程中提供更多控制。
處理復雜場景
Flux: 在處理復雜構圖方面表現出色,得益于其先進的架構。特別是文字方面,flux 可以輸出帶文字的圖片,只要提示詞足夠的準確可以直接輸出設計海報級別的圖片。
Midjourney: 能夠處理復雜場景,但在某些情況下可能需要更多的迭代來達到理想效果。
Stable Diffusion: 在處理復雜場景方面可能存在一些限制。
人體解剖渲染
Flux: 在渲染人體解剖方面表現出色,尤其是手部細節,更加的完整還原。
Midjourney: 未特別提及,但通常能夠生成具有藝術感的人物圖像,難以指定準確描繪。
Stable Diffusion: 可能在準確描繪人體特征方面遇到困難。需要額外的插件或者后期的處理才能勉強更正或基本達到效果
靈活性和集成
Flux: 提供多種變體,適合不同的使用場景和需求,包括開源和專業模型。
Midjourney: 作為商業工具,可能在定制化方面有一定的限制。
Stable Diffusion: 開源模型,社區驅動,提供了豐富的定制化和集成選項。
開源與商業模型
Flux: 提供開源模型,鼓勵社區參與和創新。
Midjourney: 為商業模型,提供專業的圖像生成服務。
Stable Diffusion: 開源模型,有活躍的社區支持和持續的改進。
特定應用
FluxI: 適合需要高細節和準確表現復雜場景的項目。
Midjourney: 適合藝術創作和設計,尤其是在需要藝術風格和創意表現的領域。
Stable Diffusion: 適合對最終圖像控制至關重要的真實感輸出。
總結來說 flux:
- 畫面更細節,效果更好
- 圖片文字支持更突出完整,輸出更準確
- 人物手部完整,符合現實,基本不會出錯
- 模型包含風格多,支持風格多樣,不依賴額外的模型協助補充
- 可忽略輸入負面提示詞,單靠正面提示詞即可準確輸出
通過以上對比,flux 之所以更強,是因為它的訓練參數是比前兩者更大,stable diffusion 3 是最高 8B 的訓練參數,約 80 億,而 flux 1 的開始就是 12B 的訓練參數,足足 120 億,多了好幾倍!單個模型的大小就有 23G 大小,可想而知,Flux 強大是很有實力的。
*注意:如果使用 GGUF 和 NF4,需額外安裝插件:
GGUF 節點: https://github.com/city96/ComfyUI-GGUF
NF4 節點: https://github.com/comfyanonymous/ComfyUI_bitsandbytes_NF4
1. 保證你的 comfyui 是最新的版本。(本文使用秋葉老師的啟動器)
點擊啟動器的版本,看到頂部的內核、擴展,依次點擊右上角的一鍵更新按鈕,更新到最新的即可。因為 flux 是 8 月前發布的,保證自己的 comfyui 是更新到 8 月 1 日之后的最新版本哦。
2. 進入官網的漢堡主頁 https://huggingface.com/black-forest-labs/flux.1-dev
下載 ae.safetensors(即 vae)、flux1-dev.safetensors(即 unet)
3. 下載 clip 文件,進入 comfyui 的 github 主頁找到 flux: https://github.com/comfyanonymous/ComfyUI_examples/tree/master/flux
從這里進入,看到 clip_l.safetensors、t5xxl_fp16.safetensors、t5xxl_fp8_e4m3fn.safetensors 這三個文件下載。
4. 文件放置位置:
5. 其他資源包括 controlnet 及 lora,在 xlab-ai 主頁 https://huggingface.co/XLabs-AI
*注意如想使用 flux 模型的 controlnet、flux 模型的 iPadapter 等功能,,還需要在 comfyui 里面下載安裝 XLabs-Ai 插件。在 comfyui 管理器里打開節點管理,然后搜索該插件并安裝,然后重啟 comfyui 即可。
6. 系統內存設置
注意采用的模型運行占內存比較大時,建議打開系統的虛擬內存:系統設置-高級-性能設置-高級-虛擬內存-勾選自動管理。
官方給出了相關使用的工作流,只需要把官方 github 的案例圖片拖放到 comfyui 即可。看圖片命名對應使用,值得我們學習。
官方案例工作流
如用 flux_dev_example 工作流為例子,將圖片拖放到 comfyui
得到下面的工作流:
把 flux_schnell_example 拖入則得到如下:
劃分結構:
flux_schnell_example 是最為簡單的,4 步驟即可出圖。
從簡單的入手,在 flux_schnell_example 工作流里面嘗試使用下面提示詞:
一個穿著校服的女孩,拿著粉筆在黑板上寫著開心文字,真實攝影,學校教室,半身構圖,電影燈光,細節豐富,日式低飽和度
A girl wearing a school uniform, holding chalk to write happy words on the blackboard, real photography, school classroom, half body composition, movie lighting, rich details, Japanese low saturation
得到的出圖:
- 黑板上的字準確體驗
- 人物的手結構正常
- 質感效果按提示詞的真實風格符合
- 出圖效率高,無等待感,跟提示詞吻合
接著我們在模型之間插入一個 lora 加載器,并且在網上下載了一個黑神話悟空的 lora 模型,加載進去(lora 來自 liblib.art 平臺作者:AI 游戲課堂熊熊)
模型先使用 fp8 schnell,使用 lora 作者提供的描述詞,然后啟動隊列,看到作者電腦 32G 內存,可以去到 85%到 98%上,顯卡是英偉達 2080。
輸入提示詞:
悟空,在繪畫室內,繪畫,素描,畫筆,寫字,努力工作,(大文字“不想工作”)
Wukong,in the painting studio,painting,sketching,using a paintbrush, writing,and working hard (big text says' don't want to work ')
得到圖像:
簡單的描述,無需負面提示詞,添加 lora 后人物手部,文字等都很好。
總的來說 flux 除了大模型需要強配置的電腦,較小的模型其實效果也錯不了多少,對于普通的自媒體應用、方案創意等足夠使用了。
另外除了簡單的添加 lora 等,熟悉 comfyui 的話,添加放大增加細節的節點,甚至使用 controlnet 等高級應用都可以產生更多更好的效果。如有更好的提示詞或者工作流,歡迎各位在評論區留言哦~
歡迎關注作者微信公眾號:「ASAK」
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
發評論!每天贏獎品
點擊 登錄 后,在評論區留言,系統會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯系我們
AI輔助海報設計101例
已累計誕生 737 位幸運星
發表評論 為下方 4 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓