深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

往期作者干貨:

因為一些原因很久沒更新了,最近一直研究和學(xué)習(xí) ComfyUI,突發(fā)奇想想聊聊關(guān)于 AI 的一些事,這兩年生成式 AI 爆發(fā)性增長并且重塑數(shù)字創(chuàng)作的工具生態(tài)。從文本生成、圖像視頻生成以及模型訓(xùn)練,可以說無法離開 AI,AI 的介入讓創(chuàng)意生產(chǎn)變得前所未有的高效簡單,但同時也帶來了體驗上的困境,例如我們在使用自動化生成便利的同時,還能保持對創(chuàng)作過程的深層控制?比如在進(jìn)行文生圖或者線稿轉(zhuǎn) 3D 的流程中,我們?nèi)绻刂颇硞€部分的設(shè)計表現(xiàn),需要利用多個方法才能完成,僅僅通過提示詞的修改并無法完成,這個矛盾在之前的 SD 等開源模型中非常明顯。

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

算法模型的開放讓設(shè)計達(dá)到了無限的可能,但更多設(shè)計師卻被迫在控制權(quán)和易用性之間做出了妥協(xié),當(dāng)重復(fù)一個流程無法生成滿意的圖像時,大多情況都是基于一個“不滿意”的圖像進(jìn)行優(yōu)化,我把這個理解為用戶心理上的妥協(xié);

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

以節(jié)點式工作流工具 ComfyUI 為例,其通過可視化編程賦予用戶對 Stable Diffusion 生成流程的精細(xì)控制權(quán),允許自由組合模型、調(diào)節(jié)參數(shù)、插入預(yù)處理模塊,成為專業(yè)創(chuàng)作者的首選工具。然而,這種高度自由的設(shè)計也帶來了顯著的認(rèn)知負(fù)擔(dān):錯綜復(fù)雜的節(jié)點連線、晦澀的參數(shù)術(shù)語、缺乏引導(dǎo)的開放式畫布,讓 0 基礎(chǔ)設(shè)計望而止步;數(shù)據(jù)顯示,超過 67%的新用戶在首次使用 ComfyUI 時因“界面混亂”而放棄進(jìn)一步探索(來源:ComfyUI 社區(qū)調(diào)研,2023)。這一現(xiàn)象揭示了生成式 AI 工具設(shè)計的核心矛盾——系統(tǒng)的靈活性與用戶的心智模型之間如何實現(xiàn)平衡?

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

一、核心問題與矛盾

1. 設(shè)計師對“控制權(quán)”的需求本質(zhì)

安全感需求:用戶希望理解生成過程(分布控制、seed 數(shù)值、CFG),避免黑箱帶來的不可預(yù)測性;

注:大多數(shù) AI 工具(如 Midjourney)像一臺自動售貨機(jī)——輸入提示詞,隨機(jī)吐出一張圖片。用戶無法知曉AI為何生成一只三頭六臂的貓,只能反復(fù)“抽卡”直到滿意。

創(chuàng)造性需求:通過精細(xì)化的控制實現(xiàn)獨特的風(fēng)格,例如分布提示,基于大模型訓(xùn)練出來的 lora,不同 lora 模型融合后的混合模型,這些需要付出很大的學(xué)習(xí)成本和時間才能滿足,我個人理解 AI 給設(shè)計師通往目標(biāo)的過程中搭建了不同的道路,但設(shè)計師如果在沒有導(dǎo)航的情況下要達(dá)到這個目標(biāo),中間可能會輾轉(zhuǎn)反側(cè),也可能一條道路就能到達(dá)目的地;

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

效率需求:自動化設(shè)計(如 MJ 和國內(nèi)其他一鍵生圖的 ai 產(chǎn)品)可以降低設(shè)計的操作成本,但同時犧牲了可控性;

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

2. comfyUI 的設(shè)計矛盾

過度控制悖論:ComfyUI 試圖打破黑箱,將 AI 拆解成可調(diào)節(jié)的“齒輪組”(如調(diào)節(jié)“采樣器”改變畫質(zhì)、用“ControlNet”控制構(gòu)圖)。但當(dāng)用戶面對 50 多個參數(shù)和上百種節(jié)點時,反而因信息過載陷入“該調(diào)哪個參數(shù)?連錯節(jié)點會爆炸嗎?”的決策癱瘓。

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

過高的配置要求:comfyUI 解決了 MJ 帶來的黑箱效應(yīng),但同時也帶來了物質(zhì)上的門檻,設(shè)計師需要配備更高的配置或者使用第三方租用云電腦等才能運行,否則前者就會造成漫長的等待,后者則需要花費大量的財力,對于設(shè)計師而言反而是造成了時間上的負(fù)荷;

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

功能維度:節(jié)點系統(tǒng)支持無限組合,但缺乏對用戶意圖的主動理解,如自動推薦節(jié)點;

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

認(rèn)知維度:參數(shù)暴露(如 CFG Scale、Sampler)提供控制感,但引發(fā)“選擇過載”實際使用過程中,如果是普通玩家,無法短時間內(nèi)通過這些參數(shù)來控制結(jié)果,核心還是在于認(rèn)知門檻過高;

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

交互維度:自由連接節(jié)點導(dǎo)致邏輯混亂(如錯誤連線無及時提示),增加調(diào)試成本。

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

我把 ControlNet 的“負(fù)面條件”打亂連接到“正面 clip 文本框”上,而采樣器的“負(fù)面條件”直接連接到“負(fù)面 clip 文本框”內(nèi),整個過程是不會出現(xiàn)任何報錯提示,但是當(dāng)運行調(diào)試的時候就會運行失敗,提示 ControlNet 缺少負(fù)面條件,ControlNet(應(yīng)用)缺少負(fù)面條件輸出等問題,眾所周知對于一些低配玩家,運行一次需要等很久,等到最后發(fā)現(xiàn)生產(chǎn)出來一個“報錯”!!!

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

二、對比分析:comfyUI 和 midjourney

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

當(dāng)設(shè)計師想生成“一只穿宇航服的柴犬”,Midjourney 可能輸出卡通風(fēng)格或超現(xiàn)實照片,設(shè)計師只能通過追加提示詞(如“3D、黏土”)逼近目標(biāo),不停的抽卡;

(實在不想用 mj 了,下面的圖本地跑的,大概的意思一樣就是不停的抽卡抽卡)

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

在 ComfyUI 中,設(shè)計師可以強制指定:用 FLUX 模型生成基礎(chǔ)圖像??然后加載相關(guān)LoRA模型??在添加個視覺風(fēng)格遷移的模型??添加宇航服??在添加個視覺風(fēng)格模型??連接OpenPose節(jié)點調(diào)整柴犬姿勢??最后用放大模型??放大畫質(zhì);但我就想說:我只是想畫只貓,為什么要弄這么復(fù)雜。。。

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

關(guān)鍵結(jié)論:

ComfyUI 的“高可控性”吸引專家設(shè)計師,但普通設(shè)計師或者 0 基礎(chǔ)設(shè)計師因認(rèn)知負(fù)荷大多放棄使用。

Midjourney 通過“限制控制權(quán)”降低門檻,但設(shè)計師可能因無法干預(yù)細(xì)節(jié)感到焦慮。

三、Comfyui 沖突點和機(jī)會點

為什么說這個呢,因為 comfyui 目前是趨勢 ai,核心的生成邏輯包括實際應(yīng)用都已經(jīng)大于 mj 了,所以接下來的內(nèi)容也是圍繞 comfyui 拆解的;

1. 參數(shù)暴露 vs 認(rèn)知負(fù)荷

問題:ComfyUI 將所有參數(shù)(如 LoRA 權(quán)重、VAE 選擇、采樣器、各種模型加載器)暴露給用戶,導(dǎo)致界面信息過載。

例如:設(shè)計師需要同時調(diào)整“提示詞權(quán)重”“采樣器類型”“ControlNet 強度”時,易混淆參數(shù)優(yōu)先級,對于這個結(jié)果的影響,是采樣器類型問題呢還是 ControlNet 的數(shù)值不對呢,最后我猜大多人過程都是一個個試一遍,最后哪個效果好用哪個;

思考點:

動態(tài)參數(shù)分組,根據(jù)生成的目標(biāo)隱藏?zé)o關(guān)的參數(shù),比如當(dāng)輸入完成“提示詞”后,可以識別出輸入的提示詞類型,生成一個 3d 風(fēng)格海報,那么基于這個提示詞,就可以提前預(yù)判出跟 3d 風(fēng)格海報相關(guān)的參數(shù)都可以隱藏;

參數(shù)依賴的可視化,通過邏輯線的方式標(biāo)記他們之間的關(guān)系,例如 CFG 與采樣步數(shù),通常來講 CFG 數(shù)值越高生成的圖越接近提示詞,但是圖像質(zhì)量會下降,采樣步數(shù)越高生成的圖質(zhì)量就越高,那么問題來了,當(dāng)設(shè)計師調(diào)整 CFG 數(shù)值時,是不是可以標(biāo)記或者提示設(shè)計師采樣步數(shù)的變化,以此來達(dá)到最優(yōu)解;

下方示例

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

2. 自由連接 vs 邏輯錯誤

問題:節(jié)點可任意連接,但缺乏邏輯校驗?zāi)壳?comfyUI 中只是告訴設(shè)計師如果兩個節(jié)點本身沒有前后關(guān)系的情況下不可以連接(沒有節(jié)點對應(yīng)的收入口)另一種情況是兩個節(jié)點在一個工作流中都能起到作用,但是節(jié)點是多功能化的,連線的時候可以正常連接,最后運行的時候就會出現(xiàn)某某節(jié)點不匹配。

例如:設(shè)計師錯誤連接 ControlNet 預(yù)處理器與 VAE 節(jié)點,導(dǎo)致生成失敗且無報錯提示。

思考點:

實時邏輯校驗,在設(shè)計師連線時提示沖突(如“該節(jié)點僅接受潛空間輸入”)。

工作流自檢模式,一鍵檢測缺失節(jié)點(如缺少“提示詞編碼器”時提醒用戶)。

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

四、設(shè)計師心理與工具的“錯位戰(zhàn)爭”

生成式 AI 工具的設(shè)計矛盾,本質(zhì)上是人類認(rèn)知模式與技術(shù)邏輯的沖突。以 ComfyUI 為例,其設(shè)計暴露了以下深層問題:

1. “技術(shù)透明化”的認(rèn)知陷阱

ComfyUI 將 AI 生成過程拆解為節(jié)點,試圖通過“透明化”提升用戶信任,但普通人并不需要(也無法理解)技術(shù)細(xì)節(jié);

不知道你們有沒有,當(dāng)我第一次看到“VAE 解碼器”“潛在空間降噪”等節(jié)點時,大腦會觸發(fā)“意義建構(gòu)焦慮”——“這些詞和我想要的圖片有什么關(guān)系?”

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

2. 控制權(quán)的“虛假承諾”

ComfyUI 看似賦予用戶完全控制權(quán),但多數(shù)參數(shù)的實際影響難以預(yù)測(如 CFG 值從 7 到 8 可能導(dǎo)致畫風(fēng)突變)

這類似于讓設(shè)計師駕駛一輛方向盤與輪胎無機(jī)械連接的汽車,轉(zhuǎn)動方向盤時,輪胎可能隨機(jī)偏轉(zhuǎn)。

設(shè)計師誤以為“控制節(jié)點=控制結(jié)果”,實則是“在黑暗中調(diào)整未知旋鈕”;

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

3. 技術(shù)極客與大眾的“認(rèn)知斷層”

開源社區(qū)的理想:“人人可 Hack”的民主化工具;

現(xiàn)實問題是開發(fā)者設(shè)計節(jié)點時默認(rèn)用戶理解 SD 原理(如 Latent Space、擴(kuò)散模型、euler_ancestralcai、dpmpp_2m),但普通用戶只關(guān)心“如何讓圖片更逼真”;

這種斷層導(dǎo)致 ComfyUI 的文檔充滿技術(shù)術(shù)語,而非用戶目標(biāo)導(dǎo)向的指南(如“修復(fù)模糊人臉”對應(yīng)哪些節(jié)點組合),這也是技術(shù)工具與用戶體驗的博弈;

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

五、對于 ComfyUI 的暢想

1. 適配不同能力的設(shè)計師

專家模式:保留完整的節(jié)點和參數(shù),讓這類設(shè)計師自由編輯

精簡模式:隱藏底層參數(shù),僅僅提供目標(biāo)導(dǎo)向的選項

自動化操作,根據(jù)提示詞推薦采樣器、cfg 數(shù)值等組合,例如提示詞是自然語言,那就匹配關(guān)于 flux 模型的專屬采樣器;

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

2. 智能節(jié)點推薦引擎

目標(biāo)推薦:輸入“生成賽博朋克城市”后,自動推薦“SDXL 模型+ControlNet 邊緣檢測+色調(diào)調(diào)整節(jié)點”;

行為預(yù)測:分析歷史工作流,推薦高頻使用的節(jié)點組合(如“LoRA 模型+分層提示詞”);

3. 可解釋性反饋面板

參數(shù)與結(jié)果的實時性:實時顯示調(diào)整 CFG 值對圖像細(xì)節(jié)、對比度的量化影響。

節(jié)點的貢獻(xiàn)度分析:生成后標(biāo)記關(guān)鍵節(jié)點(如“ControlNet 貢獻(xiàn)度 72%”),幫助用戶理解流程。

六、總結(jié):控制的幻覺與設(shè)計的謙卑

ComfyUI 揭示了生成式 AI 時代的核心矛盾——技術(shù)的能力越強大,人類越需要承認(rèn)自身認(rèn)知的局限性。工具設(shè)計不應(yīng)追求“上帝模式”,而需尋找“剛剛好的控制權(quán)”

給用戶“扳手”而非“零件庫”:提供高層級調(diào)節(jié)維度(如“畫面精細(xì)度”“風(fēng)格偏離度”),隱藏底層技術(shù)參數(shù),并不是每個設(shè)計師都是工程師的角色;大多設(shè)計師的角色只是維修工;

擁抱“不完美的人性”:允許用戶保留“我不知道為什么要調(diào)這個,但調(diào)了就有用”的玄學(xué)操作,而非強迫所有人成為 AI 工程師。

重新定義“控制”:從“絕對掌控流程”轉(zhuǎn)向“有效影響結(jié)果”,讓 AI 的不可預(yù)測性成為創(chuàng)意催化劑而非焦慮來源。

歡迎關(guān)注作者微信公眾號:「防脫發(fā)藥水」

深度好文!AI創(chuàng)作工具的「可控性」與「用戶體驗」博弈

收藏 24
點贊 42

復(fù)制本文鏈接 文章為作者獨立觀點不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。