這篇文章記錄了2024年6月底我在“阿里巴巴D20全球設(shè)計(jì)院長峰會(huì)”上做的主題分享。關(guān)于這些年來我在設(shè)計(jì)人工智能領(lǐng)域做的一些研究和反思,整理成文,與大家交流、探討。
01. 三個(gè)核心信仰
先講一下我們做設(shè)計(jì)人工智能的三個(gè)核心信仰:
1. 把科技帶入設(shè)計(jì),而不是用科技取代創(chuàng)意,不是讓設(shè)計(jì)師變成工程師:我有一個(gè)藝術(shù)的心和科技的腦。我一直想做的事情就是把科技帶到創(chuàng)意的領(lǐng)域里邊,所以我并不希望把每一個(gè)創(chuàng)作者都變成工程師,而是希望把工程的力量能夠帶到藝術(shù)的領(lǐng)域里去。其實(shí)藝術(shù)、設(shè)計(jì)、創(chuàng)意是人性化科技的手段,讓科技和我們的生活連接起來,否則科技只能冷冰冰的解決問題。
2. 不是機(jī)器取代人,而是人與機(jī)器共創(chuàng)更美好的未來:創(chuàng)業(yè)前我在美國教“人機(jī)交互”。人機(jī)交互和人工智能一個(gè)最大的區(qū)別,就是人工智能是以機(jī)器取代人為目的的,希望把人的工作自動(dòng)化。人機(jī)交互則是希望人和機(jī)器一起,做人和機(jī)器單獨(dú)都做不到的事情。我自己的信仰不是要讓人工智能去取代人的工作,而是要讓人工智能和人一起創(chuàng)造更美好的生活和未來。
3. 預(yù)測未來最好的方式是動(dòng)手創(chuàng)建未來:不論是作為創(chuàng)業(yè)者,還是研究者,有一樣不變的東西就是要?jiǎng)邮謩?chuàng)建。我們的價(jià)值觀是“創(chuàng)建未來 / to build and create”,to build就是寫代碼,to create就是去創(chuàng)作。
02. 為什么是設(shè)計(jì)人工智能
2017年,我第一次參加阿里設(shè)計(jì)的大會(huì),也是我第一次對(duì)外宣講“設(shè)計(jì)人工智能”。其實(shí)設(shè)計(jì)人工智能在那個(gè)時(shí)候并不是一個(gè)共識(shí),所以我加了一個(gè)“和”字,叫“設(shè)計(jì)和人工智能”。正因?yàn)樯厦嫣岬降男叛觯晕乙膊唤小叭斯ぶ悄茉O(shè)計(jì)”。7年過去了,讓我們更深刻的去思考、嘗試、行動(dòng),和我的同事、學(xué)生一起做了很多有意思的實(shí)驗(yàn)性項(xiàng)目。
在我的實(shí)驗(yàn)室的同事和學(xué)生,有三類專業(yè)背景:計(jì)算機(jī)、工科和人文背景。計(jì)算機(jī)背景的人解決生產(chǎn)力的問題,會(huì)去做各種生成的算法和工具;工科背景的人解決生產(chǎn)資料的問題,會(huì)去理解設(shè)計(jì)如何翻譯成機(jī)器可以理解的數(shù)據(jù);而人文背景的人則通過運(yùn)用新的科技、手段、工具,來創(chuàng)造新的場景和產(chǎn)品。
我們有一個(gè)不變的“研究問題”,就是“創(chuàng)意的可計(jì)算性”。這個(gè)問題本身是矛盾的,創(chuàng)意肯定是人文的,需要人的靈光乍現(xiàn)和歷史積淀,從這個(gè)角度來說“創(chuàng)意可計(jì)算性”是具有爭議的。但是創(chuàng)意又有一部分可被計(jì)算,什么樣的創(chuàng)意表現(xiàn)好,什么樣的形式更符合幾何原則……所以越矛盾、越爭議的題目越能帶來有意思的討論。這個(gè)討論不為了達(dá)成共識(shí),而是讓我們各自奔赴到自己方向的一個(gè)動(dòng)力。亞里士多德講過:我們知道的越多,我們知道自己不知道的就越多。所以創(chuàng)意的可計(jì)算性越多,我們理解創(chuàng)意的不可被計(jì)算性也就越多。
這個(gè)過程中學(xué)習(xí)是很重要的。我們實(shí)驗(yàn)室有研究生、博士生、博士后,也有一些交流的訪問學(xué)者、研究員和特贊科技的工程師、算法團(tuán)隊(duì)等。大多數(shù)時(shí)間并不是我在教他們,而是他們?cè)诮涛遥覀兪且粋€(gè)研究型組織,更是學(xué)習(xí)型組織。
我研究“設(shè)計(jì)人工智能”的另一個(gè)視角是企業(yè)視角。企業(yè)帶來了真實(shí)問題,有社會(huì)性的,也有商業(yè)性的;有關(guān)于每個(gè)消費(fèi)者的,也有關(guān)于整個(gè)社會(huì)的。企業(yè)里很多問題需要“更快”的解決方式。企業(yè)發(fā)展過程從研發(fā)到市場,過去這個(gè)過程背后有大量科技型投資在支撐,而現(xiàn)在則需要企業(yè)真的產(chǎn)生客戶價(jià)值為導(dǎo)向的產(chǎn)品服務(wù)和技術(shù)。
所以在設(shè)計(jì)人工智能的研究中,行動(dòng)和知識(shí)很重要,我們當(dāng)然要和歷史、文化和學(xué)科發(fā)生關(guān)系;另一方面又要和社會(huì)、商業(yè)、真相發(fā)生關(guān)系。就像我們?cè)趯W(xué)校做研究的時(shí)候,是年輕人給我們帶來了新的知識(shí)、新的工具、新的場景、新的思考方式。在商業(yè)語境做研發(fā)的時(shí)候,是客戶、合作企業(yè)給我們帶來了很多問題、答案、和研究問題。
我希望能夠通過to build and create的方式,去建立一個(gè)比較良性的“學(xué)”與“做”的模式,這大概是我做設(shè)計(jì)人工智能的研究/研發(fā)的大背景,接下來講講我們做了些什么。
03. 數(shù)據(jù)是設(shè)計(jì)人工智能的突破口
當(dāng)我們討論設(shè)計(jì)人工智能的時(shí)候,尤其是最近的AIGC——不管是文生圖、文生視頻還是文生文的內(nèi)容——其實(shí)人工智能都在扮演一個(gè)很有天賦的形式創(chuàng)造者,它們能做很漂亮的東西,不管是很漂亮的句式、很漂亮的圖片,還是很漂亮的視頻,現(xiàn)在甚至可以做很漂亮的三維模型。但是,天賦只代表形式創(chuàng)造的平均水平變高了,并不代表這是一種設(shè)計(jì)創(chuàng)造的能力,因?yàn)樗鼈冞€沒有幫我們解決問題。
一說到AIGC,我們就會(huì)期待“一鍵生成”——輸入提示詞后生成結(jié)果。要么是把一段很復(fù)雜的東西總結(jié)一下,要么是把簡單的一句話變成復(fù)雜的設(shè)計(jì)。但一鍵生成只是一個(gè)開始,離我們需要的結(jié)果還要走一段調(diào)整、再創(chuàng)作的路。讓我們先簡單了解一下這些生成式模型的基本原理,這里有幾個(gè)要素:
第一個(gè)要素是“數(shù)據(jù)集”,沒有數(shù)據(jù)集計(jì)算機(jī)就沒有可以學(xué)習(xí)的教材。
第二個(gè)要素是需要把數(shù)據(jù)embed成為一個(gè)向量矩陣?yán)铮@個(gè)過程是“深度學(xué)習(xí)”,或者更抽象的講叫算法。現(xiàn)在我們用的是深度學(xué)習(xí)框架是Transformer。
第三個(gè)要素是“算力”,通過調(diào)用GPU來完成。
以生成圖為例,我們用擴(kuò)散diffusion模型,從而讓每一張圖生成出來都是不一樣的。前半部分叫模型訓(xùn)練,后半部分叫模型應(yīng)用(更專業(yè)的詞叫“推理”),連接模型和推理的叫“提示詞”。我聽說中國GPU的使用,大概95%以上是在模型訓(xùn)練,也就是說我們還在建模型的階段,就像要致富先修路,我們還在修路的階段。另外5%左右的GPU使用在推理上,所以使用的場景、規(guī)模、數(shù)量都遠(yuǎn)遠(yuǎn)還很早期。
人工智能有三個(gè)重要支柱,分別是:算力,算力的壟斷者就是英偉達(dá);算法,算法的壟斷者是OpenAI;數(shù)據(jù),我們還沒有看到單一的壟斷者,尤其是在垂直領(lǐng)域的數(shù)據(jù)。也許消費(fèi)者數(shù)據(jù)我們有很多的平臺(tái),但是生產(chǎn)者供給側(cè)創(chuàng)意方設(shè)計(jì)的數(shù)據(jù)卻分散著,沒有很好的被處理。所以我們做設(shè)計(jì)人工智能的思路是充分利用已有的算力和算法,在設(shè)計(jì)和創(chuàng)意的數(shù)據(jù)上做文章。
數(shù)據(jù)不能只是大,而且要能被很好的處理好。在互聯(lián)網(wǎng)上大概有95%的數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù),和設(shè)計(jì)創(chuàng)意有關(guān)的很多數(shù)據(jù),幾乎都是非結(jié)構(gòu)化的數(shù)據(jù)。什么叫結(jié)構(gòu)化的數(shù)據(jù)?就是在excel表格可以處理的數(shù)據(jù)。而圖、文、視頻、音樂,地理信息、三維模型……都是非結(jié)構(gòu)化的數(shù)據(jù)。處理不好非結(jié)構(gòu)化的數(shù)據(jù),計(jì)算機(jī)就無法理解設(shè)計(jì)和創(chuàng)意。
處理非結(jié)構(gòu)化的方式,就像多模態(tài)模型或大語言模型,其實(shí)是把內(nèi)容變成向量。如果是人來處理圖片,我們會(huì)知道圖片背后的文化暗示,也可能會(huì)揣測圖片制作過程的信息……。但在大模型里,現(xiàn)在還只被用一種很簡單的方式處理,就是用圖片像素對(duì)應(yīng)文字產(chǎn)生向量。所以大模型的圖片處理還很粗糙,但是規(guī)模龐大。所以我為什么會(huì)說生成式人工智能現(xiàn)階段還只是一個(gè)有天賦的形式主義者,就是因?yàn)樗皇抢斫庀袼睾臀淖值南蛄康膶?duì)應(yīng)(學(xué)習(xí)形式與風(fēng)格),但并沒有深入的專業(yè)、文化影響。他不知道這些像素為什么存在,他只知道他們存在的概率。
從2017年到19年,我們每年做一份《設(shè)計(jì)人工智能報(bào)告》,來到阿里巴巴的設(shè)計(jì)大會(huì)發(fā)布。貫穿報(bào)告的主題之一是把設(shè)計(jì)翻譯為一種數(shù)據(jù)資產(chǎn),我一直試圖能夠用設(shè)計(jì)的語言,而不是用科技的語言去解釋設(shè)計(jì)人工智能的問題。因此在提到設(shè)計(jì)數(shù)據(jù)的時(shí)候,我借用了柳冠中先生的“設(shè)計(jì)事理學(xué)”:一種設(shè)計(jì)數(shù)據(jù)叫“大數(shù)據(jù)”,就是我們有很多對(duì)于設(shè)計(jì)的特征描述,這個(gè)設(shè)計(jì)是什么?就像剛剛我們用像素去描述這個(gè)設(shè)計(jì)是一樣的;另一種角度是從“事”的角度,設(shè)計(jì)有過程、有思考、有參考、有過程迭代、有商業(yè)影響和社會(huì)影響。而這些都把設(shè)計(jì)當(dāng)做一件“事”,而不是只是當(dāng)做一個(gè)“物”。那么這些維度怎么能夠成為設(shè)計(jì)數(shù)據(jù)資產(chǎn)的一部分,未來在模型調(diào)優(yōu)、訓(xùn)練中有所體現(xiàn),這其實(shí)就是我們實(shí)驗(yàn)室里去探索的。
04. 把設(shè)計(jì)翻譯成機(jī)器可以理解的元數(shù)據(jù)
我們是翻譯家,要把設(shè)計(jì)翻譯給機(jī)器。用生成式人工智能里一個(gè)更專業(yè)的詞,“翻譯”應(yīng)該叫做“對(duì)齊(alignment)”,對(duì)齊是大模型里很重要的維度,我們?cè)谧龅木褪前丛O(shè)計(jì)的思路和邏輯對(duì)計(jì)算機(jī)結(jié)果進(jìn)行調(diào)優(yōu)。為此,我們做了很多研究課題。比如2017-18年的時(shí)候我們做數(shù)據(jù)集,就像李飛飛教授的ImageNet讓機(jī)器能夠有眼睛一樣,由眼睛發(fā)展出了視力,能夠看見。我們做的數(shù)據(jù)集叫DesignNet,當(dāng)機(jī)器可以看見以后,是不是可以審美。我們教機(jī)器的設(shè)計(jì)語言就像教一個(gè)八歲小孩什么是設(shè)計(jì),比如字體、設(shè)計(jì)風(fēng)格、色彩組合等。這件事情非常難做,要做大量的人工標(biāo)記。很感謝我的很多耐心而優(yōu)秀的學(xué)生和同事,他們做了大量的標(biāo)記。
接下來,除了自下而上的讓機(jī)器去理解設(shè)計(jì)作品外,我們?cè)囍鲆粋€(gè)設(shè)計(jì)的知識(shí)圖譜,通過設(shè)計(jì)的書籍、文章等提取設(shè)計(jì)作為一種學(xué)科知識(shí),這些知識(shí)點(diǎn)連接成為一個(gè)自上而下的設(shè)計(jì)知識(shí)圖譜。這是我們2019年做的,采用最簡單的對(duì)話形式來進(jìn)行交互,現(xiàn)在看上去和ChatGPT還有些相似。你可以問設(shè)計(jì)問題,機(jī)器從設(shè)計(jì)知識(shí)庫里找到向量關(guān)系、或者找到問答的索引。如果說數(shù)據(jù)集是一種自下而上的草根式的理解設(shè)計(jì);那么知識(shí)圖譜就是一種自上而下,通過設(shè)計(jì)學(xué)自己本身的知識(shí)來教機(jī)器什么是設(shè)計(jì)。
那么這兩樣?xùn)|西結(jié)合在一起,是不是就可以成為設(shè)計(jì)的可計(jì)算基礎(chǔ)了呢?后來我們發(fā)現(xiàn)很難。每一次設(shè)計(jì)的語言描述又會(huì)給理解提供一個(gè)新的維度。所以我們就倒過來,開始想能不能用人工智能的技術(shù)手段去理解設(shè)計(jì)的文化現(xiàn)象?
我有一些學(xué)生,每周的頭發(fā)的顏色都是不一樣的。紅色、粉色、藍(lán)色、寶石蘭等,我問她這些顏色是哪里來的?她說這是亞文化的顏色。亞文化顏色并沒有很明確的設(shè)計(jì)定義,但是存在于很多案例中。我們想這很有意思,能不能用計(jì)算機(jī)視覺倒過來建立亞文化色彩的理論?通過提取染發(fā)劑的色卡,通過搖滾音樂會(huì)的海報(bào),倒過來去研究亞文化的色彩的理論到底是什么。所以我們就做了一個(gè)亞文化的色彩數(shù)據(jù)集,這個(gè)數(shù)據(jù)集里任何相鄰的顏色就是一種亞文化色彩的搭配關(guān)系。
當(dāng)我把這個(gè)研究項(xiàng)目介紹給一些國外學(xué)校的朋友的時(shí)候,他們告訴我正好有一個(gè)新興的學(xué)科方向,隸屬于數(shù)字人文,叫做“文化分析(cultural analytics)”。文化分析正好和人文視角的研究相對(duì)應(yīng),人文的方式叫文化研究(cultural study)。而現(xiàn)在這種計(jì)算的方式增加了文化研究的維度。其實(shí)除了在色彩、設(shè)計(jì)之外,越來越多的人文學(xué)科開始“可計(jì)算”了。著名經(jīng)濟(jì)學(xué)家陳志武教授現(xiàn)在在推動(dòng)“量化歷史”。如果我們認(rèn)為歷史原來是由一個(gè)個(gè)個(gè)體個(gè)案組成的,那陳志武教授的量化歷史是通過量化研究來研究老百姓群體,不是一個(gè)個(gè)孤立的故事,而是一個(gè)連續(xù)的過程。歷史和量化歷史的關(guān)系,正好也是設(shè)計(jì)和設(shè)計(jì)可計(jì)算之間的關(guān)系。
實(shí)驗(yàn)室還做了不少有意思的事情。有個(gè)學(xué)生自己朋友圈發(fā)出去的內(nèi)容來進(jìn)行分析和理解,做了一個(gè)小小的個(gè)人數(shù)據(jù)庫,是她99條朋友圈,里邊有她喜歡的東西、觀點(diǎn)感言等……他只做了一件事情,就想知道這99條朋友圈如果變成輸入條件,通過擴(kuò)散模型,會(huì)輸出一張什么樣的意向。結(jié)果輸出的是這樣一張圖——不知道為什么那么繽紛的朋友圈最后指向的是一個(gè)“廟門”。我覺得這個(gè)過程很有趣,擴(kuò)散模型作為一個(gè)很強(qiáng)的歸納者,不是用AIGC去卷我們已知的設(shè)計(jì)問題,而是讓我們理解以前不理解的東西,比如情緒被生成了。我們并不在意這張圖片本身的質(zhì)量,而在于通過這張意向的理解,讓更好的知道自己的情緒是怎么樣的?
如果上面的項(xiàng)目是研究物質(zhì)背后的情緒,那么我們還有一個(gè)項(xiàng)目正好相反,是研究創(chuàng)意背后的物質(zhì)。有一位學(xué)生用各種的算法和工具生成了很多圖。然后研究做這些圖的耗電量。大家知道一張圖被生成需要耗多少電量嗎?他的研究表明:我們用midjourney做一張圖,整個(gè)鏈路上用的電,大概可以把蘋果手機(jī)充電25%。生成式人工智能雖然不消耗多少的創(chuàng)造力,但是卻著實(shí)消耗不少電量。他在做的事情是把能量這個(gè)維度的數(shù)據(jù)也放到創(chuàng)意上。當(dāng)我們開始做這么多的動(dòng)畫的時(shí)候,當(dāng)我們可以實(shí)現(xiàn)空間化的時(shí)候,大家想一想背后消耗的能量有多少。我們不想那么快的進(jìn)入到道德和批判,但確實(shí)一個(gè)很重要的設(shè)計(jì)的數(shù)據(jù)維度,而過去我們是不考慮的。
上述的項(xiàng)目都遵循著如下的結(jié)構(gòu),想法通過圖文、視頻、色彩等內(nèi)容形式來承載,然后通過元數(shù)據(jù)(metadata)來對(duì)齊給機(jī)器,元數(shù)據(jù)就是那些讓機(jī)器去理解的數(shù)據(jù)單元。我們做了一個(gè)這樣的工具(musedam),讓人們可以把設(shè)計(jì)創(chuàng)意能夠翻譯成數(shù)據(jù)資產(chǎn)。
聽上去這種記錄很抽象,但是事實(shí)上這不是什么新的概念,只是通過數(shù)字化工具和人工智能,這個(gè)記錄又有了更強(qiáng)大的新工具而已。我想給大家分享這個(gè)10分鐘的紀(jì)錄片,記錄了《教父》導(dǎo)演科波拉的筆記本。這個(gè)筆記本是他自己做的,中間是《教父》的原著,外邊他做了一個(gè)白色的框,這個(gè)白色的框被貼在每一頁原著上。他在旁邊做了很多的筆記,就像元數(shù)據(jù)一樣。所以《教父》就變成了屬于科波拉的《教父》了,他說:只需要這本筆記本,他就可以拍出電影了。你們猜這本筆記本叫什么?Prompt book。
Prompt這個(gè)詞大家越來越熟悉,就是驅(qū)動(dòng)大模型的“提示詞”。早在幾十年前戲劇導(dǎo)演的創(chuàng)作過程當(dāng)中,他們就在用一個(gè)叫Prompt Book的工具。現(xiàn)在如果我們?cè)谒阉饕嫔先フ襊rompt Book,十有八九你會(huì)拿到的是一本AIGC的提示詞秘籍。但那個(gè)時(shí)候科波拉自己做了屬于自己的prompt book,所有的想法都是從這個(gè)很物質(zhì)化的元數(shù)據(jù)集里被prompt出來,產(chǎn)生他的藝術(shù)創(chuàng)作。我們?cè)谧寵C(jī)器去更好的理解設(shè)計(jì)、做設(shè)計(jì)的路上,還有很多的像科波拉做筆記本一樣的“數(shù)據(jù)工作”可以做。
05. 設(shè)計(jì)人工智能要從視覺到行動(dòng)
既然設(shè)計(jì)可以被翻譯為數(shù)據(jù),那么是不是也可以用數(shù)據(jù)來生成設(shè)計(jì)。我認(rèn)為現(xiàn)在設(shè)計(jì)的生成是形式主義,是西方視覺歷史的延續(xù)。西方學(xué)者(如Jonathan Crary等)認(rèn)為西方的視覺歷史是關(guān)于“看(opticality)”的,人作為觀者(observer)。
巫鴻教授的《重屏》則通過分析顧閎中的《韓熙載夜宴圖》來研究中國的視覺,增加了時(shí)空和變換角色的維度,他認(rèn)為在全畫中畫家有時(shí)候是第一人稱,有時(shí)候是第三人稱,有時(shí)候是宴會(huì)的參與者,有時(shí)候是宴會(huì)的記錄者。這種具有時(shí)空、行為和角色的視覺是值得引起注意的。現(xiàn)代設(shè)計(jì)其實(shí)一直在做一個(gè)努力,就是從純視覺,從設(shè)計(jì)“物”轉(zhuǎn)變?yōu)樵O(shè)計(jì)“行動(dòng)”。從只做視覺轉(zhuǎn)變?yōu)樵O(shè)計(jì)服務(wù)、體驗(yàn)、社會(huì)、生物等。從以物為中心,能不能到以人為中心?從以設(shè)計(jì)作為以造物為目的,到作為改造社會(huì)的手段。我認(rèn)為我們還缺少一種討論,是設(shè)計(jì)人工智能到底怎么能讓設(shè)計(jì)學(xué)科在推動(dòng)的變革繼續(xù)延續(xù)。
我們也做了一些很早期的嘗試,比如通過人工智能來保護(hù)傳統(tǒng)的手工藝。這個(gè)項(xiàng)目中我們討論了兩個(gè)人工智能與手工藝保護(hù)沖突的元問題:一、我們到底應(yīng)該如何讓生成的結(jié)果可控?到底是應(yīng)該要讓AI生成金山農(nóng)民畫真的很好,還是做的一般就可以。二、到底應(yīng)該生成新的金山農(nóng)民畫元素,還是用原有元素生成新的布局和主題?這些話題都是開始用人工智能作為一種手段去重新想設(shè)計(jì)的問題的時(shí)候才會(huì)遇見。如果只想絕對(duì)優(yōu)化的話,那一定應(yīng)該做到最好,應(yīng)該生成更多的元素。但是如果我們想設(shè)計(jì)作為一種保護(hù)手段的時(shí)候,也許我們不應(yīng)該這么去選擇。
過去是有了聲音才有節(jié)拍,聽到音樂翩翩起舞,舞蹈的創(chuàng)造往往受制于音樂。我們?cè)谙肴绻岩魳返南拗埔蛩厝サ簦魏挝璧付伎梢耘涑龊线m的音樂,會(huì)對(duì)舞蹈/行動(dòng)有什么影響?所以我們做了個(gè)通過節(jié)拍生成音樂的算法,只要確定節(jié)奏,就可以產(chǎn)生任何配舞音樂。
我們希望通過AI來創(chuàng)造新的故事敘述。我們總覺得AI的形象都太剛性,我女兒喜歡的AI會(huì)是什么樣子?我們用生成的方式做了很多叫“腦機(jī)比”的玩偶,每個(gè)人背后都有個(gè)故事。這些是最早的種子,第一個(gè)是魯班,第二個(gè)是達(dá)芬奇,第三個(gè)是特斯拉……然后我們用這些種子進(jìn)行組合生成,產(chǎn)生了5000個(gè)變種,比如特斯拉如果和愛因斯坦結(jié)合在一起,可能叫愛因斯拉。他們會(huì)對(duì)世界的發(fā)展產(chǎn)生什么影響?我們用GPT生成這樣的故事,也許他們改造的世界會(huì)是我們的平行宇宙。所以當(dāng)我們重新去思考AI的時(shí)候,AI應(yīng)該給我們創(chuàng)造更多的可能性,而不應(yīng)該只有一種視覺的結(jié)果。
最近我們開始試著做一些空間維度的探索。從一個(gè)中國的繪畫開始,不停的通過各種各樣生成的算法來無窮無盡的拓展它的空間邊界。可能在中國視覺是關(guān)于時(shí)空和體驗(yàn)的,我們?cè)趺礃幽軌蜃屧瓉硪粋€(gè)平面的繪畫,重新利用AI尋找回它的空間感。
我的學(xué)生想給每個(gè)人做一個(gè)自己喜歡的冥想空間。生成個(gè)人化的視覺、氣味、聲音,生成了一種你屬于你自己的獨(dú)特體驗(yàn)空間,從而讓你放松下來。
這是另一個(gè)學(xué)生的作品。我們都是被動(dòng)勞動(dòng),能不能實(shí)時(shí)的生成各種各樣的場景,把勞動(dòng)和游戲結(jié)合,勞動(dòng)就像是在玩沉浸式游戲一樣?這一系列的嘗試,其實(shí)都是讓AI不只是針對(duì)物的形式主義,而是回歸到我們希望通過設(shè)計(jì)來對(duì)行為進(jìn)行改變上。
最后,在變化萬千的人工智能技術(shù)下,始終有一些不變的東西。
第一,我們并沒有以技術(shù)作為目的,而是以技術(shù)作為手段,最后解放人。所以如果我們不能更開心,技術(shù)不能讓我們的生活更美好,這就不是一個(gè)對(duì)的技術(shù)。那反過來,如果我們的設(shè)計(jì),不能讓我們變得更快樂,不能讓這個(gè)社會(huì)變得更好,可能也不是一個(gè)好的設(shè)計(jì)。所以我覺得我們現(xiàn)在特別重要的不是只是強(qiáng)調(diào)技術(shù)的效率,也需要帶入設(shè)計(jì)的人文。
第二,一鍵生成不會(huì)產(chǎn)生好的設(shè)計(jì),積累從來沒有比現(xiàn)在更重要。就像科波拉的Prompt Book一樣,我們有多少東西被解釋、翻譯、對(duì)齊給數(shù)據(jù),就決定了我們有多少能力去提取和創(chuàng)作。所以藤子·F·不二雄在他的創(chuàng)作書里就強(qiáng)調(diào)這個(gè)觀點(diǎn):沒有想法是平白無故產(chǎn)生的,我們要提取都不會(huì)從一個(gè)透明的盒子里面去提取。所有的積累才是我們創(chuàng)作的源泉,發(fā)散才會(huì)有收斂,創(chuàng)意才會(huì)出現(xiàn)。
第三,好的創(chuàng)意來自于不斷迭代反饋,OpenAI的CEO Sam Altman說:“創(chuàng)意就是過去東西的重組,加上靈光乍現(xiàn),乘以迭代的數(shù)量和反饋的質(zhì)量。人們往往覺得要最大化的變量是靈光乍現(xiàn),其實(shí)關(guān)鍵是要最大化迭代的數(shù)量和反饋質(zhì)量。”
最后我想引用畢加索講的一句話:“電腦沒有用,因?yàn)殡娔X只會(huì)給答案。”
所以剩下的,就交給各位了。謝謝大家。
讀完本文如果感興趣設(shè)計(jì)人工智能實(shí)驗(yàn)室的研究生、博士生和博士后,可以把簡歷發(fā)給我: lfan@tongji.edu.cn。
發(fā)評(píng)論!每天贏獎(jiǎng)品
點(diǎn)擊 登錄 后,在評(píng)論區(qū)留言,系統(tǒng)會(huì)隨機(jī)派送獎(jiǎng)品
2012年成立至今,是國內(nèi)備受歡迎的設(shè)計(jì)師平臺(tái),提供獎(jiǎng)品贊助 聯(lián)系我們
AI輔助海報(bào)設(shè)計(jì)101例
已累計(jì)誕生 737 位幸運(yùn)星