這篇文章發布于 2022 年 9 月,在 GPT-3.5 即將引起全球關注的前夜。如今 AI 的生態日新月異,兩年后的我們再回顧這篇文章時,仍能深切感受到,最初的探索者對生成式 AI 未來發展所構想的藍圖如此清晰而具有前瞻性。在大模型應用日益豐富多彩的當下,這篇文章可以是理解和探索生成式 AI 潛力的寶貴資料。
AI 最新動態:
人類擅長分析事物,機器則更勝一籌。無論是欺詐或垃圾郵件檢測、預測快遞的預計到達時間,還是預測下一個要向您展示的 TikTok 視頻,機器都能從數據中找出模式,以滿足多種用途的需要。它們在這些任務中變得越來越聰明。這就是所謂的 "分析型人工智能 "或傳統人工智能。
然而人類不僅僅擅長分析事物——我們也擅長創造。我們編寫詩歌,設計產品,制作游戲,編寫代碼。直到不久前,機器還無法在創造性工作上與人類競爭——它們只能從事分析和重復性的認知勞動。但現在,機器開始擅長于創造有意義且美觀的事物。這個新的類別被稱為“生成性人工智能”,這意味著機器是在創造新事物,而不是分析已經存在的事物。
生成式人工智能不僅速度更快、成本更低,而且在某些情況下比人類手工創作的效果更好。從社交媒體到游戲、從廣告到建筑、從編碼到平面設計、從產品設計到法律、從市場營銷到銷售,每一個需要人類創造原創作品的行業都將面臨革新。某些功能可能會被生成式人工智能完全取代,而另一些功能則更有可能在人類與機器之間緊密的創意迭代周期中茁壯成長--但生成式人工智能應該能為廣泛的終端市場帶來更好、更快、更便宜的創作。理想的情況是,生成式人工智能會將創造和知識性工作的邊際成本降至幾乎為零,從而產生巨大的勞動生產力和經濟價值,并相應提升市場價值。
生成性人工智能(Generative AI)所關注的領域——知識工作和創造性工作——包括了數十億的工作者。生成性AI可以使這些工作者的效率和/或創造力至少提高10%:他們不僅工作速度更快、更高效,而且比以前更有能力。因此,生成性AI具有創造數萬億美元經濟價值的潛力。
與更廣泛意義的人工智能類似,我們非常想知道生成式 AI 的轉折點為何是此刻?可能是因為更好的模型、更多的數據、更強的算力。這一領域的變化之快超出了我們的想象,但我們還是應該大致回顧一下最近的歷史,以了解當前的背景。
第一波浪潮:小模型稱霸的階段(2015 年之前)
5 年前,小型模型被認為是理解語言的 "最先進技術"。這些小型模型在分析任務方面表現出色,被部署用于從交貨算時間預測到欺詐分類等工作。然而,對于通用生成任務來說,它們的表現力還不夠。生成人類水平的文字或代碼仍然是一個夢想。
第二波浪潮:規模化競賽階段(2015-今天)
谷歌研究院的一篇具有里程碑意義的論文(Attention is All You Need)描述了一種用于自然語言理解的新型神經網絡架構,這種架構被稱為 Transformers,這種架構能夠生成更高質量的語言模型,同時具有更強的并行處理能力,并且顯著減少了訓練時間。這些模型屬于少樣本學習者,可以較為容易地針對特定領域進行定制。
隨著人工智能模型逐漸變大,它們已開始超越人類的性能基準了。資料來源 ? 經濟學人報業有限公司,倫敦,2022 年 6 月 11 日
果然,隨著模型越來越大,它們開始達到人類水平,然后抵達近乎超人一般的水平。從 2015 年到 2020 年,用于訓練這些模型的計算量增加了 6 個數量級,其結果超過了人類在手寫、語音和圖像識別、閱讀理解和語言理解方面的性能基準。OpenAI 的 GPT-3 脫穎而出:該模型的性能比 GPT-2 有了巨大飛躍,并在 Twitter 展示了引人注目的 demo。
盡管基礎研究取得了很大進展,但這些模型并未普及。它們體積龐大,難以運行(需要 GPU 協調),不能獲得廣泛的訪問(不可用或僅為封閉測試版),而且作為云服務使用成本高昂。盡管存在這些限制,但最早的生成式人工智能應用已經開始進入戰場。
第三波浪潮:更好、更快、更便宜(2022 年之后)
計算成本越來越低。擴散模型(diffusion models)等新技術降低了訓練和運行推理所需的成本。科學界繼續在此基礎上,開發更好的算法和更大的模型。開發人員的訪問權限從封閉測試版擴展到開放測試版,甚至在某些情況下,直接開放了源代碼。對于一直無法訪問 LLMs 的開發人員來說,探索和應用開發的閘門現在已經打開,各種應用開始涌現。
第四波浪潮:殺手級應用出現(就是現在)
隨著平臺層的穩固,模型不斷變得更好、更快、更便宜,并且模型訪問趨于免費和開源,應用層的創造力已經成熟。正如移動技術通過 GPS、攝像頭和隨身熱點等新功能釋放出新型應用一樣,我們預計這些大型模型將推動新一輪的生成式 AI 的應用。正如十年前移動技術的拐點,為少數殺手級應用開辟了市場一樣,我們預計生成式 AI 也將出現殺手級應用。競爭已經開始。
以下示意圖,繪制了將支持每種類別的模型和相應的平臺,以及可能在該平臺上構建的應用程序類型。
大模型
- 文本生成是最先進的領域。然而,自然語言很難掌握,而且輸入語言的質量也至關重要。如今,這些模型在一般的中/短文寫作方面表現尚可(但即便如此,它們也通常需要迭代)。隨著時間的推移,模型在不斷被完善,我們有望看到更高質量的輸出效果、更長篇的內容以及更好的特定垂直領域的調整。
- 代碼生成很可能在短期內,對開發者的工作效率產生巨大影響,正如 GitHub CoPilot 所展示的那樣。它還將使非開發人員更容易去創造使用代碼。
- 圖片生成是最近才流行的玩法(當時是2022年,注意),但它已經開始病毒傳播了:在 Twitter 上分享生成的圖片比分享文字有趣得多!我們看到了具有不同美學風格的圖像模型的出現,以及編輯和修改生成圖像的不同技術。
- 語音合成已經存在了一段時間(Hey Siri!),但消費者和企業級應用才剛剛起步。對于電影和播客等高端應用而言,要想獲得聽起來不機械的一次性人類語音質量,標準還是相當高的。但是,就像圖像一樣,今天的模型為進一步完善,為最終輸出實用 APP 提供了一個起點。
- 視頻和 3D 模型生成正在迅速崛起。大模型有可能進入并開拓電影、游戲、VR、建筑和實體產品設計等大型創意市場,大家對 AI 在這一塊的潛力感到興奮。研究機構正在發布基礎的 3D 與視頻生成的大模型。
- 其他領域:在許多垂直領域中,大家會都在進行基礎模型的研發,這些領域包括音頻和音樂、生物學和化學(有人對生成蛋白質和分子感興趣嗎?實際上在 2024 年 AI 已經可以進行基因編輯的生成了)。
下圖展示了我們可能期望看到的基本模型的發展,以及相關應用成為可能的時間表,2025 年及以后只是猜測。
下圖則是 2023 年已經出現的的生成式人工智能應用圖景
資料來源 ? 2023 Battery Ventures State of Enterprise Tech Spending Report
AI 應用
這里列出了一些我們感到興奮的應用程序。實際上,我們感興趣的應用遠遠超出了這里所能展示的范圍,我們對各個項目的創始人和開發者們構想出的創新應用感到非常著迷。
- 文案寫作:隨著銷售和營銷策略以及客戶支持對個性化網頁和電郵內容需求的增長,語言模型的應用變得尤為重要。這些內容的短小精悍和風格化特性,加上團隊面臨的時間和成本壓力,將推動對自動化和增強型解決方案的需求。
- 特定垂直領域的寫作助手:當今的大多數寫作助手都是通用型的;我們認為,為特定終端市場構建更優秀的生成應用存在巨大的機會,從法律合同撰寫到編劇等。產品的差異化在于針對特定工作流程的模型微調和用戶體驗設計。
- 代碼生成:當前的應用程序為開發人員提供了更強動力,使他們的工作效率大大提高:GitHub Copilot 目前為安裝了它的項目,生成了近 40% 的代碼。但更大的機遇可能是向消費者開放代碼能力,學習提示詞可能會成為最終的高級編程語言。
- 藝術生成:現在,整個藝術史和流行文化,都被作為數據喂給了這些大型模型,任何人都可以隨意探索從前需要花費一生時間才能掌握的主題和風格。
- 游戲:理想的情況是,使用自然語言創建可交互的復雜場景或模型,但是這可能需要一個漫長的過程,但在短期內有一些更直接、更具可操作性的選擇,例如生成紋理和背景素材。
- 媒體/廣告:試想一下,將設計工作自動化,并為消費者實時優化廣告文案和創意,這個潛力有多大。多模態生成(生成包含聲音、圖像、文本的多媒體內容)銷售信息和與之互補的視覺效果結合到一起,就意味著巨大的機會。
- 設計:數字產品和實體產品的原型設計,是一個勞動密集型迭代過程。根據草圖和提示繪制高保真效果圖已經成為現實。隨著三維模型的出現,生成式設計過程將延伸至制造和生產——從文字到實物均是如此。你的下一個 iPhone APP 或運動鞋可能就是由機器設計的。
- 社交媒體和數字社區:用生成工具是否成為展示自我的新方式?隨著消費者學會在公共場合進行創作,像 Midjourney 這樣的新應用正在創造新的社交體驗。
生成式 AI 應用將發展成什么樣子?以下是一些預測。
1. 智能和模型微調
生成式 AI 應用建立在 GPT-3 或 Stable Diffusion 等大模型之上。隨著這些應用獲得更多的用戶數據,它們可以對模型進行微調,以便:
- 針對特定問題提高模型質量/性能;
- 減少模型大小/成本:
我們可以把生成式 AI 應用程序看作是一個用戶界面層和 “小型大腦",它位于大型通用模型 "巨型大腦 "之上。
2. 實現形式
如今,生成式 AI 應用大多以插件的形式,存在于現有的軟件生態系統中。AI 在你的集成開發環境(IDE)中生成可用的代碼,圖像生成在 Figma 或 Photoshop 中應用,甚至 Discord 機器人也成為將生成式 AI 注入數字/社交社區的工具。 此外,還有一些獨立的生成式 AI 網絡應用程序,如用于文案寫作的 Jasper 和 Copy.ai、用于視頻剪輯的 Runway 和用于記筆記的 Mem。
插件可能是開啟你自己的應用程序的契機,也可能是解決用戶數據和模型質量這個先有雞還是先有蛋的問題的精明方法(你需要通過分發來獲得足夠的使用率和數據,以改進你的模型;你也需要好的模型來吸引用戶)。我們已經看到,這種分發策略在其他市場類別,如消費/社交領域,已經取得了成功。
3. 互動范式
如今,大多數生成式 AI 演示都是“一次性”的:你提供一個輸入命令,機器立刻生成一個輸出結果,你可以選擇保留這個輸出或者丟棄它再嘗試一次。越來越多的模型正在使用這種迭代模式,你可以利用輸出結果來修改、完善、提升和產生變化。
如今,生成式 AI 輸出結果被用作原型或初稿。這些 APP 善于提出多種不同的想法,推動創意進程(如給 logo 或建筑設計提供不同選項),也善于輸出初稿,而這些初稿需要用戶精雕細琢才能達到最終狀態(如博客文章和自動生成的代碼)。隨著模型變得越來越智能,依賴于用戶數據的部分或許會減少,我們應該期待這些草稿變得越來越好,直到它們好到可以當最終的成品來使用。
4. 持續提升的行業領導力
最優秀的生成式 AI 公司,通過在用戶參與/數據與模型性能之間不斷執行的飛輪機制,創造持久的競爭優勢。要取得勝利,團隊必須通過以下步驟來啟動這一飛輪:
讓用戶全情投入地參與和使用 → 將更多的用戶數據和反饋轉化為更好的模型性能(改進提示、模型微調、用戶選擇作為標記的訓練數據)→ 利用優秀的模型性能來推動更多的用戶增長,提升用戶參與。
這些公司很可能會專注于特定的問題領域(例如編程、設計和游戲),而不是試圖滿足所有人的需求。他們在初期可能會深度集成到應用中,以利用杠桿和分發優勢來快速迭代,隨后嘗試用 AI 本地工作流程取代現有的應用程序。構建這些應用并正確積累用戶和數據需要時間,但我們相信最好的應用將會是持久的,并有可能發展成為龐大的平臺。
盡管生成式人工智能潛力巨大,但在商業模式和技術方面仍有許多問題需要解決。版權、信任與安全以及成本等重要問題還遠未解決。
生成式人工智能仍處于起步階段。平臺層剛剛起步,應用領域才剛剛開始拓展。要明確一點,我們不需要大型語言模型去寫一部像托爾斯泰的小說那樣的作品,那不是充分利用生成式 AI 的方式。當前這些模型已經足夠好,可以用來撰寫博客文章的初稿,生成 LOGO 和產品界面的原型。在不遠的將來,進入 AI 大模型的發展中期,將會有大量有價值的創造出現。
當前生成式 AI 應用還處于初期階段,有點像 iPhone 剛推出時的手機應用場景——有些花哨且內容不足,競爭差異和商業模式尚不明確。然而,這些應用中的一部分,替我們管窺了未來的發展趨勢。一旦見識到 AI 生成復雜的功能代碼,和絕妙的圖景,很難不想象未來 AI 在我們的工作和創造中成為基本角色。如果我們敢于想象幾十年后的未來,可以輕松想到生成式 AI 深刻地融入到我們的工作、創造和娛樂方式中:自動編寫的備忘錄;可以 3D 打印你能想象到的任何東西;從文本到皮克斯電影;類似 Roblox 的游戲體驗,能夠迅速生成我們夢想中的豐富世界。雖然這些體驗今天看起來像科幻,但進步的速度極快,最初性能有限的大語言模型在幾年內發展到足以自動生成代碼,如果我們繼續保持這種進化速度,并遵循“大模型摩爾定律”,那么這些遙遠的場景,就會成為可能。
歡迎關注作者的微信公眾號:潮矽
文章來源:https://www.sequoiacap.com/
作者:SONYA HUANG、PAT GRADY 和 GPT-3
編譯:陳困困
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
發評論!每天贏獎品
點擊 登錄 后,在評論區留言,系統會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯系我們
AI輔助海報設計101例
已累計誕生 737 位幸運星
發表評論 為下方 2 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓