2024/01/05

視頻生成領域的 “ChatGPT 時刻”,什么時候會到來?

今年接觸了太多 AI 工具了,AI 繪畫的先不說,光是視頻生成就已經讓我震驚不已。今天刷到了一個 VideoPoet 作者的專訪,分享的一些關于視頻生成領域的觀點非常有意思,其中關于視頻生成領域的 “ChatGPT 時刻”的解讀前瞻性十足,大家感興趣的可以了解一下!

以下是引用:
“ 視頻生成的“ChatGPT 時刻”,我覺得大概是,哪怕模型生成的還是比較短的片段,比如 2-5s,但這個生成是可控的,人類也很難分辨是 AI 生成還是人類制作。從用戶角度,只需要幾美分的代價,就能獲得一個可以被送到好萊塢專業 studio 的樣片。如果類比的話,可以類比到圖像領域 stable diffusion 1.x 或 2.x 版本,肯定還有再提升的空間,但已經到了能使用的程度,而且能激發很多應用。

我的預測是,到 2024 年底或 2025 年初,我們可能會到這個時刻。并且我認為,實現這個時刻肯定也需要 diffusion 參與,并且 diffusion 在未來一段時間,比如 1 到 2 年內,可能仍然是主流,扮演很重要的角色。這里說的 diffusion 已經包含了 transformer。

“ChatGPT 時刻”意味著模型到了一個相對穩定的階段,但后面還會再改,只不過是在這個基礎上做小的改動,可能一開始版本只能做到逼近好萊塢,有一些缺點,但可以商業化運用了,但要達到真正穩定需要更長時間。隨后還可能仍會迭代升級。

現在市場上所有的視頻生成都達不到這個標準,所以我認為視頻生成的方法可能還需要進一步迭代,有可能要達到“ChatGPT 時刻”需要新的模型和方法,它不一定是全新的模型或者架構,可能是現在市場上的某個技術路線或者方案再往前走一步。”

收藏 關注話題 點贊 37 生成海報

視頻生成領域的 “ChatGPT 時刻”,什么時候會到來?

生成問答海報 我要提問 我來回答