終于有AI視頻模型,解決了體操難題!

前天 MiniMax 的 M1 文章里,我說 MiniMax 得掏一個視頻模型出來吧。

于是,果然,前天深夜,他們發了 Hailuo 02。

終于有AI視頻模型,解決了體操難題!

這個模型,前天深夜還不能用,還沒正式上線,但是放了預告片。

他們的預告片,給我看的雞皮疙瘩起來了,我給大家看一眼。

當視頻在手機上無法加載,可前往PC查看。

不是,這真的太離譜了,第一次,見到能生成雜技動作的 AI 視頻模型,這個肢體表演和動作幅度,你們可以去 Veo3 之類的試試,是完全達不到的。

我轉完朋友圈,朋友都驚了...

終于有AI視頻模型,解決了體操難題!

直接沖著所有視頻模型的弱點開大。。。

所有人其實都知道,體操,被譽為 AI 視頻的圖靈時刻。

誰能解決體操的視頻生成問題,誰就是真神。

而雜技的難度,也僅次于體操了。

所以昨天白天 Hailuo 02 上線了之后,我就直接做了一波新鮮的測試。

比如上周末,我二刷了《碟中諜 8》。

雖然前面的文戲又臭又長讓人犯困,但到了熟悉的動作戲段落,看到阿湯哥又是潛入深海又是高空扒飛機,我還是真情實感地喊出了牛逼。

一個六旬老人,兢兢業業跑了三十年,不顧安危,一直用血肉之軀挑戰 mission impossible,就為了讓你在銀幕上看到最炸裂的視覺效果,我想不出比這更熱血的事了。

那時候我在電影院里還在感慨,扒飛機這樣的動作,雖然危險,但還是得真人上,AI 恐怕是做不來。

但是,當 Hailuo 2 上了之后。。。

什么,你說 AI 沒法扒飛機?沒法下潛艇?

你把這個片段把水印去掉,發給一個不是特別了解 AI 的人看,這誰看誰懵逼好吧。

而且這個動作的幅度、絲滑度,完全沒有很多模型為了穩,其實做的全是慢動作的那種感覺,而是真的就像真實世界的表演一樣。

我覺得普通的肢體表演,真的難不倒他了。

所以,直接上圖靈測試吧。

跳體操。

先給大家看看一年前,第一個 DiT 架構的視頻模型 Luma AI 上線的時候,生成的 AI 跳體操的視頻。

對,這是一年前。

視頻里面,運動員的四肢在空中扭曲變形。這段由 Luma 生成的視頻不僅讓近百萬網友圍觀,還讓包括 LeCun 在內的 AI 大佬們吵得不可開交。

我們再來看看,一年以后,模型在進化到今天的時候,各家的跳體操。

英文版提示詞:A gymnast launches off the high bar, does two full spins, and catches the bar again. The camera whips and tilts to capture the arc.

中文版提示詞: 一位選手從高杠躍出,完成兩次空中旋轉后再次抓杠。攝影機快速搖攝并傾斜捕捉軌跡。

前方高能預警(絕無拉踩之一,只是單 case 對比)。

這是 Veo3。

就很魔幻,運動員一碰到墊子就碎掉了,然后頭變成腳,腳變成頭。

這是可靈。

運動員先是以一種反重力的方式上了杠,然后開始用魔法讓杠變形變長。

這是即夢。

整體已經還好了,就是后面出現了,雙頭怪。

當然,上面幾個都還沒有那么離譜。

最離譜的是 runway 這個。

運動員的形體像面條一樣拉長,然后在空中開始抻面。

不是,哥們,這也太抽象了。。。

接下來,有請主角登場,Hailuo 02。

只能用一個詞評價,那就是優雅。

不過這里需要坦白的講,這段視頻,我 roll 了 3 次,才得到一個 OK 的效果。

但問題在于,我 roll 了 3 次,roll 出來了。

像 Veo3,我積分都 roll 爛了,是真 roll 不出來啊。。。

再來看一個好玩的,跳馬。

我就直接把各家的,放到一起了,看看這不顧死活的美。

再看看 Hailuo 02。

絲滑,一種奇妙的爽感。

還有體操,不是原地起跳一下,而是有助跑,有謝幕動作。鏡頭運動也很到位。

雖然有些小動作還是比較詭異的,比如開頭的小跳,還有空中的時候手也抽了一下,但是整體效果,已經好很多了。

還有雙杠倒立,真的酷。

在復雜動作上的肢體表現上,真的吊打一眾視頻模型。

這真的是第一次,有 AI 視頻,解決了體操這個圖靈測試了。

我之前一直在說 AI 視頻的難點不是畫面,而是運動。

靜態畫面誰都能出奇制勝,但讓一個動作真實發生,并且被流暢捕捉,這是另一個維度的挑戰。

不止體操,雜技,我也讓它生成了一些。

比如這個小丑在大球上拋球然后倒立的動作,只有海螺能夠做到,先拋球,然后,真正完成一個倒立的動作。

我先給大家看個這個動作最抽象的,來自 Runway Gen4,先確保你沒有在喝水或者吃東西,再往下看,我怕你嗆著自己。

不是,Runway 這玩意,怎么這么爛啊。。

真的太抽象了。

hailuo 則穩的一筆。

其實我試這個 case 之前沒覺得倒立有這么難,畢竟又沒有像體操一樣需要高速移動,沒想到試出這么神奇的結果。

以后做復雜動作測評,要加上倒立這一項了。

然后是猴子走鋼絲。

給它的動作設定是:先走完鋼絲,然后從柱子上爬下來,最后站在舞臺上,觀眾鼓掌。

每一個動作,它都完成了,沒有落下什么。

海獅頂球,然后躍入水中。

一個雜技演員拿著紙傘,在鋼絲繩上輕盈地走著。

一個雜技演員在跳板上完成一系列動作之后,準確地倒立在另一個演員之上。

準確是非常準確,物理規律也非常的到位,就是你最后稱的地方。。。

哥們的頭是真鐵啊= =

以上,基本上都是文生視頻,roll 也沒有超過 3 次,就能達到這個效果。

除了這次整個人物肢體動作的史詩級進化之外,hailuo 的表演,也一直是所有模型領域里,獨樹一幟的。

當年 hailuo 01 的時候,在全球一統江湖,就是因為他們超級牛逼的情緒表演。

而這一次,在表演的基礎上,加上巨幅的人物動作,超牛逼的物理效果,hailuo 的表演,真的達到了登峰造極的水平。

多說無益,直接給大家,看一些超級棒的例子。

一個大型機甲從天而降,胸口寫著 hailuo2。

濃煙中,消防員登上梯子,砸破窗戶。

這個 case 是最離譜的,因為,我沒想到,他真的砸碎了玻璃,玻璃渣還掉了下來,我當時看到,我人都麻了。

我真的想說:

啊????????????

一個小偷被人發現,狼狽逃竄,還摔了一跤。

最后真的摔了一跤,是我萬萬沒想到的。。。

兩個舞女展示"hailuo2.0"字樣。

從一個女人悲傷的瞳孔中看到了戰火連天。

一名拉拉隊員將隊友拋向空中,隊友翻轉兩次后完美接住。鏡頭向右平移并向上傾斜。

一名棒球投手投出快速曲線球。

這可能是最近兩個月以來,我用的,最心潮澎湃的 AI 視頻模型。

太爽了。

你讓它在同一場景下連續做幾個動作,再配上鏡頭運動,它也能滿足你。

網址在此:https://hailuoai.com/

在下方生成的時候,選用 Hailuo 02 模型就行。

終于有AI視頻模型,解決了體操難題!

而且,也終于支持原生 1080P 了。

終于有AI視頻模型,解決了體操難題!

最主要的是,Hailuo 也是真的便宜。

新人有 500 的免費積分,而生成一個 768p 的六秒視頻只需要 25 積分,1080p 也只需要 80 積分,768p 的 10 秒視頻是 50 積分。

終于有AI視頻模型,解決了體操難題!

只能說,便宜又大碗。

作為第一個通過 AI 視頻領域的體操難題的玩家,這個價格,我只能說。

海螺,牛逼,minimax,牛逼。

人終有老去的一天。

阿湯哥三十年的職業精神,成就了電影史上的傳奇。

而如今,AI 也許同樣可以用自己的方式,以另一種傳奇書寫歷史。

那些我們曾經以為 AI 不可能攻克的視覺難題,一個接一個地被打破。

人間一天,AI 一年。

這樣的時代,真好。

收藏 7
點贊 36

復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。