劉謙Designer 邀你回答

2024/03/04

谷歌推出生成交互大模型 Genie，一張草圖直接生成視頻游戲！

近日，谷歌DeepMind的研究人員推出了，首個無需數據標記、無監督訓練的生成交互模型——Generative Interactive Environments，簡稱“Genie”。

Genie是一個具有110億參數的模型，它能夠根據圖像、真實照片甚至草圖生成可控制動作的視頻游戲。這個模型的特點是無需數據標記和無監督訓練，它通過3萬小時、6800萬段游戲視頻進行了大規模訓練，而且訓練過程中沒有使用任何真實動作標簽或其他特定提示。

Genie的核心架構使用了ST-Transformer（時空變換器），這是一種結合了Transformer模型的自注意力機制與時空數據的特性，有效處理視頻、多傳感器時間序列、交通流量等時空數據的方法。ST-Transformer通過捕捉數據在時間和空間上的復雜依賴關系，提高了對時空序列的理解和預測能力。

Genie的架構主要由三大模塊組成：
1. 視頻分詞器：基于VQ-VAE的模塊，將原始視頻幀壓縮成離散的記號表示，以降低維度并提高視頻生成質量。
2. 潛在動作模型：無監督學習模塊，從原始視頻中推斷出狀態變化對應的潛在動作，并實現對每一幀的控制。
3. 動力學模型：基于潛在動作模型學習到的動作關系，預測下一幀的視頻。

除了視頻游戲，你覺得 Genie 模型還能在哪些其他領域發揮作用？

AI神器 AI視頻人工智能谷歌設計

收藏 關注話題 點贊 15

立即查看 AI神器的解決方案

效果超棒！9 款免費好用的老照片修復和上色 AI 神器

AIGC AI上色閱讀 5.1w

查看詳情

優設問答有問必答 ?? 回答問題贏獎品

5分鐘閱讀

1分鐘閱讀

5分鐘閱讀

47分鐘閱讀

9分鐘閱讀

{{comTitle}} {{comSubtitle}}

菜單 優設網uisdc.com 優設網 - 學設計上優設

您還未登錄

登錄后即可體驗更多功能

劉謙Designer 邀你回答

立即查看 AI神器 的解決方案

AIGCAI上色閱讀 5.1w

Wo~本文的評論還空著，快來搶沙發

邀你回答

Adobe 推出 AI 音樂生成工具 Project Music GenAI Control，與現有的音樂創作軟件相比有哪些優勢和不同？

< 上一篇

3.9k 設計師圍觀了該問題

在工作中，你遇到過的最“坑爹”的設計需求是什么？

下一篇 >

陳子木

文軒沒有大腦袋

陳子木

程遠

京東JellyDesign

優設讀報 2025年07月07日 星期一

上周熱門文章：《5億人在用的淘寶，如何做好秒殺頻道設計？》

Figma 正式啟動美股上市程序，募資 15 億美元沖刺年度最大科技 IPO

AI 神器 Shortcut 顛覆 Excel 操作，說話生成報表提速 10 倍

英偉達 4 億美元打包收購 CentML，95 后華人團隊全員加盟

百度湖北總代理世紀百捷宣告破產，22年"躺賺時代"終結

近期熱門問題

到底上班多久才能在周一早上心平氣和？

9位設計師參與回答

每張圖中間距最窄線條對應的數字是？ 5秒內回答！

8位設計師參與回答

iOS 26 Beta大家千萬不要手癢更新，太丑了啊

6位設計師參與回答

各位設計師平時有培養一些其他的愛好嗎？

5位設計師參與回答

高考結束后要考慮填志愿了，用過來人的經驗說說，選專業時，你首先考慮的是什么呢？

4位設計師參與回答

馬上要填志愿了，大家預測一下今年藝術類什么專業最火？

4位設計師參與回答

優設官方微信群

添加管理員 招財

微信號: 掃碼添加

嚴格審核打造高質量交流群