最近AI視頻生成領(lǐng)域真的是大招頻頻啊~~最開始是Runway發(fā)布了 Gen-2,Pika 1.0接踵而至,而google前不久剛發(fā)布了多模態(tài)模型Gemini,現(xiàn)在Google繼續(xù)放大招,發(fā)布了一個基于大語言模型的視頻生成技術(shù):VideoPoet
這款 LLM 應(yīng)用可以執(zhí)行多種視頻生成任務(wù),例如文本生成視頻、圖像生成視頻、視頻風(fēng)格化以及修補(bǔ)和擴(kuò)展功能,甚至視頻到音頻的轉(zhuǎn)化 VideoPoet 都能勝任。
這一次是對多模態(tài)大模型革命性的推動,大家覺得呢?