OpenAI,昨晚發(fā)布他們的文生視頻大模型Sora,如果用三個(gè)詞來總結(jié)Sora,那就是“60s超長長度”、“超強(qiáng)語義理解”和“世界模型”。
首先是60s一鏡到底,不止主人物穩(wěn)定,背景里面的人物都穩(wěn)定的難以置信。從大中景無縫切換到臉部特寫。
第二個(gè)是單視頻多角度鏡頭,現(xiàn)在的AI工作流都是單鏡頭單生成,一個(gè)視頻里面有多角度的鏡頭,主體還能保證完美的一致性。
還有很重要的一點(diǎn)是,Sora是能夠理解和模擬現(xiàn)實(shí)世界的模型的基礎(chǔ),我們相信這一功能將成為實(shí)現(xiàn)AGI 的重要里程碑。