近日,快手發布了國內首個效果對標 Sora 的視頻生成大模型「可靈」,并已在其旗下的快影App中開放邀測體驗。
可靈大模型是由快手 AI 團隊自研,采用了類似 Sora 的技術路線,并結合了多項自研創新技術。該模型具備強大的概念組合能力和想象力,能夠生成具有大幅度合理運動的視頻,并模擬物理世界特性。其生成的視頻分辨率高達1080p,時長最高可達2分鐘(幀率30fps),且支持自由的寬高比。
可靈大模型不僅限于文生視頻功能,還將推出其他應用,如“AI舞王”和“AI唱跳”,這些應用可以驅動表情和肢體動作,僅需一張照片就能生成相應的視頻。
目前,可靈大模型已在快影App中正式開啟邀測,支持720p視頻生成,豎版視頻生成能力也即將開放,大家可以來試一試,看看生產的效果怎么樣!
官網地址:https://kling.kuaishou.com/
給大家分享一個超好用的短視頻制作 AI 神器:GlatoAI。特別適合那些想快速給產品做介紹的自媒體小伙伴們,還有想第一時間get新產品信息的商務大哥大姐們。
你只需把鏈接往上一貼,不管是文章、產品頁還是啥網頁鏈接,GlatoAI 都能秒速分析,然后給你做個配套的短視頻廣告。視頻里啥都有,包含講話的人物+語音+字幕。
就這么簡單,不需要你費太多腦筋。趕緊試試吧,真的超好用哦!
如果對效果不滿意,還可以在以下方面進行更多的調整: 1. 修改名稱、上傳標志、產品描述、期望持續的時間、額外的介紹信息 2. 除了自動收集鏈接中的圖文視頻之外,也可以選擇自行上傳更多信息 3. 從多個備選的視頻腳本中進行篩選 4. 更改不同的數字人形象(性別、年齡、拍攝背景等等)
官網地址:GlatoAI
騰訊發布了 ToonCrafter,是一種新型的卡通動畫生成技術,可以通過生成插值方法生成自然、連貫的卡通動畫中間幀。該技術超越了傳統基于對應關系的卡通視頻插值方法,能夠處理復雜的非線性運動和遮擋問題,使動畫過渡更加平滑自然。
從演示來看效果很好,過渡很順滑,而且沒有明顯問題。ToonCrafter 利用預訓練的圖像到視頻模型,可以插值兩幅卡通圖像,并根據參考圖像對動畫草圖自動上色。它支持生成最多16幀的視頻,每幀分辨率為512x320。通過減少DDIM步驟,可以降低推理時間。
還設計了一個靈活的草圖編碼器,使用戶能夠對插值結果進行互動控制。
項目地址:ToonCrafter
就在剛剛,著名生成式 AI 音樂平臺 Elevenlabs 在官網發布了全新功能,文本可直接生成各種逼真音樂特效。
這項技術對于電影、游戲、短視頻等行業非常有幫助,因為它可以簡化尋找音效的過程,并且多數音效已經獲得了 Shutterstock 的商業授權。
Elevenlabs 的這個新功能允許用戶通過描述來生成音效,例如汽車呼嘯而過的聲音、刀劍碰撞的低沉聲音或小提琴劃過空氣的尖銳聲音。用戶可以登錄 Elevenlabs 的官網,選擇 “Sound Effects” 并使用該功能。在生成音效之前,用戶可以設置音效的時長和文本提示的還原程度。Elevenlabs 還提供了一些示例音效,如雷雨天氣的聲音和模仿獸人聲音的搖滾音樂。
Elevenlabs還提供了語音克隆和文本轉語音的功能,但目前對中文的支持較差,生成英文的效果則非常棒。
現在所有用戶都可以免費試用 Elevenlabs 的這個新功能。大家可以訪問 Elevenlabs 官網了解更多詳情。
今天我要推薦的網站,能為你提供未來感十足的AI網站生成體驗!
Framer 由Koen Bok和Jorn van Dijk于2014年創立。他們曾在Facebook和Hype進行產品設計和開發,看到現有設計工具無法滿足創建復雜互動原型的需求,于是創立了Framer。當下,Framer已經成為設計和開發領域的重要工具。
雖然在實時協作和矢量設計方面,Figma等競爭對手更具優勢,但Framer憑借其在互動原型和動畫方面的強大功能,保持了在設計工具市場中的重要地位。
? Framer亮點 ? ① 無代碼設計:你無需編程基礎,通過拖放組件即可創建復雜的交互效果。 ② 實時協作:多人同時編輯和評論,團隊合作更加高效流暢。 ③ 自動化設計:智能布局和響應式設計功能,讓你的作品在任何設備上都完美呈現。這也是最打動我的一點?,F在大大小小的設備太多了,能做到多端適配,簡直感動到哭。 ④ 豐富的模板和組件:海量模板和UI組件庫,助你快速啟動項目,節省時間。 ⑤ 高保真原型:從靜態設計到動態原型,一氣呵成,完美展示用戶體驗。
官網地址:Framer
昨天(5月30日)凌晨,OpenAI 在 x 平臺宣布,GPT-4o 多模態能力向所有用戶免費開放。不過,在使用次數上官方沒有更新公告,預計還是會是有一定次數限制。
北京時間 5 月 14 日凌晨,OpenAI 舉辦發布會,帶來了 GPT-4o 。該模型打通了文本、圖片、視頻和語音輸入,無需中間轉換,互相之間就可以直接生成。此次發布會還帶來了更智能的實時語音助手,以及適用于 macOS 的 ChatGPT 桌面應用程序。
當時,OpenAI 宣布向 ChatGPT Plus 和 Team 用戶推出 GPT-4o,很快就會向企業用戶推出。同時,也向所有人開放 GPT-4o 多模態能力,但有使用次數限制。
隨著今年WWDC的臨近,記者 Gurman 在其最新一期《Power On》專欄中,為我們揭秘了蘋果在人工智能領域的最新進展。蘋果將對其智能助手Siri進行升級,新版本的Siri將依托于蘋果自主研發的LLM技術,為用戶提供更為智能的服務。
除此之外,蘋果還將在多個方面引入AI技術以增強用戶體驗,例如通過AI技術實現語音備忘錄的自動轉錄、照片的智能修飾,以及Spotlight和Safari搜索功能的優化。而且,AI還將能夠根據用戶的短信內容,動態生成個性化的表情符號。
在個性化界面方面,蘋果也做出了創新。用戶將能夠擺脫網格的限制,自由地在屏幕上擺放圖標,并可以自定義圖標的顏色,這一改進雖與AI無直接關系,但無疑將極大地提升用戶體驗。
同時,有消息稱蘋果將在即將到來的 iOS 18 和 macOS 15 系統中,為 Safari 瀏覽器加入一系列人工智能支持的新功能。
1、智能搜索。 蘋果可能在搜索中引入 Ajax 語言模型來提供文本摘要。
2、Web橡皮擦:這一功能強調用戶界面的簡化和隱私保護的增強,允許用戶自定義網頁內容,刪除不需要的元素,如廣告和圖片。
3、用戶界面更新:蘋果正在將 Safari 的關鍵工具集中到一個位置,以提高用戶的訪問效率。
4、 AI增強的視覺查找:蘋果可能在2025年推出高級視覺搜索功能,允許用戶通過圖像獲取信息,類似于 Siri 目前識別照片中的植物、寵物和地標的功能。
這些新功能的加入,將使Safari瀏覽器的使用體驗更上一層樓,你覺得哪項最實用呢?
今天凌晨,微軟帶來了一系列重磅產品,一口氣發布了 50 多項更新。
發布會上,微軟 CEO Satya Nadella 談到了關于現代計算的兩個夢想。一個是計算機是否可以理解我們,而不是我們必須理解計算機?第二個是在這個信息不斷增加的世界里,計算機能否幫助我們根據所有這些信息進行推理、規劃和更有效地采取行動? 從 AI 基礎設施的搭建,到模型產品的落地,微軟在尋找答案的過程中,逐漸成長為一個全方位的 AI 解決方案提供商。今夜過后,或許我們都得重新審視微軟這個巨頭。
發布會要點速覽: 1、Team Copilot ,從個人助理變成團隊助理 2、全新的 Agent 代理功能 3、Phi-3 家族迎來新成員 4、Azure AI Studio,包含 API 集成、完整的工具鏈及部署全家桶 5、Fabric 大升級,推出實時智能(real-time intelligence) 6、專為云端規?;瘧眯阅軆灮?Cobalt 芯片
發布會更多詳情:https://mp.weixin.qq.com/s/MoHPci4JAb25ifDhMwUWiQ