Github 上的一個名為 OpenVoice 的 AI 語音克隆項目爆火,該項目由 myshell-ai 開源,僅開源了不到三周,就有了 6.1k 的 star。
OpenVoice能對聲音風格的精細控制,包括情感、口音、節奏、停頓和語調,同時能夠復制參考發言者的音色。
主要功能: - 準確的音色克隆:OpenVoice能夠精確地克隆參考音色,并在多種語言和口音中生成語音。 - 靈活的聲音風格控制:用戶可以控制生成語音的情感和口音,以及其他風格參數,如節奏、停頓和語調。 - 零樣本跨語言聲音克隆:OpenVoice可以在未包含在大規模多語言訓練集中的任何語言之間進行聲音克隆。
試玩地址: https://github.com/myshell-ai/OpenVoice
WonderJourney 是斯坦福與谷歌打造,而且這個項目有點厲害啊,只需要1張圖片就可以創建3D場景動畫,從用戶提供的任何位置(通過文本描述或圖像)開始,并通過一系列不同但連貫的 3D 場景生成一個旅程。從演示效果來看非常流暢,3D游戲或者影視的場景創建要變簡單了。
主要能力: ◆ 從任意位置(由文本或圖像指定)開始,WonderJourney 沿著相機軌跡生成一系列多樣化但連貫連接的 3D 場景。 ◆ 從同一個地點開始,WonderJourney 可以生成一組不同的“奇妙旅程”,并在不同的目的地結束。使用相機姿勢的軌跡渲染下面的每個視頻。 ◆ WonderJourney 還可以根據一系列文本描述(例如詩歌、俳句和故事摘要)生成受控的奇妙旅程。
大家有刷到這張蒙娜麗莎做瑜伽的動圖嗎?
這是用字節跳動最新發布的 MagicAnimate 生成的,這個AI視頻工具和昨天給大家分享的阿里 Animate Anyone 創新視頻生成技術一樣,只需一張圖片即可生成平滑穩定的視頻。更離譜的是,字節 MagicAnimate 還支持與文本結合創建動畫,并支持多人照片合成。
MagicAnimate 是新加坡國立大學和字節跳動聯合推出的「人體圖像動畫生成器」,能夠把指定的人物圖片按照既定動作序列生成視頻。其主要功能特點包括時間一致性動畫,該框架通過運動序列使參考圖像動起來,并確保動畫在時間上的連貫性,呈現自然流暢的動作,避免突兀的變化。
同時,MagicAnimate在動畫化過程中能夠保持對原始參考圖像的高度忠實度,確保動畫中的人物或對象與原圖保持一致。
感興趣的小伙伴可以關注起來,現在國產AI工具已經慢慢開始發力了,大家可以期待一下功能更強大的國產AI工具!
Genspark 近日推出全新AI幻燈片工具,通過人工智能簡化專業演示文稿的創作流程。讓PPT創作從「熬夜爆肝」變成「一句話搞定」!
該工具能夠快速整合復雜多格式數據、自動生成綜合報告,并支持交互式修改與多樣化藝術風格,以下是其核心亮點:
1?? 多格式智能整合:PDF/Excel/Word/視頻鏈接一鍵上傳,自動提取數據生成結構化內容,財務報表、學術論文秒變可視化圖表。 2?? 交互式自然語言編輯:動動嘴就能調整——“合并圖表”“添加背景音樂”,AI實時響應修改,排版布局隨心換。 3?? 藝術風格秒切換:從畢加索抽象風到《The Verge》科技感,封面設計告別模板撞款,品牌調性輕松拿捏。 4?? 企業級深度應用:10分鐘生成學術報告(含引文+摘要),5小時視頻轉PPT自動配動態圖表,教育培訓、營銷策劃效率翻倍。
?? 適用場景: - 打工人:季度匯報、競品分析一鍵出方案 - 學術黨:論文轉會議PPT,引文自動生成 - 創意人:品牌提案秒變藝術大片
試玩地址:https://www.genspark.ai/
這個瓜屬實有點夸張啊,是的你沒看錯,一家AI編程的公司,沒有智能AI,全是印度程序員冒充的! AI編程公司Builder.ai的創始人兼前CEO——Sachin Dev Duggal。他不僅造了個「全是人工,沒有智能」的假AI公司 從軟銀、微軟等巨頭手里騙到了數億美元融資,估值干到15億,而且還敢對投資人虛報300%的營收
更勁爆的是,這一騙愣是堅持了8年。 為什么一家公司能夠在如此長的時間內,掩蓋自己的真實面目?
來源:https://weibo.com/ttarticle/p/show?id=2309405170214773063752