大家好,這里是和你們一起探索 AI 的花生~
之前推薦過 AI 無痕翻譯視頻的相關(guān)內(nèi)容,它的實現(xiàn)條件包括文本內(nèi)容的準(zhǔn)確翻譯、人物語音克隆及嘴型匹配。今天我們就來看一款效果非常不錯的 AI 語音克隆工具 Speaking AI,它可以將文本轉(zhuǎn)為如真人說話一般自然的語音,還支持用戶免費克隆自己的聲音。
上期回顧:
網(wǎng)站直達: https://speaking.ai/
Speaking AI 是一個初創(chuàng)公司,創(chuàng)始人為 Harry Zheng,其團隊成員也都是中國人。公司創(chuàng)立的初衷是堅信對話式生成語音代表著人類與人工智能之間的未來接口,他們希望讓語音克隆聽起來更加自然,為人與人工智能之間的互動方式帶來根本性改變。
Speaking AI 目前有兩項主要功能:文本轉(zhuǎn)語音和語音克隆,其中語音克隆功能尤其出色,能做到接近真人說話的效果。 先來看一下其官網(wǎng)上的語音克隆案例:
視頻中第一段播放的是 Taylor Swift 的原聲,第二段播放的是克隆出來的語音,可以發(fā)現(xiàn)二者在音色上幾乎沒有差別,也就是說 Speaking AI 可以完美還原一個人原本的聲音。更厲害的是,在克隆語音中我們能聽到真人說話時常見的“呃”“啊”這樣的語氣詞和一些停頓,這些內(nèi)容在文本中并沒有體現(xiàn),是 Speaking AI 在合成過程中自動加入的,這能讓語音克隆的效果更真實自然。
Speaking AI 目前支持中文和英文的文本轉(zhuǎn)語音,另有 5 款名人語音模板供用戶選擇。此功能目前是免費的,使用人數(shù)較多時需要排隊。下面是我用成龍的聲音合成的中文內(nèi)容,效果很不錯,我自己聽著都覺得好神奇。
Speaking AI 支持用戶克隆自己和他人的聲音,你可以選擇在線錄制 10 秒的音頻,或者上傳本地音頻文件,然后進行實時轉(zhuǎn)換,操作起來非常方便。錄制時說話的情緒和語調(diào)會影響最終的合成效果,Speaking AI 的模型也會根據(jù)文本內(nèi)容自主選擇合適的情感基調(diào)。
注意:上傳他人的聲音時需要獲得對方的同意,并且不能將合成的語音用于任何非法、欺詐和有害目的。
據(jù)創(chuàng)始人介紹,目前 Speaking AI 還處于 V1 模型,算是一個試玩 Demo,性能比較有限,這種情況會在未來幾周內(nèi)得到改善。官方已經(jīng)在研發(fā) V2 模型,它將支持更多不同的語言,語音克隆速度會更快,質(zhì)量也會更高。
除了今天推薦的 Speaking AI,目前市面還有很多成熟的 AI 語音生成應(yīng)用和開源工具。
比如一直比較受關(guān)注的 Elevenlabs,幾分鐘就能克隆用戶個人聲音并合成新的語音,支持將文本轉(zhuǎn)換為中文等 28 種語言,并能以不同的情緒演繹,目前上線了視頻自動翻譯配音功能。Elevenlabs 在翻譯、電影游戲/配音、有聲書制作、聊天機器人對話上有廣泛應(yīng)用,它的文本轉(zhuǎn)語音功能可以免費使用,進入官網(wǎng)后注冊賬號就能體驗。
網(wǎng)站直達: https://elevenlabs.io/
國內(nèi)的網(wǎng)易有道技術(shù)團隊則在 11 月份開源了自研的語音合成(TTS)引擎「易魔聲」,目前支持中英文雙語,包含 2000 多種不同的音色。易魔聲也支持情感合成功能,可以合成如快樂、興奮、悲傷、憤怒等不同感覺的語音。其 Github 主頁中有官方提供的 Web 界面及批量生成結(jié)果的腳本接口,安裝后就可以免費使用。
Github 主頁: https://github.com/netease-youdao/EmotiVoice
我最近還在網(wǎng)上看到一個新的 AI 音樂合成工具 Musicfy AI,它可以將人聲哼唱轉(zhuǎn)化為不同類型的樂器伴奏,非常有意思。這可能會改變傳統(tǒng)的編曲工作流,人們可以輕松地用聲音進行音樂創(chuàng)作,對音樂感興趣的小伙伴可以嘗試一下。
網(wǎng)頁直達: https://musicfy.lol/
好啦以上就是本期為大家介紹的 AI 語音克隆工具 Speaking AI,喜歡本期內(nèi)容的話記得點贊收藏支持一波,之后會繼續(xù)為大家?guī)砀?AI 繪畫干貨知識~ 也歡迎大家掃描下方的二維碼加入“優(yōu)設(shè) AI 繪畫交流群”,和我及其他 設(shè)計師 一起交流學(xué)習(xí) AI 知識。
我最新制作的《AI 繪畫入門完全指南》已經(jīng)上線,這是針對零基礎(chǔ)人群的 AI 繪畫入門課程,可以幫你快速掌握目前最熱門的 2 款 AI 繪畫工具 Midjourney 和 Stable Diffusion,說不定之后你也可以用它們結(jié)合 Krea.AI,進一步優(yōu)化自己的創(chuàng)作流程,提升工作效率。
課程鏈接: 零基礎(chǔ) AI 繪畫入門完全指南 (uisdc.com) (錄播+課程群輔導(dǎo))
課程內(nèi)容:
- Midjourney 零基礎(chǔ)入門教學(xué)。從網(wǎng)站注冊和軟件使用介紹開始,分文本提示詞、圖像提示詞、后綴參數(shù)、命令設(shè)置 4 個部分,全面講解 Midjourney 的用法,從底層邏輯去理解如何控制出圖效果,并結(jié)合案例分享多個冷門小技巧;
- Stable Diffusion WebUI 系統(tǒng)入門教學(xué)。 也是從軟件安裝開始,講解 Stable Diffusion WebUI 的各項功能和使用技巧,幫你掌握圖生圖、文生圖功能以及當(dāng)下最熱門的控制插件 Controlnet。
- 各類實用工具、提示詞資源、AI 效率神器分享,附贈我的個人 midjourney 提示詞庫;
- 有關(guān)于 AI 繪畫發(fā)展歷程的梳理和 Stable Diffusion 開源生態(tài)體系的介紹,幫初學(xué)者補全信息差;
- AI 繪畫版權(quán)問題解析,幫使用者避開潛在風(fēng)險,保護自身權(quán)益。
推薦閱讀:
復(fù)制本文鏈接 文章為作者獨立觀點不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。
熱評 冒煙的啵板糖