5000字爆肝測評!五月 AI 資訊及實用測評合集

前言

想不想了解近期 AI 圈又發生了哪些勁爆大事件?趕緊來看這篇文章 get 第一手 AIGC 資訊和深度測評——沒錯,我們的AIGC 30天測評又和大家見面了。

如今各類 AIGC 工具平臺百花齊放,我們的測評致力于持續追蹤最新的 AI 技術進展,將 AI 圈內發生的重大事件與工具進行深度實測并匯總成文,定期發布帶給同學們,希望可以幫助大家快速了解最新的 AIGC 趨勢,并可以及時地將這些 AI 工具結合到工作、學習與生活中,運用 AIGC 將自己的生活變得更加豐富多彩!

此前,我們已經發布了第一期測評,如有需要各位同學可以點擊回顧。

另外與此前不同的是,本月我們對測評內容的篩選流程進行了升級。在持續大范圍監控 AIGC 大模型與工具平臺的上新/更新之外,我們還開始對不同 AI 工具的相似功能進行橫向對比測試,例如我們同時對 Remini 和 Midjourney 這兩個 AI 工具進行黏土風格圖像生成的測試,并最終總結出了成功經驗分享給大家,希望可以幫助大家先人一步地拓展相關的 AI 能力邊界,所以這篇文章大家一定要看到最后哦。

接下來,就讓我們來看看近期 AIGC 的最新進展吧!

第一章:近期 AI 圈大事件匯總

我們先來快速瀏覽一下近期 AI 圈發生的重要事件。每月的 AI 圈事件劃分為國內和國外,依次做整理陳述。為了保證內容的條理性,方便大家閱讀,我們用表格的形式呈現。順序為采集時隨機排列,排名不分先后。

第 1 節:國內篇

5000字爆肝測評!五月 AI 資訊及實用測評合集

第 2 節:國外篇

5000字爆肝測評!五月 AI 資訊及實用測評合集

第二章:近期重點 AI 產品實測

第 1 節:Remini

1)介紹概覽

Remini 的黏土風格濾鏡在今年的五一“重塑”了世界,相信各位同學都被它狂刷屏了吧?接下來,我們來看看 Remini 黏土濾鏡的功能實測,同時也為大家奉上可替代 Remini 的黏土風圖片制作方法,更方便設計師使用!

5000字爆肝測評!五月 AI 資訊及實用測評合集

2)產品實測

5000字爆肝測評!五月 AI 資訊及實用測評合集

Remini 的使用體驗是比較簡單和快速的。下載 app 打開后,Remini 會提供為期一周的免費試用(Remini 會在試用期截止后開始自動收取最低 4.99 美元/周的訂閱費用,所以如果不想繼續付費使用的話,大家一定要記得在后臺取消訂閱喔),之后在操作界面上選擇第一位的粘土風格,再上傳自己的圖片素材,等待十幾秒即可獲得轉換為可愛呆萌的黏土風格圖像了!

以上就是基礎的黏土風圖像制作的過程,不過作為專業的設計師,相信大家不會只滿足于此,所以接下來,我們為大家嘗試了黏土風進一步的探索——利用AI圖片生視頻的軟件制作黏土動畫。

目前市場上 AI 視頻生成軟件的選擇是比較豐富的,例如 Runway、Pika、VEED 等,在得到轉換為黏土風格的圖片后,我們可以將圖片導入 AI 視頻軟件直接生成對應的視頻。在這里我們就先以 Runway 為例,為大家演示一下黏土風圖像轉視頻的效果:

我們可以看到動起來的黏土風動畫的整體效果還是不錯的,這樣動態的呈現方式拓展了黏土風的使用場景,不論是面對設計師、運營從業者、自媒體博主等專業人群的工作需求,抑或用戶只是想為自己的照片增添獨特的魅力,這樣將原始圖像轉換為黏土風格再轉換為動畫的鏈路都能滿足。在此我們為大家拋磚引玉,各位同學可以基于此發散靈感,做更深入的探索。

那么回到 Remini 的效果測評,通過多次實測,我們發現適用于 Remini 黏土濾鏡的圖像特點:

① 除了已被大量驗證的真人圖片,Remini 對手繪插畫也可進行 3D 化的黏土濾鏡轉換;

5000字爆肝測評!五月 AI 資訊及實用測評合集

② 盡量選擇中近景,畫面色彩越豐富越好,更有趣味性和動畫感;

5000字爆肝測評!五月 AI 資訊及實用測評合集

③ 先把照片轉變成卡通風格,然后再用黏土濾鏡會更好看。

5000字爆肝測評!五月 AI 資訊及實用測評合集

與此同時,在使用中我們也發現 Remini 黏土濾鏡也不免存在 AI 生圖技術的一些共有缺點:

①? 對圖像內容的識別與判斷精準度有欠缺,無法處理好圖片中的文字信息;

② 會修改原圖內容;

③ 由于黏土濾鏡具有的手工感和粗糙感等特點,一些非常精致的細節無法做到 100%還原;

④ 同一張圖片素材每次只能生成一張對應的粘土風格圖片,如果不滿意只能退回到第一步重新開始。

5000字爆肝測評!五月 AI 資訊及實用測評合集

3)產品評價

總結來看,Remini 的黏土濾鏡使用門檻低,并且它的 AI 生成的黏土風格效果非常逼真和生動,所以對于日常個人使用還是很適合的。其次,盡管每款濾鏡都會有它或長或短的生命周期,但是我們在測評過程中發現,在短短的一周的時間里,Remini 從黏土風濾鏡已經拓展到了其它風格的濾鏡,甚至研發出了新的多重濾鏡搭配玩法——這個可能才是一個產品可以生存下去的基礎,用爆款做引子,引發用戶對產品的連鎖體驗和傳播。

不過,如果期待在這個風口上把 Remini 的黏土風格直接使用在設計工作中,因為其自成一派的手工感和“丑萌粗笨”風格導致物料可能需要人工后期調整,且 Remini 不支持對生成圖像進行修改或批量生成,這些缺點不適用于對畫面元素精準度要求高及執行效率要求較高的項目。看到這里,同學們可能感到有點心灰意冷,但是我們探索出了解決之道,大家請看下方詳解↓

4)設計師必看!復刻黏土風格教程

盡管黏土風刮得強勁,但 Remini 僅提供 7 天的免費試用期,試用期結束了就需要開通 4.99 美元/周的會員才能使用,并不便宜;而且很多非蘋果用戶的同學們根本用不上。所以,我們貼心地為大家準備了 Remini 的可替代方案——用Midjourney(以下簡稱MJ)也可以復刻出黏土風格圖像!

5000字爆肝測評!五月 AI 資訊及實用測評合集

我們的方法是用「墊圖+畫面描述+風格關鍵詞」這一公式來獲得原圖對應的黏土風格圖像。首先,先在 MJ 上傳原始圖片素材并拷貝它的鏈接,輸入“/imagine"后粘貼圖像鏈接地址,在后面描述畫面內容"a girl with brown long hair is talking to a cow on the grassland",再加上"clay animation style, 3D, vibrant color"這一組風格關鍵詞,并將 iw 值設定在 1.5 左右,即可獲得黏土風格的圖像。

5000字爆肝測評!五月 AI 資訊及實用測評合集

第 2 節. Heygen

數字人的熱度最近沒那么火熱了,但是依然有一些新的工具帶著更好的效果涌現,同時一些老牌的 AI 數字人工具也在不斷的提升自己生成質量,探索新的功能,今天就來講一下數字人領域的尖子生-Heygen。

1)介紹概覽

5000字爆肝測評!五月 AI 資訊及實用測評合集

2)產品實測

接下來,我們來依次看一下 Heygen 都有哪些功能——

3)基礎功能

① 先來看一下 Heygen 的基礎功能,不需要購買 PRO 服務,也就是有積分就可以使用的功能:圖片生成克隆人。只需要上傳一張圖片,輸入一段文字,接著可以選擇對應的語言及聲音風格,就能快速的生成一段真人說話的視頻。

這個功能整體生成的速度是很快的,最終的效果方面英文效果,要比中文的好一些;但能夠實現用圖片生成克隆人類似功能的市面上競品也很多,Heygen 在這方面沒有明顯的優勢,其中 D-ID,科大訊飛,都提供相似的功能,阿里的 EMO 和微軟最新的 VASA-1 的效果要更自然。

② 第二個要說的功能是視頻轉換語言,上傳一段講話的視頻,設置需要轉成的語言,就能快速生成一段嘴型準確的翻譯后的語言視頻。這也是之前霉霉說中文的視頻,所使用的功能。

視頻來源 x @AliceFerdi15857

這個功能轉換的效果是非常自然的,幾乎很難看出來是 AI 生成的。又因為這個功能不需要開通付費套餐,所以特別受歡迎。這樣的功能適合快速在不同的平臺上分發不同語言受眾的視頻。

4)高級功能

① 首先要提到的高級功能就是 Heygen 主要的視頻生成的克隆人,上傳一段 3-5 分鐘的人物的視頻,就能夠準確的復制外表,肢體語言、手勢動作和說話的聲音。生成不同的語言和文字內容的視頻,也支持自己上傳音頻。生成后的視頻效果可以說是業內頂尖的。

最厲害的是 Heygen 也是所有克隆人產品中,少有的能夠識別全身的肢體動作,克隆走路動作,生成一邊走一邊說的克隆人。真正的方便了內容制作者,不需要每次都錄制內容,只需要文字稿就能完成每期的視頻內容創作。

當視頻在手機上無法加載,可前往PC查看。

視頻來源:網絡

② 下面要講的一個高級功能是生成講解視頻,上傳一段 2-3 分鐘的視頻,就能夠定義企業專屬的人物形象,能夠配合需要講解的內容,在軟件中移動演講者的位置,輸入對應的文字內容,即可生成人物講解視頻。

視頻來源官網案例

這個功能適合做產品介紹。公司培訓視頻。新聞播報等需要講解的視頻內容。

這個功能一些數字人的競品也有,并且見到已經有很多落地的,有商品介紹視頻、景區介紹視頻 、新聞播報。

③ 最后要提到的這個功能就是高級功能-實時互動數字人

上傳一段視頻生成克隆數字人,或者使用之前生成的克隆人,加上大語言模型,就可以讓數字人和觀眾對話,實時渲染語音回答。支撐選擇知識庫,來讓數字人更好的回答細分領域的問題。(視頻錄屏有些卡頓)

功能實測

其實這個功能的簡版已經有很多落地實踐了,已經有了很多數字人的直播間,比如美團上很多團購的直播間,會使用數字人來直播,只是還沒看到能夠和觀眾的問題互動的功能。

第 3 節:通義聽悟 & 360AI 瀏覽器

這一節的選題是富媒體轉文字的 AI 工具,其中通義聽悟主打聲音轉文字(STT),360AI 瀏覽器主打視頻轉文字(VTT)。

① 介紹概覽_通義聽悟

5000字爆肝測評!五月 AI 資訊及實用測評合集

網址: https://tingwu.aliyun.com/home

② 產品實測_通義聽悟

在聲音轉文字的賽道,我們見過太多“實時會議記錄”和“音頻解析文字”的產品和工具,甚至早年的科大訊飛錄音筆就能干上面這兩件事,此處我們選擇通義聽悟作為被測對象是看中了它的“播客鏈接轉寫”功能——我們假想這樣一個場景,當研究一個新課題時,除了快速在網絡上搜集文字素材外,一些深度解讀的播客內容也是我們的素材來源。換做以前,我們只能耐著性子去聽播客里具體講了些什么;但是有了通義聽悟后,我們可以直接錄入目標播客的節目鏈接,功能入口見下圖。

5000字爆肝測評!五月 AI 資訊及實用測評合集

一般情況下會成功解析(如果由于版權問題無法解析,那就只能翻錄再手動導入了),時長 1 小時的播客內容,大概只需要 3-5 分鐘就能完成解析。通義聽悟對于能成功解析的播客資源,會有以下好處:

  1. 直接跳過翻錄過程,大大縮減轉寫時間
  2. 可以快速定位錄音位置,方便核實文字內容
  3. AI 總結歸納,方便快速了解全貌(如關鍵詞、摘要、章節速覽、發言總結、問答回顧)
  4. 其他 AI 工具的應用,如下圖的 AI 改寫功能,幾乎可以做到“一鍵改寫”

5000字爆肝測評!五月 AI 資訊及實用測評合集

③ 產品評價_通義聽悟

對于播客轉文字這一需求而言,通義聽悟簡直就是為此而生的。無論是快速采集播客里優質內容素材,還是自己快速了解播客內容,都是目前最好用的 AI 利器,過程絲滑且不花錢,感興趣或者有此類訴求的同學們不妨嘗試一下。

④ 介紹概覽_360AI 瀏覽器

5000字爆肝測評!五月 AI 資訊及實用測評合集

下載地址: https://browser.360.cn/ai/?src=se

⑤ 產品實測_360AI 瀏覽器

類比通義聽悟的播客鏈接解析,360AI 瀏覽器可以直接轉寫在線視頻。現階段 360AI 瀏覽器只有 PC 端的安裝包,蘋果用戶無緣體驗。

下載安裝后,用 360AI 瀏覽器打開你想要轉寫的視頻網頁,點擊瀏覽器右上角的 AI 按鈕,即可得到如下的頁面。

  1. 簡介 tab_瀏覽器會基于視頻內容分析,AI 生成簡介和視頻結構的腦圖
  2. 重點 tab_瀏覽器會生成類似于整個視頻的時間軸信息
  3. 字幕 tab_VTT 功能,方便用戶提取優質視頻的觀點和文本內容
  4. 問答 tab_用戶可以問一些視頻相關的問題,AI 瀏覽器會全網搜索并做出回答

5000字爆肝測評!五月 AI 資訊及實用測評合集

⑥ 產品評價_360AI 瀏覽器

類比通義聽悟,360AI 瀏覽器對于“視頻轉寫文字”的訴求是完全勝任的,但是沒有通義聽悟那么多 AI 相關的功能,比如“AI 改寫”、“區分發言人”等功能,不過也可以理解。通義聽悟基于阿里云等技術積累,早就開始著手 AI 產品的打造;而 360AI 瀏覽器 3 月 1 日才剛發布了第一個版本。在 AI 浪潮席卷而來的當下,360AI 瀏覽器會預見性的越做越好,讓我們期待它的進一步更新迭代。

結語

最后帶大家畫一下重點——

  1. Remini 的黏土濾鏡為大家提供了無門檻地 AI 使用體驗,同時 Remini 也在積極拓展更多風格的 AI 濾鏡,也很具有趣味性,大家可以多多嘗試。為了更好的將黏土風格應用在工作中,我們為各位設計及運營從業者提供了一套用 Midjourney 生成黏土風格圖片的解決方案,各位同學可以與自己的工作內容結合一下;
  2. Heygen 近期更新的 AI 視頻功能還是很強大的,涵蓋了人物換臉、文字轉口播視頻、創建虛擬主播及 AI 克隆人等,其中一大亮點就是 Heygen 5.0 不再局限于生成人物臉部近景及別的視頻,還可以捕捉完整的四肢動作,并生成包含人物全身的 AI 視頻;
  3. 通義聽悟與 360AI 瀏覽器將文本及視頻轉文字功能已經研發地相當成熟,尤其是嵌入 AI 技術后,可以實現內容總結、生成思維導圖、改寫潤色等原本需要耗費較長時間的工作,幫助相關從業者提升效率,將精力更多地投入到創意生產中去。

以上就是本次 AIGC 測評的全部內容了,希望能夠為同學們帶來一些啟發和新思路。如果本期的內容大家還沒有看過癮的話,一定要繼續關注我們,我們會持續追蹤 AIGC 的最新進展并在第一時間發布獨家深度測評,大家的關注和互動會是我們持續更新的動力。同學們,我們下期見!

收藏 31
點贊 25

復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。