不知道大家關注沒有,最近 Stability AI 推出了一項革命性技術:Stable Fast 3D。能夠從單張圖像快速生成高質量的3D資產。該技術在0.5秒內即可完成從輸入圖像到詳細3D模型的轉換,并且生成的3D資產包括UV展開網格、材質參數和顏色等信息。
Stable Fast 3D的功能特性
極速3D生成:從單張圖片快速生成3D模型,整個過程僅需0.5秒。 高質量輸出:確保生成的3D資產在視覺和紋理上具有高質量表現。 UV展開網格:自動生成UV映射,為3D模型提供正確的表面細節 材質參數:包含必要的材質屬性,使得3D模型在不同光照條件下都能保持逼真效果。 重網格選項:提供四邊形或三角形重網格功能,以適應不同的渲染和建需求。 兼容性:支持在多種設備和平臺上生成3D模型,包括但不限于GPU加速的本地環境和云API服務 增強現實(AR)集成:用戶可以在Stable Assistant聊天機器人中通過3D查看器分享和在AR環境中預覽3D創作。
在線體驗地址: Stable Fast 3D
剛剛發現一個在線視頻無損壓縮工具:Rotato
Rotato 是一款無損視頻壓縮工具,它基于FFmpeg技術,能夠將視頻文件大小壓縮至原來的80%到90%,幾乎不損失效果。用戶只需將視頻文件拖放到網頁界面即可開始壓縮,無需安裝任何軟件或注冊付費。 該工具在壓縮過程中不會發送數據到服務器,確保了用戶的隱私和數據安全。
Rotato 的主要特點包括: - 免費使用:用戶無需注冊或付費即可使用該工具。 - 操作簡便:通過簡單的拖放操作即可完成視頻壓縮。 - 高效壓縮:利用先進的壓縮算法,可以快速有效地減少視頻文件的大小。
Rotato 官網:https://tools.rotato.app/compress
近期,Stability AI 推出的一款創新性視頻生成模型 Stable Video 4D
模型下載:https://huggingface.co/stabilityai/sv4d
Stable Video 4D 的主要特點: - 高質量視頻內容:Stable Video 4D 能夠處理和生成高質量的視頻內容,滿足專業應用的需求。 - 合成數據集訓練:雖然目前主要基于合成數據集進行訓練,但 Stability AI 正在優化模型以適應真實世界的視頻場景。 - 相關模型:除了 Stable Video 4D,Stability AI 還發布了 Stable Video Diffusion 和 SV3D 等模型,它們支持從圖像或文本生成視頻,并在多視圖合成和高分辨率視頻生成方面表現出色。
個人感覺這個模型還挺強的,大家覺得有哪些實際應用場景啊?
OpenAI 今天發布了全新的 AI 模型“GPT-4o mini”,是一款擴大聊天機器人應用范圍的小型AI模型,它被標榜為功能強大且成本效益高的模型,并預留了未來整合圖像、視頻和音頻處理能力的空間。
作為多模態技術推進的一部分,GPT-4o mini 即時起服務于ChatGPT的免費、Plus及Team用戶,預計下周覆蓋Enterprise用戶。它是基于GPT-4o(5月發布,具備全面的多媒體處理能力和高速度)的精簡版,優化了成本和響應速度,能處理長達128K tokens的上下文,特別提升了對非英文內容的支持,知識庫更新至2023年10月。
在MMLU和MGSM基準測試中,GPT-4o mini表現出色,分別獲得了82%和87.0%的分數,優于同類模型。目前,該模型已具備文本和圖像處理功能,未來將擴展至視頻和音頻領域,大家覺得怎么樣?
戳鏈接查看詳情:GPT-4o mini
SVGStud.io 是一個基于AI的工具,用于搜索和生成可縮放矢量圖形(SVG)。
核心功能包括:
1、免費的SVG束:瀏覽大量預生成的SVG。 2、語義化SVG搜索:找到盡可能接近搜索詞或樣本圖像的SVG文件。 3、基于AI的SVG生成器:根據文本描述和(可選)示例圖像生成新的SVG。迭代優化SVGs。
所有在SVGStud.io 上的 SVG 都遵循CC-BY-SA 4.0許可證。使用 SVGStud.io 需要接受并遵守使用限制。
還可以將 SVG 轉換為其他格式,如 DXF 和 EPS。所有生成的文件都可以隨時下載。
傳送門:SVGStud.io
Magnific 又一次找到新的增長點了。這次,他們推出了一個PS插件,
這個插件的主要功能包括圖像放大和細節增強,能夠直接在 Photoshop 內部使用,無需額外操作。
具體來說,Magnific 的 PS 插件通過 Adobe Store 安裝后,可以無縫集成到 Photoshop 中。用戶只需點擊放大按鈕,插件便會在 Photoshop 中自動工作,將放大后的圖像作為新圖層插入,從而保持創作過程的流暢性。
MagnificPS插件的詳細使用教程:
Magnific 的這一插件不僅簡化了圖像處理流程,還顯著提升了工作效率,滿足了專業用戶的高需求。大家覺得這個插件的實用性怎么樣?
近日,蘋果公司與瑞士洛桑聯邦理工學院(EPFL)聯合開源了一款名為4M-21的多模態視覺模型。該模型具有廣泛的通用性和靈活性,盡管只有30億參數,但它可以執行數十種任務,包括圖像分類、目標檢測、語義分割、實例分割、深度估計和表面法線估計等。
4M-21模型在21種不同的模態下進行訓練,能夠處理包括圖像、文本、音頻等多種模態的任務。這種多模態能力使其在跨模態檢索、可控生成和開箱即用性能方面表現出色。
4M-21還支持任意到任意模態的轉換,進一步擴展了其應用范圍。
4M-21模型的推出標志著從傳統單模態優化模型向多模態綜合處理能力的重大轉變,展示了蘋果在AI領域的強大實力和創新能力。
開源地址:https://github.com/apple/ml-4m/ 論文地址:https://arxiv.org/abs/2406.09406 在線demo:https://huggingface.co/spaces/EPFL-VILAB/4M
今天發現了一個聲音克隆的好東西,我剛剛挖到的Fish Speech這個工具,不僅生成速度快到飛起,而且克隆出的聲音也很真實,支持文字轉語音功能,非常的好用!
Fish Speech 是一款由fishaudio開發的全新文本轉語音(TTS)工具,具有強大的語音克隆能力。用戶只需提供一段參考語音,系統便能迅速進行語音克隆,無需繁瑣的訓練過程。
該工具支持中文、英語和日語等多種語言,并且在語音處理上的能力接近人類水平。 Fish Speech采用了先進的AI技術,包括VQ-GAN、Llama和VITS等,能夠將文本轉換成逼真的語音。它還采用了Flash-Attn算法,以提高處理大規模數據的效率和穩定性。這些技術使得Fish Speech不僅在語音合成方面表現出色,還在語音克隆方面具有顯著的優勢。
Fish Speech的語音克隆功能特別適合內容創作者使用,他們可以利用這一工具快速生成各種聲音效果,用于視頻配音、播客制作等場景。
試玩地址:https://fish.audio/zh-CN/
今年4月份給大家透露過我們要發布新字體,現在優設招牌體正式發布!
優設招牌體是一款傳統書寫結合現代工具創作的標題美術字體。取魏碑結構轉折銳利鋒芒的特點,筆畫造型勻稱有力,給人一種剛毅且渾厚的氣質。字體骨架左低右高,賦予其勃勃生機,主筆粗細相間中宮收緊,整體風格質樸剛強、氣勢恢宏。
我們期望優設招牌體以它獨特的磅礴之美打動你,成為大家在各類設計中的理想選擇,讓人不容忽視,甚至眼前一亮。如商業門面的醒目招牌、文化傳播的力作海報、及富含傳統韻味的產品包裝等,幫助你的產品處處彰顯非凡格調。
更多介紹看這里?? http://www.czdes.cn/uisdc-zhaopaiti