在 2025 年 Google I/O 大會上,Google 宣布了一項極具吸引力的消費級 AI 應用功能:虛擬試衣(Virtual Try-On)。 - 基于新一代 圖像生成模型,專為時尚場景設計 - 能理解不同體型、姿勢、照片構圖 - 首次在如此大規模商品數據庫(10 億級別)中應用
上傳一張自己照片 AI 將在幾秒鐘內生成你穿上該商品的逼真效果圖 - 基于新一代 圖像生成模型,專為時尚場景設計 - 依托全球 500 億商品數據,提供實時可信商品信息 - 還可以根據用戶需求主動進行 多條件搜索與比較、比價分析 - 購物流程全自動執行,還可以自動支付下單
更多詳細介紹?? https://www.xiaohu.ai/c/xiaohu-ai/google-ai-7ff104
Gemini CLI已經發布幾天了,很多人拿它跟 Claude Code 對比了一下編程能力,覺得能力不如 Claude Code,就棄之不用了,實際上是錯誤理解它的定位了。
Gemini CLI(https://github.com/google-gemini/gemini-cli)不是一個編程工具,它可以有很多用途,比如翻譯文章、搜索、整理文件、子Agent
Claude Code 由于編程能力過于突出,包括后來的Codex-cli也是定位編程 Agent,所以大家對于CLI Agent天然以為是用來編程的,實際上可以做很多其他任務。
比如我用它來翻譯: > 請翻譯網頁(https://www.anthropic.com/research/project-vend-1)的內容為中文,并保存為 Markdown 文件
還可以讓它幫你整理文件夾: > 請把目錄下的照片按照日期歸檔
讓它幫你搜索: > 請檢索今天的 AI 新聞
還可以把它當作你程序的子 Agent,比如你可以在自己的程序里面通過命令 gemini -p "" 調用,然后解析調用后結果。
> gemini -p "今天芝加哥天氣怎么樣?" > 今天芝加哥天氣晴朗,最高溫度約為 81°F(約 27°C),最低溫度約為 72°F(約 22°C)。風速為 5 至 10 英里/小時,濕度為 66%。今天下雨的概率為 0%。
當然我這里只是拋磚引玉,更多用途還需要等你發掘,歡迎留言分享!
by:微博 @寶玉xp
OpenAI宣布為企業用戶推出兩大重磅功能,讓ChatGPT真正融入工作場景:
1. 一鍵連接企業知識庫 通過“連接器”功能,ChatGPT可直接訪問企業內部系統(如Outlook、Google Drive、Gmail、SharePoint等) 自動檢索用戶有權限查看的文件、郵件、數據 即時解答工作問題,相當于給企業配了AI知識管家
2. 會議記錄自動化 開啟“錄音模式”,ChatGPT自動完成: ? 實時語音轉文字 ? 提煉會議重點 ? 標記發言時間點 ? 點擊時間戳快速回聽關鍵討論 適用于線上會議、電話溝通、靈感速記等場景
此次升級讓ChatGPT從聊天工具轉型為智能工作中樞,企業數據仍受嚴格權限保護,僅處理授權內容。
Google昨天正式上線了其全新的Search Live語音搜索功能,該功能基于Gemini模型,并內置于iOS和Android版Google應用中,適用于已加入AI Mode實驗的用戶。
Search Live 的核心功能與特點 1. 實時語音對話 用戶可以通過語音與搜索引擎進行自然對話,無需手動輸入關鍵詞。例如,用戶可以問:“如何防止行李箱中的亞麻裙起皺?” Search Live 會以 AI 生成的語音回答,并支持后續提問,如“如果還是起皺了怎么辦?”。這種連續追問的機制使得搜索過程更加流暢和高效。
2. 網頁鏈接輔助 每次回答都會附帶相關網頁鏈接,方便用戶跳轉查看詳細信息或驗證答案來源,確保信息透明可信。這種設計不僅提升了信息的可信度,也增強了用戶的信任感。
3. 多模式切換 用戶可以一鍵切換至文字視圖,查看對話轉錄文本,或通過打字繼續提問,靈活適應不同使用場景。這種靈活性使得 Search Live 適用于多種場景,如駕駛、旅行或多任務處理時。
4. 后臺持續運行 即使切換到其他應用,Search Live 對話依然保持活躍,真正實現多任務并行。這一功能極大地提升了用戶的操作效率,尤其是在需要同時處理多個任務的情況下。
5. 歷史記錄保存 所有對話自動保存在 AI Mode 歷史記錄中,用戶可隨時回顧或繼續之前的搜索。這種設計不僅方便用戶回顧之前的搜索記錄,也便于用戶在需要時快速找到相關信息。