Techcrunch整理了一份AI行業(yè)最常見到的技術(shù)詞語詞典,搞懂這些,或許能幫初學(xué)者們輕松邁入AI世界的大門。
- AGI 通用人工智能 通用人工智能(AGI)是一個(gè)有些模糊的概念,通常指在多數(shù)任務(wù)上比普通人更強(qiáng)大的AI。OpenAI將其定義為“在最具經(jīng)濟(jì)價(jià)值的工作上超越人類的高度自主系統(tǒng)”。谷歌DeepMind則認(rèn)為AGI是“在大多數(shù)認(rèn)知任務(wù)上至少與人類能力相當(dāng)?shù)腁I”。
- Chain of Thought 思維鏈 思維鏈推理意味著讓AI像人一樣一步步思考,把一個(gè)大問題拆解成多個(gè)小步驟。雖然慢一點(diǎn),但在邏輯推理或編程這種需要嚴(yán)謹(jǐn)思考的場(chǎng)景里,答案會(huì)更準(zhǔn)確。現(xiàn)在的大語言模型經(jīng)過優(yōu)化,在處理復(fù)雜問題時(shí),就是靠這種“思維鏈”來提高準(zhǔn)確性。
- Deep learning 深度學(xué)習(xí) AI能自我優(yōu)化學(xué)習(xí)的關(guān)鍵技術(shù)。它模仿人腦神經(jīng)元連接方式,搭建多層人工神經(jīng)網(wǎng)絡(luò),使AI算法能夠建立比簡(jiǎn)單機(jī)器學(xué)習(xí)系統(tǒng)更復(fù)雜的關(guān)聯(lián)關(guān)系。 深度學(xué)習(xí)模型能自己識(shí)別數(shù)據(jù)里的重要特征,而無需人類預(yù)先定義,還能從錯(cuò)誤中學(xué)習(xí),不斷改進(jìn)。
- Diffusion 擴(kuò)散模型 擴(kuò)散技術(shù)是眾多藝術(shù)、音樂和文本生成AI模型的核心。受物理學(xué)啟發(fā),先“故意”一步步往數(shù)據(jù)里加噪聲,直到數(shù)據(jù)面目全非。然后,AI學(xué)習(xí)如何“逆向擴(kuò)散”,把這些被破壞的數(shù)據(jù)還原回來,從而獲得從噪聲中“創(chuàng)造”出全新數(shù)據(jù)的能力。
- Distillation 知識(shí)蒸餾 一種“師父帶徒弟”的學(xué)習(xí)方法。讓一個(gè)大型(“老師”)AI模型處理問題,然后把它的答案用來訓(xùn)練一個(gè)更小、更高效的(“學(xué)生”)模型,讓學(xué)生模型學(xué)會(huì)老師的行為。這樣就能用更小的模型,實(shí)現(xiàn)接近大型模型的性能。
- Fine-tuning 微調(diào) 微調(diào)是指對(duì)已訓(xùn)練的AI模型進(jìn)行進(jìn)一步訓(xùn)練,通過輸入新的專業(yè)化數(shù)據(jù),優(yōu)化其在特定任務(wù)或領(lǐng)域的性能表現(xiàn),使其超越原始訓(xùn)練的重點(diǎn)范圍。很多AI公司都在用這個(gè)技術(shù),把大型語言模型“微調(diào)”成適合自己行業(yè)的產(chǎn)品,提升實(shí)用性。
- GAN 生成對(duì)抗網(wǎng)絡(luò) 讓AI能“以假亂真”的關(guān)鍵技術(shù)。它由兩個(gè)互相競(jìng)爭(zhēng)的神經(jīng)網(wǎng)絡(luò)組成:生成器負(fù)責(zé)創(chuàng)造數(shù)據(jù),判別器負(fù)責(zé)鑒別真?zhèn)巍>拖褚粓?chǎng)“貓捉老鼠”的游戲,兩者不斷對(duì)抗,讓AI能自動(dòng)生成極其逼真的數(shù)據(jù),無需人工干預(yù)。GAN適合用于生成圖片或視頻。
- Hallucination 幻覺 “幻覺”是AI行業(yè)對(duì)模型虛構(gòu)內(nèi)容的專業(yè)術(shù)語,特指AI生成錯(cuò)誤信息的行為。這顯然是影響AI質(zhì)量的核心問題。
- Neural Network 神經(jīng)網(wǎng)絡(luò) 神經(jīng)網(wǎng)絡(luò)是指支撐深度學(xué)習(xí)的多層算法結(jié)構(gòu),是推動(dòng)生成式AI工具全面爆發(fā)的技術(shù)基礎(chǔ)。盡管這個(gè)概念由來已久,GPU的崛起也讓這個(gè)概念迎來了爆發(fā)。GPU被證明非常適合訓(xùn)練具有更多層次的算法,使得基于神經(jīng)網(wǎng)絡(luò)的AI系統(tǒng)在語音識(shí)別、自動(dòng)駕駛導(dǎo)航和藥物研發(fā)等多個(gè)領(lǐng)域?qū)崿F(xiàn)了遠(yuǎn)超以往的性能表現(xiàn)。
- Transfer Learning 遷移學(xué)習(xí) 把一個(gè)已經(jīng)訓(xùn)練好的AI模型拿來當(dāng)起點(diǎn),開發(fā)一個(gè)針對(duì)不同但相關(guān)的任務(wù)的新模型。這樣可以節(jié)省大量開發(fā)時(shí)間,尤其是在新任務(wù)數(shù)據(jù)量不多的時(shí)候非常有用。但要注意,模型可能還需要在新領(lǐng)域的數(shù)據(jù)上進(jìn)行額外訓(xùn)練才能表現(xiàn)最佳。
- Weights 權(quán)重 權(quán)重是AI訓(xùn)練的核心要素,它決定了在訓(xùn)練系統(tǒng)所用數(shù)據(jù)中,不同特征(或輸入變量)的重要程度,直接影響AI模型的最終輸出。訓(xùn)練開始時(shí)權(quán)重是隨機(jī)的,但隨著學(xué)習(xí)的深入,它們會(huì)不斷調(diào)整,讓AI的預(yù)測(cè)越來越準(zhǔn)。
這份詞典由Techcrunch定期維護(hù),有需要的朋友可以收藏:https://techcrunch.com/2025/05/25/from-llms-to-hallucinations-heres-a-simple-guide-to-common-ai-terms/
ps:轉(zhuǎn)自量子位
又是一匹黑馬!今天要給大家介紹的創(chuàng)意新寵Kittl!是一款在線的 AI 設(shè)計(jì)工具,同時(shí)也能為非專業(yè)人士提供一站式的設(shè)計(jì)賦能。目前已經(jīng)拿了2輪融資,今年1月的B輪,拿了3600萬美元。現(xiàn)在的kittl,每個(gè)月將近有300W的驚人訪問量!
主要亮點(diǎn): ① 實(shí)時(shí)文本變形:數(shù)千款可定制字體字型,輕松實(shí)現(xiàn)創(chuàng)意設(shè)計(jì)。 ② 海量免費(fèi)素材庫:上百萬免費(fèi)素材,隨意插入圖標(biāo)、插畫等。 ③ 一鍵生成矢量logo:支持行業(yè)風(fēng)格定制,滿足多種設(shè)計(jì)需求。 ④ 產(chǎn)品實(shí)景展示圖:直觀預(yù)覽設(shè)計(jì)效果,所見即所得。 ⑤ 流行色彩板:一鍵替換設(shè)計(jì)中的顏色,輕松實(shí)現(xiàn)多種配色方案。
試玩地址:https://www.kittl.com/
OpenAI 宣布將其專業(yè)級(jí) AI 編程工具 Codex 向 ChatGPT Plus 訂閱用戶全面開放,此舉大幅降低了開發(fā)者使用尖端 AI 輔助編程的門檻。此前,Codex 僅面向企業(yè)及團(tuán)隊(duì)級(jí)用戶開放。
本次 Codex 升級(jí)包含三項(xiàng)核心功能: 1. 聯(lián)網(wǎng)能力解禁(需手動(dòng)開啟) Codex 在執(zhí)行編程任務(wù)時(shí)可實(shí)時(shí)訪問互聯(lián)網(wǎng),實(shí)現(xiàn)依賴安裝、軟件包升級(jí)、資源拉取及代碼測(cè)試等操作。出于安全考量,該功能默認(rèn)關(guān)閉,用戶需主動(dòng)啟用并可通過白名單控制訪問權(quán)限,目前已支持 GitHub、PyPI 等 70 余個(gè)開發(fā)相關(guān)站點(diǎn)。 2. 語音驅(qū)動(dòng)編程 新增語音輸入支持,開發(fā)者可直接口述編程需求,大幅提升"氛圍編程"(Vibe Coding)效率,尤其適合快速原型構(gòu)建及移動(dòng)場(chǎng)景開發(fā)。 3. 團(tuán)隊(duì)協(xié)作優(yōu)化 新增代碼拉取請(qǐng)求(Pull Request)更新功能,允許開發(fā)者在生成初始代碼后持續(xù)迭代優(yōu)化,無縫銜接團(tuán)隊(duì)代碼審核與協(xié)作流程。
同步福利:免費(fèi)用戶迎來記憶功能 ChatGPT的對(duì)話記憶能力正式向免費(fèi)用戶開放。不過當(dāng)前為"輕量版",僅支持參考最近幾輪對(duì)話內(nèi)容,與Plus會(huì)員可定制的長期記憶庫存在差異。 此次更新進(jìn)一步強(qiáng)化了ChatGPT在專業(yè)開發(fā)領(lǐng)域的工具屬性,同時(shí)通過功能分層策略平衡用戶體驗(yàn)與商業(yè)價(jià)值,或?qū)?duì)AI編程工具市場(chǎng)競(jìng)爭(zhēng)格局產(chǎn)生深遠(yuǎn)影響。
OpenAI宣布為企業(yè)用戶推出兩大重磅功能,讓ChatGPT真正融入工作場(chǎng)景:
1. 一鍵連接企業(yè)知識(shí)庫 通過“連接器”功能,ChatGPT可直接訪問企業(yè)內(nèi)部系統(tǒng)(如Outlook、Google Drive、Gmail、SharePoint等) 自動(dòng)檢索用戶有權(quán)限查看的文件、郵件、數(shù)據(jù) 即時(shí)解答工作問題,相當(dāng)于給企業(yè)配了AI知識(shí)管家
2. 會(huì)議記錄自動(dòng)化 開啟“錄音模式”,ChatGPT自動(dòng)完成: ? 實(shí)時(shí)語音轉(zhuǎn)文字 ? 提煉會(huì)議重點(diǎn) ? 標(biāo)記發(fā)言時(shí)間點(diǎn) ? 點(diǎn)擊時(shí)間戳快速回聽關(guān)鍵討論 適用于線上會(huì)議、電話溝通、靈感速記等場(chǎng)景
此次升級(jí)讓ChatGPT從聊天工具轉(zhuǎn)型為智能工作中樞,企業(yè)數(shù)據(jù)仍受嚴(yán)格權(quán)限保護(hù),僅處理授權(quán)內(nèi)容。
Google昨天正式上線了其全新的Search Live語音搜索功能,該功能基于Gemini模型,并內(nèi)置于iOS和Android版Google應(yīng)用中,適用于已加入AI Mode實(shí)驗(yàn)的用戶。
Search Live 的核心功能與特點(diǎn) 1. 實(shí)時(shí)語音對(duì)話 用戶可以通過語音與搜索引擎進(jìn)行自然對(duì)話,無需手動(dòng)輸入關(guān)鍵詞。例如,用戶可以問:“如何防止行李箱中的亞麻裙起皺?” Search Live 會(huì)以 AI 生成的語音回答,并支持后續(xù)提問,如“如果還是起皺了怎么辦?”。這種連續(xù)追問的機(jī)制使得搜索過程更加流暢和高效。
2. 網(wǎng)頁鏈接輔助 每次回答都會(huì)附帶相關(guān)網(wǎng)頁鏈接,方便用戶跳轉(zhuǎn)查看詳細(xì)信息或驗(yàn)證答案來源,確保信息透明可信。這種設(shè)計(jì)不僅提升了信息的可信度,也增強(qiáng)了用戶的信任感。
3. 多模式切換 用戶可以一鍵切換至文字視圖,查看對(duì)話轉(zhuǎn)錄文本,或通過打字繼續(xù)提問,靈活適應(yīng)不同使用場(chǎng)景。這種靈活性使得 Search Live 適用于多種場(chǎng)景,如駕駛、旅行或多任務(wù)處理時(shí)。
4. 后臺(tái)持續(xù)運(yùn)行 即使切換到其他應(yīng)用,Search Live 對(duì)話依然保持活躍,真正實(shí)現(xiàn)多任務(wù)并行。這一功能極大地提升了用戶的操作效率,尤其是在需要同時(shí)處理多個(gè)任務(wù)的情況下。
5. 歷史記錄保存 所有對(duì)話自動(dòng)保存在 AI Mode 歷史記錄中,用戶可隨時(shí)回顧或繼續(xù)之前的搜索。這種設(shè)計(jì)不僅方便用戶回顧之前的搜索記錄,也便于用戶在需要時(shí)快速找到相關(guān)信息。
簡(jiǎn)單點(diǎn)擊拖拽就能生成曲線、直線、弧形等分割形狀,可以直接運(yùn)用到網(wǎng)頁和App設(shè)計(jì)中,分割頁面的同時(shí)提升美觀度!
ShapeDivider還支持多種形狀的自定義,包括18種可選形狀,這些形狀可以被定制,以創(chuàng)造出無限多樣且靈活的分隔器。通過將形狀轉(zhuǎn)換為輕量級(jí)的SVG文件,以及異步加載機(jī)制,確保了頁面加載速度不受影響。
感興趣的小伙伴可以訪問官網(wǎng)試玩一下:https://www.shapedivider.app/
Black Forest Labs 發(fā)布了 FLUX.1 Kontext [dev] 模型,這是其圖像編輯模型 FLUX.1 Kontext [pro] 的開源開發(fā)版本,擁有 12B參數(shù),具備 接近專有工具的圖像編輯能力,并可在消費(fèi)級(jí)硬件上運(yùn)行。
它的厲害之處在于: 1. 精準(zhǔn)編輯: 能非常準(zhǔn)確地修改圖片的局部或整體,比如添加物品、更換背景、替換特定對(duì)象(狗換貓,人不變),多次修改也不會(huì)失真變形。 2. 保持角色一致: 修改圖片時(shí),能保持人物的樣子(臉、穿著)前后一致。 3. 本地運(yùn)行免費(fèi): 最大的亮點(diǎn)是,它能在你自己的電腦(消費(fèi)級(jí)硬件)上運(yùn)行,不需要聯(lián)網(wǎng)上傳圖片,完全免費(fèi)(用于研究和非商業(yè)用途)!這就打破了GPT-4o和Gemini等收費(fèi)巨頭在這類圖像編輯上的壟斷。 4. 性能強(qiáng)勁: 官方測(cè)試顯示,在編輯精度、角色一致性等方面,它的表現(xiàn)甚至超過了谷歌的Gemini-Flash和一些其他開源模型,效果接近最好的閉源工具。 5. 方便好用: 它能和流行的圖像生成工具 ComfyUI 無縫結(jié)合,操作更簡(jiǎn)單。官方還提供了很多模板和例子指導(dǎo)怎么用。
總結(jié)來說: FLUX.1 Kontext [dev] 提供了一個(gè)強(qiáng)大、精準(zhǔn)、免費(fèi)且能保護(hù)隱私(本地運(yùn)行)的圖像編輯AI新選擇,性能直逼頂尖收費(fèi)工具。如果你對(duì)AI修圖感興趣,值得關(guān)注!
模型和技術(shù)報(bào)告已在 Hugging Face 和 arXiv 平臺(tái)公開:
- 模型下載: https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev - ComfyUI 使用教程:https://docs.comfy.org/tutorials/flux/flux-1-kontext-dev
Gemini CLI已經(jīng)發(fā)布幾天了,很多人拿它跟 Claude Code 對(duì)比了一下編程能力,覺得能力不如 Claude Code,就棄之不用了,實(shí)際上是錯(cuò)誤理解它的定位了。
Gemini CLI(https://github.com/google-gemini/gemini-cli)不是一個(gè)編程工具,它可以有很多用途,比如翻譯文章、搜索、整理文件、子Agent
Claude Code 由于編程能力過于突出,包括后來的Codex-cli也是定位編程 Agent,所以大家對(duì)于CLI Agent天然以為是用來編程的,實(shí)際上可以做很多其他任務(wù)。
比如我用它來翻譯: > 請(qǐng)翻譯網(wǎng)頁(https://www.anthropic.com/research/project-vend-1)的內(nèi)容為中文,并保存為 Markdown 文件
還可以讓它幫你整理文件夾: > 請(qǐng)把目錄下的照片按照日期歸檔
讓它幫你搜索: > 請(qǐng)檢索今天的 AI 新聞
還可以把它當(dāng)作你程序的子 Agent,比如你可以在自己的程序里面通過命令 gemini -p "" 調(diào)用,然后解析調(diào)用后結(jié)果。
> gemini -p "今天芝加哥天氣怎么樣?" > 今天芝加哥天氣晴朗,最高溫度約為 81°F(約 27°C),最低溫度約為 72°F(約 22°C)。風(fēng)速為 5 至 10 英里/小時(shí),濕度為 66%。今天下雨的概率為 0%。
當(dāng)然我這里只是拋磚引玉,更多用途還需要等你發(fā)掘,歡迎留言分享!
by:微博 @寶玉xp
給大家分享一個(gè)免費(fèi)在線工具,專門用于修復(fù)老舊和受損的照片,采用 AI 技術(shù),可以恢復(fù)老照片的顏色,修復(fù)模糊的面部,恢復(fù)照片的細(xì)節(jié)。
Restorer Photos 全球86萬用戶的選擇 無需PS技巧!上傳1張人臉老照片,AI自動(dòng): ? 修復(fù)五官細(xì)節(jié)|皺紋、眼神、笑容還原如初 ? 清除模糊噪點(diǎn)|告別朦朧、劃痕、褪色 ? 保留真實(shí)質(zhì)感|拒絕塑料假臉,守護(hù)原始感動(dòng)
網(wǎng)址我放在評(píng)論區(qū)咯~
給大家分享一篇關(guān)于AI Agent的科普文章,怎么做Agent,Agent要到哪里去這篇文章都有非常細(xì)致的講解。 它不僅涵蓋了從底層原理到上層應(yīng)用的全方位知識(shí),還通過實(shí)際案例讓你直觀感受開發(fā)的魅力與價(jià)值。 無論你是初學(xué)者還是資深開發(fā)者,都能從中汲取豐富的養(yǎng)分,助力你在 AI Agent 開發(fā)的征途上乘風(fēng)破浪,收獲屬于自己的成功與成就。
核心亮點(diǎn)速覽 ?? 協(xié)議革命 - MCP協(xié)議:實(shí)現(xiàn)工具與AI應(yīng)用解耦(如高德地圖API秒級(jí)接入) - A2A協(xié)議:支持跨平臺(tái)Agent協(xié)同(QQ小Q已用于圖片處理/行程規(guī)劃) ?? 框架創(chuàng)新 - Eino(Go框架):強(qiáng)類型編排+可視化調(diào)試,復(fù)雜Agent開發(fā)效率提升200% - tRPC-A2A-Go:一鍵封裝Agent服務(wù),兼容微信/QQ/Cherry Studio生態(tài) ?? 場(chǎng)景突破 - 多Agent分工:旅行規(guī)劃、深度搜索、意圖識(shí)別Agent協(xié)同作戰(zhàn) - 人類介入控制:關(guān)鍵任務(wù)實(shí)時(shí)審批(如酒店預(yù)訂敏感操作)
騰訊實(shí)踐成果 ? QQ小Q接入混元+DeepSeek雙模型 ? 圖片清晰化/擴(kuò)圖功能響應(yīng)速度<1秒 ? 全鏈路可觀測(cè)(Langfuse集成)
原文地址:https://mp.weixin.qq.com/s/eon4MCCErRWLT7GxSoR70g