噱頭大于實用?深度測評3款人氣超高的AI智能體產品

關于 Manus 這類產品,我想說...

從 Manus 發布至今,圍繞著這類通用型智能體的討論從沒停過。如今,在輿情平息的時候,我們覺得是時候好好評價一下這類產品了。

首先,我們稱贊 Manus 這類產品的構建思路 —— 通過多模型協作,確實在向傳說中的 “世界大模型” 靠近。但實際測試中卻暴露不少問題:號稱 “重新定義 AI 協作” 的 Manus,內測時生成 PPT 打不開 WPS、股票分析用錯數據等。

這類產品的出現確實推動了行業討論。但從實際可用性來看,目前多數通用智能體都像 Manus 一樣 “噱頭大于實用”。

以下是我們針對目前三款“通用 Agent”產品的主觀評價:

總的來說,目前三款產品可用性不足,任務成功率低,文字相關能力與 LLM 原生功能無異,通用 Agent 附加價值有限。

一、能力對比

1. Manus

主觀評分:☆☆

信息收集:可訪問網頁及讀取其中的圖片及pdf文檔內容

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

編程:接入Claude代碼大模型

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

PPT生成:可編輯,但質量較差

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

圖像生成:不支持

視頻生成:不支持

資費:免費,1000積分/月;Starter/Pro,$39/$399月

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

2. Genspark

主觀評分:☆

信息收集:可訪問網頁及讀取其中的圖片及pdf文檔內容

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

編程:接入多種代碼大模型混合使用

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

PPT生成:使用代碼方式寫PPT,效果還可以,但不可編輯

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

圖像生成:直接接入Flux,ideogram等圖像大模型

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

視頻生成:直接接入可靈,minimax等視頻大模型

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

資費:免費,200積分/日;Plus版,24.99美元/月

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

3. 扣子空間

主觀評分:☆

信息收集:可訪問網頁及讀取其中的圖片及pdf文檔內容

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

編程:接入豆包代碼大模型

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

PPT生成:視覺以及結構還可以,同時提供了PDF、PPT、文字三個版本,可二次編輯:

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

圖像生成:支持添加MCP拓展圖片生成:

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

視頻生成:不支持

資費:目前完全免費,每日有4-5個任務限制

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

一、Manus

1. 核心架構

基礎模塊:信息收集、信息分析、代碼編寫,無生成圖片視頻等多模態功能。

它通過多代理架構將任務拆分為規劃、執行、驗證等子模塊,每個代理基于獨立的語言模型或強化學習模型,通過 API 協同工作;

優勢

  1. 工作流程條理性較強,先確定任務步驟,按步驟依次進行,;
  2. 推理過程所使用的文件均可以下載,推理流程較為透明;

劣勢

  1. 需要魔法上網,對部分用戶可能有使用門檻;
  2. 多模態能力較弱,缺乏圖像處理等多模態工具;
  3. 工具集較為有限,嚴重依賴Python腳本,可以生成PPT格式的文件,但質量較差,無法二次編輯;
  4. 性能方面,推理過程較慢,從收集資料到生成分析文檔總計要消耗近30min。

2. 代碼生成

代碼方面因為是直接調用了其他 LLM 模型,所以性能與其一致。以下是生成的前端頁面。

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

3. 多模態分析功能

對于圖像有基本的分類功能,但是沒有配置針對圖像處理的模型,處理分析功能效果不好。

深度分析

收集信息,使用代碼方式生成調研報告,并發布在網頁,對于信源等搜索分析不全面,與其他 AI 工具無大異。

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

二、Genspark

1. 核心架構

基礎模塊:AI 對話/生圖/視頻/翻譯,沿用 ChatGPT、可靈等主流模型;

工具型智能體,5 類專業場景應用:綜合智能體,深度研究智能體,事實核查智能體,數據表智能體,打電話智能體;

宣傳中"80+工具"實際是基于“AI 聊天,AI 生圖,AI 視頻,翻譯“等類型工具的排列組合。

優勢

  1. 功能模塊全面,包括AI搜索與瀏覽器、圖片工作室、視頻生成、深度研究等。
  2. 任務執行效率高,尤其在多輪對話和復雜任務處理上

劣勢

  1. 需要魔法上網,對部分用戶可能有使用門檻;
  2. 工具創新不足:超90%功能與競品同質化,唯視頻生成系獨家配置(當前質量未達可用標準),尚未形成真實競爭力;
  3. 技術整合度低:多模型簡單堆砌,缺乏深度調優;
  4. 營銷與實際落差:概念智能體未突破傳統Agent框架,格式轉換等工具實為API封裝

2. 綜合分析能力

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

實際使用流程與 Manus 一致,輸入一個任務,Genspark 開始自動安排工作,完成后輸出結果,生成 PPT 視覺效果還可以,但無法二次編輯修改。

3. AI 聊天

官方宣傳其多模型集成系統(含 GPT-4、Claude3 及自研模型),但實測認為在常規對話、文本生成和信息檢索等基礎場景中,該系統表現與單一優質模型并無顯著差異。

4. 圖像生成

Genspark 會寫一套提示詞,然后使用 Flux 等公開模型(舊版模型)直接生成圖片。生成效果差于直接使用生圖工具。

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

5. 視頻生成

視頻生成模型使用的是可靈等開放模型,生成清晰度低,視頻不穩定,消耗積分大,僅一次就消耗掉了當日所有免費積分,視頻效果差于可靈等生視頻工具。

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

當視頻在手機上無法加載,可前往PC查看。

三、扣子空間

1. 核心架構

Agent:

  1. 通用 agent:與 Manus 相似。
  2. 專家 agent:針對通用 agent 做了內置 prompt,目前是用戶研究、股票分析。

兩種主要模式:

  1. 探索模式:不可修改任務規劃步驟。
  2. 規劃模式:可修改 Ai 規劃任務步驟內容。

支持接入圖片生成 MCP 產出圖片,基于豆包大模型可處理多模態數據。

優勢

  1. 不需要魔法上網,目前完全免費;
  2. 提供探索和規劃兩種模式,用戶可以修改agent規劃的步驟細節內容;
  3. 支持MCP擴展,AI agent的能力邊界被進一步擴展。

劣勢

  1. 官方宣傳的“各行各業的「領域專家」,目前只有兩個,且無法使用規劃模式調整執行任務內容。
  2. MCP擴展目前是固定列表且不支持自定義,應用空間有限。
  3. 性能上,依賴豆包模型的邏輯能力,復雜任務(如商業模型分析)易出現細節缺失,規劃模式推理過程較慢,從暫時不具備可用性。
  4. 完成任務一段時間后無法進行二次對話,任務永遠結束。
  5. Beta版本全免費,高峰期服務器易擁堵,易出現影響響應速度。

2. 通用 agent(探索模式) 任務:品牌對比分析報告

通用 agent:進行第一輪、第二輪快速思考和瀏覽器搜索。搜到信息后生成并部署網頁缺點:數據不夠新,目前還是 2023 年的內容。目前生成文檔每句話引用未標注來源,可信程度存疑。

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

3. 專家 agent 任務:生成問卷

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

左側為扣子空間、右側為 deepseek,使用了相同的 prompt,對比 deepseek,扣子空間生成的問卷更加全面、分類更準確、問題語言更清晰易懂。

4. 通用 agent(規劃模式) 任務:生成競品分析并生成筆記

執行時間較長,針對復雜任務需要 10 分鐘以上,同時在生成筆記中有概率會出現報錯的問題。生成筆記信息不全面,出現關鍵細節缺失,分析不全面等問題。

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

5. MCP agent(探索模式) 任務:生成可視化旅行攻略

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

可以調用高德地圖與墨跡天氣的信息并適時設計旅行線路,同時可以導出至飛書表格直接生成攻略。

6. MCP agent(探索模式) 任務:生成一個會跳舞的貓

調用圖像工具 MCP,生成的圖像清晰但是對于主體的處理不符合事實,需要二次修改。

噱頭大于實用?深度測評3款人氣超高的AI智能體產品

結語

從 Manus、Genspark 到扣子空間,通用智能體產品雖在技術架構上嘗試通過多模型整合、任務拆分等方式向 “世界大模型” 靠近,但實際使用中仍存在明顯局限。

目前來看,這類產品普遍能力和問題相似,如信息收集、代碼生成等能力差異不大,且多模態支持不足(如圖像、視頻生成功能缺失或質量較低)。同時,使用體驗上存在穩定性不足、付費策略不夠合理(如積分消耗快、套餐價格較高)、部分產品需依賴魔法上網等問題,影響了實際可用性。

未來,通用智能體需在技術生態建設、性能優化、付費體系完善等方面持續改進,才能從概念層面的討論走向實際應用場景的落地,真正實現從 “有限可用” 到 “可用” 的跨越。

收藏 9
點贊 43

復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。