最近,Anthropic 發布了全新大模型 Claude 3.5 Sonnet,號稱是迄今為止最智能的模型。
Claude 3.5 Sonnet 是 Anthropic 即將推出的 Claude 3.5 系列的首個版本。該模型提高了整個領域的智能水平,在絕大多數基準評估中都超越了競品大模型和自家前代最強 Claude 3 Opus。而且,運行速度、成本與自家前代 Claude 3 Sonnet 相當。最重要的是可以免費使用!
以下是關于Claude 3.5 Sonnet的幾個關鍵點:
1. 模型性能:Claude 3.5 Sonnet在多個基準測試中,包括研究生水平推理(GPQA)、本科生水平知識(MMLU)和編碼能力(HumanEval),設定了新的行業標準,展現出對細微差別、幽默和復雜指令的出色理解能力,以及以自然、友好的方式生成高質量內容的能力。
2. 速度與成本:它的運行速度是其前代Claude 3 Opus的兩倍,同時保持了與Claude 3 Sonnet相似的成本效益,這意味著對于用戶來說,它能更高效地處理復雜任務,且價格合理。
3. 免費與付費訪問:Claude 3.5 Sonnet在Claude.ai網站和iOS應用上免費提供給用戶,而訂閱了Claude Pro和Team計劃的用戶可以享受更快的訪問速率。此外,它也通過Anthropic API和亞馬遜云科技Bedrock等平臺提供,定價為每百萬個輸入token 3美元,每百萬個輸出token 15美元。
4. 視覺能力:該模型在視覺識別和處理方面也表現出色,成為Anthropic至今為止最強的視覺模型,特別是在處理視覺推理任務,如解釋圖表、圖形轉錄文本等方面,這對零售、物流和金融服務等行業尤為重要。
5. Artifacts功能:Anthropic引入了一項名為Artifacts的新功能,允許用戶在與Claude交互時,于對話旁邊專用窗口中實時查看、編輯和構建由Claude生成的內容,比如代碼片段、文本文檔和網站設計,進一步促進了人工智能與人類工作的無縫集成。
6. 安全性考量:Claude 3.5 Sonnet經過嚴格的安全測試,并被分類為AI安全等級2(ASL-2),意味著它在化學、生物、放射性、核風險、網絡安全和自主能力等領域使用相對安全,不會造成災難性損害。Anthropic還與外部專家合作,不斷測試和完善模型的安全機制,以減少濫用風險。