深度求索(DeepSeek)正式推出新一代開源大模型DeepSeek-R1-0528,該模型已在HuggingFace平臺(tái)開源并更新技術(shù)文檔。官方宣稱,其數(shù)學(xué)推理、編程能力等核心指標(biāo)已逼近GPT-4o、Gemini 2.5 Pro等國(guó)際領(lǐng)先模型。
關(guān)鍵性能突破
據(jù)模型卡信息顯示,R1-0528在AIME等高難度數(shù)學(xué)測(cè)試中得分顯著提升,邏輯推理能力實(shí)現(xiàn)突破性優(yōu)化。同時(shí),新增JSON結(jié)構(gòu)化輸出與函數(shù)調(diào)用功能,可直接對(duì)接自動(dòng)化系統(tǒng)與前后端開發(fā),大幅降低工程化部署門檻。在文本生成方面,新模型幻覺率降低約40%,議論文、小說等創(chuàng)作類任務(wù)的自然度接近人類水平。
輕量化部署方案
技術(shù)團(tuán)隊(duì)首次將R1-0528的"思維鏈"能力蒸餾至Qwen3-8B模型,使其推理性能超越原版Qwen3-8B,逼近參數(shù)規(guī)模大30倍的Qwen3-235B版本,為移動(dòng)端、邊緣計(jì)算等輕量化場(chǎng)景提供新選擇。實(shí)測(cè)數(shù)據(jù)顯示,該模型在Web前端開發(fā)任務(wù)中的代碼生成效率提升26%。
開發(fā)者生態(tài)布局
目前該模型權(quán)重已在HuggingFace開放下載,官方同步釋出適配文檔與API接入指南。業(yè)內(nèi)人士預(yù)測(cè),未來兩周內(nèi)將有大量企業(yè)宣布接入該模型。
體驗(yàn)入口:chat.deepseek.com
API文檔:api-docs.deepseek.com/guides/reasoning_model
模型權(quán)重:huggingface.co/deepseek-ai/DeepSeek-R1-0528