Claude 3.7 Sonnet深夜上線(xiàn),AI編程的天又被捅破了

AI 這個(gè)行業(yè)真的卷生卷死,凌晨 2 點(diǎn)半,剛想早睡一點(diǎn)點(diǎn),9 點(diǎn)起來(lái)蹲 DeepSeek 的開(kāi)源。

結(jié)果,Claude 直接玩偷襲了。

Claude 3.7 Sonnet深夜上線(xiàn),AI編程的天又被捅破了

Claude 3.7 Sonnet 來(lái)了,也是 Claude 家族,第一個(gè)能推理的模型。

還掏出了他們自己的 AI 編程工具。

一個(gè)一個(gè)說(shuō)吧。。。我真的很想睡覺(jué)啊。。。

更多AIGC最新資訊:

一、Claude 3.7 Sonnet

網(wǎng)站鏈接:https://claude.ai/

Claude 3.7 Sonnet 跟市面上的其他推理模型有點(diǎn)不一樣,也印證了之前 TheInformation 的爆料,這一次的 Claude 3.7 Sonnet,是一個(gè)混合推理模型。

簡(jiǎn)單的說(shuō),就是 Claude 3.7 Sonnet 即是一個(gè)普通的大模型,也是一個(gè)推理模型,你可以理解為把 DeepSeek V3 和 R1 直接揉在了一起。

切換模式使用下拉菜單去控制。

Claude 3.7 Sonnet深夜上線(xiàn),AI編程的天又被捅破了

分為普通模式和擴(kuò)展(其實(shí)就是推理)模式。

普通模式下,它就是個(gè)升級(jí)版 Claude 3.5 Sonnet,回答迅速,跟以前一樣流暢,牛逼了一些,沒(méi)啥大區(qū)別。

如果你想讓它認(rèn)真思考,比如一些數(shù)學(xué)、物理、編程、復(fù)雜分析場(chǎng)景,就可以切換到擴(kuò)展模式,這時(shí)它就會(huì)跟 R1 和 o1 一樣,開(kāi)始思維鏈展開(kāi),自己推理。

比如說(shuō)我就用普通模式去問(wèn),會(huì)發(fā)現(xiàn)跟之前差不多。

Claude 3.7 Sonnet深夜上線(xiàn),AI編程的天又被捅破了

但是切換到擴(kuò)展模式,他就會(huì)開(kāi)始思考了。

Claude 3.7 Sonnet深夜上線(xiàn),AI編程的天又被捅破了

整體坦率的講,在交互上跟其他的推理模型都一個(gè)樣。

能力還是那些老能力,在數(shù)學(xué)、物理、遵循指令、編碼以及許多其他任務(wù)上的表現(xiàn)上會(huì)更強(qiáng)。

然后我還發(fā)現(xiàn)一個(gè)非常 der 比的事情,就是他都說(shuō)自己是混合模型了,我以為我可以有無(wú)縫的體驗(yàn),在一個(gè)對(duì)話(huà)窗口中可以實(shí)現(xiàn)普通模型和擴(kuò)展模型來(lái)回切換的體驗(yàn),甚至有一些黑科技加持。

結(jié)果。。。

Claude 3.7 Sonnet深夜上線(xiàn),AI編程的天又被捅破了

這個(gè) New chat 看到?jīng)],一點(diǎn)就切換到一個(gè)新窗口了。。。

不是,DeepSeek 都能在一個(gè)對(duì)話(huà)窗口上進(jìn)行 R1 和 V3 的隨時(shí)切換呢,你這是干啥啊。。。

但是有一說(shuō)一,Claude 的文筆是真的好啊,在推理能力的加持下,感覺(jué)寫(xiě)出來(lái)的內(nèi)容,味道更正,更真人了,甚至,劇情的邏輯都更順了。

Claude 3.7 Sonnet深夜上線(xiàn),AI編程的天又被捅破了

不過(guò),這些都不重要,Claude 最牛逼的東西,還是它的編程。

非推理模型加持下的 Claude 3.5,就能跟 o1 打的有來(lái)有回,甚至至今還是 cursor 他們認(rèn)為最優(yōu)的模型。

而 Claude 3.7,直接就是屬于斷檔式把其他人按在地上摩擦了。

Claude 3.7 Sonnet深夜上線(xiàn),AI編程的天又被捅破了

在遵循指令、一般推理、多模態(tài)能力和自主編碼方面的表現(xiàn)都很牛逼,特別是加了推理之后,在數(shù)學(xué)和科學(xué)方面也是一飛沖天。

Claude 3.7 Sonnet深夜上線(xiàn),AI編程的天又被捅破了

然后有一個(gè)是我覺(jué)得最騷的基準(zhǔn),就是他們讓 Claude 3.7 Sonnet,玩寶可夢(mèng)紅。。。

Claude 3.7 Sonnet深夜上線(xiàn),AI編程的天又被捅破了

一款非常老但是非常經(jīng)典的游戲,整個(gè)寶可夢(mèng)系列的第一世代。

他們給了 Claude 配備了基本的內(nèi)存、屏幕像素輸入和按鍵操作功能,讓 Claude 開(kāi)著擴(kuò)展思維去玩寶可夢(mèng),最后結(jié)果是這樣的。

Claude 3.7 Sonnet深夜上線(xiàn),AI編程的天又被捅破了

之前的版本在游戲早期就直接廢了,Claude 3.0 Sonnet 甚至沒(méi)能出新手村。。。

但是 Claude 3.7 Sonnet 的 AI 代理(Agent)的能力就非常強(qiáng),成功挑戰(zhàn)了三個(gè)道館的館主,贏了他們的徽章。

非常的有意思,可以非常直觀(guān)的看出來(lái),Claude 3.7 Sonnet 在編程、代理、數(shù)學(xué)等等的能力上,幾乎有了質(zhì)的飛躍。

AI 編程這個(gè)領(lǐng)域,看來(lái)又要前進(jìn)一大步了。

在 API 的定價(jià)上,Claude 3.7 Sonnet 每百萬(wàn)輸入是 3 美刀,美百萬(wàn)輸出是 15 美刀,最長(zhǎng)能干到 128k 的輸出,通過(guò) prompt caching 可節(jié)省高達(dá) 90%的成本,通過(guò) batch processing 可節(jié)省 50%的成本,整體還是稍微良心一點(diǎn)的。

不過(guò)跟 DeepSeek 這種價(jià)格屠夫比起來(lái),還是有不少距離,但是也比 OpenAI 好了。。。

主要還是 DeepSeek 實(shí)在太便宜了。

Claude 3.7 Sonnet深夜上線(xiàn),AI編程的天又被捅破了

在推理控制上,開(kāi)發(fā)者還是比較自由的,甚至可以設(shè)置“思維預(yù)算”,精確控制 Claude 在一個(gè)問(wèn)題上花費(fèi)的時(shí)間。

整體來(lái)說(shuō),Claude 3.7 Sonnet 還是非常香的。

當(dāng)然,如果他不封號(hào)且格局不是那么小的話(huà),會(huì)更好。。。

二、Claude Code

他們自己的類(lèi)似于 Cursor 的 AI 編程工具。

Claude 3.7 Sonnet深夜上線(xiàn),AI編程的天又被捅破了

可以搜索和閱讀代碼,編輯文件,編寫(xiě)和運(yùn)行測(cè)試,提交并推送代碼到 GitHub,并使用命令行工具。

他們自己的界面,也非常的命令行。

Claude 3.7 Sonnet深夜上線(xiàn),AI編程的天又被捅破了

目前開(kāi)放了限量預(yù)覽,有興趣的可以去這個(gè)地方查看所有的詳情:https://docs.anthropic.com

Claude 3.7 Sonnet深夜上線(xiàn),AI編程的天又被捅破了

整個(gè)手冊(cè)已經(jīng)寫(xiě)的非常詳細(xì)了,我就不過(guò)多贅述了。

但是對(duì)于一些剛開(kāi)始我那 AI 編程的或者是沒(méi)代碼知識(shí)的,我還是無(wú)腦建議 Trae 或者 Cursor。

寫(xiě)在最后

AI 圈的進(jìn)化速度實(shí)在是太快了,前腳馬斯克的 Grok3 地球最聰明的稱(chēng)號(hào)屁股還沒(méi)坐熱,Claude 3.7 Sonnet 直接殺出來(lái)了。

而且把模型的上限,再一次拔高了一個(gè)臺(tái)階。

這就是 AI 的江湖啊,深刻的感覺(jué)到了連睡覺(jué)都是罪過(guò)。

早上 9 點(diǎn)還要起來(lái)蹲 DeepSeek 的開(kāi)源。

你們就卷吧,AI 公司肯定沒(méi)啥事,第一個(gè)卷死的一定是 AI 自媒體。。。

但這就是 AI 時(shí)代最刺激的部分。

沒(méi)得覺(jué)睡,也開(kāi)心。

畢竟,每天都在見(jiàn)證歷史。

你說(shuō)呢。

歡迎關(guān)注作者的微信公眾號(hào):數(shù)字生命卡茲克

Claude 3.7 Sonnet深夜上線(xiàn),AI編程的天又被捅破了

收藏 13
點(diǎn)贊 20

復(fù)制本文鏈接 文章為作者獨(dú)立觀(guān)點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。