AI 這個(gè)行業(yè)真的卷生卷死,凌晨 2 點(diǎn)半,剛想早睡一點(diǎn)點(diǎn),9 點(diǎn)起來(lái)蹲 DeepSeek 的開(kāi)源。
結(jié)果,Claude 直接玩偷襲了。
Claude 3.7 Sonnet 來(lái)了,也是 Claude 家族,第一個(gè)能推理的模型。
還掏出了他們自己的 AI 編程工具。
一個(gè)一個(gè)說(shuō)吧。。。我真的很想睡覺(jué)啊。。。
更多AIGC最新資訊:
網(wǎng)站鏈接:https://claude.ai/
Claude 3.7 Sonnet 跟市面上的其他推理模型有點(diǎn)不一樣,也印證了之前 TheInformation 的爆料,這一次的 Claude 3.7 Sonnet,是一個(gè)混合推理模型。
簡(jiǎn)單的說(shuō),就是 Claude 3.7 Sonnet 即是一個(gè)普通的大模型,也是一個(gè)推理模型,你可以理解為把 DeepSeek V3 和 R1 直接揉在了一起。
切換模式使用下拉菜單去控制。
分為普通模式和擴(kuò)展(其實(shí)就是推理)模式。
普通模式下,它就是個(gè)升級(jí)版 Claude 3.5 Sonnet,回答迅速,跟以前一樣流暢,牛逼了一些,沒(méi)啥大區(qū)別。
如果你想讓它認(rèn)真思考,比如一些數(shù)學(xué)、物理、編程、復(fù)雜分析場(chǎng)景,就可以切換到擴(kuò)展模式,這時(shí)它就會(huì)跟 R1 和 o1 一樣,開(kāi)始思維鏈展開(kāi),自己推理。
比如說(shuō)我就用普通模式去問(wèn),會(huì)發(fā)現(xiàn)跟之前差不多。
但是切換到擴(kuò)展模式,他就會(huì)開(kāi)始思考了。
整體坦率的講,在交互上跟其他的推理模型都一個(gè)樣。
能力還是那些老能力,在數(shù)學(xué)、物理、遵循指令、編碼以及許多其他任務(wù)上的表現(xiàn)上會(huì)更強(qiáng)。
然后我還發(fā)現(xiàn)一個(gè)非常 der 比的事情,就是他都說(shuō)自己是混合模型了,我以為我可以有無(wú)縫的體驗(yàn),在一個(gè)對(duì)話(huà)窗口中可以實(shí)現(xiàn)普通模型和擴(kuò)展模型來(lái)回切換的體驗(yàn),甚至有一些黑科技加持。
結(jié)果。。。
這個(gè) New chat 看到?jīng)],一點(diǎn)就切換到一個(gè)新窗口了。。。
不是,DeepSeek 都能在一個(gè)對(duì)話(huà)窗口上進(jìn)行 R1 和 V3 的隨時(shí)切換呢,你這是干啥啊。。。
但是有一說(shuō)一,Claude 的文筆是真的好啊,在推理能力的加持下,感覺(jué)寫(xiě)出來(lái)的內(nèi)容,味道更正,更真人了,甚至,劇情的邏輯都更順了。
不過(guò),這些都不重要,Claude 最牛逼的東西,還是它的編程。
非推理模型加持下的 Claude 3.5,就能跟 o1 打的有來(lái)有回,甚至至今還是 cursor 他們認(rèn)為最優(yōu)的模型。
而 Claude 3.7,直接就是屬于斷檔式把其他人按在地上摩擦了。
在遵循指令、一般推理、多模態(tài)能力和自主編碼方面的表現(xiàn)都很牛逼,特別是加了推理之后,在數(shù)學(xué)和科學(xué)方面也是一飛沖天。
然后有一個(gè)是我覺(jué)得最騷的基準(zhǔn),就是他們讓 Claude 3.7 Sonnet,玩寶可夢(mèng)紅。。。
一款非常老但是非常經(jīng)典的游戲,整個(gè)寶可夢(mèng)系列的第一世代。
他們給了 Claude 配備了基本的內(nèi)存、屏幕像素輸入和按鍵操作功能,讓 Claude 開(kāi)著擴(kuò)展思維去玩寶可夢(mèng),最后結(jié)果是這樣的。
之前的版本在游戲早期就直接廢了,Claude 3.0 Sonnet 甚至沒(méi)能出新手村。。。
但是 Claude 3.7 Sonnet 的 AI 代理(Agent)的能力就非常強(qiáng),成功挑戰(zhàn)了三個(gè)道館的館主,贏了他們的徽章。
非常的有意思,可以非常直觀(guān)的看出來(lái),Claude 3.7 Sonnet 在編程、代理、數(shù)學(xué)等等的能力上,幾乎有了質(zhì)的飛躍。
AI 編程這個(gè)領(lǐng)域,看來(lái)又要前進(jìn)一大步了。
在 API 的定價(jià)上,Claude 3.7 Sonnet 每百萬(wàn)輸入是 3 美刀,美百萬(wàn)輸出是 15 美刀,最長(zhǎng)能干到 128k 的輸出,通過(guò) prompt caching 可節(jié)省高達(dá) 90%的成本,通過(guò) batch processing 可節(jié)省 50%的成本,整體還是稍微良心一點(diǎn)的。
不過(guò)跟 DeepSeek 這種價(jià)格屠夫比起來(lái),還是有不少距離,但是也比 OpenAI 好了。。。
主要還是 DeepSeek 實(shí)在太便宜了。
在推理控制上,開(kāi)發(fā)者還是比較自由的,甚至可以設(shè)置“思維預(yù)算”,精確控制 Claude 在一個(gè)問(wèn)題上花費(fèi)的時(shí)間。
整體來(lái)說(shuō),Claude 3.7 Sonnet 還是非常香的。
當(dāng)然,如果他不封號(hào)且格局不是那么小的話(huà),會(huì)更好。。。
他們自己的類(lèi)似于 Cursor 的 AI 編程工具。
可以搜索和閱讀代碼,編輯文件,編寫(xiě)和運(yùn)行測(cè)試,提交并推送代碼到 GitHub,并使用命令行工具。
他們自己的界面,也非常的命令行。
目前開(kāi)放了限量預(yù)覽,有興趣的可以去這個(gè)地方查看所有的詳情:https://docs.anthropic.com
整個(gè)手冊(cè)已經(jīng)寫(xiě)的非常詳細(xì)了,我就不過(guò)多贅述了。
但是對(duì)于一些剛開(kāi)始我那 AI 編程的或者是沒(méi)代碼知識(shí)的,我還是無(wú)腦建議 Trae 或者 Cursor。
AI 圈的進(jìn)化速度實(shí)在是太快了,前腳馬斯克的 Grok3 地球最聰明的稱(chēng)號(hào)屁股還沒(méi)坐熱,Claude 3.7 Sonnet 直接殺出來(lái)了。
而且把模型的上限,再一次拔高了一個(gè)臺(tái)階。
這就是 AI 的江湖啊,深刻的感覺(jué)到了連睡覺(jué)都是罪過(guò)。
早上 9 點(diǎn)還要起來(lái)蹲 DeepSeek 的開(kāi)源。
你們就卷吧,AI 公司肯定沒(méi)啥事,第一個(gè)卷死的一定是 AI 自媒體。。。
但這就是 AI 時(shí)代最刺激的部分。
沒(méi)得覺(jué)睡,也開(kāi)心。
畢竟,每天都在見(jiàn)證歷史。
你說(shuō)呢。
歡迎關(guān)注作者的微信公眾號(hào):數(shù)字生命卡茲克
復(fù)制本文鏈接 文章為作者獨(dú)立觀(guān)點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。
發(fā)評(píng)論!每天贏獎(jiǎng)品
點(diǎn)擊 登錄 后,在評(píng)論區(qū)留言,系統(tǒng)會(huì)隨機(jī)派送獎(jiǎng)品
2012年成立至今,是國(guó)內(nèi)備受歡迎的設(shè)計(jì)師平臺(tái),提供獎(jiǎng)品贊助 聯(lián)系我們
AI輔助海報(bào)設(shè)計(jì)101例
已累計(jì)誕生 737 位幸運(yùn)星
發(fā)表評(píng)論 為下方 6 條評(píng)論點(diǎn)贊,解鎖好運(yùn)彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評(píng) ↓