大模型時代,幾乎每次谷歌大會前夕,OpenAI都會以新品“狙擊”其發(fā)布節(jié)奏。但此次,由于OpenAI備貨不足,GPT-5尚未完成,Anthropic接棒了這項“任務”。
當地時間5月22日,谷歌I/O大會結束次日,Anthropic發(fā)布 Claude 4 系列大模型,包括旗艦版Claude Opus 4 與普適版Claude Sonnet 4,直接沖擊谷歌Gemini 2.5 Pro在編程領域的熱度。
刷新AI編程模型熱度
由OpenAI 前員工們創(chuàng)立至今,逐漸發(fā)展為OpenAI最大競品之一的Anthropic,主要定位為安全優(yōu)先的AI解決方案提供商,專注于企業(yè)級市場,在混合推理模型與編程能力方面具備一定行業(yè)優(yōu)勢。此次新模型產品進一步加深其在編程領域的影響力。
技術層面,據Anthropic方面表示,Claude Opus 4作為編碼模型,在復雜、長時間運行任務和智能體工作流中擁有持續(xù)的高性能;Claude Sonnet 4是Sonnet 3.7 的升級版,提供更強的代碼和推理能力,同時更精確地響應用戶指令。
兩款模型新品均采用混合模型架構,提供快速響應和用于更深層次推理的擴展思維模式,均可在Anthropic API、亞馬遜云科技Bedrock和Google Cloud的Vertex AI上使用。兩相對比,Opus 4是Anthropic截至目前最強模型,專為復雜、長時間任務設計,適合需要深度推理和高級代理能力的場景。而Sonnet 4平衡了性能與效率,響應速度更快,適合日常開發(fā)和高流量任務,同時提供了更高的性價比。
目前AI編程賽道的明星公司Cursor與Claude綁定較深,Cursor中有四個Claude4模型可選——Claude Sonnet 4、Claude Sonnet 4 thinking、Claude Opus 4、Claude Opus 4 thinking。
此前谷歌發(fā)布的Gemini 2.5 Pro作為旗艦AI模型,優(yōu)化了編程能力,在代碼生成、調試和上下文理解等方面已表現出色。“小貓補光燈”開發(fā)者花生經過對比測評發(fā)現,Gemini 2.5 Pro在復雜長代碼方面表現偶爾不錯,但對指令的理解和遵從能力相比Claude稍差,視覺審美也比較糟糕,常常會有莫名其妙的表現。對比之下,Claude Sonnet 4原型細節(jié)內容更豐富,適合日常編程選擇。
Opus是比Sonnet更大的模型,花生表示,在非編程的數學、推理等任務方面比Sonnet模型更好,但也更貴。尤其在Cursor中是需要啟用Max模式,也就是每一次回答都需要單獨計費的。但在常規(guī)的編程任務表現上并沒有顯著優(yōu)于Sonnet模型,相對更適合上下文長度非常長的大型復雜項目,或者重構項目。
北理工前沿交叉科學研究院研究生丁紀翔也是在Cursor內體驗的Claude 新模型,他對記者表示,Cursor里Opus屬于Max標記的模型,需要單獨付費,且相對速度較慢,小項目使用Sonnet足夠了。
AI編程兩大發(fā)展方向
5月以來,AI編程領域熱點事件頻發(fā)。
5月3日,蘋果與Anthropic聯手開發(fā)由AI驅動的Vibe Coding(氛圍編程)平臺;6日,OpenAI被曝將以30億美元收購AI編程創(chuàng)業(yè)公司Windsurf;17日,OpenAI推出編程智能體Codex,可實現自動生成、調試和優(yōu)化代碼;20日,美團宣布將上線一款AI編程類工具“NoCode”;21日,騰訊披露公司已有約85%的程序員使用騰訊云代碼助手CodeBuddy。
另在19日至23日,海外頭部廠商微軟、谷歌、Anthropic各自舉辦的大會均披露新模型在AI編程方面的技術與產品進展,AI編程行業(yè)經過多年發(fā)展,終于走向產品交付。
在峰瑞資本合伙人陳石看來,整個AI編程行業(yè)發(fā)展起始于2022年年底GPT-3.5的發(fā)布,同時行業(yè)也分拆為兩大方向——其一是Copilot助手,人主導、AI輔助,如Github Copilot、Cursor、Windsurf、Trae等產品;其二是Agent智能體,AI主動執(zhí)行,人類扮演監(jiān)督者角色,如Devin。
錦秋基金合伙人臧天宇回顧過去半年多的投資項目發(fā)現,近60%的項目分布在應用層,其中,Agent方向占比近40%,也屬于目前行業(yè)討論最熱烈的方向。Agent方向可分為兩類,其中之一就是Coding Agent,專注于解決代碼問題。長期來看,臧天宇認為,行業(yè)有望借助代碼這一通用工具向更通用的智能Agent發(fā)展。
此次Anthropic大會現場,Anthropic CEO Dario Amodei(達里奧?阿莫代伊)表示:“我們不再教AI寫代碼,而是讓它開始獨立完成項目。過去建模型,現在我們在建產品。”硅谷AI編程獨角獸Replit CEO Amjad Masad(阿姆賈德?馬薩德)此前表示,“AI 的下一個階段不再是我們告訴它怎么做,而是我們告訴它想做什么,它自己決定怎么做。AI不只是干活,而是開始決定任務怎么被拆解,流程怎么被安排。”
Anthropic的新模型為編程Agent完成產品交付打了個樣,但整個行業(yè)的發(fā)展仍面臨技術成熟、認知匹配,以及安全性等方面的待完善。陳石表示,Agent技術上目前面臨模型能力、上下文收集能力兩方面制約,Copilot這種協(xié)作類產品比較容易率先打開市場。
在丁紀翔的體驗中,AI編程產品顯著提高了工作效率,原本需要三周時間完成的工作量,現在疊加AI工具的輔助,三天即可完成。但目前AI編程的不足在他看來,主要在于機器還沒有“自我意識”,需要人類先提出核心要點與任務方向,AI無法直接提供一個有價值的創(chuàng)意點。
“AI coding這個市場非常大,大家都處在早期,還看不到終局。”陳石表示,創(chuàng)業(yè)公司要做一些艱難的選擇,找一些非共識的方向,Agent是一個可以考慮的選擇。
幫企客致力于為您提供最新最全的財經資訊,想了解更多行業(yè)動態(tài),歡迎關注本站。鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。