在科技界的矚目之下,美國大模型領域的獨角獸企業Anthropic于近日在其首屆開發者大會上,震撼發布了Claude模型的最新版本:Claude Opus 4與Claude Sonnet 4。此次更新標志著Claude系列自2024年6月以來迎來的首次大版本迭代,為人工智能領域注入了新的活力。
Anthropic將Claude Opus 4譽為“編程領域的巔峰之作”,該模型在復雜、耗時長的任務及智能體工作流中展現出了卓越的穩定性。而Claude Sonnet 4作為Claude Sonnet 3.7的重大升級,以編程與推理能力為核心,同時能更精確地理解并響應用戶提示詞。這兩款模型均為混合模型,提供了即時回復與用于深度推理的擴展思考(extended thinking)兩種模式。
在權威的編程基準測試SWE-bench Verified上,開啟擴展思考的Claude Opus 4與Claude Sonnet 4分別以79.4%和80.2%的得分,顯著超越了OpenAI Codex-1、OpenAI o3、OpenAI GPT-4.1及Gemini 2.5 Pro等競爭對手。在編程、工具使用、視覺推理及數學等領域的基準測試中,這兩款模型同樣表現出色,超越了OpenAI o3。而在多語言問答及研究生級別推理任務上,Claude Opus 4與OpenAI o3得分相當。
新模型的智能體能力也得到了顯著提升,最高可獨立運行7小時,并引入了文件API、提示詞緩存等創新功能。這些升級使得Claude系列模型在處理復雜任務時更加高效與智能。
值得注意的是,Pro、Max、Team和Enterprise級別的Claude訂閱用戶將能夠使用這兩款新模型及其擴展思考模式,而Sonnet 4則向免費用戶開放。用戶可在Anthropic API、Amazon Bedrock及Google Cloud的Vertex AI上調用這些模型,定價與之前的Opus和Sonnet模型保持一致。
Anthropic還同期推出了AI編程助手Claude Code,該助手接入了Claude Opus 4模型,能夠實時映射并解釋百萬行級別的代碼庫。Claude Code與GitHub、GitLab、VS Code、JetBrains IDE及命令行工具深度集成,可直接嵌入至開發終端中,為開發者提供了前所未有的便捷與高效。
在Code with Claude開發者大會上,Anthropic創始人Dario Amodei開場便直接揭曉了Claude 4系列模型的發布,給與會者帶來了巨大驚喜。Amodei表示,雖然Anthropic已有一段時間未更新Opus模型,但Opus始終被定位為旗下最強大、最智能的模型,而Sonnet則是用戶過去一年來廣泛使用的中等水平模型。盡管Claude Opus 4在部分基準測試上的成績并未明顯高于Claude Sonnet 4,但Amodei強調,對于如此大型的模型而言,基準測試并不能全面反映其能力。
Anthropic首席產品官、Instagram聯合創始人Mike Krieger進一步分享了Claude 4系列模型的詳細信息。Krieger指出,Claude Opus 4在理解代碼庫、規劃添加內容以及處理復雜智能體工作流方面表現出色,而Claude Sonnet 4則在日常編碼任務、應用程序開發及配對編程方面大放異彩。Claude 4系列模型還升級了關鍵功能,使其能夠并行處理多種工具,并在會話之間保持記憶,隨著時間的推移不斷積累知識。
Krieger還分享了他在加入Anthropic后不久,憑借Claude的幫助,僅用3人團隊便成功打造亞馬遜Alexa語音助手原型的經歷。這次合作不僅讓Claude成為Alexa Plus的核心模型之一,也讓Krieger更加堅信AI協作的潛力。如今,AI已不僅是工具,而是真正的智能協作伙伴,持續推動技術邊界的拓展。