Anthropic公司于近日正式揭曉了其最新的技術成果——Claude Opus 4.1模型。這一版本相較于今年5月推出的Claude 4系列,在編碼、推理和執行指令方面實現了顯著提升。
據Anthropic官方介紹,Claude Opus 4.1在SWE-bench Verified評估中的軟件工程準確性達到了74.5%,相較于Claude Sonnet 3.7的62.3%和Claude Opus 4的72.5%,進步顯著。新模型在深度研究、數據分析,特別是細節追蹤和代理搜索方面的能力尤為突出。
相較于Opus 4,Opus 4.1在多項功能上均有所提升,特別是在多文件代碼重構方面的表現令人矚目。Rakuten Group的測試顯示,Opus 4.1能夠精準定位大型代碼庫中的錯誤并進行修正,而不會進行不必要的調整或引入新錯誤。
Windsurf的基準測試報告指出,Opus 4.1在初級開發者測試中的表現相較于Opus 4有了顯著提升,這一性能飛躍與從Sonnet 3.7到Sonnet 4的升級相當。
即日起,Claude Opus 4.1模型正式向Claude客戶開放。用戶可以通過Claude Code、Anthropic的API、亞馬遜Bedrock以及谷歌云的Vertex AI平臺使用該模型。
值得注意的是,Anthropic還在社交媒體上透露,未來幾周內將發布對模型的重大改進,這無疑讓業界對Claude系列模型的后續升級充滿期待。與此同時,OpenAI也預計將在本周內發布新動態。