阿里通義千問近期發(fā)布了一項重大技術(shù)成果——Qwen3-Coder,這款代碼模型被譽為迄今為止最具代理能力的產(chǎn)品,并已向全球開發(fā)者開源。這一舉措標志著阿里在AI編程領(lǐng)域的又一重大突破。
Qwen3-Coder提供多種版本,其中最強大的版本為Qwen3-Coder-480B-A35B-Instruct。這款MoE模型結(jié)合了480B的基礎(chǔ)參數(shù)和35B的激活參數(shù),支持高達256K token的上下文長度,并可通過YaRN技術(shù)擴展至1M token。其卓越的代碼生成能力和Agent特性尤為突出。
據(jù)透露,Qwen3-Coder-480B-A35B-Instruct在Agentic Coding、Agentic Browser-Use和Agentic Tool-Use方面取得了開源模型的頂尖表現(xiàn),與業(yè)界知名的Claude Sonnet4模型不相上下。這一成就進一步鞏固了Qwen3-Coder在AI編程助手領(lǐng)域的領(lǐng)先地位。
為了幫助開發(fā)者更好地利用Qwen3-Coder,通義團隊還推出了Qwen Code命令行工具。該工具基于Gemini Code進行了優(yōu)化,調(diào)整了prompt和工具調(diào)用協(xié)議,旨在最大限度地提升Qwen3-Coder在Agentic Coding任務(wù)中的表現(xiàn)。Qwen3-Coder的API還與Claude Code、Cline等工具實現(xiàn)了無縫協(xié)同。
目前,Qwen3-Coder已在多個平臺如魔搭社區(qū)和HuggingFace上開源,全球開發(fā)者均可免費下載和使用。同時,該模型即將集成到阿里的AI編程產(chǎn)品通義靈碼中,其API也已在阿里云百煉平臺上上線。
回顧今年5月,Anthropic公司發(fā)布的Claude 4雙模型——Claude Opus 4和Claude Sonnet 4,以“不間斷編碼7小時”為賣點,展示了其強大的編碼和推理能力。Claude Code編程助手也隨之全面開放。在權(quán)威編程基準測試SWE-bench Verified中,Claude Opus 4和Claude Sonnet 4分別取得了79.4%和80.2%的高分,遠超OpenAI Codex-1、o3、GPT-4.1以及Gemini 2.5 Pro等模型。
面對如此強勁的競爭對手,通義團隊表示,Qwen3-Coder的升級從多個維度進行了優(yōu)化,以提升代碼能力。數(shù)據(jù)方面,模型訓練使用了總計7.5T的數(shù)據(jù),其中70%為代碼數(shù)據(jù),確保了模型在保持通用與數(shù)學能力的同時,擁有出色的編程能力。上下文方面,原生支持256K token長度,并通過YaRN技術(shù)擴展至1M,專為倉庫級和動態(tài)數(shù)據(jù)處理優(yōu)化。還通過Qwen2.5-Coder對低質(zhì)數(shù)據(jù)進行清洗與重寫,顯著提升了數(shù)據(jù)質(zhì)量。
在真實世界的軟件工程任務(wù)中,如SWE-Bench測試,通義團隊在Qwen3-Coder的后訓練階段實施了Agent RL策略,鼓勵模型通過多輪交互利用工具解決問題。借助阿里云的基礎(chǔ)設(shè)施,實現(xiàn)了同時運行20k個獨立環(huán)境的能力。這一基礎(chǔ)設(shè)施為模型提供了大規(guī)模的強化學習反饋和評測,助力Qwen3-Coder在SWE-bench Verified測試中取得了開源模型的頂尖成績。