阿里云近期在智能編程領域投下了一枚震撼彈,正式對外宣布其AI編程大模型Qwen3-Coder將全面開放源代碼。這一消息迅速在業(yè)界引發(fā)了廣泛關注,Qwen3-Coder憑借其出色的代碼生成與Agent能力,在Agentic Coding、Agentic Browser-Use以及基礎編碼任務等多個方面均達到了開源模型的前沿水平,無疑為智能編程技術的發(fā)展開啟了新篇章。
Qwen3-Coder系列模型提供了多樣化的規(guī)格選擇,而此次率先開源的版本是其性能最為強勁的一款——Qwen3-Coder-480B-A35B-Instruct。該模型基于先進的MoE架構,參數(shù)量高達4800億,激活參數(shù)為350億,原生支持256K的上下文長度,并通過YaRN技術可擴展至1M,這為處理龐大的代碼庫和復雜動態(tài)數(shù)據(jù)提供了強有力的支撐。
在預訓練階段,阿里云通義團隊通過一系列創(chuàng)新策略顯著增強了Qwen3-Coder的代碼處理能力。數(shù)據(jù)層面,7.5萬億字節(jié)的訓練數(shù)據(jù)中,代碼占比高達70%,確保了模型在保持通用性和數(shù)學能力的同時,編程能力也達到了卓越水平。在上下文處理方面,模型原生支持的長上下文能力專為大型代碼倉庫和動態(tài)數(shù)據(jù)設計,大幅提升了Agentic Coding的效率和精準度。團隊還采用了合成數(shù)據(jù)擴展技術,利用Qwen2.5-Coder對低質(zhì)量數(shù)據(jù)進行清洗和重寫,進一步提升了數(shù)據(jù)質(zhì)量。
進入后訓練階段,通義團隊引入了執(zhí)行驅動的大規(guī)模強化學習策略,通過自動擴展測試樣例,構建了海量的高質(zhì)量訓練實例。這一策略不僅大幅提升了代碼的執(zhí)行成功率,還對其他任務產(chǎn)生了顯著的正面效應。在真實世界的軟件工程任務中,如SWE-Bench,Qwen3-Coder展現(xiàn)了卓越的自主規(guī)劃、工具調(diào)用和決策能力,在SWE-bench Verified上取得了開源模型的最佳成績。
為了讓開發(fā)者更便捷地使用Qwen3-Coder,通義團隊還推出了命令行工具Qwen Code。該工具針對Qwen3-Coder系列模型進行了專門的優(yōu)化,增強了解析器和工具支持,使開發(fā)者能夠更充分地挖掘模型在代理式編程上的潛力。同時,Qwen3-Coder的API還與Claude Code、Cline等編程工具實現(xiàn)了協(xié)同工作,為開發(fā)者提供了更加靈活高效的編程體驗。
目前,Qwen3-Coder已在魔搭社區(qū)和HuggingFace等平臺全面開放源代碼,全球開發(fā)者均可免費下載和使用。該模型即將接入阿里的AI編程產(chǎn)品通義靈碼,進一步拓展其應用場景。阿里云百煉平臺也已上線了Qwen3-Coder的API,為開發(fā)者提供了更為便捷的接入途徑。
想要了解更多關于Qwen3-Coder的信息,請訪問以下鏈接:
魔搭社區(qū):https://modelscope.cn/models/Qwen/Qwen3-Coder-480B-A35B-Instruct
Hugging Face:https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507
Qwen Code GitHub:https://github.com/QwenLM/qwen-code