中國電商巨頭阿里巴巴旗下的通義千問團隊近日再次傳來捷報,其最新推出的開源大語言模型Qwen3-Coder-480B-A35B-Instruct,在軟件開發(fā)領(lǐng)域掀起波瀾。
就在不久前,通義千問團隊剛剛發(fā)布了Qwen3-235B-A22B-2507模型,這款非推理大語言模型憑借卓越表現(xiàn),迅速躍居全球領(lǐng)先地位,即便是與谷歌、OpenAI等美國科技巨頭的專有AI模型相比也毫不遜色。而此次推出的Qwen3-Coder,更是專注于軟件開發(fā)領(lǐng)域,為程序員們帶來了全新的助力。
Qwen3-Coder模型設(shè)計精妙,能夠處理復(fù)雜的多步驟編程工作流程,只需數(shù)秒或數(shù)分鐘,便能創(chuàng)建出功能完備的應(yīng)用程序。這一特性使其在智能體編程任務(wù)中,與Claude Sonnet-4等專有產(chǎn)品形成了有力競爭,并在開源模型中創(chuàng)造了新的基準分數(shù)。
更為Qwen3-Coder采用了Apache 2.0開源許可證,這意味著任何企業(yè)都可以免費獲取、下載、修改、部署,并在其商業(yè)應(yīng)用中使用該模型,無需向阿里巴巴或任何其他方支付任何費用。這一舉措大大降低了企業(yè)的成本,同時提供了更高的選擇性。
在第三方基準測試中,Qwen3-Coder表現(xiàn)優(yōu)異,其“感知編程”功能更是受到了AI高級用戶的高度評價。用戶可以通過自然語言進行編程,無需遵循正式的開發(fā)流程和步驟,極大地提高了編程效率。有專家甚至稱贊其為迄今為止最好的編程模型。
Qwen3-Coder現(xiàn)已在Hugging Face、GitHub、通義千問聊天平臺、阿里巴巴通義千問API以及眾多第三方編程和AI工具平臺上上線。企業(yè)可以根據(jù)自身需求,選擇合適的平臺進行使用。
該模型不僅功能強大,其架構(gòu)也頗具特色。Qwen3-Coder采用了專家混合(MoE)模型架構(gòu),總參數(shù)高達4800億,每次查詢可激活350億參數(shù)。同時,該模型原生支持256K Token上下文長度,通過YaRN技術(shù)可外推至100萬Token,使其能夠在單次處理中理解和操作整個代碼倉庫或冗長文檔。
在智能體評估套件中,Qwen3-Coder在開源模型中取得了領(lǐng)先性能。在智能體瀏覽器使用、多語言編程和工具使用等任務(wù)中,該模型也展現(xiàn)出了出色的表現(xiàn)。視覺基準顯示,在代碼生成、SQL編程、代碼編輯和指令跟隨等類別中,Qwen3-Coder的訓練迭代均呈現(xiàn)出漸進式改進。
為了方便開發(fā)者使用,通義千問還開源了Qwen Code這一CLI工具。該工具支持函數(shù)調(diào)用和結(jié)構(gòu)化提示,使Qwen3-Coder更容易集成到編程工作流程中。同時,Qwen3-Coder還與多個開發(fā)者平臺進行了集成,如Claude Code、Cline、Ollama等,為開發(fā)者提供了更多的選擇。
除了強大的功能和靈活的架構(gòu)外,Qwen3-Coder還受益于先進的后訓練技術(shù)。通過代碼強化學習和長期智能體強化學習,該模型在多樣化、可驗證的代碼任務(wù)上進行了高質(zhì)量、執(zhí)行驅(qū)動的學習,并在多輪交互中學會了規(guī)劃、使用工具和適應(yīng)。這些技術(shù)使得Qwen3-Coder在模擬真實世界的軟件工程挑戰(zhàn)時表現(xiàn)出色。
對于企業(yè)而言,Qwen3-Coder提供了封閉源碼專有模型的開放、高能力替代方案。其強大的編程執(zhí)行能力和長上下文推理能力,使其特別適用于代碼庫級理解、自動化拉取請求工作流程、工具集成和編排等場景。同時,作為開源模型,企業(yè)可以在自己的基礎(chǔ)設(shè)施上部署Qwen3-Coder,避免供應(yīng)商鎖定并更直接地管理計算使用。
開發(fā)者們對Qwen3-Coder的初步反應(yīng)非常積極。多位AI研究員、工程師和開發(fā)者在測試了該模型后,紛紛表示其性能卓越,適應(yīng)性強,且與現(xiàn)有開發(fā)堆棧的集成度很高。這些反饋進一步證明了Qwen3-Coder在技術(shù)嫻熟用戶群體中的受歡迎程度。
阿里巴巴通義千問團隊的這一創(chuàng)新成果,無疑為軟件開發(fā)領(lǐng)域帶來了新的活力和機遇。隨著Qwen3-Coder的廣泛應(yīng)用和推廣,我們有理由相信,它將為更多的企業(yè)和開發(fā)者帶來實實在在的幫助和收益。