阿里巴巴旗下的通義千問平臺近日揭曉了其旗艦產(chǎn)品Qwen3模型的重大升級,全新版本Qwen3-235B-A22B-Instruct-2507-FP8正式面世,該版本特別引入了“非思考模式”的改進(jìn)。
此次更新的Qwen3模型,在多項(xiàng)通用能力上實(shí)現(xiàn)了顯著提升,尤其是在指令理解、邏輯推理、文本解析、數(shù)學(xué)運(yùn)算、科學(xué)知識、編程技能及工具運(yùn)用等方面。在多個(gè)權(quán)威評測中,如GQPA知識評估、AIME25數(shù)學(xué)測試、LiveCodeBench編程基準(zhǔn)測試、Arena-Hard人類偏好對齊測試以及BFCL智能體能力評估,Qwen3均展現(xiàn)出了卓越表現(xiàn),超越了諸如Kimi-K2、DeepSeek-V3等頂級開源模型,以及Claude-Opus4-Non-thinking等領(lǐng)先的非開源模型。
不僅如此,Qwen3模型在此次更新中還強(qiáng)化了多項(xiàng)關(guān)鍵性能指標(biāo)。首先,在多語言環(huán)境下,模型對于長尾知識的覆蓋能力有了顯著提升,能夠更好地應(yīng)對跨語言的信息檢索需求。其次,在處理主觀性和開放性任務(wù)時(shí),模型對用戶偏好的把握更加精準(zhǔn),能夠生成更加貼合用戶期望、質(zhì)量更高的回復(fù)和文本內(nèi)容。模型的長文本處理能力也得到了大幅提升,支持處理長達(dá)256K的文本,進(jìn)一步增強(qiáng)了上下文理解能力。
升級后的Qwen3模型已在魔搭社區(qū)和HuggingFace平臺上開源發(fā)布,供開發(fā)者及研究人員下載和使用。這一舉措無疑將推動(dòng)人工智能領(lǐng)域的技術(shù)創(chuàng)新和應(yīng)用拓展,為更多行業(yè)帶來智能化升級的可能性。
此次Qwen3模型的升級,不僅彰顯了阿里巴巴在人工智能技術(shù)領(lǐng)域的深厚積累和創(chuàng)新實(shí)力,也為全球AI社區(qū)的發(fā)展注入了新的活力。