阿里通義千問近期發(fā)布了其旗艦版Qwen3模型的重大更新,推出了名為Qwen3-235B-A22B-Instruct-2507-FP8的新版本,該版本主打非思考模式。此次升級(jí),Qwen3在多個(gè)核心能力上實(shí)現(xiàn)了顯著飛躍。
據(jù)官方介紹,新版Qwen3在指令遵循、邏輯推理、文本解讀、數(shù)學(xué)運(yùn)算、科學(xué)知識(shí)、編程技巧及工具應(yīng)用等多個(gè)維度均有所增強(qiáng)。在一系列權(quán)威測試中,如GQPA知識(shí)評(píng)估、AIME25數(shù)學(xué)競賽模擬、LiveCodeBench編程挑戰(zhàn)、Arena-Hard人類偏好對(duì)齊測試以及BFCL智能體能力評(píng)測,Qwen3均展現(xiàn)出了卓越表現(xiàn),甚至超越了諸如Kimi-K2、DeepSeek-V3等頂尖開源模型,以及Claude-Opus4-Non-thinking等領(lǐng)先的閉源模型。
值得注意的是,就在新版Qwen3發(fā)布前不久,國際知名大模型排行榜LMArena宣布,開源模型Kimi K2憑借其萬億參數(shù)的強(qiáng)大實(shí)力,登頂全球開源模型排行榜首位。盡管如此,新版Qwen3依然憑借自身實(shí)力,在業(yè)界引起了廣泛關(guān)注。
此次升級(jí),Qwen3不僅在通用能力上有所提升,還在多個(gè)關(guān)鍵性能指標(biāo)上取得了顯著進(jìn)步。特別是在多語言長尾知識(shí)的覆蓋上,模型的表現(xiàn)有了質(zhì)的飛躍。同時(shí),在處理主觀及開放性任務(wù)時(shí),Qwen3能夠更好地理解并契合用戶偏好,提供更加有用和高質(zhì)量的回復(fù)。新模型的長文本處理能力也大幅提升至256K,進(jìn)一步增強(qiáng)了其上下文理解能力。
目前,這一全新升級(jí)的Qwen3模型已經(jīng)在魔搭社區(qū)和HuggingFace平臺(tái)上開源發(fā)布,供開發(fā)者們下載和使用。