阿里巴巴通義千問團隊近期揭曉了其Qwen3系列中的又一力作——Qwen3-30B-A3B-Instruct-2507模型。這款全新開源模型采用了非思考模式設計,僅需激活3B參數,便能在核心性能上與Gemini2.5-Flash及GPT-4o等閉源巨頭比肩。
Qwen3-30B-A3B-Instruct-2507已在魔搭社區(ModelScope)及HuggingFace平臺全面開放源代碼。作為Qwen3-30B-A3B系列的新成員,它不僅繼承了通義千問團隊在架構上的創新精髓,還顯著降低了運算成本,力求達到千億級閉源模型的性能水平。
在官方公布的數據中,Qwen3-30B-A3B-Instruct-2507在數學推理(AIME25測試得分61.3分)、代碼生成(LiveCodeBenchv6得分43.2分)、研究生級物理與天文學問題(GPQA測試得分70.4分)及人類偏好對齊(Arena-Hard v2得分69分)等多個關鍵基準測試中均有卓越表現,甚至在部分指標上超越了GPT-4o。這一成績彰顯了該模型在邏輯推理、數學、科學及編程等領域的全面實力。
Qwen3-30B-A3B-Instruct-2507在多語言長尾知識覆蓋方面也表現出色,能夠更精準地理解并回應用戶的主觀和開放性需求,生成高質量的文本內容。同時,其長文本理解能力提升至256K,使用戶能夠輕松處理更加復雜的文本信息。
自2023年發布以來,通義千問系列模型已開源超過200個版本,全球下載量突破3億次大關,衍生模型數量更是超過10萬個,彰顯了其在市場上的強大影響力和技術創新的深厚底蘊。