通義千問Qwen3-4B系列小模型發布，端側部署性能強勁，手機也能流暢運行-魔扣目錄

日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告：魔扣目錄網為廣大站長提供免費收錄網站服務，提交前請做好本站友鏈：【網站目錄：http://www.ylptlb.cn 】，免友鏈快審服務（50元/站），

網站：52011
待審：79
小程序：12
文章：1184964
會員：801

通義千問Qwen3-4B系列小模型發布，端側部署性能強勁，手機也能流暢運行

發布時間：2025-08-07 14:31:56 作者：網友整理

通義千問宣布Qwen3-4B系列模型的發布。這一新模型以其小巧的體積和強大的性能，為人工智能的端側部署帶來了新的可能性。

在前兩周相繼更新了Qwen3-235B-A22B和Qwen3-30B-A3B的Instruct/Thinking「2507」版本后，研發團隊再次發力，推出了更小尺寸的Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507模型。這些新模型在性能上取得了顯著提升，特別是在非推理領域，Qwen3-4B-Instruct-2507全面超越了閉源的GPT4.1-Nano，而在推理領域，Qwen3-4B-Thinking-2507的表現更是令人矚目，其推理能力可與中等規模的Qwen3-30B-A3B（thinking）相媲美。

研發團隊堅信，小型語言模型（SLM）對代理人工智能(Agentic AI)的發展具有極其重要的價值。此次發布的「2507」版本Qwen3-4B模型，不僅體積小，性能強勁，而且對手機等端側硬件部署極為友好。目前，新模型已在魔搭社區和Hugging Face正式開源，吸引了眾多開發者的關注和體驗。

Qwen3-4B-Instruct-2507的通用能力得到了顯著提升，其表現超越了商業閉源的小尺寸模型GPT-4.1-nano，甚至與中等規模的Qwen3-30B-A3B（non-thinking）性能接近。該模型還覆蓋了更多語言的長尾知識，在主觀和開放性任務中增強了人類偏好對齊，能夠提供更符合人們需求的答復。更令人驚喜的是，其上下文理解能力擴展至256K，即使是小模型，也能輕松處理長文本。

與此同時，Qwen3-4B-Thinking-2507的推理能力也大幅增強。在聚焦數學能力的AIME25測評中，該模型以4B參數量斬獲了81.3分的驚人成績，這一表現足以媲美中等模型Qwen3-30B-Thinking。其通用能力也顯著提升，Agent分數更是超越了更大尺寸的Qwen3-30B-Thinking模型。同樣具備256K tokens的上下文理解能力，支持更復雜的文檔分析、長篇內容生成以及跨段落推理等場景。

隨著Qwen3-4B系列模型的發布，人工智能在端側應用的前景變得更加廣闊。相信在不久的將來，我們會看到更多基于這一模型的創新應用，為人們的生活和工作帶來更多便利。

分享到：

標簽：通義千問 Qwen3