阿里巴巴近期在人工智能領(lǐng)域取得了重大進(jìn)展,其最新推出的開源大模型“通義千問3”(Qwen3),在國際權(quán)威評測中脫穎而出,成功登頂全球開源模型榜首。這一成就得益于LiveBench排行榜的最新發(fā)布,該榜單由圖靈獎得主楊立昆攜手紐約大學(xué)等機(jī)構(gòu)共同維護(hù),是衡量大模型綜合能力的重要標(biāo)尺。
“通義千問3”自4月29日正式亮相以來,僅用了短短一周時(shí)間,便以其卓越的指令遵循能力,超越了眾多頂級閉源模型,包括o3High、o4-Mini High和Gemini2.5pro等,一舉奪得全球第一的桂冠。LiveBench評測涵蓋了數(shù)學(xué)、推理、編程及語言理解等多個(gè)維度,以其動態(tài)更新的題庫確保了評測的公正性和挑戰(zhàn)性,因此,“通義千問3”的這一成就尤為引人注目。
值得注意的是,“通義千問3”不僅在性能上表現(xiàn)出色,其參數(shù)量還僅為DeepSeek-R1的三分之一,成本大幅降低。作為國內(nèi)首個(gè)“混合推理模型”,“通義千問3”融合了“快思考”與“慢思考”兩種模式,能夠在處理簡單任務(wù)時(shí)迅速響應(yīng),面對復(fù)雜問題時(shí)則進(jìn)行深入的多步驟思考,這一創(chuàng)新設(shè)計(jì)不僅提高了算力的利用效率,還有效節(jié)省了資源。
“通義千問3”的部署成本也極具競爭力,用戶僅需四張H20顯卡即可實(shí)現(xiàn)其滿血版部署,顯存占用僅為性能相近模型的三分之一。這一顯著的性能提升和成本優(yōu)勢,充分展示了阿里巴巴在大模型領(lǐng)域的深厚技術(shù)積累和創(chuàng)新能力。
“通義千問3”的成功發(fā)布,無疑將激發(fā)更多企業(yè)和開發(fā)者對開源AI模型構(gòu)建的興趣和參與熱情,為人工智能行業(yè)的發(fā)展注入新的動力。這一里程碑式的成就,標(biāo)志著阿里巴巴在人工智能領(lǐng)域的持續(xù)深耕和不斷突破,也為全球AI技術(shù)的發(fā)展貢獻(xiàn)了中國智慧和力量。