百川智能近期宣布推出其醫療領域的增強大模型Baichuan-M2,該模型在HealthBench基準測試中取得了60.1的高分。值得注意的是,Baichuan-M2以32B的參數規模,超越了OpenAI的gpt-oss120b模型(得分57.6),以及其他多個世界領先的開源大模型,如Qwen3-235B、Deepseek R1和Kimi K2。
回溯至今年年初,百川智能率先在行業內發布了“AI患者模擬器”,通過真實數據創建了涵蓋不同年齡、性別和癥狀的上萬個虛擬患者,并模擬了數百萬次的診療過程。基于這一創新范式,百川智能開源了Baichuan-M1,這是業內首個醫療增強模型。
經過七個月的技術迭代,百川智能升級了患者模擬器,并引入了端到端的強化學習機制。這一改進使得Baichuan-M2在HealthBench等評測標準上取得了更為顯著的突破。
為了滿足醫療領域用戶對于隱私保護的嚴格要求,百川智能對Baichuan-M2進行了深度輕量化處理。量化后的模型精度幾乎不受影響,能夠在RTX4090顯卡上單卡部署。與DeepSeek-R1 H20的雙節點部署方式相比,這一方案的成本降低了57倍。Baichuan-M2針對國產主流芯片進行了開發和適配,使得大多數醫療機構能夠利用現有硬件條件實現快速部署。
針對急診、門診等需要快速交互的場景,Baichuan-M2的MTP版本基于Eagle-3架構進行了優化,在單用戶場景下實現了74.9%的token處理速度提升。