小米大模型團隊近期震撼發布其最新研發的多模態大模型——Xiaomi MiMo-VL-7B-2508,此次發布包括強化學習(RL)與監督微調(SFT)兩大版本,為人工智能領域再添新動力。
據官方公布的數據顯示,這款新版模型在多個核心性能指標上取得了顯著突破。特別是在學科推理、文檔理解、圖形界面定位和視頻理解四大領域,它刷新了以往記錄。其中,MMMU基準得分首次躍上70分的高位,ChartQA的準確率高達94.4%,ScreenSpot-v2測試中的表現也達到了92.5%,而VideoMME的得分則提升至70.8%。
此次模型迭代的關鍵在于對強化學習穩定性的優化以及對監督微調流程的改進。這些努力使得模型在內部VLM Arena的評分從1093.9大幅提升至1131.2,標志著小米大模型團隊在技術研發上的又一次飛躍。
尤為新版模型還引入了一項創新功能:用戶可以通過“/no_think”指令自由切換“思考”與“非思考”模式。在“思考”模式下,模型會全程展示推理鏈條,確??刂瞥晒β蔬_到100%;而在“非思考”模式下,模型則直接生成答案,響應速度更快,且成功率高達99.84%。這一功能無疑為用戶提供了更加靈活多樣的使用體驗。
對于希望體驗最新技術的用戶,小米大模型團隊推薦使用RL版本的Xiaomi MiMo-VL-7B-RL-2508模型,該模型在大多數情況下都能提供出色的表現。用戶可以通過以下鏈接獲取該模型的開源代碼:https://huggingface.co/XiaomiMiMo/MiMo-VL-7B-RL-2508。
對于有特殊需求的用戶,小米大模型團隊還提供了SFT版本的Xiaomi MiMo-VL-7B-SFT-2508模型。用戶可以在此基礎上進行進一步的SFT或RL訓練。與上一版SFT模型相比,該版本的RL穩定性得到了顯著提升。用戶可以通過以下鏈接獲取該版本的開源代碼:https://huggingface.co/XiaomiMiMo/MiMo-VL-7B-SFT-2508。