日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:52011
  • 待審:79
  • 小程序:12
  • 文章:1184964
  • 會員:801

近日,英偉達(NVIDIA)的掌舵人黃仁勛與一家備受矚目的中國AI初創企業——MiniMax(希宇科技)的創始人閆俊杰進行了一場長達兩小時的私密會晤。據悉,閆俊杰是唯一獲此殊榮的中國AI創業公司創始人,與黃仁勛共同探討了中美AI行業的現狀與未來趨勢。

MiniMax由閆俊杰于2021年創立,他此前曾任商湯科技的高管職位。這家新興企業在AI領域迅速嶄露頭角,特別是在大規模混合架構推理模型方面取得了顯著成就。

今年6月,MiniMax震撼發布了全球首個開源的大規模混合架構推理模型M1。該模型不僅在性能上超越了國內的閉源模型,逼近了DeepSeek R1及海外頂尖模型的水平,更以卓越的效率和高性價比贏得了業界的廣泛關注。

MiniMax的M1模型得益于其獨創的Lightning Attention機制,這一機制在計算注意力矩陣時表現出色,大幅提升了訓練和推理效率。因此,M1模型在處理長上下文輸入和深度推理任務時具有顯著優勢,支持業內最高的100萬上下文輸入,以及長達8萬Token的推理輸出。

在算力使用方面,M1模型同樣表現出色。在進行8萬Token深度推理時,其算力需求僅為DeepSeek R1的約30%。這一特性使得MiniMax在訓練和推理階段都擁有巨大的算力效率優勢。

MiniMax還提出了創新的強化學習算法CISPO,通過裁剪重要性采樣權重來提升學習效率。在AIME實驗中,CISPO的收斂性能顯著優于包括字節近期提出的DAPO在內的多種強化學習算法,甚至超越了DeepSeek早期使用的GRPO。

得益于這些技術創新,MiniMax的強化訓練過程異常高效,遠遠超出了預期。整個強化學習階段僅使用了512塊H800 GPU,耗時三周,租賃成本僅為53.47萬美金,比最初預算少了一個數量級。

在業內主流的17個評測集上,MiniMax對M1進行了詳細評測。結果顯示,M1在長上下文理解任務中表現出色,僅以微弱差距落后于Google的Gemini 2.5 Pro,但在代理工具使用場景(TAU-bench)中卻戰勝了后者。

鑒于M1模型的高效訓練和推理算力使用,MiniMax宣布在MiniMax APP和Web平臺上提供不限量免費使用服務。同時,公司還以業內最低價格在官網上提供API服務,價格根據輸入長度的不同而有所差異,但均比DeepSeek-R1更具性價比。

分享到:
標簽:技術創新 創始人 深度 探討 對話
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 52011

    網站

  • 12

    小程序

  • 1184964

    文章

  • 801

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定