6月17日,月之暗面(Moonshot AI)發布全新開源代碼大模型Kimi-Dev-72B,在AI軟件工程基準測試SWE-bench Verified上取得60.4%的成績,刷新了全球開源模型的最好成績(SOTA)。
據悉,Kimi-Dev-72B專為軟件工程任務設計,參數量為72B,在SWE-bench Verified測試中超越了剛剛發布不久的DeepSeek-R1-0528(57.6%),后者參數量高達671B。
據介紹,Kimi-Dev-72B采用大規模強化學習訓練,能夠在現實代碼環境中自動修復Docker存儲庫,確保在完整測試套件通過后才給予獎勵,以提升模型輸出的正確性和魯棒性,貼合真實軟件開發標準。
目前,Kimi-Dev-72B模型權重、源代碼已在Hugging Face與GitHub平臺開源,并面向開發者社區開放下載部署。
【來源:網易科技】