在AI算力優化的浪潮中,螞蟻集團正逐步嶄露頭角,憑借其在AI技術領域的全面發力,實現了基于中國AI芯片的模型技術突破。這一突破不僅引起了業界的廣泛關注,還標志著螞蟻集團在AI科技競爭中邁出了重要一步。
據最新消息,螞蟻集團CTO兼平臺技術事業群總裁何征宇領導的Ling Team團隊,成功開發了兩個名為Ling-Lite和Ling-Plus的百靈系列開源MoE模型。Ling-Lite的參數規模達到了168億,而Ling-Plus的基座模型參數規模更是高達2900億。盡管與AI行業中預估的GPT-4.5的1.8萬億參數和DeepSeek-R1的6710億參數相比仍有差距,但螞蟻團隊在預訓練階段使用了較低規格的硬件系統,成功將計算成本降低了約20%,達到了508萬元人民幣,同時實現了與阿里通義Qwen2.5-72B-Instruct和DeepSeek-V2.5-1210-Chat相當的性能。
這一技術成果不僅體現在模型參數和計算成本上,更在于螞蟻團隊在AI Infra技術上的創新。他們構建了一個約9萬億token的高質量語料庫,并采用創新的MoE架構,通過多階段訓練和優化策略,提高了訓練效率。在AI異構計算平臺上,螞蟻團隊將多個訓練框架集成到統一的分布式深度學習框架中,即開源項目DLRover。同時,他們還開發了輕量級調試工具XPUTimer和彈性分布式訓練EDiT,進一步提高了訓練效率和性能。
在存儲優化方面,螞蟻團隊通過存儲與訓練流程的協同設計,提升了MoE場景下的I/O效率。在5000個加速器MoE訓練任務中,他們成功將檢查點寫入延遲降低了50%,減少了一半的時間消耗,同時還將訓練節點上的峰值內存消耗降低了60%。這一成果不僅證明了在性能較弱的硬件上訓練大規模MoE模型的可行性,還為基礎模型開發提供了更靈活、更經濟的方法。
螞蟻團隊在訓練階段使用的并非完全依賴英偉達芯片,而是采用了國產AI/GPGPU芯片產品。這一舉措不僅有助于降低對國外技術的依賴,還為中國AI產業的自主可控發展提供了有力支持。據彭博報道,螞蟻團隊最終得到的結果與英偉達芯片(如H800)的結果相似,進一步證明了國產芯片在AI領域的潛力和實力。
在模型性能方面,Ling-Lite和Ling-Plus均表現出色。在英語理解方面,Ling-Lite模型在一項關鍵基準測試中的表現優于meta的Llama 3.1-8B模型。在中文基準測試中,Ling-Lite和Ling-Plus模型均優于DeepSeek的同類模型。Ling-Plus在安全性和錯誤拒絕方面表現出更好的整體平衡,取得了最好的結果。
螞蟻集團表示,Ling-Plus和Ling-Lite將計劃開源,并應用于醫療、金融等行業領域。目前,螞蟻已經推出了三款AI助手管家產品,包括生活助手“支小寶”、AI金融管家“螞小財”以及剛剛發布的AI醫生助手等產品和解決方案。這些產品的推出不僅有助于提升用戶體驗和效率,還將進一步推動AI技術在各個領域的廣泛應用和發展。
然而,螞蟻團隊也承認大模型訓練是一個具有挑戰性且資源密集的過程。在訓練階段,他們面臨了包括穩定性在內的多種挑戰。即使是硬件或模型結構的微小變化也可能導致問題,包括模型錯誤率的大幅上升。但螞蟻團隊通過不斷的技術創新和優化策略,成功克服了這些困難,取得了今天的成果。
螞蟻集團的這一成果不僅彰顯了中國AI創新能力的不斷增強,還加速了中國技術進步的步伐。如果內容得到證實,這將凸顯出中國正在朝著AI自給自足的方向邁進。隨著AI技術的不斷發展和應用領域的不斷擴大,相信螞蟻集團將繼續在AI領域發揮重要作用,為推動中國AI產業的發展做出更大貢獻。