【ITBEAR】9月25日消息,隨著技術的飛速發展,國內大模型企業正邁向一個全新的時代——十萬卡時代。近日,百度、阿里云等科技巨頭相繼宣布,在AI大模型領域取得重要突破,成功部署支持十萬卡級別的大規模集群,這標志著中國在AI算力方面邁出了堅實的一步。
百度發布的百舸AI異構計算平臺4.0,專為部署十萬卡大規模集群而設計。據百度智能云事業群總裁沈抖介紹,該平臺在萬卡集群上實現了有效訓練時長占比高達99.5%以上,通過一系列技術創新,大幅提升了模型訓練效率,整體性能相比業界平均水平提升了30%。這一成就不僅彰顯了百度在AI技術方面的深厚底蘊,也為中國大模型企業的發展注入了強勁動力。
與此同時,阿里云也宣布其靈駿單網絡集群已擴展至十萬卡級別。阿里云CTO周靖人透露,他們的萬卡算力集群可以實現連續訓練有效時長大于99%,模型算力利用率提升20%以上。這些數據顯示出阿里云在AI算力領域的強大實力和持續創新的精神。
據ITBEAR了解,十萬卡集群的部署不僅面臨著巨大的資金成本挑戰,還需要克服諸多技術難題。GPU的敏感性和大規模集群的故障率問題是其中之一。此外,大模型訓練過程中的網絡傳輸能力也是一個不容忽視的挑戰。然而,國內大模型企業通過不斷的技術研發和創新,正逐步攻克這些難題,展現出令人矚目的進步速度。
值得一提的是,中國大模型企業在發展過程中還面臨著特殊的困難,即無法完全依賴國外芯片方案。因此,國內企業需要在使用包括國產GPU在內的異構芯片方面下功夫,以確保在算力規模上能夠與美國企業相抗衡。這一挑戰也催生了國內芯片產業的快速發展和技術創新。
然而,隨著大模型性能的提升,成本問題也日益凸顯。十萬卡集群每天消耗的電力就相當于北京市東城區一天的居民用電量。因此,如何在保證性能的同時降低成本,成為大模型企業需要思考的重要問題。阿里云方面表示,他們將通過降價帶動應用爆發,并著眼于長遠發展,不僅僅局限于眼前的利益。
總的來說,國內大模型企業在邁向十萬卡時代的道路上取得了顯著的進展。他們通過技術創新和持續努力,正逐步克服各種挑戰,展現出強大的發展勢頭。未來,我們有理由期待這些企業在AI領域取得更加輝煌的成就。
#AI大模型# #十萬卡時代# #百度百舸# #阿里云靈駿# #算力挑戰#