近日,斯坦福大學以人為本人工智能研究所(Stanford HAI)公布了一份引人矚目的《2025年人工智能指數報告》,該報告由李飛飛等人聯合領導,揭示了中美兩國在AI模型性能上的驚人趨近。
這份詳盡的456頁報告,廣泛探討了AI領域的多個維度,包括基準測試成績、應用加速與投資趨勢、中美AI模型的對比、公眾認知的變遷以及AI硬件的發展概況。報告中的數據與見解,為全球AI的發展提供了寶貴的參考。
在AI性能的提升上,報告指出,2023年引入的MMMU、GPQA和SWE-bench三大基準測試中,AI系統的表現實現了質的飛躍。其中,MMMU的成績提升了18.8個百分點,GPQA更是躍升了48.9個百分點,而SWE-bench的進步更是驚人,達到了67.3個百分點。生成高質量視頻的技術也取得了重大突破,語言模型智能體在編程任務上的表現甚至超越了人類。
投資方面,生成式AI在2024年吸引了全球范圍內的廣泛關注,私人投資總額高達339億美元,與前一年相比,增長率達到了18.7%。這一數據無疑表明了投資者對生成式AI未來發展的強烈信心。
在企業應用層面,生成式AI的普及速度令人咋舌。2023年,僅有33%的企業將生成式AI應用于至少一項業務職能中。然而,到了2024年,這一比例已經躍升至71%,實現了翻倍的增長。這充分展示了生成式AI在企業中的應用潛力和價值。
在中美AI模型的對比上,報告指出,雖然美國在AI模型數量上仍占據優勢,2024年開發了40個值得關注的模型,而中國則開發了15個。但在MMLU和Humaneval等關鍵基準測試中,中美模型的性能差距已經大幅縮小。從2023年的兩位數差距,到2024年的0.3%的微小差距,中美兩國在AI模型性能上的競爭已經變得異常激烈。
報告還提到,中國在AI領域的論文數量和專利數量上仍然保持著領先地位。這進一步證明了中國在AI研究和創新方面的強大實力。