近日,科技界迎來了一次重大突破,馬斯克的人工智能初創公司xAI正式推出了其最新的聊天機器人——Grok 3。這款產品的發布不僅引起了業界的廣泛關注,還因其背后的巨大投入和技術革新成為了熱議的話題。
據悉,馬斯克和他的團隊在Grok 3的訓練上投入了大量資源,動用了20萬塊GPU,這一數字足以讓人瞠目結舌。他們聲稱,這一前所未有的訓練規模使得Grok 3在高級推理能力上超越了現有的眾多人工智能模型。這無疑給當前的人工智能領域帶來了一股強勁的新勢力。
在直播發布會上,馬斯克詳細介紹了Grok 3的訓練歷程。從最初的10萬張H100 GPU,到訓練進行到第92天時的20萬張,這一規模的擴張速度之快,令人嘆為觀止。而Grok 3的實力也的確沒有辜負這份投入,它在數學、科學、代碼等多個數據集上的表現均超越了GPT-4o、DeepSeek-V3等非推理模型。
在LMSYS Arena排行榜上,Grok 3更是以Elo評分超1400的優異成績位列榜首,斷層式領先其他模型。這一成績無疑是對xAI團隊努力與投入的最好證明。而Grok-3 mini版本也展現出了強大的實力,其性能基本上領先或媲美其他閉源/開源模型。
除了在數學和科學領域展現出的卓越能力外,Grok 3還在自動化游戲開發方面展現出了巨大潛力。在發布會上,xAI團隊要求Grok 3現場創造一款融合《俄羅斯方塊》和《寶石迷陣》的新游戲。令人驚訝的是,Grok 3不僅迅速生成了Python腳本定義了游戲的元素,還呈現出了獨特的玩法,這一表現讓在場的所有人都為之驚嘆。
Grok 3還包含一個名為Big Brain的功能,這是一個專門用于推理的模型模式。它能夠在處理查詢時進行更深入的思考,從而得出更加準確的答案。馬斯克在發布會上幽默地表示,17個月前,最初的Grok模型幾乎不能解決高中問題,而現在它已經進步了很多,已經準備好“上大學”了。
然而,盡管Grok 3取得了如此巨大的成功,但其背后的巨大投入也引發了業界的熱議。與DeepSeek通過算法優化和高效的資源利用方式大幅降低對高端GPU的依賴不同,馬斯克選擇了直接投入大量GPU來快速推出Grok 3。這一做法雖然換來了LMSYS Arena排行榜上41分的提升,但也引發了關于性價比的討論。
盡管如此,馬斯克瘋狂砸錢的舉動或許有著更深遠的考量。在當前的人工智能領域,任何模型的訓練都離不開GPU。而馬斯克的20萬塊GPU不僅是為了快速推出Grok 3,更可能是為了后續保持快速迭代的能力,從而在人工智能領域保持領先地位。