近日,科技界巨頭馬斯克在其個(gè)人社交平臺X上預(yù)告了一項(xiàng)重大突破:自家公司xAI研發(fā)的Grok 3人工智能模型即將面世。他激動地宣稱,這將是“地球上最聰明的AI”。
兩天后,北京時(shí)間2025年2月18日中午,馬斯克攜手xAI的精英工程師和研究團(tuán)隊(duì),通過直播向全球觀眾揭開了Grok 3的神秘面紗。這場發(fā)布會精彩紛呈,不僅詳細(xì)介紹了Grok 3在訓(xùn)練上投入的巨大資源,還展示了其強(qiáng)大的計(jì)算能力和一系列創(chuàng)新應(yīng)用。
馬斯克在發(fā)布會上自豪地表示,Grok 3是在Colossus超級計(jì)算機(jī)上訓(xùn)練完成的,這臺超級計(jì)算機(jī)在短短八個(gè)月內(nèi)建成,搭載了驚人的10萬顆英偉達(dá)H100 GPU,提供了超過2億GPU小時(shí)的計(jì)算資源,是Grok 2的10倍之多。這一顯著的算力提升,使得Grok 3能夠更高效地處理海量數(shù)據(jù),大大縮短了訓(xùn)練時(shí)間。
xAI團(tuán)隊(duì)還現(xiàn)場展示了Grok 3與ChatGPT的數(shù)據(jù)對比圖,雖然Grok起步較晚,但在MMLU得分上卻以驚人的速度追上了ChatGPT。在LMSYS(大模型競技場)中,Grok 3的排名同樣遙遙領(lǐng)先,其性能在多個(gè)方面都超越了Gemini、DeepSeek和ChatGPT等競爭對手。
發(fā)布會現(xiàn)場,xAI團(tuán)隊(duì)還演示了Grok 3的一些實(shí)際應(yīng)用。他們要求Grok 3現(xiàn)場生成一段關(guān)于太空發(fā)射的3D動畫代碼,結(jié)果在兩分鐘的思考后,Grok 3成功生成了可直接運(yùn)行的Python代碼,并展示了精美的3D動畫效果。團(tuán)隊(duì)還要求Grok 3制作一款類似于俄羅斯方塊和寶石迷陣的游戲,Grok 3同樣在短時(shí)間內(nèi)給出了令人滿意的答案。
更令人矚目的是,xAI團(tuán)隊(duì)還推出了一款基于Grok 3的全新搜索引擎——DeepSearch。這款搜索引擎不僅能夠搜索網(wǎng)頁并查找現(xiàn)有資料,還能“推測用戶的真實(shí)意圖”并進(jìn)行思考。通過交叉對比多個(gè)信息源,它能夠確保返回最準(zhǔn)確的答案,為用戶帶來前所未有的搜索體驗(yàn)。
直播結(jié)束后,網(wǎng)友們紛紛發(fā)表了自己的看法。AI領(lǐng)域?qū)<铱ㄅ廖鞣窒砹怂摹跋刃邪妗笔褂皿w驗(yàn),他認(rèn)為Grok 3的“思考”功能非常先進(jìn),能夠出色地解決復(fù)雜問題,如創(chuàng)建棋盤游戲網(wǎng)頁等。同時(shí),Grok 3還具備類似“深度研究”的搜索功能,能夠提供高質(zhì)量的研究問題答案。然而,在某些情況下,它也會產(chǎn)生幻覺,如提供錯(cuò)誤的URL或不準(zhǔn)確的事實(shí)。
Imarena.ai官方在經(jīng)過測試后發(fā)文稱,Grok 3是首個(gè)突破1400分的模型,在所有類別中排名第一,這是一個(gè)前所未有的里程碑。這一消息無疑進(jìn)一步提升了Grok 3的聲譽(yù)和關(guān)注度。
然而,盡管Grok 3受到了廣泛贊譽(yù),但也有一些網(wǎng)友在測試后認(rèn)為它在編程方面并不是很擅長。對于這一爭議,馬斯克和xAI團(tuán)隊(duì)并未直接回應(yīng)。他們表示,Grok 3第一批獲得訪問權(quán)限的人將從X上的Premium+訂閱者開始,而普通用戶何時(shí)能用上,目前尚不清楚。