【ITBEAR科技資訊】3月29日消息,埃隆·馬斯克旗下的人工智能初創(chuàng)公司xAI剛剛宣布,全新升級的Grok-1.5已正式亮相。官方此次推送相當(dāng)?shù)驼{(diào),僅附上了相關(guān)鏈接,顯然意在“字少事大”,讓升級內(nèi)容本身成為焦點。
這次Grok-1.5的升級主要集中在兩大方面。首先是長上下文理解能力的顯著提升。據(jù)悉,新版本的上下文窗口已經(jīng)從原先的8192字節(jié)躍升至128K字節(jié),足足提升了16倍,這一數(shù)字已與當(dāng)前領(lǐng)先的GPT-4模型持平。這意味著Grok-1.5在處理更長、更復(fù)雜的提示時能夠游刃有余,同時保持出色的指令遵循能力。在大海撈針(NIAH)評估中,Grok-1.5更是憑借其強大的檢索功能,在長達128K的上下文中準(zhǔn)確檢索出嵌入文本,取得了完美的檢索成績。
據(jù)ITBEAR科技資訊了解,Grok-1.5的另一大亮點在于其處理編程和數(shù)學(xué)相關(guān)任務(wù)的能力得到了大幅增強。無論是在數(shù)學(xué)領(lǐng)域的MATH基準(zhǔn)測試,還是在編程領(lǐng)域的Humaneval基準(zhǔn)測試,Grok-1.5均展現(xiàn)出了卓越的性能。具體來說,它在MATH基準(zhǔn)測試上獲得了50.6%的得分,成功超越了中杯Claude 3 Sonnet;而在GSM8K數(shù)學(xué)推理能力評測中,更是取得了高達90分的佳績。在編程方面,Grok-1.5在Humaneval基準(zhǔn)測試上的得分為74.1%,不僅超越了中杯Claude 3 Sonnet和Gemini Pro1.5,甚至還超過了GPT-4,僅次于大杯Claude 3 Opus。
Grok-1.5的這次升級無疑為其在人工智能領(lǐng)域的發(fā)展注入了新的活力。無論是在長上下文理解還是編程數(shù)學(xué)能力上,它都展現(xiàn)出了令人矚目的實力。未來,我們有理由期待Grok-1.5在更多領(lǐng)域的應(yīng)用和表現(xiàn)。