【ITBEAR科技資訊】8月29日消息,SuperCLUE日前發布了最新的中文大模型8月榜單,為業界帶來了一場關于語言模型實力的鮮明競爭。本次榜單包括了總排行榜、OPEN多輪開放問題排行榜、OPT三大能力客觀題排行榜、十大基礎能力排行榜以及開源排行榜等五個部分,旨在全面評估各大模型在不同領域的表現。
據ITBEAR科技資訊了解,SuperCLUE在本次評測中選擇了16個最具代表性的通用大語言模型,并采用了全新的評測數據集,其中包含3337道測試題目。這一數據集設計旨在更準確地反映語言模型在實際應用中的表現。
在8月榜單中,Baichuan-13B憑借其經過STF迭代優化的第二版,在國內大模型評測中脫穎而出,奪得榜首位置。SuperCLUE對Baichuan-13B的效果給予了高度評價,認為其表現非常出色。
值得注意的是,雖然國外代表性模型,如GPT4.0、Claude2、gpt-3.5和Llama-2參與了榜單的對比,但并未參與排名。這意味著本次榜單聚焦于國內大模型的表現和競爭。
除了總排行榜的勝出,Baichuan-13B還在知識問答和生成創作領域展現出優異的表現,進一步鞏固了其在多個領域的實力。此外,Baichuan-13B在開源排行榜中也大幅領先于Llama-2,顯示了在開放共享方面的積極貢獻。
綜合來看,SuperCLUE的這份8月榜單為我們呈現了中文大模型領域的最新實力對比,Baichuan-13B的脫穎而出以及在多個領域的卓越表現將進一步推動語言模型技術的發展與創新。