【ITBEAR科技資訊】6月25日消息,近日,隨著各省2024年高考成績陸續揭曉,學霸們的成績成為熱議焦點。與此同時,一場別開生面的“AI高考”也吸引了廣泛關注。據悉,有媒體組織了一場AI大模型的高考模擬測試,旨在評估這些模型在解答高考試題時的表現。
最新發布的高考新課標Ⅰ卷大模型評測報告顯示,GPT-4o在文科總分中拔得頭籌,獲得了562分的高分。而在國內產品中,字節跳動旗下的豆包緊隨其后,取得了542.5分的優異成績。據ITBEAR科技資訊了解,本次大模型高考評測完全采用河南省的高考試卷,河南高考文科本科一批錄取分數線為521分,豆包等三款國產AI成功突破一本線,展現了出色的能力。
在文科領域,特別是語文和英語考試中,AI大模型展現出了與人類考生相媲美的水平。國產大模型憑借對中文語言的深入理解,在語文考試中表現出色,百小應、字節豆包和騰訊元寶等模型在語文考試中名列前茅。而在英語考試中,大模型在閱讀、語言運用等客觀題方面取得了較高的分數,甚至有的模型獲得了滿分。然而,在寫作部分,AI大模型的表現尚待提高,最高分僅為29分。
然而,在理科方面,AI大模型的表現則顯得較為薄弱。大模型的理科最高分尚未達到480分,多數模型的理科總分在400分以下。特別是在數學、化學和物理等科目中,AI大模型的表現與人類頂尖考生存在較大差距。數學考試中,僅有GPT-4o、文心一言4.0和豆包等少數模型獲得了60分以上的成績?;瘜W和物理的平均分數更是低至34分和39分,顯示出AI大模型在理科領域的不足。
這場“AI高考”不僅為我們展示了AI大模型在高考模擬測試中的表現,也揭示了AI在教育領域的應用潛力和挑戰。隨著技術的不斷進步,AI在教育領域的應用將更加廣泛,為人類的教育事業帶來更多可能性。