科大訊飛近日宣布,其星火深度推理模型X1已完成全面升級,并同步推出了基于星火X1的星火醫療大模型X1。這款醫療大模型在診斷推薦、健康咨詢等醫學領域的應用上,展現出了卓越的性能,樹立了新的行業標桿。
尤為星火X1作為國內首個且目前唯一的采用全國產算力訓練的深度推理大模型,即便在模型參數量相對較少的情況下,其數學能力依然能夠與DeepSeek R1和OpenAI的某型號模型相媲美。此次升級不僅彰顯了星火X1的強大實力,也證明了基于國產算力訓練的全棧自主可控大模型的巨大潛力。
在首個測試題目中,關于甲、乙兩人卡片比賽得分概率的問題,星火X1迅速給出了正確答案,并且解題步驟詳盡明了。相比之下,DeepSeek R1則給出了錯誤答案。在接下來的題目中,星火X1繼續保持著穩定的發揮,與DeepSeek R1各有勝負,但星火X1在整體正確率上略勝一籌。
星火X1解答題目1的部分截圖
在解題過程中,兩款大模型都展現出了類人思考的能力,它們會對題目進行深入分析,明確解題所需的知識點,并詳細展示推理邏輯。這種能力不僅有助于用戶理解答案,還能讓用戶知其所以然,從而觸類旁通,掌握解決同類問題的方法。
兩款大模型還支持識圖解題功能,識別率極高。無論是紙質試卷、作業的照片,還是網絡截圖,都能被輕松識別并解答。這一特點有效解決了數學公式、圖形難以用鍵盤輸入的難題,為用戶提供了更加便捷、高效的解題體驗。
科大訊飛星火深度推理大模型X1之所以能夠取得如此優異的成績,或許與其新增的兩大創新技術密不可分。一方面,通過高效的領域數據自動化挖掘和多類型數據合成算法,科大訊飛構建了海量的數學領域預訓練數據,從而顯著提升了模型的數學專業能力。另一方面,基于評語模型與強化學習算法,科大訊飛實現了大模型長思維鏈的激發,并促使模型在推理過程中進行反思驗證,進一步提高了推理的準確性。
此次星火X1的升級和星火醫療大模型X1的推出,不僅展示了科大訊飛在人工智能領域的深厚積累和創新實力,也為醫療、教育等多個領域的發展注入了新的活力。未來,隨著技術的不斷進步和應用場景的不斷拓展,科大訊飛的大模型產品有望在更多領域發揮重要作用。