近期,科技界傳來一則引人注目的消息,斯坦福大學與華盛頓大學的科研團隊攜手,利用不足50美元的云計算成本,成功培育出一款名為s1的人工智能推理模型。這款模型在數學解題與編程能力上的表現,據相關報道,已與業界領先的OpenAI O1及DeepSeek R1等模型比肩。
然而,深入探究后發現,s1模型的誕生并非完全從零起點出發。《科創板日記》披露,該模型的訓練實際上是基于阿里云推出的通義千問(Qwen)模型進行了監督微調。換言之,s1模型的“低成本高效能”特性,得益于站在了一個已經具備強大基礎的開源模型肩膀上。
這一發現揭示了人工智能領域的一個新趨勢:即便是在資源有限的情況下,通過合理利用現有的開源模型并進行針對性的優化,同樣能夠創造出具有競爭力的AI產品。s1模型的成功,無疑為眾多科研團隊和企業提供了一個值得借鑒的范例。