昆侖萬維Skywork o1：解鎖強推理與自我反思，AI新里程碑？-魔扣目錄

昆侖萬維在人工智能領域邁出了重要一步，正式推出了其最新力作——「天工大模型4.0」o1版，命名為Skywork o1。這款模型以其獨特的復雜思考推理能力，在國內首次實現了中文邏輯推理o1模型的突破。

Skywork o1不僅僅是對OpenAI o1模型的簡單復現，它在模型輸出中內嵌了思考、計劃、反思等高級能力。經過標準評測集的驗證，與普通模型相比，Skywork o1的推理能力顯著提升，真正實現了通過思考和反思來增強推理能力的目標。昆侖萬維團隊通過獨特的技術路線，成功將初始推理能力較弱的基座模型提升到了生態位的頂尖水平。

此次發布的Skywork o1系列包含三款模型，旨在滿足不同用戶的需求：

第一款是Skywork o1 Open，基于Llama 3.1 8B的開源模型，它在同生態位的開源模型中評測指標大幅提升，達到了SOTA水平，并成功解鎖了許多輕量級模型無法完成的復雜數學任務。Skywork o1 Open的發布，將加速國內開源社區復現o1模型的進程。

第二款是Skywork o1 Lite，這款模型具備完整的思考能力，尤其在中文支持和推理速度上表現優異。在數學、中文邏輯和推理類問題上，Skywork o1 Lite展現出了出色的性能。

第三款是Skywork o1 Preview，作為本次發布的完整版推理模型，它配備了自研的線上推理算法，相比Skywork o1 Lite，擁有更多樣和深入的思考過程，以及更完善和高質量的推理能力。

Skywork o1 Open在各項數學和代碼指標上的表現均大幅提高，不僅超越了同生態位的Llama-3.1-8B模型，還解鎖了諸如GPT 4o等較大量級模型無法完成的數學推理任務，如24點計算。這為推理模型在輕量級設備上的部署提供了新的可能性。

昆侖萬維還開源了兩個推理任務的Process Reward Model（PRM）：Skywork o1 Open-PRM-1.5B和Skywork o1 Open-PRM-7B。與之前的開源PRM相比，Skywork o1 Open-PRM能夠對模型回答中的每個步驟進行打分，而不僅僅是對整個回答進行評分。在大部分基準測試中，Skywork o1 Open-PRM-1.5B的表現接近或超過了8B的開源模型，而Skywork o1 Open-PRM-7B則接近或超過了10倍量級的模型。

Skywork o1在邏輯推理任務上性能的大幅提升，得益于昆侖萬維自研的三階段訓練方案。首先，通過自研的多智能體體系構造高質量的分步思考、反思和驗證數據，對基座模型進行繼續預訓練和監督微調。其次，研發了適配分步推理強化的Skywork o1 Process Reward Model（PRM），有效捕捉到復雜推理任務中間步驟和思考步驟對最終答案的影響。最后，基于自研的Q*線上推理算法，配合模型在線思考，尋找最佳推理路徑。

Skywork o1模型展現出了多項亮點功能，包括模型思考和規劃能力、自我反思能力和自我驗證能力。在復雜問題分析、思考反思過程以及輸出答案質量上，Skywork o1 Lite和Skywork o1 Preview線上版本均有大幅提升。例如，在面對難度較大的考研數學題時，Skywork o1 Preview能夠一步步推理出正確結果。在解決比大小問題時，其思考過程嚴謹，邏輯清晰，準確得出正確答案，并給出了差值計算。

Skywork o1在中文邏輯問題思考中也展現出了反思能力，能夠準確識別并糾正錯誤的讀音，給出后續對話建議。在“算24點”游戲中，Skywork o1不僅給出了正確答案，還進行了自我驗證，確認過程和答案符合命題要求。在競賽數學、密碼解密以及智力問答等復雜場景中，Skywork o1也表現出了優異的性能。

昆侖萬維自2024年以來，持續在人工智能領域發力，陸續發布了「天工2.0」、「天工3.0」、「天工大模型4.0」4o版——Skywork 4o，以及此次的「天工大模型4.0」o1版（Skywork o1）。這些舉措不僅貫徹了公司“All in AGI 與 AIGC”的戰略，也是構建AI技術棧的重要一步。昆侖萬維將繼續秉持“實現通用人工智能，讓每個人更好地塑造和表達自我”的使命，從模型層、應用層等全方位、多維度來構建公司的技術競爭力和生態矩陣。

日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

昆侖萬維Skywork o1：解鎖強推理與自我反思，AI新里程碑？

數獨大挑戰2018-06-03

答題星2018-06-03

全階人生考試2018-06-03

運動步數有氧達人2018-06-03

每日養生app2018-06-03

體育訓練成績評定2018-06-03