近日,互聯網巨頭字節跳動旗下的AI助手豆包,在低調進行一項引人矚目的技術測試。有用戶于上周二發現,豆包正在小范圍內探索一項深度思考模型的應用,而該模型并非此前傳聞中的DeepSeek。
緊接著,在3月5日這一天,豆包正式對外宣布,其“深度思考”推理模式已全面上線,這一模式將廣泛應用于問答、搜索、寫作以及閱讀等多個場景。用戶只需簡單地在輸入框中開啟“深度思考 Beta”功能,即可體驗這一全新模式。
據豆包的相關負責人透露,目前正在進行測試的,是豆包自家深度思考模型的多個實驗版本。有消息進一步指出,這些測試版本均基于豆包1.5基座模型進行研發。
回溯至今年1月中旬,豆包大模型團隊在發布豆包1.5 Pro版本時,曾提及一個名為Doubao-1.5-pro-AS1-Preview的深度推理模型。據稱,該模型在完全不依賴其他模型數據的情況下,通過RL算法的突破以及工程上的優化,充分利用了Test Time Scaling的算力優勢,成功實現了RL Scaling,進而研發出了豆包的深度思考模式。
深度思考模式的出現,為用戶帶來了前所未有的體驗。它不僅能夠展示AI的最終答案,更重要的是,能夠呈現模型解決問題的完整邏輯鏈條。這一過程中,模型會展示其思維鏈,即COT(Chain of Thought),這是一種模擬出來的思考過程。通過訓練,模型能夠輸出中間步驟,如自我質疑、反思等,盡管這些只是文字序列,但卻能夠呈現出類似人類的思考過程。
在深度思考模式下,用戶將有機會觀察到模型在解決問題時的每一個細節。例如,在解答數學題目時,模型會詳細展示其從問題拆解、多種方法驗證,到最終得出結論的全過程。這種透明的思考過程,無疑將極大地提升用戶對AI助手的信任度和滿意度。