在科技界的一次重大突破中,中關村論壇上亮相了一款名為AutoGLM沉思的創新AI產品,該產品由智譜公司推出,標志著全球首個集深度研究與實際操作能力于一體的智能體(Agent)的誕生。
AutoGLM沉思通過一系列技術創新,成功打破了實時聯網搜索、動態工具調用、深度分析及自我驗證的界限,實現了長程推理和任務執行的無縫銜接。這一成就不僅在國內首次正式開放了Deep Research功能,更將AI技術的應用推向了新的高度。
據智譜內部評估,AutoGLM沉思背后的核心——深度思考模型GLM-Z1-Air,在性能上已能與業界領先的DeepSeek-R1(671B,激活37B)相媲美。目前,該功能已在智譜清言的網頁端、PC端及手機App上全面上線,且對用戶免費開放,不限量使用。
AutoGLM沉思的發布版本為preview版,主要面向研究場景,而智譜計劃在未來兩周內進一步擴展其智能體執行能力,并推出“虛擬機”版本。技術演進路徑涵蓋了從GLM-4基座模型,經由GLM-Z1推理模型,到GLM-Z1-Rumination沉思模型,最終進化為AutoGLM模型的全過程。其中,核心鏈路的模型和技術將于4月14日正式開源,并陸續在MaaS平臺上線。
AutoGLM沉思的設計初衷是讓機器不僅具備思考能力,還能主動行動,實現“邊想邊干”。這一能力的實現依托于三大關鍵特性:深度思考、感知世界以及工具使用。AutoGLM沉思融合了這些能力,超越了OpenAI的Deep Research,不僅擅長深入研究,更能真正執行任務,使AI Agent從單純的思考者進化為能夠交付結果的智能執行者。
在技術細節上,智譜重新訓練了320億參數的基座模型GLM-4-Air-0414,通過加入更多代碼類、推理類數據,并針對智能體能力進行優化,顯著提升了模型在工具調用、聯網搜索及代碼任務上的表現。GLM-4-Air-0414以較小的參數量實現了與更大規模模型的比肩效果,特別適用于涉及多輪復雜交互的智能體任務。
基于GLM-4-Air-0414,智譜推出了全新的深度思考模型GLM-Z1-Air,通過引入更多推理類數據并在對齊階段深度優化通用能力,使其在性能上與DeepSeek-R1相媲美,且在推理速度上提升了8倍,成本降低至1/30。GLM-Z1-Air還能在消費級顯卡上運行,進一步降低了使用門檻。
智譜通過擴展強化學習訓練,提升了模型結合工具使用完成長程推理的能力,從而訓練出了沉思模型GLM-Z1-Rumination。該模型能夠主動理解用戶需求,在復雜任務中不斷優化推理、反復驗證與修正假設,使研究成果更加可靠與實用。
在斯坦福大模型中心選定的智能體基準評測AgentBench上,AutoGLM系列模型取得了顯著成績,特別是在Phone Use和Browser Use基準測試中,AutoGLM-Phone和AutoGLM-Web均超越了此前最佳成績,展現了在網頁交互場景中的領先能力。智譜自研的GLM-PC(CogAgent)也在多個權威評測榜單上取得了SOTA成績,憑借較小的參數規模超越了包括GPT-4o+UGround在內的更大規模模型。