深度求索科技有限公司近日宣布,其最新的AI模型DeepSeek-V3.1已正式面世,這一版本標志著公司在智能化探索的征途中邁出了重要的一步。DeepSeek-V3.1旨在為用戶提供更加先進、高效且功能多樣的人工智能解決方案。
相較于之前的版本,DeepSeek-V3.1帶來了諸多顯著的升級。其中,混合推理架構的引入尤為引人注目。這一創(chuàng)新設計使得模型能夠在思考模式與非思考模式之間自由切換,極大地提升了用戶的操作靈活性。在思考模式下,DeepSeek-V3.1-Think的響應速度較DeepSeek-R1-0528有了顯著提升,展現(xiàn)了更加高效的思考能力。通過Post-Training優(yōu)化技術,新模型在工具應用和智能體任務中的執(zhí)行效率也達到了新的高度。
為了滿足不同用戶的需求,深度求索科技有限公司同步升級了官方App和網頁端模型至DeepSeek-V3.1版本。用戶只需輕點“深度思考”按鈕,即可輕松實現(xiàn)兩種模式之間的切換。同時,DeepSeek API也迎來了同步更新,`deepseek-chat`和`deepseek-reasoner`分別對應非思考模式和思考模式,且API的上下文容量已擴展至128K。API Beta接口還新增了對`strict`模式函數(shù)調用的支持,進一步提升了輸出的準確性和可靠性。
DeepSeek-V3.1還加強了對Anthropic API格式的支持,使得開發(fā)者能夠輕松地將該模型與Claude Code框架相結合,從而為用戶提供更加靈活多樣的應用體驗。這一改進無疑為開發(fā)者提供了更大的創(chuàng)作空間,進一步拓展了模型的應用場景。
在工具調用和智能體支持方面,DeepSeek-V3.1同樣表現(xiàn)出色。無論是編程智能體測評還是搜索智能體測評,DeepSeek-V3.1都展現(xiàn)出了顯著的進步。特別是在復雜任務和多學科專家級難題測試中,其性能已遠超之前的版本,為用戶提供了更加智能和高效的解決方案。
DeepSeek-V3.1在思考效率方面也進行了優(yōu)化。經過思維鏈壓縮訓練后,V3.1-Think在減少輸出token數(shù)的同時,保持了與R1-0528相當?shù)娜蝿毡憩F(xiàn)。而在非思考模式下,V3.1同樣能夠有效控制輸出長度,確保模型性能的穩(wěn)定性。
為了推動技術的開源與共享,深度求索科技有限公司決定將DeepSeek-V3.1的Base模型在Huggingface和魔搭平臺上開源。這一舉措不僅為用戶提供了更多獲取模型資源的途徑,還促進了技術的交流與進步。Base模型在V3的基礎上進行了外擴訓練,增加了840B tokens的訓練量,進一步提升了模型的性能和穩(wěn)定性。
在價格方面,深度求索科技有限公司宣布將對DeepSeek開放平臺API接口調用價格進行調整,并取消夜間時段優(yōu)惠。自指定日期起,所有API服務將按照新版價格表計費。然而,在調整之前,用戶仍可繼續(xù)享受當前的優(yōu)惠價格。同時,公司已增加了API服務資源,以確保用戶能夠順暢地進行調用。
對于想要了解更多關于DeepSeek-V3.1信息的用戶,可以訪問以下開源鏈接和官方文檔:
開源鏈接:
Huggingface平臺:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
魔搭平臺:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
官方文檔:
https://api-docs.deepseek.com/zh-cn/guides/anthropic_api