火山引擎旗下的大模型服務平臺——火山方舟,近日宣布了一個重大更新:成功接入了最新版的DeepSeek-R1-0528模型。這一舉措不僅再次證明了火山引擎在大模型服務技術領域的深厚積累,更為廣大企業用戶和開發者帶來了更加高效、順暢的大模型應用體驗。
火山方舟平臺深知速度與穩定性對于大模型應用的重要性,因此精心打造了一套高性能服務體系。憑借自研的xLLM推理框架,該平臺成功將模型推理延遲降低至每Token 30毫秒的驚人水平。同時,其卓越的穩定性確保了即便在負載出現波動的情況下,也能保持高效且低延遲的輸出,從而保障了實時交互的流暢無阻。火山方舟還提供了強大的并發支持能力,默認支持高達500萬TPM(每分鐘處理Token數)和3萬RPM(每分鐘請求數),充分滿足了企業級應用對于高并發調用的嚴苛需求。
在場景應用方面,火山方舟為DeepSeek-R1-0528模型提供了豐富的功能支持,包括但不限于函數調用和聯網能力等。針對企業和開發者在實際應用中可能遇到的各種場景需求,火山方舟構建了全方位的支持體系。無論是需要處理大規模數據的離線批量推理場景,還是希望提升含有重復提示或標準化開頭文本的應用場景響應速度,火山方舟都能提供靈活且高效的解決方案。同時,平臺還推出了TPM保障包服務,允許用戶根據業務峰值需求靈活調整流量額度,確保關鍵業務場景下的服務穩定不中斷。
為了讓企業用戶和開發者能夠更快地上手并順利落地大模型應用,火山方舟提供了多種便捷的體驗入口。在火山引擎體驗中心,用戶無需注冊登錄即可直接免費體驗新版DeepSeek-R1-0528模型的核心功能。體驗滿意后,用戶可通過一鍵跳轉至控制臺完成注冊配置,實現從初步體驗到正式調用的無縫銜接。對于專業開發者而言,火山方舟官方控制臺提供了包括快速模型調用配置、API直連以及可視化參數調試等在內的一系列高效配置工具。應用實驗室還開源了多款高價值的大模型應用模板,這些模板覆蓋了從基礎功能到復雜場景的各種需求,為企業用戶提供了現成的工具箱。
為了讓更多新用戶能夠輕松嘗試大模型應用,火山方舟特別推出了新客戶5折優惠活動。未注冊過火山引擎賬號的企業或個人,在注冊并完成實名認證后,在火山方舟平臺開通DeepSeek-R1-0528模型,即可在開通后的14天內享受該模型最高10億tokens用量的5折優惠。這一舉措無疑將大大降低新用戶探索大模型應用的門檻。