隨著每一次工業革命的浪潮,人類社會經歷了前所未有的躍遷式發展。如今,以人工智能(AI)為核心的新一輪技術變革正洶涌而來,企業如何在這樣的背景下獲取必要的技術支撐,為通用人工智能時代的到來做好充足準備,成為了業界關注的焦點。
近日,在2024火山引擎FORCE原動力大會·冬技術主論壇上,一系列創新產品及升級方案被隆重推出,旨在幫助企業解決落地大模型所面臨的實際難題。字節跳動基礎架構負責人趙鵬偉在會上發表了重要講話。
“為了迎接通用人工智能時代的到來,企業必須在性價比、創新能力和安全保障等方面做好充分準備。”趙鵬偉指出,“火山引擎通過提供AI云原生式的全鏈路產品服務能力,包括豆包大模型、大模型服務、AI基礎設施、數據和安全方向的新成果,致力于與眾多企業和開發者共同推進未來的AI創新變革。”
火山引擎提出了AI云原生的新概念,認為未來的計算范式應以GPU為核心,重新優化計算、存儲與網絡架構。AI云原生將允許GPU直接訪問存儲和數據庫,顯著降低IO延遲,并提供更高規模的高速互聯和端到端的安全保護。為此,火山引擎將打造以AI負載為中心的基礎架構新范式,推出新一代計算、網絡、存儲和安全產品。
在計算層面,火山引擎推出了新一代GPU實例,通過vRDMA網絡支持大規模并行計算和P/D分離推理架構,顯著提升訓練和推理效率,降低成本。在存儲方面,新發布的EIC彈性極速緩存能夠實現GPU直連,使大模型推理時延降低至原來的五十分之一,成本降低20%。在安全層面,火山引擎推出了PCC私密云服務,構建大模型的可信應用體系,實現用戶數據在云上推理的端到端加密,且性能優越,推理時延與明文模式相比差異在5%以內。
火山方舟作為一站式大模型服務平臺,通過Cache、離線推理模式等產品與升級,以及全新發布的Prompt優解,加速了大模型能力的落地。Prompt優解通過“自動+互動”的方式協助用戶編寫提示詞,用機器實現類似人類的反思、類比、錯誤總結能力,全自動優化prompt,助力企業低成本高效率獲得高質量prompt。目前,Prompt優解已通過火山方舟開放全量公測。
火山引擎始終將成本和價格作為重要考量因素,發布了離線批量推理方案和上下文緩存,進一步踐行“人人用得起,才是好模型”的理念,幫助用戶實現更為精細化和低成本的運營。
全新發布的扣子1.5和HiAgent1.5,助力企業打造AI原生應用。從通用大模型到企業AI應用落地,需要跨越三道鴻溝,而扣子1.5和HiAgent1.5的推出,將幫助企業更好地實現這一轉變。豆包大模型最新發布的視覺理解模型、文生圖模型2.1和音樂模型,都可以通過扣子以插件的方式體驗,有助于更多多模態AI應用的誕生。
為了幫助企業用好數據,驅動業務價值的提升,火山引擎發布了數據飛輪2.0,通過AI創新重新定義企業數據智能。數據飛輪2.0全面注入大模型,帶來前所未有的決策洞察,通過一體化數智研發與一站式數據智能運營,簡化工作流程。在多元異構計算引擎的加速下,快速處理結構與非結構數據資產,激發企業更多潛在數據資產,實現更大的動力。
火山引擎云安全圍繞“讓智能更安全、讓安全更智能”的理念,為AI基礎設施提供透明可信的安全保障,并通過安全智能體,將字節跳動沉淀的安全經驗服務于每個企業。大模型應用進入快速發展階段,企業對模型能力、價格以及落地難度都提出了更高要求。火山引擎本次發布的多款全新產品與升級,進一步降低了模型訓練、推理應用的難度,以更高性價比和更強安全保障,為企業落地AI能力奠定了堅實基礎。