近日,匯集全球?qū)<业脑朴嬎阈袠I(yè)盛會——2023 亞馬遜云科技中國峰會在上海舉辦,向量數(shù)據(jù)庫的奠基者和領(lǐng)先者 Zilliz 受邀參會。峰會現(xiàn)場,Zilliz 合伙人兼產(chǎn)品負責(zé)人郭人通、首席工程師焦恩偉通過主題分享的方式從不同維度為開發(fā)者和行業(yè)專家詳解云原生向量數(shù)據(jù)庫在大模型時代的重要意義。

在企業(yè)轉(zhuǎn)型 ISV 創(chuàng)新與探索論壇上,郭人通和亞馬遜云科技人工智能與學(xué)習(xí)產(chǎn)品總監(jiān)張洋分享了亞馬遜云科技在 AIGC 行業(yè)的應(yīng)用洞察及服務(wù)、基于大語言模型的落地方案和成功案例。其中,郭人通重點講述了向量數(shù)據(jù)庫如何助力 AIGC 構(gòu)建存儲、緩存以及 Zilliz 如何為 AWS 生態(tài)賦能。

郭人通從大模型的 “AI 幻覺”講起。他表示,當(dāng)下“AI 幻覺”是大模型的主要痛點之一,構(gòu)建知識庫是應(yīng)對此問題的有效方式,向量數(shù)據(jù)庫可以作為知識庫的擴展插件為大模型進行知識增強。這也為 LLMs 時代構(gòu)建數(shù)據(jù)應(yīng)用提供了一種新的范式——CVP Stack。其中 C 是以 ChatGPT 為代表的大模型;V 代表 Vector Database;P 代表 prompt engineering。其中 C 作為運算單元,提供邏輯分析和自然語言對接的能力,V 作為存儲單元,提供穩(wěn)定準確、高容量的知識,P 在前兩者的基礎(chǔ)上,提供面向具體業(yè)務(wù)的適配能力。
在整個 CVP Stack 中,向量數(shù)據(jù)庫扮演著重要角色,其中,Milvus 作為云原生的開源向量數(shù)據(jù)庫,被全球超過 1000 家企業(yè)用戶所信賴,下載和安裝次數(shù)超過 350 萬,在 GitHub 的 Star 數(shù)目超 2 萬,在 SIGMOD 和 VLDB 等數(shù)據(jù)庫頂會上發(fā)表了論文,奠定了向量數(shù)據(jù)庫的基礎(chǔ)。目前,Milvus 不僅具備百億級向量的擴展能力,還集成 OpenAI、Langchain、Huggingface、Pytorch 等 AI 生態(tài),是大語言模型落地應(yīng)用的重要組成部分。
而為了給用戶提供開箱即用的全托管向量檢索服務(wù),Zilliz 還推出了全托管 Milvus 的向量數(shù)據(jù)庫 Zilliz Cloud,具備維護成本低、使用門檻低、豐富的企業(yè)級特性及安全放心的特點。 據(jù)郭人通透露,Zilliz Cloud 已支持 AWS、GCP,不日即將支持阿里云、百度智能云、騰訊云、金山云等。作為 AWS 的優(yōu)秀生態(tài)合作伙伴,Zilliz Cloud 可以輕松與其它兩百多種 AWS 服務(wù)進行集成,例如利用 AWS 行業(yè)領(lǐng)先的安全服務(wù),構(gòu)建云上安全的向量數(shù)據(jù)庫。同時,借助 AWS 的 region 力量,Zilliz Cloud 可以為全球不同地區(qū)的用戶提供近距離的高質(zhì)量服務(wù)。

在云原生數(shù)據(jù)庫論壇上,焦恩偉與亞馬遜云科技數(shù)據(jù)分析專家湯市健共話 AIGC 時代“新基建”的向量存儲與檢索服務(wù),他們不僅分享了亞馬遜云科技上的向量存儲與檢索選項、服務(wù)實踐,也對全球流行的向量數(shù)據(jù)庫Milvus 及 Zilliz Cloud 進行了架構(gòu)揭秘。其中,焦恩偉從非結(jié)構(gòu)化數(shù)據(jù)處理面臨的挑戰(zhàn)講起,通過對 Milvus 服務(wù)于 AIGC 的特性與大模型應(yīng)用的實踐,展示了向量數(shù)據(jù)庫的未來和無限潛力。

焦恩偉表示,向量數(shù)據(jù)庫是為 AI 而生的數(shù)據(jù)庫,Milvus 作為全球第一款開源向量數(shù)據(jù)庫,具備云原生分布式、超高性能、可插拔引擎及云端一體的特點。Milvus 與 NVIDIA Rapids 的合作,使其成為全球第一個支持 GPU 的向量數(shù)據(jù)庫,相比于 CPU 實現(xiàn)了 3 倍查詢性能的提升;而 Milvus 團隊與 AWS Graviton 合作,利用 ARM Neon 指令集加速,大幅提升了向量檢索在 ARM CPU 上執(zhí)行的性價比。

而隨著 AIGC 浪潮翻涌,以 Milvus 和 Zilliz Cloud 為代表的向量數(shù)據(jù)庫成為 AIGC 時代架構(gòu)的重要組成部分,其中重要的大模型應(yīng)用場景是 OSSChat 和 GPTCache。未來,在 AIGC 領(lǐng)域的發(fā)展推動下,向量數(shù)據(jù)庫將向著更大、更快、更穩(wěn)的方向發(fā)展,降低使用成本,更好地為開發(fā)者與企業(yè)服務(wù)。
此外,在“開發(fā)者會客廳”活動上,Zilliz 的展位吸引了來自全球各地的開發(fā)者打卡、交流,他們對于向量數(shù)據(jù)庫的佼佼者 Milvus 以及 Zilliz Cloud 充滿好奇,爭相加入項目社區(qū),探討云原生向量數(shù)據(jù)庫技術(shù)與自身業(yè)務(wù)場景結(jié)合的更多可能性。
總體而言,向量數(shù)據(jù)庫作為大模型時代頗受關(guān)注的細分賽道,其重要性不言而喻。Milvus 和 Zilliz Cloud 作為賽道的奠基者與領(lǐng)先者,通過 CVP Stack 的方式為大模型場景的落地提供了典型的范本。回歸 AI 時代,對于為廣大開發(fā)者和相關(guān)企業(yè)而言,探索開箱即用的向量數(shù)據(jù)庫產(chǎn)品勢在必行。好消息是,據(jù) Zilliz 官方透露,全托管 Milvus SaaS/PaaS 即將上線,由 Zilliz 原廠打造!覆蓋阿里云、百度智能云、騰訊云、金山云。目前已支持申請試用,企業(yè)用戶 PoC 申請或其他商務(wù)合作請聯(lián)系 [email protected]。