向量數據庫領域近年來風起云涌,成為技術界關注的焦點。高效檢索高維向量數據對于大型模型的訓練和推理至關重要,特別是在2023年大模型技術迅猛發展后,向量檢索作為檢索增強生成(RAG)技術的關鍵組成部分,更是被推到了數據庫技術的風口浪尖。
然而,隨著RAG技術的廣泛應用,其局限性也日益凸顯。RAG技術主要依賴于向量化知識本身,難以捕捉獨立信息之間的鏈接,無法結合關系和語境進行深度語義理解和上下文細微差別的處理。這種局限性在處理復雜查詢時顯得尤為明顯。
面對這一挑戰,杭州悅數科技有限公司(以下簡稱悅數)CTO葉小萌帶領團隊,在2023年與LlamaIndex聯合提出了Graph RAG的概念,并迅速分享了這一概念的初步驗證結果。Graph RAG通過結合知識圖譜和圖數據庫的優勢,能夠更精確、全面地檢索相關信息,使模型能夠關聯上下文給出更準確的答復。
悅數CTO葉小萌表示,技術的差異化策略是悅數的核心競爭力。大模型的興起讓RAG技術成為熱點,但要讓通過公域數據訓練的大模型理解私域數據,就需要先將私域數據保存下來,并通過向量化進行比較以快速找到關聯內容。然而,向量數據庫的局限性促使悅數團隊開始探索圖數據庫與向量的結合。
在悅數團隊首次提出Graph RAG概念時,人們對這一結合還感到陌生。但悅數并未退縮,迅速組建團隊開始打造RAG產品。經過一年的努力,悅數RAG產品已經面世,并進入產品市場匹配階段(PMF),預計今年將進行大規模推廣。
悅數團隊中的古思為是Graph RAG項目的核心成員之一。在他看來,市面上的RAG結合方式都存在局限性,而Graph RAG則具有足夠的復雜性和想象力。他回顧說,Graph RAG就像一個小帳篷,能夠容納多種技術和方法,但同時也帶來了選擇上的挑戰。最終,悅數團隊通過反復斟酌和取舍,簡化了實現方式,并取得了不錯的反響。
在概念落地過程中,悅數團隊遇到了不少挑戰。為了讓用戶即使對圖庫無感知也能獲得良好的使用效果,團隊與數十個客戶進行了深入溝通,并迭代出了開箱即用的解決方案。如今,悅數RAG已經能夠無縫銜接DeepSeek,并正在進行基于蒸餾技術、圖上推理等功能的迭代。
悅數不僅在RAG領域走在前沿,還在圖數據庫國際標準制定方面取得了重要進展。2024年4月,國際標準化組織(ISO)發布了國際標準圖查詢語言GQL,而悅數一直跟蹤并投入研發這一標準。在GQL標準發布后的同年11月,悅數推出了全球首款原生支持GQL的分布式圖數據庫產品——悅數圖數據庫v5.0。
悅數圖數據庫的增長勢頭強勁。在2023年實現了兩倍多的增長,2024年又比2023年增長近三倍,已接近收支平衡。葉小萌表示,悅數并不是為了做信創而做信創,而是自然而然地走向了信創之路。悅數圖數據庫的每一行代碼都是團隊親手寫下,具有自主可控的特點,是做信創的良好土壤。
然而,進入信創名錄并非易事。悅數正在積極適配各種信創操作系統和硬件,以期在信創市場占據一席之地。同時,悅數圖數據庫還通過了中國信通院舉辦的“可信數據庫”圖數據庫性能測試,成為國內首個全項完成該測試的圖數據庫產品。
悅數的客戶中有一半以上都有信創需求。葉小萌觀察到,現在還愿意出高價的企業往往是國央企或具有國資背景的企業。在政企領域的客戶競爭中,金融業尤為激烈。為了避免卷入價格戰,悅數在投標時會避開價格分數占比過高的場景,并盡量避免搶低價客戶。葉小萌認為,產品價格應該體現產品本身給客戶帶來的價值,卷技術對行業有利,但卷價格則無法體現軟件產品的價值。
親歷圖數據庫市場成長的浪潮,葉小萌感受到市場教育的成效顯著。現在團隊接觸客戶時,不再需要介紹圖數據庫的定義和功能,而是直接從介紹行業經驗和使用場景開始。他形容數據庫市場的競爭有如長跑,現在已經進入后半程,第一梯隊和第二梯隊已經逐漸顯現。
葉小萌作為技術狂人,深受硅谷科技大公司工程師文化的影響,希望打造技術上最強的公司。悅數的氛圍十分接近他心之所向的工程師文化,員工專注做技術、以技術為導向,具有很強的自驅力。然而,對葉小萌來說,創業最難的是突破邊界。在商業化開始后,他需要面對客戶,觀察對方的反應、猜測背后的想法,這對他來說是一個新的挑戰。