在探討生成式AI時(shí)代數(shù)據(jù)庫(kù)構(gòu)建的全新路徑時(shí),OceanBase在近期舉辦的2025開(kāi)發(fā)者大會(huì)上給出了自己的答案——一體化數(shù)據(jù)底座。這一創(chuàng)新理念由OceanBase CEO楊冰提出,旨在通過(guò)一體化產(chǎn)品和引擎,同時(shí)應(yīng)對(duì)OLTP、OLAP以及AI的混合負(fù)載需求。
當(dāng)前,企業(yè)數(shù)據(jù)存儲(chǔ)與處理正面臨前所未有的挑戰(zhàn)。隨著大模型訓(xùn)練和實(shí)時(shí)推理等場(chǎng)景產(chǎn)生的海量異構(gòu)數(shù)據(jù)不斷增加,存儲(chǔ)系統(tǒng)需要具備更高的容量彈性和跨模態(tài)管理能力。同時(shí),數(shù)據(jù)處理需兼顧事務(wù)處理的實(shí)時(shí)性、分析決策的高效性以及AI任務(wù)的復(fù)雜計(jì)算需求。然而,傳統(tǒng)數(shù)據(jù)基礎(chǔ)設(shè)施與生成式AI的數(shù)據(jù)需求之間存在割裂,亟需能夠整合多模態(tài)數(shù)據(jù)處理、海量數(shù)據(jù)處理等特征,并深度融合AI能力的新型數(shù)據(jù)底座。
在此背景下,OceanBase作為國(guó)產(chǎn)數(shù)據(jù)庫(kù)的主力軍,率先在數(shù)據(jù)庫(kù)轉(zhuǎn)型之路上取得了突破。他們不僅宣布全面擁抱AI,打造“Data×AI”核心能力,還啟動(dòng)了人才和組織體系的升級(jí),并圍繞一體化數(shù)據(jù)底座發(fā)布了首款面向AI的應(yīng)用產(chǎn)品PowerRAG。
在大會(huì)期間,媒體與OceanBase的CEO楊冰、CTO楊傳輝進(jìn)行了深入交流,試圖探尋這家數(shù)據(jù)庫(kù)廠商在AI時(shí)代的核心競(jìng)爭(zhēng)力。他們指出,數(shù)據(jù)的特征直接影響模型的性能、泛化能力和應(yīng)用效果,但AI的發(fā)展也帶來(lái)了一系列新的挑戰(zhàn)。例如,互聯(lián)網(wǎng)公開(kāi)數(shù)據(jù)作為大模型訓(xùn)練的基石即將枯竭,高質(zhì)量數(shù)據(jù)的獲取成本將逐步攀升;嚴(yán)謹(jǐn)?shù)男袠I(yè)數(shù)據(jù)稀缺且流動(dòng)困難,數(shù)字化進(jìn)程滯后、數(shù)據(jù)質(zhì)量要求嚴(yán)苛、核心數(shù)字化知識(shí)沉淀不足等問(wèn)題突出。
多模態(tài)數(shù)據(jù)的處理能力需求增強(qiáng),數(shù)據(jù)質(zhì)量評(píng)估也變得更加困難。螞蟻集團(tuán)CTO何征宇指出:“數(shù)據(jù)的邊界決定了大模型的能力上限,所有的數(shù)據(jù)公司都將成為AI公司?!彪S著數(shù)據(jù)量的迅猛增長(zhǎng),IDC預(yù)測(cè)到2028年,全球新生成數(shù)據(jù)量規(guī)模將達(dá)到393.9ZB,其中企業(yè)數(shù)據(jù)規(guī)模和增速尤為凸顯。數(shù)據(jù)在AI時(shí)代的角色正在被重塑,數(shù)據(jù)基礎(chǔ)設(shè)施不僅要實(shí)現(xiàn)存儲(chǔ)和計(jì)算能力的提升,還要支持知識(shí)的學(xué)習(xí)、獲取,以及應(yīng)用的推理和決策。
因此,AI正驅(qū)動(dòng)數(shù)據(jù)基礎(chǔ)設(shè)施從Data Infra向“數(shù)據(jù)×AI”的融合架構(gòu)Data×AI Infra躍遷。傳統(tǒng)的數(shù)據(jù)基礎(chǔ)設(shè)施轉(zhuǎn)型顯得更為急迫,IDC軟件市場(chǎng)研究經(jīng)理李凌霄提到,當(dāng)前數(shù)據(jù)基礎(chǔ)設(shè)施存在負(fù)載割裂、云環(huán)境割裂、多模態(tài)割裂和技術(shù)債務(wù)等問(wèn)題,阻礙了生成式AI的落地。OceanBase的Data×AI戰(zhàn)略旨在實(shí)現(xiàn)數(shù)據(jù)與AI的融合,一體化數(shù)據(jù)底座正是一體化數(shù)據(jù)庫(kù)的延伸。
OceanBase的核心優(yōu)勢(shì)在于,它不僅能夠支持OLTP和OLAP傳統(tǒng)數(shù)據(jù)庫(kù)工作負(fù)載,還能支持AI領(lǐng)域的工作負(fù)載,如半結(jié)構(gòu)化數(shù)據(jù)JSON處理、向量數(shù)據(jù)庫(kù)、混合檢索以及RAG能力等。這些技術(shù)積淀為數(shù)據(jù)與模型的一體化融合提供了基礎(chǔ),成為大模型落地產(chǎn)生價(jià)值的關(guān)鍵所在。為了將數(shù)據(jù)融入模型,提高數(shù)據(jù)質(zhì)量和結(jié)構(gòu)化程度,從而提升模型準(zhǔn)確度和推理效率,OceanBase進(jìn)一步將打造“Data×AI”核心能力細(xì)化為兩方面工作:一方面是將數(shù)據(jù)融入模型,另一方面是將AI原生集成到數(shù)據(jù)庫(kù)中。
在產(chǎn)品層面,OceanBase首發(fā)了面向AI的應(yīng)用產(chǎn)品PowerRAG,為開(kāi)發(fā)者提供AI驅(qū)動(dòng)的開(kāi)箱即用RAG服務(wù)。PowerRAG解決了傳統(tǒng)搭建RAG服務(wù)方案的開(kāi)發(fā)周期長(zhǎng)、維護(hù)成本高、灰箱調(diào)試?yán)щy、性能難以優(yōu)化等問(wèn)題。通過(guò)提供document和Chat兩個(gè)核心API接口,用戶可以快速實(shí)現(xiàn)文檔知識(shí)庫(kù)、智能對(duì)話、圖像比對(duì)、數(shù)據(jù)分析等多種AI應(yīng)用場(chǎng)景的開(kāi)發(fā)。
經(jīng)過(guò)15年的磨礪,OceanBase已經(jīng)淬煉出獨(dú)特的Data×AI Infra方法論,構(gòu)建起智能時(shí)代的核心競(jìng)爭(zhēng)力。作為螞蟻集團(tuán)100%自研的原生分布式數(shù)據(jù)庫(kù),OceanBase支持支付寶的全部核心賬務(wù)和核心支付系統(tǒng),連續(xù)十余年穩(wěn)定支撐雙十一的高并發(fā)場(chǎng)景。OceanBase通過(guò)橫向擴(kuò)展的技術(shù)底座,構(gòu)建起符合AI時(shí)代技術(shù)能力的技術(shù)基礎(chǔ),同時(shí)以縱向深化的高性能數(shù)據(jù)處理基準(zhǔn),為打造AI時(shí)代的一體化數(shù)據(jù)底座積勢(shì)。