在數據庫領域,萬里數據庫已經默默耕耘了16年,如今,萬里數據庫已經悄然走向了前臺,開始嶄露頭角。
近日,賽迪顧問發(fā)布了《“十四五”關鍵應用領域之數據庫市場研究報告》。賽迪直屬工業(yè)和信息化部中國電子信息產業(yè)發(fā)展研究院,所以,能拿到一些媒體拿不到的官方數據,比如:關鍵應用領域數據庫部署情況等,因此,有一定參考價值。
值得關注的是,此次報告中,萬里數據庫進入領導者象限,成為最大黑馬。
按賽迪報告對領導者象限廠商的定位:企業(yè)產品技術路線符合市場需求、市場占有率較高,且技術具有領先性,在某些方向具有一定的領導力。而且公司產品安全性高,符合關鍵應用領域需求。
萬里數據庫入圍領導者象限是否實至名歸?說實話,閱讀報告前,我其實有些不以為然。但仔細閱讀報告后,我意識到之前的判斷可能有些草率和片面了。萬里數據庫的異軍突起,還是有一定數據與事實支撐的。當然,這是建立在特定市場與特定條件的基礎之上。
賽迪報告評價模型采用競爭力四象限圖模型,從技術先進性和產品安全性兩個維度對企業(yè)展開評估。從象限圖中可以看到,萬里數據庫處于領導者象限的中間位置,在產品安全性和技術先進性方面,與國內熟知的一些數據庫廠商位于同一領先水平。
報告開篇就強調:
“本報告主要研究在關鍵應用領域中應用的數據庫產品,涉及的數據庫均為商業(yè)發(fā)行版。”
這句話,我理解有兩層意思:其一,調研對象僅針對數據庫商業(yè)發(fā)行版,排除了開源版(社區(qū)版)產品,這或許就是為什么有些數據庫廠商并未出現(xiàn)在這份報告中的原因;其二,報告針對的并非全市場,而是關鍵應用領域市場。那么,什么是關鍵應用領域?
報告給出的定義是:
關鍵應用領域是指面向公眾提供網絡信息服務或支撐能源、通信、金融、 交通、公共事業(yè)等重要行業(yè)運行的信息系統(tǒng)或工業(yè)控制系統(tǒng)。毫無疑問,關鍵應用領域其實就是國產化替代首當其沖的產業(yè)。
為什么評估模型要基于技術先進性和產品安全性這2個維度?這2個維度又具體包含哪些因素?該報告也給出了原因。這與在“十四五”關鍵應用領域建設過程中,對數據庫的要求直接相關:
一、對數據庫安全性要求更高
關鍵應用領域被視為重要的信息基礎設施與行業(yè),因為它們的中斷或破壞將對重要的社會功能產生嚴重影響。這些系統(tǒng)一旦故障,會影響重要行業(yè)的正常運行,對國家政治、經濟、科技、社會、文化、國防、環(huán)境以及人民生命財產造成嚴重損失。
據報告介紹,安全性這項指標主要考慮:公司股權結構、產品安全等級、客戶類型等因素。
二、對數據庫技術架構先進性要求更高
為什么關鍵應用領域對數據庫技術架構先進性要求更高?報告指出,這取決于現(xiàn)階段,數據庫產品面臨兩大技術挑戰(zhàn):
1、支撐云計算時代新的技術要求
依托公有云的存儲和計算資源,云數據庫實現(xiàn)了存儲和計算的完全解耦,在提供近乎無限的延展性和高彈性的同時,亦保障了數據的一致性,并支持結構化和半結構化數據的處理。同時,云數據庫平臺作為服務整體交付,節(jié)約了用戶管理基礎架構所需的成本、時間和資源。目前,數據庫管理軟件向云端的遷移亦成為明確趨勢。
2、滿足數據量劇增背景下,如何高效穩(wěn)定地使用數據,支撐業(yè)務發(fā)展
隨著計算載體的迭代與業(yè)務需求的相互促進,傳統(tǒng)數據庫在某些伸縮性強的業(yè)務場景中已難以滿足市場需求,分布式數據庫在這些場景中的優(yōu)勢便顯現(xiàn)出來。在數據量劇增的背景下,集中式數據庫顯現(xiàn)出了存儲建設成本高、擴展性較差等問題。分布式數據庫則通過資源池化管理,實現(xiàn)物理或邏輯層的相互隔離和資源的自由伸縮,具備彈性擴張、HTAP事務、多租戶管理、高可用等能力,與云計算場景需求相匹配。同時,分布式數據庫對多種數據類型的兼容,可以實現(xiàn)對存儲于不同物理服務器、不同格式的數據進行結構與算法的優(yōu)化,突破服務器類型的限制,為上層不同類型的應用提供多模式的數據服務。
因此,基于以上2大挑戰(zhàn),云數據庫及分布式架構成為現(xiàn)階段最熱門的技術路線。數據庫產品是否考慮到新的技術要求并與新興技術融合,就成為了一項重要指標。
當然,技術先進性這項指標也并不僅限于此。據該報告介紹,這項指標主要考慮:產品架構、技術路線、服務體系、應用案例等因素。
搞明白了產品安全性及技術先進性兩個維度所包含的具體指標,萬里數據庫憑什么能進入領導者象限,就可以一一對應進行分析了。
從公司股權結構看,萬里數據庫算是國內較早一批從事分布式數據庫研發(fā)的廠商,成立于2000年10月24日。據工信部數據庫發(fā)展白皮書2021顯示,國產數據庫企業(yè)成立年限超過10年的不足50%,而成立20年以上的數據庫企業(yè)只有十四家,萬里數據庫就屬于其中一家。
從天眼查可以查到,萬里數據庫是一家背景“清白”的獨立數據庫企業(yè),并沒有外資背景,也沒有與任何一家云廠商綁定。這對于企業(yè)多云異構的復雜環(huán)境有適用性、中立性。國外當紅炸子雞Snowflake,已經證明了中立性的價值。
“未來,國內數據庫市場會形成至少2個梯隊。第1梯隊是互聯(lián)網巨頭,萬里數據庫的目標是做第2梯隊領頭羊。為什么除了互聯(lián)網巨頭之外,還能有第2梯隊?因為,客戶替換是為了避免被外資大廠綁定,同樣,也不愿意接下來被另外的巨頭綁定,這就給萬里數據庫這樣的獨立數據庫廠商提供了市場空間。”
這是去年,萬里數據庫聯(lián)合創(chuàng)始人林韶賓在接受我的采訪時說過的一段話。其中就提到了中立性這點。
天眼查顯示,萬里數據庫旗下有且僅有唯一一個全資子公司,即北京拓林思軟件有限公司(Turbolinux),是國內最早一批從事Linux產品化的公司。
這說明,萬里數據庫在基礎軟件領域很早就開始布局國產替代市場,有著較深的技術積累和國內商業(yè)化的認知,否則不會存活到現(xiàn)在。這與近幾年跟隨風口瘋狂入場的一些新興數據庫公司,有著本質區(qū)別。
從產品安全等級看,萬里數據庫是否符合國產化要求?具體到行業(yè),如:萬里數據庫是否符合金融國產化要求,相關資質是否齊全?
從公眾號、網站等公開資料可以了解到,萬里數據庫自2018年開始與國產芯片、操作系統(tǒng)、服務器、中間件等國產軟硬件開展兼容適配。目前,萬里的數據庫已兼容所有主流的國產軟硬件。
萬里數據庫先后通過了中國人民銀行、中國電科院、中國軟件評測中心等行業(yè)及業(yè)內權威的安全等級測試認證,并且產品在金融、運營商、能源等行業(yè)有較大規(guī)模的落地。
這說明萬里數據庫滿足國家安全標準與用戶安全標準。通過安全等級測試是一方面,更具說服力的是在金融、運營商、能源等行業(yè)頭部企業(yè)中有較大規(guī)模的落地實踐,這能說明很多問題。
從客戶類型及應用案例看,客戶類型及案例能有效證明產品的安全性。賽迪報告中雖未直接披露廠商和產品,但從案例架構圖中,不難找到萬里數據庫的身影。客觀地說,對于沒有國家隊背景的萬里數據庫而言,活著且越活越好,并不是一件容易的事。
雖然,萬里數據庫的商業(yè)模式與大部分數據庫廠商沒有區(qū)別,主要以售賣License為主。但萬里數據庫針對頭部客戶采用靈活的聯(lián)合研發(fā)模式,我認為,這才是萬里數據庫能夠敲開金融、運營商、能源等行業(yè)客戶,并迅速鋪開的主要原因。
聯(lián)合研發(fā)的案例并不難發(fā)現(xiàn)。2019年,萬里數據庫與國家電網聯(lián)合發(fā)布“思極有容”數據庫。2020年,又與聯(lián)通沃音樂聯(lián)合研發(fā)海納數據智能平臺uniBase。
售賣License的案例,如2020年,萬里數據庫中標了中移動OLTP數據庫聯(lián)合創(chuàng)新項目,在業(yè)內一鳴驚人。
毫無疑問,萬里數據庫的主要用戶都是國內關鍵應用領域中的頭部企業(yè)。如前所述,如果萬里數據庫的產品不符合國家電網、中國移動等行業(yè)巨頭的應用標準,它憑什么中標?沒國家隊身份的它又憑什么活著?
從產品架構看,去年,我對萬里數據庫聯(lián)合創(chuàng)始人林韶賓的專訪中已經提及(詳情見《萬里數據庫是一家怎樣的公司?》)
GreatDB采用原生分布式架構、基于多數派協(xié)議+數據冗余實現(xiàn)高可靠,基于兩階段提交協(xié)議+DTM實現(xiàn)分布式事務ACID、集群架構全組件按需高可擴展。 GreatDB還針對中國企業(yè)級市場的需求改進了事務模型,從吞吐和延時兩個維度改進了性能。從用戶角度出發(fā),對原生分布式數據庫進行了增強。
因此,從產品架構上,萬里數據庫的原生分布式架構具有一定技術領先性。
從技術路線看,萬里數據庫基于MySQL技術路線進行自主研發(fā),這與其技術優(yōu)勢直接相關。萬里數據庫技術團隊為前MySQL中國研發(fā)中心及服務中心,先后與MySQL AB、SUN、Oracle合作研發(fā)過MySQL核心代碼。
萬里數據庫對MySQL主要有以下貢獻:Replication功能開發(fā)、NDB Cluster功能開發(fā)、Bug修復、中文手冊編譯等。顯然,在MySQL技術路線上,萬里數據庫有很深的技術積累而非浮于表面,這是其核心競爭力的體現(xiàn)。
眾所周知,國產數據庫多數基于MySQL和PostgreSQL二次開發(fā)而來,利用開源技術縮短與國外頭部企業(yè)的差距無可厚非。事實上,不僅在國內,國外也一樣。以下列出的都是基于MySQL開發(fā)的產品,其中就包含大眾所熟知的國外的AWS Aurora。
(來源:Database of Database 網站)
但是,如我一直強調的,利用開源技術不等于完全依靠開源技術,應該在開源技術上有著自己的創(chuàng)新。掌握核心能力,不是在開源技術上穿個“衣”帶個“帽”就號稱自研、自主可控。
這點,萬里數據庫相比國內其它一些廠商的含糊其辭,要實在些,并不掩飾自己產品基于MySQL技術路線的事實,想必這份自信也是源于其多年自主研發(fā)經驗及對MySQL核心技術的掌控。并且,萬里數據庫還兼具目前流行的開源技術路線。2021年,萬里數據庫將其多年技術積累進行了開源,推出GreatSQL社區(qū)。
基于國內已經形成龐大的圍繞MySQL軟件生態(tài)和人才生態(tài)的事實,搭建一個獨立自主的國內MySQL分支社區(qū),其現(xiàn)實意義已在業(yè)界形成廣泛共識。當然,分支社區(qū)搭建容易搞活難,GreatSQL社區(qū)未來發(fā)展還有待觀察,但GreatSQL社區(qū)2021年已被評為“Gitee最有價值開源項目”,可見其潛力還是被業(yè)內認可的。目前,國內數據庫分支社區(qū)做的成功的不是沒有,比如openGauss就做得風生水起,不過它是基于PostgreSQL技術路線。
從服務體系看,服務很重要。因為,大部分應用企業(yè)在MySQL數據庫方面的故障解決能力、企業(yè)級數據服務支撐能力是不足的,維護團隊規(guī)模也不大。
從趨勢看,專業(yè)化服務是當前數據庫市場的主要發(fā)展趨勢。什么是專業(yè)化服務?舉個例子,雖然Oracle貴,服務也貴,但絕對是專業(yè)服務的典范。一個電話過去,Oracle派團隊過來駐場一個月,調試-測試-出報告,甚至會將配置哪里錯了、哪里可以優(yōu)化、哪些工具可以用來繼續(xù)監(jiān)測等都講得清清楚楚。甚至不是Oracle的問題,也會順手提出來,這就是專業(yè)化服務。
但是,專業(yè)化技術服務能力并不等于“搬磚”能力,其源動力是企業(yè)的技術能力水平。解決當前國產化替換的關鍵是技術掌控,而不是堆人。當然,堆人是一種態(tài)度,也能解決表面問題,但最核心的仍是對技術的掌控。
萬里數據庫是少數幾家接受我采訪時,主動談到測試方法論和工具的廠商。數據庫研發(fā)過程中最大的痛點不是解決問題,而是發(fā)現(xiàn)并重現(xiàn)問題。
如何保障產品的穩(wěn)定性?涉及分布式產品的測試,與以往單機不同。分布式架構有許多故障組合,尤其是機器多了以后,計算、存儲節(jié)點包含對上下游工具的兼容等都會導致一系列行為的不同。為此,萬里數據庫倒騰出了一個厲害的東西“混沌測試工具DBomb”。這個東西,我只有在采訪高斯實驗室和Oracle時才聽過。所以,萬里數據庫在解決產品技術問題方面是有其獨到之處的,這不是剛剛成立三五年的數據庫廠商可以做到的。
綜上所述, 無論是從公司技術團隊背景、產品、成功案例可移植性以及技術服務能力,萬里數據庫都表現(xiàn)得全面且均衡。因此,能進入到領導者象限,也就不難理解了。
關注”萬里數據庫“公眾號,點擊底部菜單欄【賽迪報告】下載完整報告