IDC對中國人工智能市場的研究數(shù)據(jù)顯示,2018年,中國人工智能市場投資規(guī)模約25億美元,其中了66%以上為以算力為核心的基礎(chǔ)架構(gòu)硬件市場投資。IDC預(yù)測,到2022年,中國的人工智能市場投資規(guī)模將超過百億美元,未來五年的復(fù)合增長率超過59%,將形成一個全新的千億人民幣規(guī)模的人工智能基礎(chǔ)架構(gòu)硬件產(chǎn)業(yè)生態(tài)。AI算力正承載人工智能應(yīng)用的平臺和基礎(chǔ),加速推動人工智能系統(tǒng)的快速發(fā)展和演進。
隨著人工智能規(guī)模化落地,企業(yè)在制定AI轉(zhuǎn)型路線時可考慮“1+N”的應(yīng)用場景模式,“1”是結(jié)合公司核心業(yè)務(wù),把1個或幾個對業(yè)務(wù)影響最大的場景做到極致;“N”是用最高的效率規(guī)模化落地盡可能多的應(yīng)用場景,使場景的總體價值最大化。
人工智能在今天是一個特別火又特別令人困惑的話題。火是因為被各行各業(yè)寄予厚望,困惑是因為目前公眾在新聞媒體上看到更多的AI集中在感知層,例如人臉識別、語音識別、無人車等。但回到我們的企業(yè)經(jīng)營,似乎和無人車這樣的技術(shù)完全聯(lián)系不到一起去。享受著AI紅利的企業(yè),例如BAT,也沒有哪家是靠人臉識別在經(jīng)營的。第四范式一直致力于解決的問題,是如何把人工智能技術(shù)和各行各業(yè)企業(yè)的生產(chǎn)、經(jīng)營能夠結(jié)合起來。一個企業(yè)、一個組織,通常自上而下分為戰(zhàn)略制定者、策略制定者、策略執(zhí)行者三種角色。過去20年,互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)解決了策略執(zhí)行的環(huán)節(jié)。未來的20年,人工智能將會通過改造 “策略制定”的環(huán)節(jié)來提升企業(yè)業(yè)務(wù)。
第四范式的企業(yè)愿景是AI For Everyone,我們希望把人工智能技術(shù)帶到每一個行業(yè),比如金融、零售、能源、安防、醫(yī)療、媒體等,幫助企業(yè)去實現(xiàn)智能化轉(zhuǎn)型。回到企業(yè)本身,無論是否使用AI技術(shù),首先我們需要關(guān)心的企業(yè)需要提升什么業(yè)務(wù)價值。
首先,每個企業(yè)可能都會有1個或多個核心業(yè)務(wù),這些業(yè)務(wù)提升會帶動整個企業(yè)的提升。例如,最近幾年,互聯(lián)網(wǎng)應(yīng)用越來越關(guān)心的“千人千面”,本質(zhì)上是通過個性化服務(wù)應(yīng)用提升客戶活躍度,降低客戶流失率。客戶活躍度的提升,會帶動企業(yè)整體的提升。對于零售或制造業(yè)企業(yè),提升供應(yīng)鏈效率,降低成本,也會帶動企業(yè)核心競爭力的提升。面對這些核心應(yīng)用場景,我們需要AI做到“極致的效果”,因為每提升一個百分點的效果,對企業(yè)都至關(guān)重要。
其次,很多企業(yè)也往往面臨場景應(yīng)用極其分散的情況。例如,大型金融企業(yè),他們的業(yè)務(wù)往往較為分散。這種情況下,AI的規(guī)模化落地,往往比單場景的極致效果對企業(yè)更為重要。假設(shè)一個企業(yè)有一千個場景,其中一個場景提升10倍,對整個企業(yè)來說,只有百分之一的提升。而如果我們能高效地完成一千個場景的全面覆蓋,即使每個場景只提升1倍,那也百分之百的提升。所以,面對場景眾多的企業(yè),AI的規(guī)模化落地能力是企業(yè)智能化轉(zhuǎn)型的關(guān)鍵。
我們習(xí)慣把企業(yè)的核心場景稱之為“1”,把眾多的場景稱之為“N”。通常企業(yè)的智能化轉(zhuǎn)型,需要一個“1+N”應(yīng)用模式。這里需要指出的是,“1”不一定只有一個應(yīng)用,有些企業(yè)可能會有若干個“1”這樣的核心應(yīng)用,但一定不會很多。
企業(yè)的業(yè)務(wù)一定是和企業(yè)的發(fā)展目標(biāo)相關(guān)的。例如,我們服務(wù)某知名國際零售集團,根據(jù)企業(yè)的發(fā)展目標(biāo),將其業(yè)務(wù)分為“開源”和“節(jié)流”兩大類。“開源”的目標(biāo)主要和客戶相關(guān),包括提升客戶留存率、單客戶價值、平均客戶留存時間等。手段上來說,可能有千人千面的推薦、coupon的營銷等。AI在里面可以通過優(yōu)化推薦、營銷等環(huán)節(jié),提升留存率、單客戶價值等核心指標(biāo)。“節(jié)流”的目標(biāo)主要是降低中后臺運營的成本和提升運營效率。通過提升供應(yīng)鏈等環(huán)節(jié)的效率,降低成本,提升企業(yè)的競爭力。這其中,個性化服務(wù)、供應(yīng)鏈?zhǔn)呛诵膽?yīng)用,是“1”,1個百分點的提升就足以改變企業(yè)的競爭格局。而眾多細(xì)分場景,如各種單據(jù)的OCR、各種場景的語音識別、智能客服、流程機器人等,是“N”,規(guī)模化的落地可以提升企業(yè)的整體效率。
“1”一定要做到極致的效果,這類標(biāo)桿型應(yīng)用對于AI系統(tǒng)的要求較高。一是高維,也就是精細(xì),越高維度的AI,其效果上能做到越精細(xì)。過去的專家模型,往往維度(規(guī)則數(shù)量)在幾個到幾千個不等。傳統(tǒng)意義上的高維模型,往往局限在萬級別的維度遺下。第四范式開發(fā)的高維機器學(xué)習(xí)引擎,最高可支持到萬億(10^12)維度,通過極致的機器算力,實現(xiàn)遠(yuǎn)超傳統(tǒng)幾個數(shù)量級的精準(zhǔn)性。二是實時,隨著服務(wù)線上化以及對極致體驗的要求,對業(yè)務(wù)的實時響應(yīng)要求越來越高。尤其面對高維,我們發(fā)現(xiàn)往往過去能做到實時的系統(tǒng),做不到高維;能做到高維的系統(tǒng),做不到實時。為此,第四范式自主研發(fā)了RTiDB系統(tǒng),實現(xiàn)萬億維度模型毫秒級響應(yīng)的精準(zhǔn)決策。三是閉環(huán)(自學(xué)習(xí)能力),任何系統(tǒng)都不可能完美,都可能會犯錯。我們更怕的不是AI犯錯誤,而是AI持續(xù)不斷地犯同樣的錯誤。因此,持續(xù)利用業(yè)務(wù)應(yīng)用過程中的反饋數(shù)據(jù)進行系統(tǒng)自我更新與優(yōu)化的能力,是未來AI系統(tǒng)極其重要的核心能力。我們也經(jīng)常發(fā)現(xiàn),AI系統(tǒng)的最大提升,很多時候并不來自于系統(tǒng)上線的那一刻,而是來自于上線以后經(jīng)年累月的自我迭代提升。
“N”追求的是規(guī)模化落地,現(xiàn)在我們服務(wù)的很多企業(yè)都面臨著“全面AI改造”,在面對1千個甚至1萬個場景時,如果每個都做到極致,代價和效率是不夠的。實現(xiàn)規(guī)模化落地和極致效果的路徑不完全一樣。首先需要建立一個統(tǒng)一的方法論,讓更多人用統(tǒng)一方法規(guī)模化生產(chǎn)AI。第四范式建立了一個以 “庫伯學(xué)習(xí)圈”理論為基礎(chǔ)的AI方法論,并基于此構(gòu)建了“先知”平臺,將AI開發(fā)過程分成 “行為數(shù)據(jù)采集、反饋數(shù)據(jù)采集、模型訓(xùn)練、模型應(yīng)用”四個標(biāo)準(zhǔn)步驟,我們幫助客戶和合作伙伴的開發(fā)者在先知上按照這樣的一二三四去產(chǎn)生AI。以我們服務(wù)的某大型央企為例,其開發(fā)者數(shù)量眾多,AI開發(fā)者卻非常有限,我們?yōu)槠涮峁┝私y(tǒng)一的方法論和平臺,讓開發(fā)者針對業(yè)務(wù)目標(biāo),在上面開發(fā)各種各樣的AI應(yīng)用。
其次,AI規(guī)模化應(yīng)用過程中要有完善的數(shù)據(jù)治理能力,尤其是對于大中型的企業(yè),數(shù)據(jù)治理非常重要。可能我們過去已經(jīng)做了大數(shù)據(jù)系統(tǒng),但往往是面向BI建設(shè)的,BI大數(shù)據(jù)主要是幫助人去總結(jié)一些經(jīng)驗,因此更強調(diào)查詢、統(tǒng)計、可視化等功能。AI大數(shù)據(jù)是給機器看的數(shù)據(jù),需要的是完整、實時和支持機器自學(xué)習(xí)的閉環(huán)。兩個大數(shù)據(jù)系統(tǒng)的設(shè)計理念天然不同,我們經(jīng)常會看到企業(yè)由于過去建設(shè)了面向BI的大數(shù)據(jù)系統(tǒng),又將AI建設(shè)在這個系統(tǒng)之上,非但沒有幫到AI,反倒成為AI落地的障礙。因此,大規(guī)模AI實踐過程中企業(yè)需要一套面向AI的數(shù)據(jù)治理系統(tǒng),能夠存取PB級甚至更大量的日志、支持實時存儲、形成一個線上數(shù)據(jù)采集和處理的閉環(huán)等。
最后是AI算力,以往大家關(guān)注的焦點主要集中在兩個方面:一是通過購買大量的服務(wù)器和GPU來提升算力;二是通過芯片實現(xiàn)AI的加速。但是算力是一個完整的體系架構(gòu),甚至不僅僅包括硬件,而是軟件和硬件的“結(jié)合體”,只有了解AI算法的運算架構(gòu)與邏輯,才能針對硬件去做深層次的優(yōu)化。AI系統(tǒng)其實是有“套路”的設(shè)計,具備固定的計算模式,它需要的是一個專用計算,不像大數(shù)據(jù)和軟件需要的是通用計算。基于專用計算的特點,算法和軟件其實可以直接定義好計算,提前把計算的部分去硬件化。此外,過去傳統(tǒng)的通用通信協(xié)議、存儲系統(tǒng)也同樣面臨著無法支撐AI的困境,需要針對于AI算法的特性進行深度優(yōu)化。以TCP的通信協(xié)議為例,該協(xié)議通過“三次握手”建立可靠的數(shù)據(jù)交換機制,保證數(shù)據(jù)傳輸不丟失。但AI只需要在傳輸過程中,保證數(shù)據(jù)的統(tǒng)計特性即可,傳輸100份數(shù)據(jù)與傳輸90份數(shù)據(jù)的統(tǒng)計結(jié)果差異微乎其微。
第四范式從去年開始研究開發(fā)新的硬件體系SageOne,我們不是為了去生產(chǎn)硬件,而是為了設(shè)計軟硬一體的方案,產(chǎn)出更適合人工智能專用算法的算力架構(gòu)。