浙江工商大學(xué)人文社會(huì)科學(xué)資深教授,阿里巴巴集團(tuán)第三屆學(xué)術(shù)委員會(huì)委員,浙江工商大學(xué)應(yīng)用經(jīng)濟(jì)學(xué)一級(jí)學(xué)科博士點(diǎn)學(xué)術(shù)委員會(huì)主任,浙江工商大學(xué)學(xué)術(shù)委員會(huì)副主任,浙江工商大學(xué)經(jīng)濟(jì)學(xué)部主任,享受?chē)?guó)務(wù)院特殊津貼,浙江省有突出貢獻(xiàn)的中青年專(zhuān)家。

摘要
金融大數(shù)據(jù)和大數(shù)據(jù)金融,是兩個(gè)具有不同內(nèi)涵的概念,我們有必要在區(qū)分各自?xún)?nèi)涵的基礎(chǔ)上,通過(guò)分析金融大數(shù)據(jù)構(gòu)成來(lái)說(shuō)明用于金融決策的信息來(lái)源,通過(guò)分析大數(shù)據(jù)金融這一動(dòng)態(tài)過(guò)程來(lái)論證大數(shù)據(jù)、互聯(lián)網(wǎng)和人工智能等的融合對(duì)金融決策行為的重塑。對(duì)于大數(shù)據(jù)金融,無(wú)論是分析它的操作過(guò)程還是應(yīng)用場(chǎng)景,都必須對(duì)大數(shù)據(jù)金融實(shí)施平臺(tái)和技術(shù)條件配置作出分析的同時(shí),對(duì)云計(jì)算、機(jī)器學(xué)習(xí)等人工智能手段作用于大數(shù)據(jù)金融發(fā)展的過(guò)程進(jìn)行分析。本文在考察金融大數(shù)據(jù)構(gòu)成的基礎(chǔ)上,力圖通過(guò)大數(shù)據(jù)金融的研究來(lái)揭示將來(lái)人類(lèi)金融決策行為有可能產(chǎn)生的一般機(jī)理。
1
金融大數(shù)據(jù)構(gòu)成及內(nèi)涵考察
金融運(yùn)行和金融發(fā)展是人類(lèi)經(jīng)濟(jì)文明的一個(gè)重要組成部分。從反映人類(lèi)文明的人文主義看,大數(shù)據(jù)問(wèn)世前后的人文主義是不同的。在大數(shù)據(jù)問(wèn)世前的農(nóng)業(yè)化社會(huì)直至工業(yè)化社會(huì)的初期和中期,盡管出現(xiàn)了各種風(fēng)靡一時(shí)的人文主義,但科技因素對(duì)人文主義的影響通常是從屬于文化因素的;大數(shù)據(jù)問(wèn)世后,科技人文主義有著逐步取代歷史上各種人文主義的趨勢(shì)。推崇大數(shù)據(jù)的未來(lái)學(xué)家是科技人文主義的信奉者,他們認(rèn)為將來(lái)一切都由大數(shù)據(jù)主宰,人類(lèi)所有活動(dòng)和自然界所有現(xiàn)象都將會(huì)成為一種“算法”。世界的未來(lái)大勢(shì)果真如此嗎?對(duì)此,經(jīng)濟(jì)學(xué)家可能不敢貿(mào)然下結(jié)論,但在大數(shù)據(jù)、互聯(lián)網(wǎng)和人工智能等相融合的今天,金融運(yùn)行和金融發(fā)展作為人類(lèi)經(jīng)濟(jì)活動(dòng)的重要領(lǐng)域,有許多可通過(guò)現(xiàn)象捕捉和把握的機(jī)理,需要經(jīng)濟(jì)學(xué)家去研究。
事實(shí)上,大數(shù)據(jù)是自有人類(lèi)就存在但直到工業(yè)化后期才出現(xiàn)的概念,該概念既包括數(shù)字化數(shù)據(jù),也包括非數(shù)字化數(shù)據(jù);既包括人類(lèi)社會(huì)活動(dòng)留下的所有痕跡,也包括自然界所有現(xiàn)象的痕跡。同時(shí),它不僅包括已發(fā)生事件的歷史數(shù)據(jù),而且包括正在發(fā)生事件的現(xiàn)期數(shù)據(jù)和將會(huì)發(fā)生事件的未來(lái)數(shù)據(jù)。我們現(xiàn)今描述和論證的大數(shù)據(jù),主要是針對(duì)人類(lèi)活動(dòng)而言的,如工業(yè)大數(shù)據(jù)、農(nóng)業(yè)大數(shù)據(jù)、消費(fèi)大數(shù)據(jù)、金融大數(shù)據(jù)、投資大數(shù)據(jù)、社交媒體大數(shù)據(jù)以及人們衣食住行各種分類(lèi)的大數(shù)據(jù)等。就金融大數(shù)據(jù)而論,它主要由金融機(jī)構(gòu)、廠商、個(gè)人和政府當(dāng)局在投資、儲(chǔ)蓄、利率、股票、期貨、債券、資金拆借、貨幣發(fā)行量、期票貼現(xiàn)和再貼現(xiàn)等構(gòu)成。大數(shù)據(jù)構(gòu)成的分類(lèi)權(quán)重很復(fù)雜,需要我們利用云平臺(tái)和運(yùn)用云計(jì)算、人工智能技術(shù)來(lái)處理,而不是簡(jiǎn)單加總就可以作為決策依據(jù)的數(shù)據(jù)。換言之,理解金融大數(shù)據(jù)的構(gòu)成并不難,困難主要發(fā)生在如何搜集、整合和分類(lèi)大數(shù)據(jù)的分類(lèi)權(quán)重,以及如何對(duì)這些經(jīng)常變動(dòng)的金融大數(shù)據(jù)進(jìn)行挖掘、加工和處理。
金融大數(shù)據(jù)內(nèi)涵,可以理解為大數(shù)據(jù)中蘊(yùn)含的反映人們金融交易行為互動(dòng)的基本信息,這是一種依據(jù)“信息來(lái)源于大數(shù)據(jù)”的認(rèn)知而得出的理論考量。比較金融大數(shù)據(jù)內(nèi)涵與金融大數(shù)據(jù)構(gòu)成,兩者之間存在關(guān)聯(lián);前者會(huì)在一定程度上規(guī)定后者,這主要體現(xiàn)在大數(shù)據(jù)分類(lèi)構(gòu)成及其權(quán)重變化會(huì)導(dǎo)致金融運(yùn)行有可能出現(xiàn)的機(jī)遇、風(fēng)險(xiǎn)或危機(jī)等方面;金融大數(shù)據(jù)內(nèi)涵并不等價(jià)于金融大數(shù)據(jù)構(gòu)成,這是因?yàn)椋鹑诖髷?shù)據(jù)內(nèi)涵在一定程度和范圍內(nèi)要受到政府宏觀調(diào)控政策及其制度安排的影響,以至于人們難以依據(jù)金融大數(shù)據(jù)構(gòu)成進(jìn)行決策。這個(gè)問(wèn)題會(huì)涉及金融大數(shù)據(jù)外延,以及人們根據(jù)金融大數(shù)據(jù)進(jìn)行決策會(huì)不會(huì)出現(xiàn)偏差等的討論。不過(guò),我們?cè)谝话憷碚搶用嫔嫌懻摻鹑诖髷?shù)據(jù)內(nèi)涵,把聚焦點(diǎn)放在金融大數(shù)據(jù)構(gòu)成上,應(yīng)該說(shuō)抓住了問(wèn)題分析的癥結(jié)。
金融大數(shù)據(jù)內(nèi)涵具有極大量、多維度和完備性等特征,人們根據(jù)金融大數(shù)據(jù)進(jìn)行決策,需要有處理這些特征的新科技手段。在現(xiàn)已運(yùn)用的新科技中,云平臺(tái)是搜集和分類(lèi)極大量和完備性之大數(shù)據(jù)的基礎(chǔ),集約化云計(jì)算是加工和處理極大量和完備性之大數(shù)據(jù)的主要技術(shù)手段,機(jī)器學(xué)習(xí)、物聯(lián)網(wǎng)、區(qū)塊鏈等其他人工智能技術(shù)則是對(duì)多維度大數(shù)據(jù)進(jìn)行甄別、判斷和預(yù)測(cè)的主要分析工具。人類(lèi)運(yùn)用新科技手段對(duì)金融大數(shù)據(jù)的挖掘、搜集、整合、分類(lèi)、加工和處理,存在著效用函數(shù)的評(píng)估問(wèn)題。從正確把握金融大數(shù)據(jù)內(nèi)涵從而消除金融活動(dòng)不確定性來(lái)考察,該效用函數(shù)要取得最大值,關(guān)鍵是人們不僅要能加工和處理歷史數(shù)據(jù),而且要能加工和處理現(xiàn)期數(shù)據(jù)和未來(lái)數(shù)據(jù),并且能夠從歷史數(shù)據(jù)、現(xiàn)期數(shù)據(jù)和未來(lái)數(shù)據(jù)中獲得準(zhǔn)確信息。金融大數(shù)據(jù)內(nèi)涵既可以從靜態(tài)上理解,也可以從動(dòng)態(tài)過(guò)程解釋。顯然,經(jīng)濟(jì)學(xué)家分析現(xiàn)期數(shù)據(jù)和未來(lái)數(shù)據(jù)是對(duì)金融大數(shù)據(jù)內(nèi)涵的動(dòng)態(tài)研究,它是我們解說(shuō)金融大數(shù)據(jù)內(nèi)涵的分析基點(diǎn)。
社會(huì)物理學(xué)認(rèn)為人們面對(duì)未來(lái)決策存在“想法流”(彭特蘭,2015),這個(gè)想法流與人們行為之間有著可靠數(shù)量關(guān)系,它會(huì)改變?nèi)说倪x擇并能夠推動(dòng)創(chuàng)新。這個(gè)觀點(diǎn)的啟示是,我們可以把金融領(lǐng)域已經(jīng)發(fā)生事件的行為數(shù)據(jù),定義為金融機(jī)構(gòu)、政府當(dāng)局、廠商和個(gè)人的“行為數(shù)據(jù)流”,把金融領(lǐng)域尚未發(fā)生但即將會(huì)發(fā)生事件的行為數(shù)據(jù),解說(shuō)為金融機(jī)構(gòu)、政府當(dāng)局、廠商和個(gè)人的“想法數(shù)據(jù)流”。在結(jié)合金融大數(shù)據(jù)是數(shù)字化數(shù)據(jù)與非數(shù)字化數(shù)據(jù)之和的規(guī)定下,我們可得到以下等式:金融大數(shù)據(jù) = 行為數(shù)據(jù)流 + 想法數(shù)據(jù)流 = 歷史數(shù)據(jù) + 現(xiàn)期數(shù)據(jù) + 未來(lái)數(shù)據(jù) = 數(shù)字化數(shù)據(jù) + 非數(shù)字化數(shù)據(jù)。這個(gè)系列等式非常重要,它在很大程度和范圍內(nèi)揭示了金融大數(shù)據(jù)內(nèi)涵,給我們提供了一幅研究正在興起的大數(shù)據(jù)金融的分析圖景。
大數(shù)據(jù)金融,主要是指運(yùn)用大數(shù)據(jù)分析方法從事金融活動(dòng)的方法和過(guò)程,即廠商、個(gè)人和政府通過(guò)云計(jì)算、機(jī)器學(xué)習(xí)、物聯(lián)網(wǎng)、區(qū)塊鏈等人工智能技術(shù)來(lái)匹配金融大數(shù)據(jù)的方法和過(guò)程。大數(shù)據(jù)金融反映的是,金融機(jī)構(gòu)、政府當(dāng)局、廠商和個(gè)人正在進(jìn)行決策的具體過(guò)程。較之于金融大數(shù)據(jù),大數(shù)據(jù)金融關(guān)注大數(shù)據(jù)工具的選擇和運(yùn)用,強(qiáng)調(diào)金融活動(dòng)主體在互聯(lián)網(wǎng)擴(kuò)張過(guò)程中掌握和運(yùn)用云平臺(tái)、云計(jì)算、機(jī)器學(xué)習(xí)、物聯(lián)網(wǎng)、區(qū)塊鏈等人工智能手段的技術(shù)層級(jí),注重金融活動(dòng)的效用函數(shù)。從數(shù)字經(jīng)濟(jì)運(yùn)行角度看,大數(shù)據(jù)金融的落地過(guò)程伴隨著互聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能等相互融合的運(yùn)行過(guò)程。
2
大數(shù)據(jù)金融的實(shí)施平臺(tái)和技術(shù)配置分析
大數(shù)據(jù)在各行各業(yè)廣泛運(yùn)用的背景是互聯(lián)網(wǎng)擴(kuò)張,信息互聯(lián)網(wǎng)由PC互聯(lián)網(wǎng)發(fā)展到了移動(dòng)互聯(lián)網(wǎng),物體互聯(lián)網(wǎng)由物聯(lián)網(wǎng)和人工智能兩大塊構(gòu)筑,價(jià)值互聯(lián)網(wǎng)通過(guò)區(qū)塊鏈開(kāi)始嶄露頭角。互聯(lián)網(wǎng)擴(kuò)張的直接后果產(chǎn)生了以互聯(lián)網(wǎng)為平臺(tái)、以大數(shù)據(jù)為基本要素、以云計(jì)算和機(jī)器學(xué)習(xí)等人工智能為手段的數(shù)字經(jīng)濟(jì)。數(shù)字經(jīng)濟(jì)涉獵范圍很廣,大數(shù)據(jù)金融便在其中,換言之,互聯(lián)網(wǎng)擴(kuò)張是大數(shù)據(jù)金融的實(shí)施背景。
(一)互聯(lián)網(wǎng)擴(kuò)張為大數(shù)據(jù)金融提供平臺(tái),大數(shù)據(jù)金融會(huì)借助這個(gè)平臺(tái)得以縱深發(fā)展
在數(shù)字經(jīng)濟(jì)開(kāi)始滲透宏觀和微觀經(jīng)濟(jì)領(lǐng)域的當(dāng)今世界,廠商與廠商、廠商與政府、廠商與消費(fèi)者之間的行為互動(dòng),已充分反映出互聯(lián)網(wǎng)擴(kuò)張態(tài)勢(shì)。隨著5G通訊、社交媒體、傳感器、定位系統(tǒng)等的覆蓋面越來(lái)越寬廣,信息互聯(lián)網(wǎng)、物體互聯(lián)網(wǎng)和價(jià)值互聯(lián)網(wǎng)會(huì)提供海量數(shù)據(jù),這些海量數(shù)據(jù)為從事大數(shù)據(jù)金融的金融機(jī)構(gòu)、政府當(dāng)局、廠商和個(gè)人提供了操作依據(jù),這主要體現(xiàn)在以下幾方面:(1)利用新科技手段對(duì)大數(shù)據(jù)進(jìn)行搜集、整合、分類(lèi)、加工和處理,以獲取用于決策的準(zhǔn)確信息;(2)利用互聯(lián)網(wǎng)與5G通訊、社交媒體、傳感器、定位系統(tǒng)等的關(guān)聯(lián),建立金融大數(shù)據(jù)平臺(tái);(3)通過(guò)金融大數(shù)據(jù)平臺(tái)實(shí)現(xiàn)數(shù)據(jù)智能化和網(wǎng)絡(luò)協(xié)同化。就互聯(lián)網(wǎng)擴(kuò)張與數(shù)據(jù)智能化、網(wǎng)絡(luò)協(xié)同化的聯(lián)系而論,大數(shù)據(jù)金融在要求極高的數(shù)據(jù)智能化的同時(shí),也要求協(xié)同交易的網(wǎng)絡(luò)協(xié)同化,但這兩項(xiàng)要求都離不開(kāi)互聯(lián)網(wǎng)擴(kuò)張。
從金融交易行為互動(dòng)看,從事大數(shù)據(jù)金融的各主體借助互聯(lián)網(wǎng)擴(kuò)張,能否取得效用函數(shù)的滿(mǎn)意值,主要看能不能實(shí)現(xiàn)數(shù)據(jù)智能化和網(wǎng)絡(luò)協(xié)同化,以及能不能實(shí)現(xiàn)網(wǎng)絡(luò)協(xié)同效應(yīng)。以上表述或許夾帶著經(jīng)濟(jì)和技術(shù)參半之意境的“形而上”,但不管怎么說(shuō),從事大數(shù)據(jù)金融的各主體要取得滿(mǎn)意的效用函數(shù),必須提升對(duì)金融大數(shù)據(jù)的挖掘、加工和處理的技術(shù)層級(jí),必須在面對(duì)投資、儲(chǔ)蓄、利率、股票、期貨、債券、資金拆借、法定準(zhǔn)備率、期票貼現(xiàn)率和再貼現(xiàn)率、貨幣發(fā)行量等金融大數(shù)據(jù)時(shí),能夠甄別和判斷出扭曲信息和虛假信息,從而在較高數(shù)據(jù)智能化水平上實(shí)現(xiàn)網(wǎng)絡(luò)協(xié)同效應(yīng)。事實(shí)上,如果從事大數(shù)據(jù)金融的主體能實(shí)現(xiàn)網(wǎng)絡(luò)協(xié)同效應(yīng),不僅意味著他們的數(shù)據(jù)智能化能力達(dá)到了與客戶(hù)協(xié)同的知己知彼水準(zhǔn),而且也意味著他們借助互聯(lián)網(wǎng)擴(kuò)張取得了很大的成功。但在現(xiàn)實(shí)中,不同主體的數(shù)據(jù)智能化和網(wǎng)絡(luò)協(xié)同化水平是不同的,追溯其源,是因?yàn)樗麄兙哂械募夹g(shù)條件配置不同。互聯(lián)網(wǎng)擴(kuò)張為大數(shù)據(jù)金融提供了數(shù)據(jù)智能化平臺(tái)是一回事,各決策主體能在多大程度上利用這個(gè)平臺(tái)從而達(dá)到一定的技術(shù)層級(jí)卻是另一回事。
(二)大數(shù)據(jù)金融要求一定水準(zhǔn)的技術(shù)條件配置,各金融主體達(dá)到這一水準(zhǔn)后,才有可能實(shí)現(xiàn)網(wǎng)絡(luò)協(xié)同效應(yīng)
這里所說(shuō)的技術(shù)條件配置,是指挖掘、搜集、加工和處理大數(shù)據(jù)的云平臺(tái)、云計(jì)算、機(jī)器學(xué)習(xí)等人工智能技術(shù)及其組合。為分析方便計(jì),我們把能夠搜集、整理和分類(lèi)大數(shù)據(jù),但不獨(dú)立擁有云平臺(tái)和不具有云計(jì)算能力的金融運(yùn)作者,界定為低技術(shù)條件配置者;把既能夠搜集、整理和分類(lèi)大數(shù)據(jù)也能夠加工和處理大數(shù)據(jù),并且擁有云平臺(tái)和具有云計(jì)算能力的金融運(yùn)作者,界定為中等技術(shù)條件配置者;把完全具備以上技術(shù)條件配置并且還能夠挖掘大數(shù)據(jù)的金融運(yùn)作者,界定為高技術(shù)條件配置者。顯然,這樣的劃分主要是針對(duì)未來(lái)情形而言的,這樣的劃分對(duì)大數(shù)據(jù)金融的運(yùn)行有以下推論:不同技術(shù)條件配置者由于技術(shù)層級(jí)的差異,他們對(duì)金融大數(shù)據(jù)及其構(gòu)成的加工和處理能力便存在差異,高技術(shù)條件配置者要比中低技術(shù)條件配置者能更加準(zhǔn)確地開(kāi)發(fā)、設(shè)置和運(yùn)營(yíng)金融品種,能夠在高層級(jí)數(shù)據(jù)智能化基礎(chǔ)上達(dá)到網(wǎng)絡(luò)協(xié)同化,能夠在取得滿(mǎn)意效用函數(shù)值的同時(shí)實(shí)現(xiàn)網(wǎng)絡(luò)協(xié)同效應(yīng)。
網(wǎng)絡(luò)協(xié)同效應(yīng)是以網(wǎng)絡(luò)協(xié)同化為基礎(chǔ)的。與實(shí)體經(jīng)濟(jì)中廠商之間以及廠商與消費(fèi)者之間的網(wǎng)絡(luò)協(xié)同化一樣,大數(shù)據(jù)金融中的網(wǎng)絡(luò)協(xié)同化所面臨的經(jīng)營(yíng)場(chǎng)景,也可劃分為簡(jiǎn)單和復(fù)雜兩種類(lèi)型;對(duì)于具備新科技條件配置的金融運(yùn)作者來(lái)講,要實(shí)現(xiàn)網(wǎng)絡(luò)協(xié)同效應(yīng),只是具備駕馭簡(jiǎn)單運(yùn)營(yíng)場(chǎng)景是不夠的,而是必須具有駕馭復(fù)雜運(yùn)營(yíng)場(chǎng)景的勢(shì)力。例如,一個(gè)從事多元化經(jīng)營(yíng)的金融機(jī)構(gòu)通常要比單一經(jīng)營(yíng)國(guó)債或單一經(jīng)營(yíng)股票或單一經(jīng)營(yíng)期貨的金融機(jī)構(gòu),具有應(yīng)對(duì)復(fù)雜場(chǎng)景的網(wǎng)絡(luò)協(xié)同化能力。聯(lián)系技術(shù)條件配置看問(wèn)題,由于高技術(shù)條件配置的金融機(jī)構(gòu)可以通過(guò)云平臺(tái)搜集、整合和分類(lèi)諸如投資、儲(chǔ)蓄、利率、股票、期貨、債券、資金拆借、法定準(zhǔn)備率、期票貼現(xiàn)率和再貼現(xiàn)率、貨幣發(fā)行量等的大數(shù)據(jù)構(gòu)成及其變動(dòng),他們?cè)诩庸ぁ⑻幚砗推ヅ溥@些大數(shù)據(jù)時(shí)可得到高水準(zhǔn)的云計(jì)算和機(jī)器學(xué)習(xí)等人工智能技術(shù)的支持,因此,這樣的金融機(jī)構(gòu)一定會(huì)遠(yuǎn)超低技術(shù)條件配置的金融機(jī)構(gòu)而取得網(wǎng)絡(luò)協(xié)同化,從而實(shí)現(xiàn)網(wǎng)絡(luò)協(xié)同效應(yīng)。
當(dāng)我們?cè)俅苏摷熬W(wǎng)絡(luò)協(xié)同效應(yīng)時(shí),問(wèn)題的分析畫(huà)面開(kāi)始轉(zhuǎn)向清晰。高技術(shù)條件配置的金融機(jī)構(gòu)之所以能夠在網(wǎng)絡(luò)交易平臺(tái)上對(duì)復(fù)雜金融產(chǎn)品有協(xié)同效應(yīng),是因?yàn)楦邔蛹?jí)的數(shù)據(jù)智能化給他們提供了加工、處理和匹配金融大數(shù)據(jù)的支持,對(duì)于那些受政策或制度安排變化干擾的金融產(chǎn)品,他們利用云計(jì)算、機(jī)器學(xué)習(xí)、物聯(lián)網(wǎng)、區(qū)塊鏈等人工智能技術(shù)匹配金融大數(shù)據(jù)的優(yōu)勢(shì)就顯示出來(lái)。例如,像債券、資金拆借、期票貼現(xiàn)及股市或期市等衍生金融產(chǎn)品,往往會(huì)成為高技術(shù)條件配置金融機(jī)構(gòu)的經(jīng)營(yíng)專(zhuān)利,而那些中低技術(shù)條件配置的金融機(jī)構(gòu),便很難通過(guò)匹配金融大數(shù)據(jù)將這些金融產(chǎn)品作為經(jīng)營(yíng)對(duì)象。于是,在高技術(shù)條件配置的金融機(jī)構(gòu)經(jīng)營(yíng)這類(lèi)屬性的金融產(chǎn)品的過(guò)程中,大數(shù)據(jù)金融會(huì)形成因網(wǎng)絡(luò)協(xié)同效應(yīng)而引發(fā)的進(jìn)入壁壘。大數(shù)據(jù)金融引發(fā)進(jìn)入壁壘這種現(xiàn)象,現(xiàn)階段還只是處于端倪狀態(tài),它何時(shí)會(huì)成為常態(tài)呢?這個(gè)問(wèn)題仍然可以從技術(shù)條件配置的變化得到說(shuō)明。
(三)新科技條件配置的頂級(jí)狀態(tài)是人工智能可以匹配現(xiàn)期數(shù)據(jù)和未來(lái)數(shù)據(jù),這種狀態(tài)預(yù)示著大數(shù)據(jù)金融的未來(lái)
如上所述,金融大數(shù)據(jù)主要是正在發(fā)生事件的現(xiàn)期數(shù)據(jù)與尚未發(fā)生事件的未來(lái)數(shù)據(jù)之和,這兩類(lèi)數(shù)據(jù)的共同特征是它們都具有極強(qiáng)的不確定性,都需要挖掘才能獲得。然則,挖掘大數(shù)據(jù)與搜集大數(shù)據(jù)不是一回事。大數(shù)據(jù)的搜集,是以發(fā)生了的歷史數(shù)據(jù)為對(duì)象的,它可以通過(guò)互聯(lián)網(wǎng)搜索引擎和程序的較成熟的人工智能來(lái)完成;大數(shù)據(jù)的挖掘,是以還沒(méi)有發(fā)生的未來(lái)數(shù)據(jù)為對(duì)象的,現(xiàn)有的各種人工智能技術(shù)還沒(méi)有發(fā)展到能成功地挖掘大數(shù)據(jù)的水平。大數(shù)據(jù)金融運(yùn)行中尚未發(fā)生的待挖掘數(shù)據(jù),是人類(lèi)經(jīng)濟(jì)活動(dòng)中最不確定性的數(shù)據(jù)。就人類(lèi)挖掘和匹配金融大數(shù)據(jù)的新科技條件配置而論,如果能夠挖掘和匹配還沒(méi)有發(fā)生的金融大數(shù)據(jù),應(yīng)該說(shuō)人類(lèi)新科技條件配置達(dá)到了頂級(jí)狀態(tài)。
在信息不完全的工業(yè)化時(shí)代,經(jīng)濟(jì)學(xué)從未停止對(duì)經(jīng)濟(jì)活動(dòng)的假設(shè)、判斷和預(yù)測(cè)的研究,經(jīng)濟(jì)學(xué)家從關(guān)注預(yù)測(cè)、估計(jì)和假設(shè)檢驗(yàn)的統(tǒng)計(jì)學(xué),到注重因果關(guān)系分析的計(jì)量經(jīng)濟(jì)學(xué),再到幾乎單一強(qiáng)調(diào)預(yù)測(cè)的機(jī)器學(xué)習(xí),十分清楚地體現(xiàn)了經(jīng)濟(jì)學(xué)追求數(shù)據(jù)匹配以實(shí)現(xiàn)準(zhǔn)確預(yù)測(cè)經(jīng)濟(jì)事件的思想軌跡。在大數(shù)據(jù)和互聯(lián)網(wǎng)時(shí)代,隨著機(jī)器學(xué)習(xí)方法正在逐步解決計(jì)量經(jīng)濟(jì)學(xué)因樣本小和維度低之處理數(shù)據(jù)的局限,原先計(jì)量經(jīng)濟(jì)學(xué)和機(jī)器學(xué)習(xí)之間不相容甚或相悖的地方出現(xiàn)了交集, 并開(kāi)始出現(xiàn)交集增大的融合。但是,機(jī)器學(xué)習(xí)等人工智能技術(shù)迄今的發(fā)展水準(zhǔn),充其量只能加工、處理和匹配歷史數(shù)據(jù),并不能加工、處理和匹配大數(shù)據(jù)金融亟需要解決的現(xiàn)期數(shù)據(jù)和未來(lái)數(shù)據(jù);以機(jī)器學(xué)習(xí)為代表的人工智能技術(shù)的發(fā)展空間是巨大的,作為對(duì)問(wèn)題深入研究的一種探討,如果人類(lèi)在將來(lái)能夠運(yùn)用機(jī)器學(xué)習(xí)方法解決現(xiàn)期數(shù)據(jù)和未來(lái)數(shù)據(jù)的加工、處理和匹配,那么,機(jī)器學(xué)習(xí)將有可能成為新科技頂級(jí)條件配置的標(biāo)志。
3
機(jī)器學(xué)習(xí):推動(dòng)大數(shù)據(jù)金融發(fā)展的人工智能技術(shù)分析
當(dāng)今世界的金融運(yùn)行和發(fā)展,正在朝著大數(shù)據(jù)金融的運(yùn)作方向邁進(jìn)。我們可對(duì)這個(gè)方向作出以下高度概括性的描述:金融運(yùn)行將以搜集、整合、分類(lèi)金融大數(shù)據(jù),發(fā)展到挖掘、加工、處理和匹配金融大數(shù)據(jù)。換言之,當(dāng)人們對(duì)金融大數(shù)據(jù)采取以機(jī)器學(xué)習(xí)為核心的人工智能方法進(jìn)行挖掘、加工、處理和匹配時(shí),金融運(yùn)行便開(kāi)始從金融大數(shù)據(jù)走向大數(shù)據(jù)金融。從機(jī)器學(xué)習(xí)在新科技應(yīng)用中扮演的角色考察,無(wú)論是以許多簡(jiǎn)單模型代替單一復(fù)雜模型,進(jìn)而得到大量計(jì)算機(jī)服務(wù)器支持并廣泛運(yùn)用的“數(shù)據(jù)驅(qū)動(dòng)法”,還是以計(jì)量經(jīng)濟(jì)學(xué)為底蘊(yùn)從而將人工智能作為通用技術(shù)使用的分析方法,機(jī)器學(xué)習(xí)都將成為赫然貫穿其間的主要技術(shù)方法。大數(shù)據(jù)金融給我們提供的總體畫(huà)面是:在機(jī)器學(xué)習(xí)這一典型人工智能的引領(lǐng)下,經(jīng)濟(jì)學(xué)分析方法或許要發(fā)生讓主流經(jīng)濟(jì)學(xué)家大跌眼鏡的變革。
(一)機(jī)器學(xué)習(xí)技術(shù)及其類(lèi)型不斷提升的過(guò)程,是大數(shù)據(jù)金融發(fā)展的過(guò)程,這個(gè)過(guò)程代表著金融運(yùn)行的未來(lái)趨勢(shì)
機(jī)器學(xué)習(xí)是指通過(guò)對(duì)海量數(shù)據(jù)之多維度的分析處理,甄別和剔除扭曲信息和錯(cuò)誤信息,通過(guò)搜尋真實(shí)或準(zhǔn)確信息來(lái)實(shí)現(xiàn)最大化決策的一種匹配大數(shù)據(jù)的人工智能方法。學(xué)術(shù)界根據(jù)機(jī)器學(xué)習(xí)的特征,將之分為監(jiān)督學(xué)習(xí)(Supervised Learning)、無(wú)監(jiān)督學(xué)習(xí)(Unsupervised Learning)和強(qiáng)化學(xué)習(xí)(Reinforcement Learning)三種類(lèi)型。監(jiān)督學(xué)習(xí)與無(wú)監(jiān)督學(xué)習(xí)之間的區(qū)別,在于學(xué)習(xí)過(guò)程中有沒(méi)有標(biāo)簽的數(shù)據(jù)樣本。對(duì)于大數(shù)據(jù)金融來(lái)說(shuō),由于不同金融產(chǎn)品具有不同資本屬性,具有不同的價(jià)格數(shù)據(jù),金融機(jī)構(gòu)通常會(huì)運(yùn)用具有回歸算法和分類(lèi)算法的監(jiān)督學(xué)習(xí),按照數(shù)據(jù)輸入和輸出的一般法則,通過(guò)建模對(duì)這些數(shù)據(jù)展開(kāi)機(jī)器學(xué)習(xí)。另一方面,在大數(shù)據(jù)金融的運(yùn)行中,基于任何一種金融產(chǎn)品都不明顯具有反映明確收益的特征,金融機(jī)構(gòu)也會(huì)運(yùn)用沒(méi)有數(shù)據(jù)樣本標(biāo)識(shí)的聚類(lèi)算法來(lái)進(jìn)行無(wú)監(jiān)督學(xué)習(xí),以期通過(guò)機(jī)器學(xué)習(xí)來(lái)體驗(yàn)和匹配各種不同金融產(chǎn)品的大數(shù)據(jù),進(jìn)而運(yùn)用于自己的決策。
不過(guò),針對(duì)大數(shù)據(jù)金融之?dāng)?shù)據(jù)多維度的復(fù)雜性,監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)只是金融大數(shù)據(jù)走向大數(shù)據(jù)金融中的基礎(chǔ)性機(jī)器學(xué)習(xí)方法;它們通常局限于歷史數(shù)據(jù),對(duì)現(xiàn)期數(shù)據(jù)的匹配還有相當(dāng)大的距離,至于把未來(lái)數(shù)據(jù)轉(zhuǎn)化成“算法”則是很遙遠(yuǎn)的事。目前正在廣泛運(yùn)用的強(qiáng)化學(xué)習(xí)(Reinforcement Learning),是一種在動(dòng)態(tài)環(huán)境中不斷試錯(cuò)從而努力使決策最大化的人工智能算法;強(qiáng)化學(xué)習(xí)比較適合于金融機(jī)構(gòu)對(duì)短期金融品種的經(jīng)營(yíng),能在一定程度和范圍內(nèi)匹配現(xiàn)期數(shù)據(jù),但它還是望塵莫及于未來(lái)數(shù)據(jù)。隨著大數(shù)據(jù)金融的進(jìn)一步發(fā)展,金融機(jī)構(gòu)開(kāi)始使用迄今為止最先進(jìn)最深邃的深度學(xué)習(xí)(Deep Learning)方法,機(jī)器深度學(xué)習(xí)方法之所以被廣泛運(yùn)用于大數(shù)據(jù)金融,是因?yàn)樗鼘⒁源髷?shù)據(jù)的多維度為鍥入口,通過(guò)多層次神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì),把低層級(jí)特征數(shù)據(jù)與高層級(jí)特征數(shù)據(jù)相結(jié)合,以揭示大數(shù)據(jù)的分布特征;深度學(xué)習(xí)推動(dòng)了人工智能技術(shù)的進(jìn)一步發(fā)展,但它仍然不能處理和匹配現(xiàn)期數(shù)據(jù)和未來(lái)數(shù)據(jù)。
大數(shù)據(jù)金融的未來(lái)發(fā)展趨勢(shì),是具備頂級(jí)新科技的金融機(jī)構(gòu)能夠匹配現(xiàn)期數(shù)據(jù)和未來(lái)數(shù)據(jù),這要求金融機(jī)構(gòu)以機(jī)器學(xué)習(xí)為代表的人工智能技術(shù)的快速提升。誠(chéng)然,人工智能技術(shù)的提升是計(jì)算機(jī)專(zhuān)家或大數(shù)據(jù)專(zhuān)家的事,但金融機(jī)構(gòu)需要借助頂級(jí)人工智能技術(shù)把金融大數(shù)據(jù)轉(zhuǎn)化成“算法”,這可以理解為是金融運(yùn)行未來(lái)發(fā)展的趨勢(shì)。學(xué)術(shù)界有一種隱隱約約將大數(shù)據(jù)理解為新科技靈魂的看法,這個(gè)看法比較切合于對(duì)大數(shù)據(jù)金融之未來(lái)發(fā)展趨勢(shì)的詮釋。我們關(guān)于金融大數(shù)據(jù)和大數(shù)據(jù)金融之相關(guān)性的理論論證,需要對(duì)大數(shù)據(jù)展開(kāi)基礎(chǔ)理論方面的討論。
(二)大數(shù)據(jù)思維會(huì)代替過(guò)去只依據(jù)部分?jǐn)?shù)據(jù)進(jìn)行推論的因果思維,隨著大數(shù)據(jù)金融的發(fā)展,在將來(lái)金融機(jī)構(gòu)的因果推斷中機(jī)器學(xué)習(xí)會(huì)得到越來(lái)越多的應(yīng)用
大數(shù)據(jù)思維本質(zhì)上仍然是因果思維,但較之于過(guò)去那種只依據(jù)部分?jǐn)?shù)據(jù)進(jìn)行推理的因果思維,它是建立在決策信息來(lái)源于大數(shù)據(jù)這個(gè)推論之上的,大數(shù)據(jù)思維反映了工業(yè)化時(shí)代人類(lèi)運(yùn)用有限樣本數(shù)據(jù)不能準(zhǔn)確剖析事物因果關(guān)系從而不具有總體性和相關(guān)性的缺陷;關(guān)于這個(gè)問(wèn)題,舍恩柏格曾通過(guò)對(duì)大數(shù)據(jù)分析如何提示人類(lèi)取舍信息的解說(shuō),對(duì)大數(shù)據(jù)思維是一種包含總體思維、相關(guān)思維、容錯(cuò)思維和智能思維的模式作出了論證。總的來(lái)講,金融機(jī)構(gòu)投資經(jīng)營(yíng)的效用函數(shù)會(huì)驅(qū)動(dòng)他們放棄傳統(tǒng)因果思維模式,金融大數(shù)據(jù)的極大量、多維度和完備性等特征,會(huì)要求金融機(jī)構(gòu)采取容納總體思維、相關(guān)思維、容錯(cuò)思維和智能思維的大數(shù)據(jù)思維模式。大數(shù)據(jù)金融的發(fā)展會(huì)催生出新的人工智能方法,但到目前為止,機(jī)器學(xué)習(xí)方法在金融大數(shù)據(jù)的因果推斷及其應(yīng)用中,還沒(méi)有顯示將要退出人工智能首選位置的跡象。
機(jī)器學(xué)習(xí)之于選擇行為的預(yù)測(cè),越來(lái)越顯示出機(jī)器學(xué)習(xí)在因果推斷中的極強(qiáng)應(yīng)用前景。計(jì)量經(jīng)濟(jì)學(xué)融合機(jī)器學(xué)習(xí)方法是一種學(xué)術(shù)趨向。從學(xué)科發(fā)展和大數(shù)據(jù)金融的未來(lái)發(fā)展考察,有一點(diǎn)幾乎可以肯定,那就是這種融合會(huì)產(chǎn)生一種以機(jī)器學(xué)習(xí)為主、經(jīng)濟(jì)計(jì)量為輔的格局。這可從以下兩方面說(shuō)明:1、基于利用常規(guī)傾向性得分匹配法(Propensity Score Matching)得出的估計(jì)難以在協(xié)變量眾多的前景下進(jìn)行,機(jī)器學(xué)習(xí)可以采用套索算法(LASSO)和隨機(jī)森林(Random Forest)等方法來(lái)篩選眾多協(xié)變量,以代替?zhèn)鹘y(tǒng)步驟對(duì)大數(shù)據(jù)進(jìn)行的匹配;2、機(jī)器學(xué)習(xí)重視因果推斷中的異質(zhì)性處理效應(yīng)(Heterogeneous Treatment Effect),這將在很大程度上彌補(bǔ)過(guò)去因果關(guān)系推斷只關(guān)注平均處理效應(yīng)(Average Treatment Effect)的不足。金融大數(shù)據(jù)包含眾多協(xié)變量,它在數(shù)據(jù)匹配和數(shù)據(jù)異質(zhì)性處理等方面,一定會(huì)隨大數(shù)據(jù)金融之覆蓋面的進(jìn)一步拓寬而復(fù)雜化,因而機(jī)器學(xué)習(xí)方法的應(yīng)用空間是巨大的,這是其他人工智能手段無(wú)法比擬的。
大數(shù)據(jù)金融中的機(jī)器學(xué)習(xí)應(yīng)用空間拓展的效應(yīng),突出反映在金融機(jī)構(gòu)對(duì)現(xiàn)期數(shù)據(jù)和未來(lái)數(shù)據(jù)的挖掘、加工、處理和匹配上。對(duì)于金融機(jī)構(gòu)來(lái)講,如果他們的數(shù)據(jù)智能化達(dá)到很高乃至于達(dá)到頂級(jí)水平,那便意味著機(jī)器學(xué)習(xí)將會(huì)深入應(yīng)用到各種金融產(chǎn)品及其組合的相對(duì)準(zhǔn)確的預(yù)測(cè)上,投資效用是很高的;反之,則表明金融機(jī)構(gòu)駕馭金融大數(shù)據(jù)的能力還處于較低層級(jí),意味著機(jī)器學(xué)習(xí)的應(yīng)用水平還有很大的提升空間。我們?nèi)绾螌?duì)這種情形作出一般理論概括和描述呢?很明顯,這個(gè)問(wèn)題的分析需要結(jié)合金融機(jī)構(gòu)的理性選擇行為以及大數(shù)據(jù)金融的實(shí)踐展開(kāi)。
(三)在大數(shù)據(jù)金融的實(shí)際運(yùn)行中,金融機(jī)構(gòu)的決策行為仍然是理性選擇,他們具有怎樣的數(shù)據(jù)智能化層級(jí)就會(huì)有怎樣的效用函數(shù)值
互聯(lián)網(wǎng)擴(kuò)張時(shí)代的一個(gè)基本事實(shí)是,金融機(jī)構(gòu)的選擇行為正在逐步擺脫信息約束和認(rèn)知約束。以信息約束而言,金融大數(shù)據(jù)的完備性和極大量具備了提供完備信息的基礎(chǔ),金融機(jī)構(gòu)可通過(guò)5G通訊、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、傳感器、定位系統(tǒng)、社交媒體等,去搜集、整合和分類(lèi)各種金融產(chǎn)品的大數(shù)據(jù);可通過(guò)云平臺(tái)、云計(jì)算、機(jī)器學(xué)習(xí)、物聯(lián)網(wǎng)、區(qū)塊鏈等人工智能手段,去加工和處理各種金融產(chǎn)品的大數(shù)據(jù),于是,信息約束的局面將隨金融機(jī)構(gòu)能夠從金融大數(shù)據(jù)中獲取大量信息而逐漸被打破。就認(rèn)知約束而論,金融機(jī)構(gòu)可通過(guò)云平臺(tái)、云計(jì)算、機(jī)器學(xué)習(xí)等人工智能手段,通過(guò)對(duì)金融大數(shù)據(jù)進(jìn)行多維度分析以取得正確認(rèn)知,從而使認(rèn)知形成過(guò)程由以前明顯夾帶主觀判斷的分析路徑轉(zhuǎn)變成主要依靠新科技的認(rèn)知路徑。這種轉(zhuǎn)變實(shí)際上是改變了金融機(jī)構(gòu)的理性選擇的內(nèi)容和過(guò)程,以至于悄然改變了金融機(jī)構(gòu)的認(rèn)知函數(shù)、偏好函數(shù)和效用函數(shù),值得經(jīng)濟(jì)學(xué)家深入思考和研究。
金融機(jī)構(gòu)擺脫了信息約束和認(rèn)知約束,不僅是對(duì)以新古典經(jīng)濟(jì)學(xué)為底蘊(yùn)的主流經(jīng)濟(jì)理論的期望效用函數(shù)(Neumann and Morgenstern,1947;Arrow and Debreu,1954)的否定,而且也是對(duì)以行為和心理實(shí)驗(yàn)為基礎(chǔ)的非主流經(jīng)濟(jì)理論(Kahneman and Tversky,1973,1974,1979; Simth,1994)提出了嚴(yán)重質(zhì)疑。大數(shù)據(jù)金融實(shí)踐在理性選擇理論上向我們展現(xiàn)的基本分析線索和畫(huà)面,既不是傳統(tǒng)理論在“經(jīng)濟(jì)人假設(shè)”基礎(chǔ)上通過(guò)給定條件約束和運(yùn)用嚴(yán)密數(shù)理邏輯推論所得出的何種選擇才符合理性,也不是運(yùn)用大量數(shù)學(xué)模型來(lái)解釋什么樣的選擇才是能實(shí)現(xiàn)最大化的理性。結(jié)合機(jī)器學(xué)習(xí)等人工智能手段的運(yùn)用來(lái)理解,這種畫(huà)面可以解釋為是“人與數(shù)據(jù)對(duì)話(huà)”以及“數(shù)據(jù)與數(shù)據(jù)對(duì)話(huà)”。需要說(shuō)明的是,這兩種對(duì)話(huà)形式與經(jīng)濟(jì)行為主體的新科技層級(jí)相關(guān)聯(lián)。
如上所述,依據(jù)云平臺(tái)、云計(jì)算、網(wǎng)絡(luò)協(xié)同、機(jī)器學(xué)習(xí)等人工智能技術(shù)的掌握和運(yùn)用,我們可把金融機(jī)構(gòu)劃分為掌握新科技的低級(jí)層級(jí)、中級(jí)層級(jí)和高級(jí)層級(jí)的決策主體;易言之,金融機(jī)構(gòu)運(yùn)用機(jī)器學(xué)習(xí)等技術(shù)手段加工和處理金融大數(shù)據(jù)的能力,從而取得什么樣的效用函數(shù)的能力,是由他們的新科技層級(jí)決定。在全球經(jīng)濟(jì)一體化的背景下,金融機(jī)構(gòu)面對(duì)錯(cuò)綜復(fù)雜的金融產(chǎn)品的價(jià)格波動(dòng),要實(shí)現(xiàn)效用函數(shù)最大化,必須能夠?qū)鹑诖髷?shù)據(jù)有挖掘、加工和處理的能力,這是我們反復(fù)強(qiáng)調(diào)的,但從嚴(yán)格意義或高標(biāo)準(zhǔn)要求來(lái)講,金融機(jī)構(gòu)必須具有將客戶(hù)和競(jìng)爭(zhēng)者的偏好和認(rèn)知等轉(zhuǎn)化為“算法”的能力,這便要求金融機(jī)構(gòu)在掌握和運(yùn)用機(jī)器學(xué)習(xí)方法的同時(shí),還能夠掌握和運(yùn)用諸如邏輯推理、概率推理、專(zhuān)家系統(tǒng)、語(yǔ)音識(shí)別、自然語(yǔ)言處理等人工智能技術(shù)。金融機(jī)構(gòu)只有在達(dá)到新科技的高級(jí)層級(jí)的條件配置下才能進(jìn)入這一門(mén)檻,只有在進(jìn)入新科技的頂級(jí)層級(jí)后才完全具備這種能力。金融機(jī)構(gòu)進(jìn)入新科技的頂級(jí)層級(jí)的標(biāo)志,是能夠挖掘正在發(fā)生的現(xiàn)期數(shù)據(jù)和尚未發(fā)生的未來(lái)數(shù)據(jù),因此,問(wèn)題的討論又回到了機(jī)器學(xué)習(xí)這一人工智能技術(shù)的掌握和運(yùn)用上來(lái)。
(四)從當(dāng)前人工智能處理大數(shù)據(jù)的各種技術(shù)規(guī)定考察,人類(lèi)能不能挖掘以及能在多大程度上挖掘正在發(fā)生的現(xiàn)期數(shù)據(jù)和尚未發(fā)生的未來(lái)數(shù)據(jù),在將來(lái),可能還得主要依賴(lài)于機(jī)器學(xué)習(xí)技術(shù)的提升和拓寬
大數(shù)據(jù)金融的運(yùn)行充滿(mǎn)不確定性,是問(wèn)題的一方面;大數(shù)據(jù)金融極有可能成為未來(lái)學(xué)家和人工智能專(zhuān)家推崇的“算法”,則是問(wèn)題的另一方面。從目前不同類(lèi)型的機(jī)器學(xué)習(xí)對(duì)大數(shù)據(jù)的加工和處理看,無(wú)論是監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí),還是強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí),它們主要還是對(duì)已發(fā)生事件的歷史數(shù)據(jù)的加工和處理;對(duì)于正在發(fā)生事件的現(xiàn)期數(shù)據(jù)的加工和處理,可謂是剛剛處于起步探索階段;對(duì)于尚未發(fā)生事件的未來(lái)數(shù)據(jù),可以說(shuō)基本上不具備加工和處理的能力。以金融大數(shù)據(jù)而言,金融機(jī)構(gòu)挖掘正在發(fā)生和尚未發(fā)生的數(shù)據(jù),必須具有頂級(jí)科技條件配置。具體地說(shuō),就是金融機(jī)構(gòu)要在全面掌握和運(yùn)用互聯(lián)網(wǎng)、云平臺(tái)、物聯(lián)網(wǎng)、云計(jì)算、機(jī)器學(xué)習(xí)等人工智能技術(shù)的基礎(chǔ)上,以歷史數(shù)據(jù)和已經(jīng)掌握的部分現(xiàn)期數(shù)據(jù)作為分析材料,采取可稱(chēng)之為“外推、類(lèi)比或擬合”方法來(lái)進(jìn)行預(yù)測(cè)性挖掘,至于加工和處理正在發(fā)生和尚未發(fā)生的數(shù)據(jù),也可以按照同樣的思路展開(kāi)。誠(chéng)然,由于新科技運(yùn)用還沒(méi)有走到這一步,我們現(xiàn)在不能描述這種“外推、類(lèi)比或擬合”方法,但從當(dāng)前人工智能處理大數(shù)據(jù)的各種技術(shù)規(guī)定看,最有可能先被嘗試和最有可能獲得成功的,可能仍然是機(jī)器學(xué)習(xí)方法。
金融大數(shù)據(jù)是經(jīng)濟(jì)活動(dòng)中變化最快最不確定的數(shù)據(jù),運(yùn)用機(jī)器學(xué)習(xí)方法挖掘、加工和處理這些大數(shù)據(jù),無(wú)疑會(huì)在處理歷史數(shù)據(jù)、現(xiàn)期數(shù)據(jù)和未來(lái)數(shù)據(jù)的框架內(nèi),涉及前文提及的數(shù)字化數(shù)據(jù)和非數(shù)字化數(shù)據(jù)以及行為數(shù)據(jù)流和想法數(shù)據(jù)流,顯然,這使機(jī)器學(xué)習(xí)在挖掘、加工和處理金融大數(shù)據(jù)是會(huì)產(chǎn)生一時(shí)難以逾越的困難。這些困難主要反映在當(dāng)前最先進(jìn)的人工智能理論還不能有效解決紛繁數(shù)據(jù)之間的因果關(guān)系。因此,解決這個(gè)問(wèn)題的關(guān)鍵是突破學(xué)習(xí)過(guò)程的黑箱,使因果推斷和機(jī)器學(xué)習(xí)之間的理論交叉從單向聯(lián)系變成多向聯(lián)系,讓人工智能面對(duì)紛繁復(fù)雜的大數(shù)據(jù)處理時(shí)能夠進(jìn)行反事實(shí)分析(Counterfactual Analysis)。大數(shù)據(jù)金融的運(yùn)行和發(fā)展,長(zhǎng)期存在著被新制度經(jīng)濟(jì)學(xué)重點(diǎn)描述的以交易成本為底蘊(yùn)的逆向選擇、機(jī)會(huì)主義和道德風(fēng)險(xiǎn)等現(xiàn)象,這些現(xiàn)象會(huì)以大數(shù)據(jù)形式在金融產(chǎn)品的投資經(jīng)營(yíng)中反映出來(lái),因而機(jī)器學(xué)習(xí)要通過(guò)吸納因果推斷理論的成果來(lái)提升新科技層級(jí),以實(shí)現(xiàn)對(duì)現(xiàn)期數(shù)據(jù)和未來(lái)數(shù)據(jù)的挖掘、加工和處理。
那么,機(jī)器學(xué)習(xí)的未來(lái)發(fā)展應(yīng)朝著什么樣的方向砥礪前行呢?關(guān)于這個(gè)問(wèn)題,有學(xué)者認(rèn)為機(jī)器學(xué)習(xí)要能夠解決那些真正有價(jià)值變量的選擇問(wèn)題,也有學(xué)者認(rèn)為機(jī)器學(xué)習(xí)要解決人們選擇的風(fēng)險(xiǎn)回避問(wèn)題。在筆者看來(lái),我們應(yīng)該把機(jī)器學(xué)習(xí)的使命定格在對(duì)現(xiàn)期數(shù)據(jù)和未來(lái)數(shù)據(jù)的挖掘、加工和處理上。針對(duì)大數(shù)據(jù)金融,計(jì)算機(jī)和人工智能專(zhuān)家要在各種機(jī)器學(xué)習(xí)方法充分發(fā)展的基礎(chǔ)上,深化和拓寬強(qiáng)化學(xué)習(xí)和深化學(xué)習(xí),來(lái)挖掘、加工和處理各種金融產(chǎn)品價(jià)格和數(shù)量的現(xiàn)期數(shù)據(jù)和未來(lái)數(shù)據(jù)。機(jī)器學(xué)習(xí)在這方面的成功案例,是AlphaGo和Master與世界頂級(jí)棋手的對(duì)弈,機(jī)器學(xué)習(xí)通過(guò)對(duì)大約30萬(wàn)幅圍棋譜之大數(shù)據(jù)的加工和處理,在無(wú)數(shù)臺(tái)服務(wù)器的支持下對(duì)這些棋譜進(jìn)行深度學(xué)習(xí),并通過(guò)強(qiáng)化學(xué)習(xí)挖掘出戰(zhàn)勝世界頂級(jí)棋手的未來(lái)數(shù)據(jù)。深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的融合方法極可能是機(jī)器學(xué)習(xí)的發(fā)展方向。
4
幾點(diǎn)補(bǔ)充說(shuō)明:
金融大數(shù)據(jù)是人類(lèi)經(jīng)濟(jì)活動(dòng)的一個(gè)最值得重點(diǎn)研究的領(lǐng)域。依據(jù)未來(lái)學(xué)家的觀點(diǎn),對(duì)金融大數(shù)據(jù)的分析和研究,還必須聯(lián)系人類(lèi)經(jīng)濟(jì)活動(dòng)的其他數(shù)據(jù)進(jìn)行,顯然,這個(gè)觀點(diǎn)是以人類(lèi)一切活動(dòng)和自然界一切現(xiàn)象都可以轉(zhuǎn)化成“算法”為依據(jù)的。基于現(xiàn)階段人類(lèi)匹配大數(shù)據(jù)的能力還只是處于初期發(fā)展階段,也基于大數(shù)據(jù)金融的運(yùn)行和發(fā)展具有相對(duì)獨(dú)立性,我們只是把金融大數(shù)據(jù)的挖掘、加工和處理放置在大數(shù)據(jù)金融運(yùn)行的框架內(nèi)進(jìn)行分析。這個(gè)分析框架在體現(xiàn)它們之間相互關(guān)聯(lián)的同時(shí),重點(diǎn)是揭示它們之間的作用機(jī)理。未來(lái)學(xué)家把一切都視為“算法”,是以互聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能等的融合達(dá)到頂級(jí)技術(shù)層次為前提的,當(dāng)人類(lèi)不能達(dá)到或距這個(gè)技術(shù)層次很遠(yuǎn)時(shí),我們把金融大數(shù)據(jù)從社會(huì)大數(shù)據(jù)中抽象出來(lái)展開(kāi)分析,仍然是大數(shù)據(jù)視野下直面問(wèn)題研究的一種分析。
大數(shù)據(jù)金融的運(yùn)行和發(fā)展是制度、主體和行為的綜合,其內(nèi)容極其寬泛。當(dāng)我們將之作為一種“算法”來(lái)考察,問(wèn)題的分析便聚焦于技術(shù)層面;當(dāng)我們強(qiáng)調(diào)技術(shù)發(fā)展對(duì)大數(shù)據(jù)金融的影響,問(wèn)題的探討就集中于金融機(jī)構(gòu)的選擇行為;當(dāng)我們關(guān)注金融機(jī)構(gòu)的選擇行為,問(wèn)題的進(jìn)一步研究就需要討論效用函數(shù)。這條邏輯分析鏈最顯著的特點(diǎn),是在關(guān)注新科技之于金融機(jī)構(gòu)技術(shù)條件配置的前提上,把金融機(jī)構(gòu)劃分為低中高三種類(lèi)型的技術(shù)層級(jí),并通過(guò)這種劃分來(lái)預(yù)估不同技術(shù)層級(jí)金融機(jī)構(gòu)的效用函數(shù)。本文在討論新科技對(duì)金融機(jī)構(gòu)的效用函數(shù)影響時(shí),重點(diǎn)分析了以機(jī)器學(xué)習(xí)為代表的人工智能的掌握和運(yùn)用,沒(méi)有涉及專(zhuān)家系統(tǒng)、機(jī)器人學(xué)、搜索、邏輯推理與概率推理、語(yǔ)音識(shí)別與自然語(yǔ)言處理等人工智能,這是基于金融大數(shù)據(jù)的特殊性規(guī)定其他人工智能技術(shù)只是間接適合于解釋金融大數(shù)據(jù)的考慮。我們以機(jī)器學(xué)習(xí)深化作為金融機(jī)構(gòu)技術(shù)層級(jí)提升的依據(jù),繞開(kāi)了其他人工智能技術(shù),但并不否定這些技術(shù)手段提升金融機(jī)構(gòu)技術(shù)層級(jí)的作用。
金融大數(shù)據(jù)與大數(shù)據(jù)金融在內(nèi)涵上的差異絕不是一種概念或范疇的玩味,前者是互聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能等融合的客觀實(shí)在,后者是表征了大數(shù)據(jù)時(shí)代或互聯(lián)網(wǎng)時(shí)代金融體系的運(yùn)行和發(fā)展,它代表著金融體系未來(lái)發(fā)展的方向。本文以機(jī)器學(xué)習(xí)進(jìn)步來(lái)解說(shuō)金融機(jī)構(gòu)挖掘、搜集、整合、分類(lèi)、加工和處理大數(shù)據(jù),目的是揭示大數(shù)據(jù)金融的運(yùn)行機(jī)理,并通過(guò)這一機(jī)理的揭示來(lái)展現(xiàn)未來(lái)金融世界的發(fā)展圖景。基于機(jī)器學(xué)習(xí)等人工智能發(fā)展的現(xiàn)狀,我們把新科技層級(jí)作為推論金融機(jī)構(gòu)處理和匹配大數(shù)據(jù)之能力的依據(jù),跳越了對(duì)新科技運(yùn)用過(guò)程的具體分析,客觀地講,這樣的分析程序和框架對(duì)大數(shù)據(jù)金融運(yùn)行的論證所得出的認(rèn)知,同樣適合對(duì)其他經(jīng)濟(jì)領(lǐng)域的分析。不過(guò),這種推論性分析是粗線條的,至于機(jī)器學(xué)習(xí)等人工智能技術(shù)對(duì)金融機(jī)構(gòu)處理和匹配大數(shù)據(jù)的具體過(guò)程,則需要等到新科技發(fā)展導(dǎo)致數(shù)據(jù)智能化和網(wǎng)絡(luò)協(xié)同化的全面提升,再由經(jīng)濟(jì)學(xué)家來(lái)進(jìn)行理論化和系統(tǒng)化。
現(xiàn)有的經(jīng)濟(jì)理論關(guān)于數(shù)字經(jīng)濟(jì)的分析進(jìn)而關(guān)聯(lián)于大數(shù)據(jù)匹配的研究,主要集中在通過(guò)互聯(lián)網(wǎng)擴(kuò)張對(duì)數(shù)字經(jīng)濟(jì)的概念界定、行業(yè)范圍界定、行業(yè)屬性界定以及規(guī)模測(cè)算等方面,很少有文獻(xiàn)從理論角度對(duì)數(shù)字經(jīng)濟(jì)運(yùn)行作出經(jīng)濟(jì)學(xué)解釋。其實(shí),數(shù)字經(jīng)濟(jì)的核心永遠(yuǎn)是如何挖掘、搜集、整合、加工和處理大數(shù)據(jù),永遠(yuǎn)是通過(guò)匹配大數(shù)據(jù)以獲取準(zhǔn)確信息來(lái)實(shí)現(xiàn)效用最大化。當(dāng)數(shù)字經(jīng)濟(jì)突破行業(yè)和區(qū)域范圍,它在伴隨全體廠商追求效用最大化的同時(shí),社會(huì)資源配置機(jī)制便會(huì)得到優(yōu)化。這便是本文將金融大數(shù)據(jù)與大數(shù)據(jù)金融作為研究專(zhuān)題的意義所在。