將AI融入工作流程已成為眾多企業(yè)的共識(shí)。但當(dāng)大模型扎根企業(yè)時(shí),現(xiàn)實(shí)的阻力卻不容忽視:缺乏高質(zhì)量的行業(yè)數(shù)據(jù)、與業(yè)務(wù)場(chǎng)景適配不足、員工對(duì)AI心存戒備等等,這些痛點(diǎn)正考驗(yàn)著企業(yè)的決心與智慧。明略科技集團(tuán)于去年推出一站式大模型AI智能助理——小明助理Copilot,經(jīng)過(guò)內(nèi)部的試水與打磨,95%的員工已在日常工作中高頻應(yīng)用,周活達(dá)到70%以上,初步實(shí)現(xiàn)“與大模型同頻”。
近日,明略科技創(chuàng)始人、CEO吳明輝受邀蒞臨混沌學(xué)園,結(jié)合企業(yè)自身實(shí)踐與行業(yè)觀察,就大模型落地企業(yè)的方法論,展開(kāi)深度分享,以下為核心要點(diǎn)整理:
明略科技創(chuàng)始人、CEO 吳明輝
參數(shù)越大,效果越好?
在同其它企業(yè)CEO、CIO、CMO聊天時(shí),我發(fā)現(xiàn)大家對(duì)于大模型的出現(xiàn)都感到很興奮,很多公司都建立了人工智能小分隊(duì),但嘗試幾次后發(fā)現(xiàn)效果并不理想。
現(xiàn)在,OpenAI已經(jīng)把參數(shù)做得非常高,它擁有的是互聯(lián)網(wǎng)上的通識(shí)知識(shí)。如果訓(xùn)練得足夠好,它可以擁有優(yōu)秀本科畢業(yè)生同等的認(rèn)知能力。但即使擁有了這種認(rèn)知能力,就能確保大數(shù)據(jù)在企業(yè)中做好很多工作嗎?
答案是否定的。
值得注意的是,大量的模型參數(shù)并不能確保在工作中有效轉(zhuǎn)化成生產(chǎn)力。有些任務(wù),即使用很小參數(shù)的模型也能解決。
在無(wú)法判斷一個(gè)大模型效果好壞時(shí),我建議大家可以向大模型提出一個(gè)問(wèn)題進(jìn)行檢測(cè),“美國(guó)的哪一個(gè)州跟其他的州不接壤”,這個(gè)問(wèn)題的正確答案是阿拉斯加和夏威夷,它需要大數(shù)據(jù)知道美國(guó)的地理情況以及州和州之間的關(guān)系。
我們講大模型的迭代能力,就是要提高它的推理能力,而推理的過(guò)程需要信息。
現(xiàn)在,參數(shù)在不斷提高的過(guò)程中并沒(méi)有增加信息,不斷提高參數(shù)只是讓模型的推理能力變強(qiáng)大了。做個(gè)類(lèi)比,模型是f,信息是x,只有把正確的x給到強(qiáng)大的模型f,才有可能算出正確的y,才有可能輔助企業(yè)的理性決策和下一步行動(dòng),這是部分企業(yè)認(rèn)為大模型不好用的核心原因。
今天人們想將大模型應(yīng)用到公司當(dāng)中,但是大模型并不知道公司原有的生產(chǎn)資料和信息系統(tǒng)。一個(gè)好的大模型,需要人們將信息找過(guò)來(lái)。
大模型落地企業(yè)的核心:知識(shí)工程
管理大師野中郁次郎在《創(chuàng)造知識(shí)的企業(yè)》一書(shū)中提到,每個(gè)企業(yè)有暗默的知識(shí),也有顯性的知識(shí),企業(yè)最核心的就是要把這些知識(shí)管理好。
在大模型時(shí)代,這些知識(shí)不僅存在于每位員工的大腦中,存在于企業(yè)的文檔庫(kù)中,甚至存在于每次會(huì)議的錄音當(dāng)中。有一天,大語(yǔ)言模型可以直接執(zhí)行錄音里面的知識(shí)。這就如同一個(gè)優(yōu)秀的高校畢業(yè)生在你身邊當(dāng)助手,你需要做的就是每天用資料同它交互,就可以大幅提升效率。未來(lái),企業(yè)的知識(shí)管理邏輯也將發(fā)生巨大的變化。
企業(yè)迎接大模型時(shí)代的第一個(gè)命題,就是要解決知識(shí)工程問(wèn)題。
現(xiàn)代認(rèn)知心理學(xué)將知識(shí)分為兩類(lèi),一類(lèi)是陳述性知識(shí),一類(lèi)是程序性知識(shí)。例如,大象是一種動(dòng)物,這是陳述性知識(shí)。把大象放到冰箱里面分幾步,這是程序性知識(shí)。編程知識(shí)也屬于程序性知識(shí)。
當(dāng)人們問(wèn)大模型提問(wèn),“湖南和湖北的兩個(gè)省會(huì),哪個(gè)人口更多?”一些大模型往往會(huì)卡住,因?yàn)樗緵](méi)有理解這句話(huà)的意思。但如果通過(guò)操作把它的CoT(思維鏈)能力調(diào)出來(lái),大模型就有能力將答案推理出來(lái)。如同一名剛?cè)肼毜男聠T工,只要公司把任務(wù)拆得足夠細(xì),他就能做好。大模型的學(xué)習(xí)、發(fā)展和應(yīng)用的過(guò)程,同人類(lèi)從小的學(xué)習(xí)發(fā)展過(guò)程非常相像,兩者是完全可以類(lèi)比的。
Prompt(提示詞工程)和CoT(思維鏈)技術(shù)是大模型能力發(fā)現(xiàn)的重要組成部分,其革命性意義可以媲美人類(lèi)文字和印刷術(shù)的發(fā)明。CoT的重點(diǎn)是把程序?qū)懬宄?。在小明助理Copilot中,只要簡(jiǎn)要地表明你的目標(biāo),它就可以將Prompt模板寫(xiě)出來(lái),非常方便。
Prompt和CoT的出現(xiàn),實(shí)現(xiàn)了大模型和大模型之間互相學(xué)習(xí)的設(shè)想,只要讀懂了你的指令,大模型就可以將這些指令執(zhí)行得非常好,并且下一個(gè)人可以立足于訓(xùn)練成熟的AI繼續(xù)發(fā)展,每個(gè)人都站在巨人的肩膀之上。
除此之外,還有更高級(jí)的用法,比如Agent。Agent的本質(zhì)就是模型和信息,好的Agent可以把大語(yǔ)言模型和Memory、Tools、Planning的能力有機(jī)地組織起來(lái)。
連接大模型與知識(shí)的理想方式
在整理數(shù)據(jù)和知識(shí)時(shí),企業(yè)不僅要考慮如何規(guī)劃數(shù)據(jù)、知識(shí),同時(shí)也要考慮權(quán)限問(wèn)題。我的建議是按照兩個(gè)維度四象限的邏輯進(jìn)行分析,包括數(shù)據(jù)的公開(kāi)程度、執(zhí)行任務(wù)的推理復(fù)雜性等。對(duì)于低密集又需要高難度推理能力的,可以直接使用在線(xiàn)大模型;對(duì)于高密集且推理能力不高的,例如財(cái)務(wù)信息、HR信息、研發(fā)產(chǎn)品信息等,可以部署一個(gè)私有化模型。企業(yè)要做的,就是把對(duì)應(yīng)的密集問(wèn)題想明白、分好級(jí)。
在企業(yè)中,真正想把信息系統(tǒng)整理好,并且和大模型連接起來(lái),需要解決諸多難題。最簡(jiǎn)單的方法就是使用Copilot。
Copilot是什么?pilot的意思是駕駛員,Co-pilot的意思是聯(lián)合駕駛或副駕駛。舉個(gè)例子,人們最理想的狀態(tài)是讓汽車(chē)變成無(wú)人駕駛,但成本和代價(jià)很大。在Copilot模式中,主駕駛還是人,副駕駛的職能是協(xié)助人做一些決策和操作,甚至完成主駕托管的任務(wù),但最后的決定權(quán)仍在人類(lèi)手中。明略開(kāi)發(fā)小明助理Copilot的意義就在于此。
通過(guò)小明助理Copilot,今年公司員工已經(jīng)做到了廣泛使用大模型,平均每個(gè)員工一天使用10次以上,大家不僅可以用GPT解決工作生活中遇到的一些問(wèn)題,還可以應(yīng)用到自己的生產(chǎn)環(huán)境中,用于提升生產(chǎn)效率,公司團(tuán)隊(duì)絕大多數(shù)的同學(xué)都已經(jīng)拿到了大模型的船票。
如同《異類(lèi)》一書(shū)中提出的1萬(wàn)小時(shí)定律,只要比別人多花一些時(shí)間做某件事情,未來(lái)就有機(jī)會(huì)享受到某個(gè)領(lǐng)域的競(jìng)爭(zhēng)紅利。每一項(xiàng)新技術(shù)的出現(xiàn)都是有紅利的,最終大家也一定都會(huì)使用到,但更早接觸的人會(huì)比別人多一些機(jī)會(huì)和時(shí)間。
彭博社是全球最大的金融信息服務(wù)商,明略科技旗下的秒針系統(tǒng)是中國(guó)最大的廣告領(lǐng)域信息服務(wù)商,兩者有著一定的共通之處。彭博社的創(chuàng)始人邁克爾·布隆伯格創(chuàng)業(yè)初期,立志將終端機(jī)賣(mài)給每一個(gè)金融機(jī)構(gòu),希望幫助大家快速獲取互聯(lián)網(wǎng)上的金融信息,這也成就了彭博社今天在全球金融信息服務(wù)領(lǐng)域的霸主地位。很多公司都在擁抱新技術(shù),它們可能是將某一項(xiàng)新技術(shù)用到了極致,或者是第一個(gè)使用新技術(shù)從而顛覆了上一代產(chǎn)品,最終走出了新的曲線(xiàn)。