智東西
編譯 | Glu
編輯 | 李水青
智東西6月13日消息,當(dāng)?shù)貢r間6月7日,科技巨頭谷歌公司對其AI聊天機器人Bard進行了更新,提升了機器人邏輯與推理能力,并增加了表格的導(dǎo)出形式。
Bard是谷歌公司為了對抗ChatGPT和BingChat,在今年3月21日正式推出的一款聊天機器人。此次更新是谷歌繼5月新增Bard圖片回復(fù)功能后的又一次功能迭代,主要針對Bard的數(shù)學(xué)計算能力,預(yù)計能將Bard解決數(shù)學(xué)問題的能力提高30%。
一、結(jié)果的生成:不只靠預(yù)測,加入計算力
Bard這次的具體更新內(nèi)容包括兩個方面:
1、提升在數(shù)學(xué)計算、編碼問題和字符串操作方面的能力;
2、提供了一個“到谷歌表格”的新導(dǎo)出選項。有了這個新功能,用戶可以將Bard在其回答中創(chuàng)建的表格直接導(dǎo)出到表格中。
在第一項更新中,Bard使用了一種名為“隱式代碼執(zhí)行(implicit code execution)”的新技術(shù),它可以讓Bard編寫和執(zhí)行自己的代碼。最新版本的Bard識別能根據(jù)邏輯代碼的提示,在后臺編寫代碼、對其進行測試,并使用結(jié)果來生成更準(zhǔn)確的回答。
這大大提高了Bard的推理和數(shù)學(xué)能力,使其有能力解決高級推理和邏輯性較強的復(fù)雜問題。如:
- 15683615的質(zhì)因數(shù)是什么?
- 計算某人儲蓄的增長率
- 倒寫單詞“Lollipop”
▲Bard對倒寫單詞“Lollipop”的回復(fù)
Bard之前所使用的LLM(大語言模型)像是一個預(yù)測引擎。LLM根據(jù)提示,來預(yù)測可能進一步出現(xiàn)的詞匯,進而生產(chǎn)回復(fù),整個流程并不涉及精細(xì)的邏輯推理與計算。因此,他們有能力解決語言類、創(chuàng)造性任務(wù),但卻無法準(zhǔn)確回答推理、數(shù)學(xué)等領(lǐng)域的問題。
二、結(jié)合大模型與傳統(tǒng)代碼,準(zhǔn)確度提高30%
這項技術(shù)的靈感來源是二分法,特別是丹尼爾·卡尼曼(Daniel Kahneman)的雙系統(tǒng)思維模型,他認(rèn)為人的大腦存在兩個系統(tǒng),并稱之為系統(tǒng)1和系統(tǒng)2:
- 系統(tǒng)1是無意識思考,是快速的、直觀的、毫不費力的,如一個樂手在演出現(xiàn)場即興演奏,使用的就是系統(tǒng)1思維;
- 系統(tǒng)2則需要耗費精力、保持專注,是緩慢的、審慎的,如人們運用數(shù)學(xué)運算、學(xué)習(xí)專業(yè)樂器演奏時,使用的是系統(tǒng)2思維。
以此類比:
- LLM是在系統(tǒng)1思維下運作的——沒有經(jīng)過深度思考,快速產(chǎn)生文本;
- 傳統(tǒng)代碼計算方法則與系統(tǒng)2類似——公式化、不靈活,但能產(chǎn)生正確的結(jié)果。
以做一道數(shù)學(xué)題為例,如果只使用系統(tǒng)1,那根本不需要解題方法,直接把想到的答案寫出來就行了;但是加上系統(tǒng)2后,便可以運用加減乘除等數(shù)學(xué)方法去解題。
本次更新中,谷歌結(jié)合了LLM(系統(tǒng)1)和傳統(tǒng)代碼(系統(tǒng)2)的能力,來幫助提高Bard反應(yīng)的準(zhǔn)確性。谷歌稱,在他們的內(nèi)測數(shù)據(jù)集中,Bard解決計算類問題的準(zhǔn)確性提高了約30%。
即使這樣,Bard也無法保證回應(yīng)的絕對準(zhǔn)確。Bard不會生成有助于提示響應(yīng)的代碼,它生成的代碼可能是錯誤的,它也無法保證一定將執(zhí)行的代碼包括在其響應(yīng)中。
結(jié)語:各大廠商關(guān)注機器人邏輯性,AIGC準(zhǔn)確性將繼續(xù)提高
6月1日,OpenAI宣布ChatGPT數(shù)學(xué)解題能力將大幅提升,現(xiàn)在,谷歌也宣布了Bard的數(shù)學(xué)計算能力提高了30%。
這向我們釋放了強烈的訊號,即AIGC聊天機器人行業(yè)陸續(xù)在關(guān)注著AIGC解決復(fù)雜問題的能力、生成內(nèi)容的準(zhǔn)確性,并不斷在以各種方式提升AIGC內(nèi)容的結(jié)構(gòu)化、邏輯性。未來,我們將享受到能力更強大、結(jié)果更準(zhǔn)確的AI服務(wù)。
來源:google官網(wǎng)