在2025年的科技舞臺上,一項(xiàng)由中國人民大學(xué)高瓴人工智能學(xué)院竇志成教授團(tuán)隊(duì)攜手百川智能科技公司共同推出的創(chuàng)新研究引起了廣泛關(guān)注。該研究針對企業(yè)級深度搜索的需求,提出了一種全新的解決方案,并已在權(quán)威平臺上發(fā)布,感興趣的研究者和從業(yè)者可通過訪問(論文代碼庫鏈接已移除)獲取詳盡的論文資料。
現(xiàn)代職場中,面對復(fù)雜多變的問題,工作者往往需要穿梭于公司內(nèi)部的豐富資源與互聯(lián)網(wǎng)的廣闊信息之間。例如,金融分析師在評估企業(yè)投資風(fēng)險時,既要參考公司內(nèi)部的深度數(shù)據(jù)庫,又要瀏覽網(wǎng)上的最新報道和市場分析。然而,現(xiàn)有的AI搜索工具如同局限在單一圖書館的管理員,難以同時駕馭這兩種信息源,給出全面而精準(zhǔn)的答案。
針對這一痛點(diǎn),中國人民大學(xué)的研究團(tuán)隊(duì)攜手合作伙伴,開發(fā)了一款名為HierSearch的系統(tǒng)。該系統(tǒng)模擬了一個專業(yè)的信息收集團(tuán)隊(duì),由三位“成員”構(gòu)成:一位專注于公司內(nèi)部資料的本地搜索專家,一位精通網(wǎng)絡(luò)搜索的網(wǎng)絡(luò)搜索專家,以及一位負(fù)責(zé)整體調(diào)度的規(guī)劃者。當(dāng)用戶提出需求時,規(guī)劃者會根據(jù)問題的特性,靈活調(diào)配專家資源,或是讓兩位專家協(xié)同作戰(zhàn),最終匯總信息,給出最佳解答。
HierSearch的核心優(yōu)勢在于其分工合作的設(shè)計理念。傳統(tǒng)搜索系統(tǒng)往往試圖集所有功能于一身,結(jié)果卻往往顧此失彼,特別是在網(wǎng)絡(luò)搜索這一復(fù)雜任務(wù)上,表現(xiàn)尤為欠佳。這好比學(xué)生在考試中先做簡單題,而將難題留到最后,導(dǎo)致整體成績不佳。相比之下,HierSearch的分層架構(gòu)讓每個專家都能在自己的領(lǐng)域內(nèi)發(fā)揮最大效能。
為了訓(xùn)練這一高效的AI團(tuán)隊(duì),研究人員采用了分層強(qiáng)化學(xué)習(xí)的方法。這一過程類似于培養(yǎng)一個專業(yè)團(tuán)隊(duì):先分別訓(xùn)練兩位搜索專家,讓他們各自掌握內(nèi)部資料檢索和網(wǎng)絡(luò)信息搜集的技能。隨后,再訓(xùn)練規(guī)劃者,使其學(xué)會如何高效調(diào)度兩位專家,以及整合他們的搜索結(jié)果。這種分而治之的訓(xùn)練策略,顯著提高了系統(tǒng)的整體性能。
然而,在實(shí)際應(yīng)用中,專家們搜集的信息往往夾雜著大量無關(guān)甚至錯誤的內(nèi)容。為了應(yīng)對這一挑戰(zhàn),研究人員設(shè)計了一個知識精煉器,作為團(tuán)隊(duì)的信息篩選員。這一組件會對兩位專家?guī)Щ氐男畔⑦M(jìn)行細(xì)致審查,首先篩選出直接支持問題解答的關(guān)鍵證據(jù),再從全局角度進(jìn)行二次篩選,確保最終提交給規(guī)劃者的信息都是最有價值的。
HierSearch的工作流程宛如一個高效的咨詢團(tuán)隊(duì)處理客戶委托。項(xiàng)目經(jīng)理(即規(guī)劃者)首先分析問題性質(zhì),然后決定是由內(nèi)部資料專家單獨(dú)處理,還是由網(wǎng)絡(luò)調(diào)研專家單獨(dú)行動,或是讓兩位專家協(xié)同工作。專家們各自利用專業(yè)工具和資源進(jìn)行搜索后,信息篩選員會對他們的發(fā)現(xiàn)進(jìn)行質(zhì)量控制,剔除無關(guān)和錯誤信息。最終,項(xiàng)目經(jīng)理綜合所有高質(zhì)量信息,為客戶提供滿意的答案。
研究團(tuán)隊(duì)在多個領(lǐng)域的數(shù)據(jù)集上對HierSearch進(jìn)行了測試,包括通用領(lǐng)域、金融領(lǐng)域和醫(yī)學(xué)領(lǐng)域。結(jié)果顯示,這一分層系統(tǒng)在所有測試中均顯著優(yōu)于傳統(tǒng)方法。更重要的是,HierSearch不僅答案質(zhì)量更高,搜索效率也更為出色,有效避免了傳統(tǒng)系統(tǒng)常見的無效搜索問題。
尤為分層訓(xùn)練方法相較于傳統(tǒng)的扁平化訓(xùn)練方法展現(xiàn)出了顯著的優(yōu)越性。傳統(tǒng)方法要求系統(tǒng)同時掌握所有搜索工具,結(jié)果往往學(xué)習(xí)效率低下,且傾向于使用容易出結(jié)果的工具。而分層方法讓每個專家都能在自己的領(lǐng)域內(nèi)深耕細(xì)作,再通過規(guī)劃者進(jìn)行協(xié)調(diào),實(shí)現(xiàn)了整體效能的顯著提升。
在實(shí)際應(yīng)用效果的分析中,研究團(tuán)隊(duì)發(fā)現(xiàn)HierSearch在多知識源環(huán)境中的搜索成功率和推理成功率均遠(yuǎn)高于現(xiàn)有方法。該系統(tǒng)能夠充分利用本地知識源的專業(yè)性和針對性,以及網(wǎng)絡(luò)知識源的全面性和及時性,在不同類型的問題上都能提供高質(zhì)量的答案。
從效率角度來看,盡管HierSearch采用了三個智能體的分層架構(gòu),但其計算成本并未顯著增加。相比那些需要并行搜索多個知識源的傳統(tǒng)方法,HierSearch通過智能的任務(wù)分配和信息篩選,實(shí)際上減少了不必要的搜索操作,特別是成本較高的網(wǎng)絡(luò)搜索。
這項(xiàng)研究不僅是一項(xiàng)技術(shù)創(chuàng)新,更為企業(yè)級AI應(yīng)用提供了一個切實(shí)可行的解決方案。在現(xiàn)實(shí)的企業(yè)環(huán)境中,員工確實(shí)需要同時利用內(nèi)部知識和外部信息來解決復(fù)雜問題。HierSearch的出現(xiàn),為這一需求提供了一個高效的技術(shù)路徑,讓AI助手能夠像人類專家團(tuán)隊(duì)一樣協(xié)同工作,為用戶提供更全面、更準(zhǔn)確的信息支持。
Q&A環(huán)節(jié):
Q1:HierSearch系統(tǒng)的工作原理是什么?它與普通搜索工具有何不同?
A:HierSearch由一個本地搜索專家、一個網(wǎng)絡(luò)搜索專家和一個規(guī)劃者組成。當(dāng)用戶提出需求時,規(guī)劃者會根據(jù)問題性質(zhì)決定由哪位專家進(jìn)行搜索,或讓兩位專家協(xié)同工作。系統(tǒng)還配備了一個信息篩選員來過濾無關(guān)和錯誤信息。這種分工協(xié)作的方式使HierSearch比普通搜索工具更全面、更準(zhǔn)確。
Q2:分層強(qiáng)化學(xué)習(xí)訓(xùn)練方法相比傳統(tǒng)方法有何優(yōu)勢?
A:分層訓(xùn)練讓每個專家都能在自己的領(lǐng)域內(nèi)精通技能,再通過規(guī)劃者進(jìn)行協(xié)調(diào),就像音樂家各自練好自己的樂器,再通過指揮家協(xié)調(diào)整個樂團(tuán)。研究發(fā)現(xiàn),傳統(tǒng)方法往往偏向于簡單任務(wù),而在網(wǎng)絡(luò)搜索等困難任務(wù)上表現(xiàn)不佳。分層方法則顯著提升了整體效果。
Q3:哪些企業(yè)適合使用HierSearch系統(tǒng)?其效果如何?
A:HierSearch特別適合需要同時利用內(nèi)部資料和外部信息的企業(yè),如金融、醫(yī)療、咨詢等行業(yè)。測試顯示,該系統(tǒng)在多個領(lǐng)域的數(shù)據(jù)集上都顯著優(yōu)于現(xiàn)有方法,不僅答案質(zhì)量更高,搜索效率也更好,能有效減少無效搜索,降低人工成本。