【ITBEAR】9月23日消息,阿里巴巴的研究團(tuán)隊(duì)近日公布了一項(xiàng)令人矚目的研究成果:他們成功開(kāi)發(fā)出一個(gè)基于大模型的VARP智能體框架,該框架能讓AI以視覺(jué)方式理解并操作游戲,且在《黑神話·悟空》中展現(xiàn)出了超越人類玩家的實(shí)力。
據(jù)ITBEAR了解,這項(xiàng)研究的核心在于VARP框架的獨(dú)特設(shè)計(jì)。它不同于傳統(tǒng)的強(qiáng)化學(xué)習(xí)方法,而是直接將游戲截圖作為輸入,通過(guò)視覺(jué)語(yǔ)言模型進(jìn)行推理,生成Python代碼形式的動(dòng)作指令來(lái)操作游戲。這種方法的創(chuàng)新之處在于,它顯著減少了所需的數(shù)據(jù)量,僅依靠1000條有效數(shù)據(jù)就實(shí)現(xiàn)了令人印象深刻的游戲操作水平。
在研究過(guò)程中,阿里巴巴的團(tuán)隊(duì)定義了12個(gè)與《黑神話·悟空》相關(guān)的任務(wù),其中75%與戰(zhàn)斗有關(guān)。他們構(gòu)建了一個(gè)包含鍵鼠操作和游戲截圖的人類操作數(shù)據(jù)集,并以此為基礎(chǔ)訓(xùn)練了VARP智能體。該智能體在90%的簡(jiǎn)單和中等水平戰(zhàn)斗場(chǎng)景中取得了勝利,甚至在面對(duì)某些精英怪時(shí),其勝率已經(jīng)超過(guò)了人類玩家。
值得一提的是,VARP框架還包含了三個(gè)庫(kù):情景庫(kù)、動(dòng)作庫(kù)和人工引導(dǎo)庫(kù)。這些庫(kù)存儲(chǔ)了智能體的自我學(xué)習(xí)和人類指導(dǎo)的內(nèi)容,使其能夠進(jìn)行高效的檢索和更新。這種設(shè)計(jì)不僅提升了AI的學(xué)習(xí)效率,還為其在面對(duì)復(fù)雜任務(wù)時(shí)提供了更多的靈活性。
盡管VARP智能體在游戲操作中取得了顯著的成果,但研究團(tuán)隊(duì)也指出了其存在的局限性。例如,由于視覺(jué)語(yǔ)言模型的推理速度限制,AI無(wú)法實(shí)時(shí)處理每一幀畫(huà)面,這可能導(dǎo)致其在某些情況下錯(cuò)過(guò)關(guān)鍵信息。此外,在沒(méi)有人類引導(dǎo)的情況下,智能體可能無(wú)法自行找到正確的游戲路線。
阿里巴巴的這項(xiàng)研究無(wú)疑為AI在游戲領(lǐng)域的應(yīng)用開(kāi)辟了新的道路。它不僅展示了AI在理解和操作復(fù)雜游戲方面的巨大潛力,還為未來(lái)的游戲開(kāi)發(fā)和AI技術(shù)研究提供了有價(jià)值的參考。
#阿里巴巴# #VARP智能體# #AI游戲操作# #黑神話悟空# #視覺(jué)語(yǔ)言模型#