【ITBEAR科技資訊】6月26日消息,谷歌旗下的DeepMind公司近日宣布成功研發(fā)出一種名為RoboCat的人工智能模型,該模型具備多任務解決和適應的能力,并能夠通過不同的真實世界機器人完成任務。這一突破性進展為機器人技術(shù)領域帶來了新的可能性。
RoboCat的靈感來自DeepMind的另一款AI模型Gato,后者具備文本、圖像和事件分析與處理的能力。為了訓練RoboCat,研究人員采集了模擬和真實機器人的圖像和動作數(shù)據(jù),其中包括來自虛擬環(huán)境中其他機器人控制模型、人類控制機器人以及RoboCat早期版本的數(shù)據(jù)。
據(jù)ITBEAR科技資訊了解,RoboCat的訓練過程包括以下幾個步驟:首先,研究人員利用人類控制的機械臂在模擬或真實環(huán)境中進行每個任務或機器人的100到1000次演示,例如拾取齒輪或堆疊積木等。隨后,他們對RoboCat進行微調(diào),針對每個任務創(chuàng)建專門的"衍生"模型,并進行平均約1萬次的訓練。通過結(jié)合衍生模型生成的數(shù)據(jù)和演示數(shù)據(jù),研究人員不斷擴大RoboCat的訓練數(shù)據(jù)集,并訓練出新的RoboCat版本。
最終,RoboCat在模擬和真實世界中完成了總共253個任務的訓練,并在這些任務的141個變體上進行了測試。DeepMind表示,在觀察了1000次人類控制的演示后,RoboCat學會了操作不同類型的機械臂。盡管RoboCat已經(jīng)在四種具有兩爪臂的機器人上進行了訓練,但該模型也能夠適應一種更復雜的機械臂,該機械臂具備三指夾具和更多的可控輸入。
不過,RoboCat在DeepMind的測試中在不同任務上的成功率存在較大差異,最低成功率為13%,最高可達99%。這些結(jié)果是基于1000次演示的訓練數(shù)據(jù)得出的,如果演示次數(shù)減半,成功率也會相應降低。但在某些情況下,DeepMind聲稱RoboCat只需觀察100次演示即可學習新任務。DeepMind的研究科學家李亞歷克斯表示,RoboCat有望進一步降
低學習新任務的難度。他表示,只要提供一定數(shù)量的新任務演示,RoboCat就能夠進行微調(diào),并自動生成更多數(shù)據(jù)以進一步提升性能。研究團隊的未來目標是減少RoboCat學習新任務所需的演示次數(shù),使之少于10次,以進一步提高效率和適應性。這一研究成果對于推動機器人技術(shù)的發(fā)展具有重要意義,為機器人在各個領域的應用打開了更廣闊的前景。