在機器人技術領域的最新進展中,智元機器人公司近期宣布推出了一項名為AgiBot Digital World的創新仿真框架,為機器人操作技能的研究與應用提供了強有力的支持。該框架不僅包含了靈活的仿真數據生成方案,還預訓練了大規模仿真數據,并建立了一套統一的模型評測標準,同時開源了海量仿真數據資源。
AgiBot Digital World專為機器人操作技能設計,集成了海量且逼真的三維資產,多樣化的專家軌跡生成機制,以及全面的模型評估工具。通過高度模擬訓練場景,并全鏈自動化生成數據,該框架能夠實現各種具身仿真服務,如精確模擬機器人訓練場景等。
智元機器人同步開源的仿真數據集AgiBot Digital World Dataset,覆蓋了家居、商超、辦公、餐飲和工業五大場景,共計180多種具體物品,9種常見材質,以及12種核心技能。這些數據資源的豐富性,為機器人操作技能的訓練提供了堅實基礎。
AgiBot Digital World的三維資產庫通過人工精細建模、三維重建技術和生成式人工智能(AIGC)等途徑構建,擁有多樣化的物體、場景和機器人模型。這些資產能夠滿足各種復雜機器人操作任務的仿真需求,為機器人提供高保真模擬訓練場景。
基于NVIDIA Isaac-Sim仿真平臺,AgiBot Digital World能夠提供高度逼真的視覺渲染和精確的物理模擬。仿真情景與真實世界之間的域差異小,感知和交互的細節真實,如光透過玻璃窗投射的光影、隨機器人動作變動的倒影等,視覺效果極為自然。
AgiBot Digital World還引入了多模態大模型,支持基于資產庫自動生成操作任務,并根據指定任務自動生成操作場景和物體布局。這一功能能夠根據實際訓練需求,靈活創建多樣化、復雜度可調的仿真任務與仿真環境,實現數據閉環。例如,在書房環境中,若機器人需要從桌面任務轉向書架上的立面操作,系統能夠一鍵召喚取書任務,并自動捕捉到環境中的書架。
在數據生成方面,AgiBot Digital World提供了多元化專家軌跡生成策略,包括真機操作數字孿生、具身智能體自動生成以及仿真遙操作。這些策略能夠生成具有多樣性和魯棒性的專家軌跡數據,增強模型在真實環境中的泛化能力。同時,數據生成引擎還支持包括多視角RGB-D圖像、觸覺信息、機器人狀態信息在內的多模態數據,為策略學習提供了豐富資源。
智元機器人此次開源的仿真數據,不僅質量高,可供端到端模型可靠訓練,還支持快速泛化,能夠應對各種環境下的挑戰。同時,數據集中包含了多個步驟的長程任務以及多技能組合的短程任務,適用于多技能訓練和多任務泛化執行。這些數據資源的靈活應用,將極大提升機器人操作的適應性和效率。