在近期的一次科技創新展示中,人形機器人的站立與行走能力再次成為公眾關注的焦點。還記得元宵晚會上撒貝寧與宇樹機器人的略顯笨拙的互動嗎?不久的將來,這樣的場景或許將成為歷史,因為上海交通大學與上海人工智能實驗室的研究團隊已經取得了突破性進展。
研究人員發布了一項名為“HoST”的強化學習框架,旨在讓人形機器人能夠迅速適應各種真實場景和地形,實現穩定且多樣化的站立動作。這一創新不僅讓機器人從零基礎開始學習站立,還確保了其動作的自然流暢與高效。
HoST框架通過結合多評判強化學習、平滑正則化以及隱式速度約束,實現了機器人站立動作的自適應學習。這意味著,無論是在虛擬環境中訓練,還是直接應用于現實世界的機器人,都能展現出出色的站立能力。內置的速度限制確保了機器人動作的平穩性,有效減少了震蕩和劇烈動作,保護了硬件的完整性。
據項目負責人介紹,HoST框架展現出了三大顯著特點:首先,多樣化的站立姿勢讓機器人在室內和室外環境中都能實現平穩站立;其次,強大的魯棒性使得機器人在面對外部干擾時,如力、有效載荷變化、柔軟障礙物以及隨機扭矩丟失等,都能保持穩定的站立狀態;最后,緊急狀態下的站立技能,如跌倒恢復、動態平衡和站立穩定性等,進一步增強了機器人的實用性和安全性。
在宇樹G1人形機器人上的測試中,HoST框架的表現令人印象深刻。無論是在戶外環境中的臺階、樹木旁,還是鋪滿石子的道路和草坪上,機器人都能迅速從躺臥狀態站起。同樣,在室內環境中,無論是沙發、地板、斜坡還是軟墊,機器人都能輕松應對各種姿勢,實現快速站立。
機器人在動態平衡能力上也展現出了卓越的表現。從斜坡上站起后,機器人能夠一邊保持平衡,一邊進行移動。即使在背負6千克大背包或受到外部干擾的情況下,機器人也能毫不費力地完成站立動作。
HoST框架的提出,不僅解決了以往方法中忽略硬件限制和依賴預設軌跡的問題,還為人形機器人的站立控制提供了新的解決方案。通過從零開始的強化學習,HoST框架確保了機器人在各種地形上的姿態自適應站立動作,實現了從仿真到現實的有效遷移。這一成果為將站立控制集成到現有人形系統中奠定了基礎,并預示著人形機器人在現實世界中的適用性將得到進一步拓展。