日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長提供免費收錄網(wǎng)站服務(wù),提交前請做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:52011
  • 待審:79
  • 小程序:12
  • 文章:1184964
  • 會員:801

與OpenAI分道揚鑣后,F(xiàn)igure多次預(yù)告的AI新成果,在2月20日晚終于揭曉了答案。Figure發(fā)布通用人形機器人控制的視覺-語言-動作(VLA)端到端具身模型Helix。實現(xiàn)了從視覺輸入和自然語言指令到機器人動作的直接映射,克服了傳統(tǒng)方法中需要大量任務(wù)特定訓(xùn)練的限制。其高效訓(xùn)練、強大泛化能力和多機器人協(xié)作功能,使其在人形機器人領(lǐng)域具有顯著優(yōu)勢和廣闊的應(yīng)用前景。

從全球范圍來看,無論是特斯拉、PhysicalIntelligence(PI),還是Figure都無一例外采用了端到端的大模型,由此看來,端到端具身大模型是實現(xiàn)具身智能體的重要路徑。各路科技媒體紛紛報道這一世界級新成果。

英雄所見略同?

但有趣的是,機器人大講堂經(jīng)過深入研究發(fā)現(xiàn),F(xiàn)igure Helix的這一最新模型架構(gòu)卻與清華姚班團隊在2024年6月發(fā)表在CoRL2024的一篇論文中的端到端具身大模型HiRT模型架構(gòu)高度相似。HiRT還同期應(yīng)用在了清華系具身智能企業(yè)星動紀元自研端到端原生機器人大模型ERA-42上,因此星動也是國內(nèi)第一個能夠做到One policy for multipletasks,實現(xiàn)端到端原生機器人大模型落地真機的公司。

Figure Helix與清華姚班團隊

2024年6月發(fā)布在CoRL2024的端到端具身大模型HiRT架構(gòu)高度相似

HiRT應(yīng)用在清華系具身智能企業(yè)星動紀元自研端到端原生機器人大模型ERA-42

HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers于2024年6月發(fā)表在CoRL2024

論文傳送門:https://arxiv.org/pdf/2410.05273

Figure Helix的端到端機器人大模型架構(gòu)

技術(shù)架構(gòu)解讀

從論文中可以看到Figure Helix和ERA-42在模型框架結(jié)構(gòu)上高度相似,都采用相同的層次化系統(tǒng)結(jié)構(gòu),使用latent來連接上層視覺語言模型和下層控制網(wǎng)絡(luò),完全擁有相同的高頻控制特性、泛化能力、端到端架構(gòu)。

具體來看,Helix和ERA-42都采用了層次化設(shè)計。

Helix:采用系統(tǒng)1(S1)和系統(tǒng)2(S2)的雙系統(tǒng)架構(gòu)。S2是一個擁有70億參數(shù)的視覺-語言模型(VLM),處理頻率為7-9Hz,負責(zé)高級理解;S1是一個擁有8000萬參數(shù)的視覺-運動控制策略,處理頻率為200Hz,負責(zé)實時動作控制。

ERA-42:采用高層次規(guī)劃和低層次控制的雙系統(tǒng)架構(gòu)。高層次規(guī)劃負責(zé)理解任務(wù)和生成動作序列,低層次控制負責(zé)實時執(zhí)行動作。高層使用70億參數(shù)的Instructblip 視覺語言模型,低層使用4000萬參數(shù)的transformer結(jié)構(gòu),兩種之間使用latent變量進行通信連接。

其次,兩者都采用端到端訓(xùn)練。

Helix:Helix的訓(xùn)練是完全端到端的,從原始像素和自然語言指令映射到連續(xù)動作輸出,使用標準回歸損失進行訓(xùn)練。

ERA-42:ERA-42也支持端到端訓(xùn)練,能夠直接從輸入數(shù)據(jù)到輸出動作進行學(xué)習(xí),無需復(fù)雜的中間表示。


第三,兩者都具備強大泛化能力。

Helix:Helix具有強大的泛化能力,能夠處理數(shù)千種形狀、大小和材質(zhì)各異的物品,并且可以在零樣本情況下泛化到新測試對象上。

ERA-42:ERA-42通過層次化的Transformer模型,能夠更好地處理復(fù)雜的機器人控制任務(wù),并且在不同的環(huán)境和任務(wù)中表現(xiàn)出良好的泛化能力。

第四,兩者都可以在機器人上實現(xiàn)實時控制。

Helix:Helix的系統(tǒng)1(S1)能夠以200Hz的頻率輸出精確的機器人動作,實現(xiàn)高精度的動作協(xié)調(diào)。

ERA-42:ERA-42通過層次化的Transformer模型,能夠?qū)崿F(xiàn)對機器人動作的實時控制,確保機器人在復(fù)雜環(huán)境中快速響應(yīng)。

第五,兩者都用單一神經(jīng)網(wǎng)絡(luò)。

Helix:Helix使用單一的一組神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)所有行為,無需進行任何針對特定任務(wù)的微調(diào)。

ERA-42:ERA-42通過層次化的Transformer模型,能夠在一個統(tǒng)一的框架下處理多種機器人控制任務(wù),無需為每個任務(wù)單獨訓(xùn)練模型。

路線的分化與創(chuàng)新

后期,星動紀元還將世界模型融入原生機器人大模型ERA-42中

Video Prediction Policy:A Generalist Robot Policy with Predictive Visual Representations 于2024年12月發(fā)表在arXiv

論文傳送門:https://arxiv.org/pdf/2412.14803

后期,星動紀元采取了一條不同的訓(xùn)練道路,將世界模型融入,使ERA-42不僅具備行動能力,還具備了對物理世界的理解能力,能夠?qū)ξ磥硇袆榆壽E進行預(yù)測,有效提升了機器人執(zhí)行任務(wù)的高效性、準確性和在執(zhí)行長時序任務(wù)時的抗干擾性,使人形機器人商業(yè)化應(yīng)用潛力更進一步。

現(xiàn)實執(zhí)行任務(wù)行動軌跡和ERA-42預(yù)測執(zhí)行任務(wù)行動軌跡對比圖,

體現(xiàn)了融入世界模型后ERA-42不僅能夠?qū)ξ磥硇袆榆壽E進行預(yù)測,且預(yù)測行動軌跡和現(xiàn)實行動軌跡幾乎一致。

此外,強化學(xué)習(xí)在模型訓(xùn)練中的應(yīng)用提升了模型的推理能力和泛化能力。它也為未來人工智能在具身智能體領(lǐng)域的研究和應(yīng)用提供了新的思路和方法。

例如,DeepSeek通過其GRPO(基于群組采樣的高效大語言模型強化學(xué)習(xí)訓(xùn)練方法)實現(xiàn)了更高效和穩(wěn)定的訓(xùn)練過程。此外,強化學(xué)習(xí)還被證明能夠激勵模型自主發(fā)展出復(fù)雜的行為和解決問題的策略,例如DeepSeek-R1-Zero在訓(xùn)練過程中展現(xiàn)出的“頓悟時刻”,進一步證明了強化學(xué)習(xí)在解鎖新智能水平方面的潛力。這些成果表明,強化學(xué)習(xí)不僅是提升模型性能的關(guān)鍵技術(shù),更是未來人工智能發(fā)展的必然趨勢。

因此,星動后續(xù)模型訓(xùn)練也采用了強化學(xué)習(xí)技術(shù),通過獎勵機制引導(dǎo)模型學(xué)習(xí)最優(yōu)的動作策略。這些方法使得模型能夠在復(fù)雜的環(huán)境中自主學(xué)習(xí)和優(yōu)化,進一步提升訓(xùn)練效率、降低訓(xùn)練成本和提升了模型的泛化能力。(星動紀元發(fā)表相關(guān)論文:Improving Vision-Language-Action Model with Online Reinforcement Learning 在ICRA 2025)

論文傳送門:https://arxiv.org/pdf/2501.16664

構(gòu)建通用具身智能體需要軟硬件協(xié)同迭代,就像人的“大腦”和“身體”需要同步成長一樣,這也是星動紀元與Figure技術(shù)思路相一致的地方。據(jù)相關(guān)報道顯示,ERA-42協(xié)同星動紀元自研全直驅(qū)、12個全主動自由度五指靈巧手星動XHAND1以及高性能通用人形機器人星動STAR1能夠能夠執(zhí)行靈巧高精度任務(wù)。目前星動XHAND1已學(xué)會了使用不同工具完成100多種復(fù)雜靈巧操作精細化任務(wù),并且持續(xù)在同一個模型下學(xué)習(xí)新的技能。

基于端到端原生機器人大模型以及為AI設(shè)計的硬件平臺,國內(nèi)企業(yè)在推動原生通用具身智能體產(chǎn)業(yè)落地方面已具備一定優(yōu)勢。隨著技術(shù)的不斷進步與完善,有望在未來的全球市場競爭中占據(jù)有利地位,并加速實現(xiàn)機器人的廣泛應(yīng)用。

分享到:
標簽:清華 撞車 路線 智能 發(fā)布
用戶無頭像

網(wǎng)友整理

注冊時間:

網(wǎng)站:5 個   小程序:0 個  文章:12 篇

  • 52011

    網(wǎng)站

  • 12

    小程序

  • 1184964

    文章

  • 801

    會員

趕快注冊賬號,推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨大挑戰(zhàn)2018-06-03

數(shù)獨一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學(xué)四六

運動步數(shù)有氧達人2018-06-03

記錄運動步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績評定2018-06-03

通用課目體育訓(xùn)練成績評定