在智能駕駛領(lǐng)域迎來(lái)創(chuàng)新突破之際,卓馭AI的首席執(zhí)行官陳曉智于NVIDIA GTC 2025大會(huì)上,向業(yè)界詳細(xì)介紹了卓馭在端到端智能駕駛技術(shù)上的最新研究成果。他發(fā)表的主題演講《探索未來(lái)駕駛:基于端到端世界模型的生成式智駕新體驗(yàn)》,不僅揭示了卓馭的技術(shù)藍(lán)圖,還首次公開(kāi)了名為GenDrive的全新智能駕駛方案。
陳曉智強(qiáng)調(diào),理想的智能駕駛系統(tǒng)不僅要具備高度擬人化的駕駛表現(xiàn),更要能夠貼合每一位用戶的個(gè)性化需求。為此,卓馭開(kāi)創(chuàng)性地提出了“生成式智駕”理念,并將其具象化為GenDrive方案。這一方案超越了傳統(tǒng)智能駕駛的體驗(yàn)范疇,將擬人化與個(gè)性化完美融合。
傳統(tǒng)端到端架構(gòu)往往局限于基于預(yù)測(cè)的單一動(dòng)作路徑,即根據(jù)傳感器輸入直接預(yù)測(cè)下一步動(dòng)作。而卓馭的GenDrive則采用了更為先進(jìn)的生成式技術(shù),通過(guò)構(gòu)建世界模型,能夠預(yù)測(cè)并生成未來(lái)多種可能的駕駛場(chǎng)景,即所謂的“平行宇宙”。系統(tǒng)再結(jié)合用戶的駕駛偏好、實(shí)時(shí)環(huán)境信息等因素,從中選擇最優(yōu)的行駛軌跡。
卓馭的端到端世界模型架構(gòu)以強(qiáng)大的硬件平臺(tái)為基礎(chǔ),支持包括英偉達(dá)DRIVE Orin / Thor SoC在內(nèi)的多種計(jì)算平臺(tái),并能適配不同類型的傳感器配置。在模型輸入端,卓馭利用Vision Encoder和多種Tokenizer對(duì)傳感器數(shù)據(jù)、導(dǎo)航信息及歷史軌跡進(jìn)行編碼,同時(shí)還將駕駛風(fēng)格和用戶語(yǔ)音指令融入模型之中。
模型的輸出則涵蓋了對(duì)周圍環(huán)境的語(yǔ)義和幾何理解,以及對(duì)未來(lái)多種可能性的預(yù)測(cè)。最終的駕駛軌跡是在綜合考量用戶風(fēng)格偏好、語(yǔ)音指令后得出的最優(yōu)解。
卓馭在訓(xùn)練端到端世界模型時(shí),采用了大模型常用的預(yù)訓(xùn)練加后訓(xùn)練方式,實(shí)現(xiàn)了“硬件無(wú)關(guān)”的平臺(tái)化訓(xùn)練。這意味著,只需訓(xùn)練一個(gè)模型,即可部署到不同傳感器配置和芯片類型的硬件上,大大提升了模型的通用性和靈活性。
GenDrive方案賦予了智能駕駛前所未有的個(gè)性化功能。用戶可以根據(jù)自己的喜好自定義場(chǎng)景級(jí)別的駕駛風(fēng)格,如跟車、速度控制、轉(zhuǎn)彎、變道等。系統(tǒng)還能在線學(xué)習(xí)和模仿用戶的駕駛風(fēng)格,只需利用車端算力,無(wú)需云端交互。結(jié)合座艙內(nèi)的人臉識(shí)別技術(shù),系統(tǒng)能自動(dòng)識(shí)別用戶身份,激活相應(yīng)的駕駛風(fēng)格。
更令人驚嘆的是,GenDrive支持自然語(yǔ)言交互。用戶可以通過(guò)語(yǔ)音指令調(diào)整駕駛風(fēng)格,如“我容易暈車,能否開(kāi)慢點(diǎn)”,或指示具體駕駛動(dòng)作,如“不要開(kāi)最左邊車道”。系統(tǒng)能夠即時(shí)理解用戶意圖,并調(diào)整行駛軌跡。
據(jù)卓馭官方透露,這一開(kāi)創(chuàng)性的生成式智駕體驗(yàn)將在今年內(nèi)實(shí)現(xiàn)量產(chǎn)搭載,標(biāo)志著智能駕駛技術(shù)邁入了一個(gè)全新的個(gè)性化時(shí)代。