【ITBEAR】斯坦福與MIT聯(lián)手推出WonderWorld,為實(shí)時(shí)生成開放世界游戲帶來革新。該項(xiàng)目實(shí)現(xiàn)了從單一圖像出發(fā),在用戶實(shí)時(shí)交互下生成無限延展的3D場景,極大地縮短了生成時(shí)間,將交互式3D世界生成推向?qū)崟r(shí)門檻。
用戶只需上傳一張圖片,即可踏入AI創(chuàng)造的虛擬世界。通過移動(dòng)視角和輸入文本提示,用戶能實(shí)時(shí)決定探索方向和場景內(nèi)容。無論是魔幻森林、現(xiàn)實(shí)都市還是寧靜鄉(xiāng)村,WonderWorld都能迅速呈現(xiàn)。
WonderWorld的核心突破在于其速度。研究團(tuán)隊(duì)開發(fā)的FLAGS場景表示方法,使系統(tǒng)能在短短10秒內(nèi)生成新場景,比現(xiàn)有方法快近100倍。該項(xiàng)目還解決了多個(gè)3D場景間常出現(xiàn)的幾何“裂縫”問題。
實(shí)驗(yàn)測試表明,WonderWorld在不同場景類型和視覺風(fēng)格上均表現(xiàn)出色,且明顯優(yōu)于其他基準(zhǔn)方法。該項(xiàng)目還展示了從一張輸入圖片接受不同用戶控制生成不同場景內(nèi)容的能力。
WonderWorld由斯坦福大學(xué)吳佳俊團(tuán)隊(duì)與MIT聯(lián)合打造,論文主要作者為斯坦福大學(xué)五年級博士生俞洪興。該項(xiàng)目在硅谷廣受歡迎的Hacker News上也被熱烈討論。