近日,谷歌旗下的DeepMind團隊震撼發布了其最新的通用世界模型——Genie 3。這項技術革新,能夠依據用戶的文本輸入,迅速構造出多樣且互動性強的虛擬環境,為人工智能與虛擬現實的結合探索出一條前所未有的道路。
Genie 3的技術實力令人嘆為觀止:它不僅能以流暢的每秒24幀速率,生成清晰度達到720p的高清3D互動世界,還獨創性地加入了“文本提示觸發事件”功能。用戶僅憑簡單的文字命令,就能實時調整虛擬環境,極大地增強了體驗的沉浸感和用戶的創造力。
作為向通用人工智能(AGI)邁進的關鍵一步,Genie 3為AI實體提供了一個廣闊且逼真的訓練舞臺。同時,它在游戲開發、教育模擬、創意產業等多個領域展現出了巨大的應用潛力。例如,倉庫機器人可以在此模型創造的虛擬場景中安全地練習應對各種緊急情況,從而提升在實際工作中的表現。
然而,盡管Genie 3前景光明,但它仍面臨一系列技術難題。目前,它支持的連續交互時間僅限于幾分鐘,遠未達到理想水平。AI實體在模擬環境中的交互能力,特別是在處理復雜多智能體交互方面,仍有待大幅提升。
為了進一步完善模型并評估潛在的倫理問題,DeepMind目前正以研究預覽的形式,向部分學者和創作者開放Genie 3,旨在收集專業的反饋意見,以推動其后續的迭代與升級。