在科技巨頭OpenAI宣布ChatGPT即將全面融入蘋果生態系統的同一天,谷歌于12月12日震撼發布了其最新一代大型模型——Gemini 2.0。這款模型尤為引人注目之處在于,它是專門為AI智能體(AI Agent)設計的。
谷歌掌門人Sundar Pichai透露,過去一年中,谷歌將大量資源投入到開發能夠深刻理解世界、具備前瞻思維,并在監督下有效執行任務的“代理型”模型上。如今,他們自豪地推出了最強大的模型——Gemini 2.0。這款模型借助多模態領域的最新進展和原生工具,正逐步構建一個更加貼近人們心中普遍AI助手愿景的新型AI智能體。
與此同時,谷歌DeepMind的首席執行官Demis Hassabis也發表了看法,他認為2025年將是AI智能體的黃金時代,而Gemini 2.0無疑是支撐這一新時代的最新一代模型。
值得注意的是,盡管Gemini 2.0的正式版本尚未面向公眾開放,但谷歌已經將其提供給部分開發者進行內部測試。率先亮相的是比Gemini 1.5 Pro更加強大的Gemini 2.0 Flash實驗版。該實驗版已在網頁端上線,Gemini用戶只需通過PC端即可訪問,而移動端的推出也指日可待。
谷歌發布的基準測試結果顯示,無論是在多模態的圖片、視頻處理能力上,還是在編碼、數學等能力上,僅僅是Flash實驗版的Gemini 2.0,其表現幾乎全面超越了Gemini 1.5 Pro。更令人驚喜的是,其響應速度也實現了兩倍的提升。