亞馬遜近日在科技界掀起波瀾,正式揭曉了其最新研發(fā)成果——通用人工智能體Nova Act。這款智能體不僅能夠操控網(wǎng)絡(luò)瀏覽器,還能自主執(zhí)行一系列簡單的網(wǎng)絡(luò)任務,標志著亞馬遜在AI智能體技術(shù)領(lǐng)域的強勢入局。
為了助力開發(fā)者更好地利用Nova Act,亞馬遜同步推出了專屬的軟件開發(fā)工具包(SDK)。開發(fā)者可以通過訪問nova.amazon.com網(wǎng)站,輕松獲取這一工具包,并在此平臺上探索亞馬遜旗下的各類Nova基礎(chǔ)模型。
Nova Act由亞馬遜在舊金山新成立的AGI(通用人工智能)實驗室精心打造,該實驗室由前OpenAI研究員David Luan和Pieter Abbeel共同領(lǐng)導。值得注意的是,Nova Act未來還將為亞馬遜備受矚目的生成式AI增強版語音助手Alexa+提供核心功能支持。
盡管目前開放的版本為“研究預覽版”,功能尚待進一步完善,但Nova Act已經(jīng)展現(xiàn)出了強大的潛力。亞馬遜表示,通過Nova Act SDK,開發(fā)者可以為用戶自動化處理諸如在線訂購沙拉、預訂餐廳晚餐等基礎(chǔ)性的網(wǎng)絡(luò)操作。這一工具包提供了豐富的功能,使AI智能體能夠輕松瀏覽網(wǎng)頁、填寫表單、選擇日歷日期等。
在性能表現(xiàn)上,Nova Act同樣不負眾望。在亞馬遜內(nèi)部的多項測試中,Nova Act的表現(xiàn)超越了來自O(shè)penAI和Anthropic的同類智能體。特別是在ScreenSpot Web Text測試中,Nova Act以94%的高分,超過了OpenAI的CUA(88%)和Anthropic的Claude 3.7 Sonnet(90%)。然而,關(guān)于Nova Act在更常用的智能體評估基準上的表現(xiàn),亞馬遜尚未公布相關(guān)數(shù)據(jù)。
對于為何會選擇開發(fā)訂購沙拉等看似簡單的AI智能體,Luan在接受采訪時表示,這是構(gòu)建超智能AI系統(tǒng)的重要一步。他認為,AGI應該是一個能夠在計算機上完成人類所能做的任何事情的AI系統(tǒng)。而Nova Act SDK正是為了可靠地自動化執(zhí)行簡短、簡單的任務而設(shè)計的,同時它還為開發(fā)者提供了精確定義何時需要人類介入智能體工作流程的工具。
目前,市場上的早期AI智能體普遍面臨著可靠性不足的挑戰(zhàn)。這些系統(tǒng)往往運行緩慢,難以長時間獨立工作,且容易犯下人類通常不會犯的錯誤。亞馬遜能否通過Nova Act克服這些難題,成為市場關(guān)注的焦點。隨著Nova Act的推出,亞馬遜正式加入了AI智能體技術(shù)的競爭行列,與OpenAI的Operator、Anthropic的Computer Use等產(chǎn)品展開了激烈的較量。