喬布斯在2010年為Siri描繪的愿景,正逐步成為當(dāng)下AI助手競相追逐的目標(biāo)。Siri的聯(lián)合創(chuàng)始人Norman Winarsky回憶道,喬布斯當(dāng)時(shí)預(yù)見了一位能夠如真人般進(jìn)行情感互動并助用戶處理事務(wù)的個人助理的巨大潛力。而今,十四載光陰已過,人們對于一個“深諳己意、無所不能、能執(zhí)行跨領(lǐng)域任務(wù)”的超級助手的期待依舊不減。
據(jù)悉,OpenAI計(jì)劃于明年1月推出的AI助手產(chǎn)品,將致力于實(shí)現(xiàn)諸如自動發(fā)送工作郵件、制定旅行計(jì)劃等功能。業(yè)界普遍認(rèn)為,大模型的突破正在加速這一愿景的實(shí)現(xiàn)。OpenAI的高管頻繁提及AI Agent將引領(lǐng)下一場技術(shù)革命,而美國銀行在11月初的研報(bào)中也指出,相較于ChatGPT和Copilot,具備更強(qiáng)自主規(guī)劃與行動能力的Agentic AI正引領(lǐng)一個全新的創(chuàng)新周期。
在這場創(chuàng)新周期中,成為離用戶最近、連接最廣泛、能促進(jìn)Agent協(xié)作的AI助手,被視為一個平臺級的機(jī)會。一方面,大模型的支持使得基于自然語言的交互有望取代圖形界面交互,任何場景都有可能被這種新的交互方式重塑。另一方面,交互方式的變革或?qū)⒋蚱栖浻布I(lǐng)域的既有平衡,引發(fā)一場利益格局的重新洗牌。
當(dāng)下的競爭尚處于初級階段,參與者眾多。銳意進(jìn)取的大模型創(chuàng)業(yè)公司、掌握主要平臺的互聯(lián)網(wǎng)巨頭、在互聯(lián)網(wǎng)巨頭夾縫中求生的中型公司,以及渴望從軟件市場中分一杯羹的硬件企業(yè),都在積極尋求突破。從競爭層面來看,通用AI助手、垂直領(lǐng)域AI助手、工具型AI助手等領(lǐng)域均有人涉足。
美國銀行在研報(bào)中將AI的發(fā)展劃分為三波浪潮:前GenAI、GenAI和Agentic AI。前GenAI時(shí)代從1940年延續(xù)至ChatGPT發(fā)布前,AI主要用于數(shù)據(jù)驅(qū)動的決策支持。而GenAI時(shí)代,以ChatGPT等為代表的AI應(yīng)用,不僅讓交流更加自然,還極大地提升了個人生產(chǎn)與生活效率。Agentic AI階段,AI將能夠自動化整個任務(wù)并代表用戶采取行動,Gartner預(yù)測,到2028年,至少15%的日常工作決策將由Agentic AI自主完成。
在Agentic AI的發(fā)展道路上,大模型開始強(qiáng)調(diào)上下文記憶能力,這是自主決策的前提。Google的AI助手Gemini已能記住訂閱用戶的生活信息、工作內(nèi)容和個人偏好。同時(shí),模態(tài)能力和操作APP的能力的突破,使得AI助手的能力邊界不斷拓展。智譜的AutoGLM和Anthropic的computer use分別展示了在手機(jī)和電腦上實(shí)現(xiàn)AI助手操作APP的能力。
多家企業(yè)開始依托AI助手搭建第三方AI應(yīng)用生態(tài)。微軟推出了Azure AI Foundry平臺,旨在幫助組織設(shè)計(jì)、定制和維護(hù)管理AI應(yīng)用和AI助手。百度則推出了無代碼AI應(yīng)用搭建工具秒噠,計(jì)劃支持創(chuàng)建數(shù)百萬個應(yīng)用程序。蘋果前員工認(rèn)為,Siri未能及時(shí)拓展第三方生態(tài)系統(tǒng),是其后續(xù)發(fā)展乏力的原因之一。
當(dāng)前的AI助手競爭,猶如一場激烈的社團(tuán)話事人選舉。互聯(lián)網(wǎng)平臺作為上一屆話事人,不愿輕易交出權(quán)力;大模型創(chuàng)業(yè)公司作為新晉提名者,積極尋求上位;硬件廠商作為社團(tuán)元老,試圖平衡各方利益;工具型產(chǎn)品則需要在各方勢力中做出選擇。在這場博弈中,大模型創(chuàng)業(yè)企業(yè)最為積極,國內(nèi)外多家企業(yè)都推出了自己的AI助手產(chǎn)品,并不斷增強(qiáng)其內(nèi)容生成和智能體連接能力。
互聯(lián)網(wǎng)平臺同樣不甘示弱,阿里、百度、騰訊、字節(jié)等大廠都推出了自己的AI助手產(chǎn)品,依托用戶、數(shù)據(jù)、場景和資源的深厚積累,步伐更加從容。硬件廠商則希望通過AI助手打破管道化的定位,實(shí)現(xiàn)用戶習(xí)慣、數(shù)據(jù)積累、屏幕識別和應(yīng)用操作的深度融合。工具型產(chǎn)品則根據(jù)自身能力,選擇推出垂直場景AI助手或融入其他AI助手。
在這場話事人之爭中,模型能力、業(yè)務(wù)場景、用戶獲取和軟硬件整合等因素將決定最終的勝負(fù)。模型能力的提升是實(shí)現(xiàn)精準(zhǔn)理解和靈活調(diào)用的基礎(chǔ);豐富的Agent生態(tài)意味著更多的能力供給和更高的入口層級;軟硬件廠商需要找到助手時(shí)代的相處之道;而在產(chǎn)品體驗(yàn)、生態(tài)成熟度相近的情況下,低成本掌控流量將成為關(guān)鍵。因此,硬件廠商和互聯(lián)網(wǎng)平臺在這方面具有天然優(yōu)勢。