北京時間8月19日,聲網(wǎng)母公司Agora, Inc. 公布了2025年第二季度財報。財報顯示,第二季度Agora, Inc. 總營收3426萬美元,同比增長11.0%(不含去年三季度起已終止的低毛利業(yè)務(wù))。公司指引三季度收入?yún)^(qū)間為3400-3600萬美元,同比去年三季度增長7.6%-13.9%。
在美國通用會計準則(GAAP)下,Agora, Inc. 第二季度凈利潤為146萬美元(合人民幣1050萬元),繼2024年Q4同比扭虧為盈后,已連續(xù)三個季度實現(xiàn)GAAP盈利,且利潤額超過一季度3倍以上。
對此,Agora, Inc. 創(chuàng)始人兼CEO趙斌表示,“我們欣然宣布,公司連續(xù)三個季度實現(xiàn)美國通用會計準則(GAAP)下的盈利。利潤率的持續(xù)提升得益于穩(wěn)健的收入增長與運營效率的不斷優(yōu)化。
自今年三月推出對話式AI引擎產(chǎn)品以來,我們已攜手客戶在多個場景下開發(fā)語音對話智能體。目前,部分客戶的智能體方案已在呼叫中心和AI陪伴硬件等場景落地應(yīng)用。
基于這一良好發(fā)展勢頭,我們將繼續(xù)深度融合垂直場景專業(yè)知識與特點,并進一步提升產(chǎn)品性能與體驗。 我們?nèi)找鎴远ǖ叵嘈牛覀兊募夹g(shù)將驅(qū)動客服、教育和智能硬件等廣泛行業(yè)的智能化轉(zhuǎn)型。”
在現(xiàn)金儲備方面,截至2025年6月30日,Agora, Inc. 現(xiàn)金、現(xiàn)金等價物、銀行存款及銀行理財產(chǎn)品為3.77億美元。
對話式 AI 引擎全新升級,支持聲紋識別、數(shù)字人、視覺理解
7月26-29日,聲網(wǎng)亮相2025世界人工智能大會(WAIC),正式發(fā)布新版對話式AI引擎,該版本新增聲紋識別、數(shù)字人與視覺理解三項功能,實現(xiàn)對話式AI音視頻交互體驗的全新升級。
· 聲紋識別:選擇性注意力鎖定新增聲紋識別功能,該功能賦予AI精準識別用戶聲紋特征的能力,有效區(qū)分不同說話者。用戶只需在對話初期大聲、清晰地說話,即可提升AI對聲音的鎖定效果。聲紋識別不僅可以智能屏蔽95%的環(huán)境人聲、噪聲,讓AI對話更準確、高效,同時也適用于多人與AI對話的場景,實現(xiàn)更加多元化的對話式AI響應(yīng)與服務(wù)。
· 數(shù)字人交互:支持商湯等市場主流的數(shù)字人方案,通過集成高度擬真、表情動作自然的數(shù)字人,用戶可與屏幕中的高度擬人化的數(shù)字形象進行實時、生動的對話互動,增強交互的臨場感與情感連接,且有多個數(shù)字人形象供選擇,適用于虛擬客服、教育陪伴、娛樂社交等多種場景。
· 視覺理解:新增的視覺理解能力為AI加上“眼睛”,一方面支持實時視頻,能夠解析攝像頭捕捉的畫面信息,結(jié)合語音指令,AI能“看懂”用戶手勢、環(huán)境物體或特定視覺線索,實現(xiàn)“所見即所言”的智能反饋;另一方面,支持拍照與圖片上傳識別,AI會解答圖片中的關(guān)鍵信息,可適用于教育場景的拍照識題與作業(yè)批改,智能助手場景的識物、翻譯、分析等。在對話式AI中加入視覺理解,將為人機對話協(xié)作開辟更廣闊的空間。
對話式AI正從基礎(chǔ)的互動問答向深度理解、情感共鳴和情境感知演進。聲網(wǎng)對話式 AI引擎具備的聲紋識別、數(shù)字人和視覺理解等能力,成為構(gòu)建下一代自然、沉浸式人機交互基礎(chǔ)設(shè)施的重要一步。
此外,本季度聲網(wǎng)還發(fā)布了全球首個AI模型評測平臺(對話式)。該平臺針對對話式 AI 場景下,級聯(lián)大模型中的ASR+LLM+TTS 延遲數(shù)據(jù)提供主流供應(yīng)商的橫向測評,更直觀的展示聲網(wǎng)對話式AI引擎適配各主流模型的實時性能數(shù)據(jù)。同時,平臺還提供了“競技場”功能,開發(fā)者可自由選擇ASR、LLM、TTS的主流供應(yīng)商進行對比,根據(jù)性能延遲的數(shù)據(jù)表現(xiàn),選擇更適配自身業(yè)務(wù)的模型供應(yīng)商。
助力AI智能助手、AI陪伴機器人等多元場景落地
隨著不斷地技術(shù)創(chuàng)新和體驗升級,聲網(wǎng)進一步加速了對話式AI能力在各行業(yè)場景的落地。本季度,聲網(wǎng)在AI智能助手、AI陪伴機器人、多模態(tài)AI智能體創(chuàng)作等多個場景中,都實現(xiàn)了客戶應(yīng)用案例落地。
星野是依托MiniMax先進的多模態(tài)AIGC技術(shù),構(gòu)建的自由創(chuàng)造與分享AI智能體的創(chuàng)作平臺。基于MiniMax在文本、聲音、視覺模型下的先進能力,以及聲網(wǎng)對話式 AI 技術(shù),星野平臺中的用戶與AI智能體可實現(xiàn)秒回、清晰、流暢的實時語音對話,再搭配超擬人的AI音色,讓AI交互更接近人類的真實對話,成為用戶娛樂、工作、學(xué)習(xí)中的AI伙伴。
MiniMax Chat是基于MiniMax最新自研多模態(tài)大語言模型打造的AI助手,在聲網(wǎng)助力下,語音對話體驗成為MiniMax Chat亮點功能之一,響應(yīng)速度快、AI秒回,即使在弱網(wǎng)、嘈雜環(huán)境下,也能清晰、流暢對話。基于MiniMax出色的新一代語音大模型,AI的聲音逼真、語氣自然,能流暢處理多語種混合輸出,并提供調(diào)節(jié)語速和更換聲音等功能。
智譜清言是基于智譜GLM系列模型開發(fā)的AI助手,結(jié)合智譜出色的音視頻理解模型和情感語音模型,清言能夠看到和理解用戶所處環(huán)境,更好地提供問答、翻譯、導(dǎo)游、作業(yè)輔導(dǎo)等功能。在聲網(wǎng)對話式AI技術(shù)的助力下,智譜清言的視頻通話延遲更低,對話更流暢。
賦之科技推出的EBO Air 2 Plus探索了全新AI玩法,通過聲網(wǎng)對話式AI引擎,讓用戶可與多個大模型助手展開對話,支持6大角色,20+音色,無論知識問答、互動聊天、還是情感陪伴都能一鍵與 AI 實現(xiàn)自然、流暢的真實互動體驗。
Miko3是一款STEAM智能教育機器人,通過聲網(wǎng)提供的對話式AI技術(shù),Miko3機器人不僅可以與孩子進行自然、流暢的對話,還能準確識別兒童的情緒并快速給予相應(yīng)的反饋,成為貼心的情感陪伴者。
從高效生產(chǎn)力工具到暖心情感陪伴,聲網(wǎng)對話式AI能力正深度滲透智能硬件、教育、社交等多元領(lǐng)域,持續(xù)釋放行業(yè)價值與增長潛力。未來,聲網(wǎng)將深耕場景創(chuàng)新與技術(shù)迭代,不斷打磨人與智能體的實時互動體驗,以更自然、沉浸的交互能力,助力AI真正融入千行百業(yè)的實踐場景。