11月27日,36氪重磅發布「WISE2024 商業之王系列年度企業名冊」,聲網憑借在實時互動領域的深厚技術積累、專業的客戶服務以及在生成式 AI 時代的技術創新,成功入選「WISE2024 商業之王 年度最具商業價值企業」。
作為中國最具社會影響力的年度行業峰會之一,36氪 WISE 大會始終站在時代前沿,被譽為前瞻中國商業經濟的風向標。今年10月,36氪特別啟動調研,聚焦發掘那些為產業長期發展、全球經濟增長提供創新動能的代表企業,設置了「WISE2024 商業之王年度最具商業價值企業」、「WISE2024 商業之王年度最具商業潛力企業」兩大類別及九大新經濟領域。經過對數百家提報企業的數輪遴選,結合專業分析師意見,正式發布了「WISE2024 商業之王系列年度企業名冊」。
以生成式 AI 為代表,提“智”增效的數字化轉型,持續向全行業深度覆蓋。聲網是全球實時互動云行業的開創者和引領者,為包括社交泛娛樂、教育、IoT、企業協作在內的20余行業賽道,200多種場景提供 RTE 服務。一直以來,聲網都始終對 AI 技術保持敏感,并持續跟進,借助 AI 技術,提升實時互動體驗,讓實時互動場景變得更加豐富。
幾年前,聲網在業內首次將 AI 算法全面引入 RTC 技術棧的各個領域,用于改善音視頻體驗與 QoE 體驗。在音頻領域,聲網打造了新一代實時音頻技術智能引擎“鳳鳴AI引擎”,其中的 AI 降噪、AI 回聲消除、空間音頻等能力給實時互動場景帶來了更加純凈和沉浸的聽覺體驗。在視頻領域,聲網的“實時高清·超級畫質”解決方案,在全面提升視頻畫質的同時,也帶來了 AI 美顏、虛擬背景、AI 驅動表情與動作等方面的體驗進化。
自2023年以來,聲網持續不斷地探索生成式 AI 與 RTE 能力相結合給不同行業帶來的應用場景創新與效率提升。如今,隨著多模態大模型技術的發展,能以語音與人類進行自然對話的多模態 AI 將在客戶服務、教育和健康等多個場景中得到廣泛應用,而聲網則有望成為對話式 AI 的關鍵基礎設施。
在10月25日舉辦的第十屆實時互聯網大會上,聲網正式發布了 RTE+AI 能力全景圖,從實時 AI 基礎設施、RTE+AI 生態能力、聲網 AI Agent、實時多模態對話式 AI 解決方案、RTE+AI 應用場景五個維度,清晰呈現了當下 RTE 與 AI 相結合的技術能力、架構方案與應用場景。RTE 已經成為生成式 AI 時代 AI 基礎設施的關鍵部分,而 RTE 與生成式 AI 結合所帶來的場景創新,也將成為下一個十年的主題。
聲網對話式 AI 解決方案 構建實時多模態 AI 語音交互
聲網通過與多家客戶在 AIGC 場景的深度合作,探索出了實時多模態對話式 AI 解決方案,該方案以語音為核心,支持視頻擴展,可實現文本/音頻/圖像/視頻的組合輸入&輸出,通過豐富的功能構建真實、自然的 AI 語音交互體驗。
實時多模態對話式 AI 解決方案具備四大優勢:對交互延遲進行優化,延遲可做到低于500ms;支持 AI 降噪、背景人聲過濾,讓語音對話更純靜;支持隨時打斷與超擬人化人聲合成,讓對話更智能與逼真;同時還支持靈活可擴展的 AI Agent 架構等一系列功能,幫助開發者與企業快速構建適配自己業務場景的 AI 實時語音對話服務。
在多模態大模型的趨勢下,RTE 成為了人與 AI 交互中的重要一環,越來越多的企業與開發者都在探索在大語言模型或者 AI 應用場景中快速集成高效的音視頻能力。對此,聲網推出了 Linux Server SDK,支持當下大模型編程最主流的兩類語言 Python 與 Go ,企業可基于聲網 Linux SDK ,快速接入大模型,上線具備 RTC 傳輸能力的 AI 應用場景,如 AI 陪伴、AI 助理、AI 語言陪練和 AI 客服等。
AI+會議協作、IoT、教育 重塑實時互動體驗
會議協作領域,聲網的 aPaaS 產品“靈動會議”,通過 RTE 技術與生成式 AI 能力的融合,重塑會議協作使用體驗,為客戶提供低代碼視頻會議平臺,并且采用了多云、多平臺設計,提供 SFU+MCU 混合架構部署能力,支持客戶進行靈活部署和擴展,全面滿足客戶會議、協作和調度需求。
RTE 技術確保了低延遲、高質量的音視頻傳輸,讓視頻會議溝通更加實時流暢;而生成式 AI 則通過對會議內容的分析和生成,提供智能化的輔助功能,如實時字幕、AI 會議紀要等。兩大技術支撐,讓會議從傳統的信息傳輸工具升級為智能協作平臺,有效提升了會議效率和用戶體驗。
IoT領域,在實時多模態對話式 AI 解決方案的基礎上,聲網針對 IoT 行業的特殊性,探索出了 AI x IoT 智能硬件解決方案,該方案能夠在低功耗、低算力芯片上快速實現大模型的接入,具備低延時實時互動、低成本靈活適配的特性,通過豐富的功能在智能硬件場景中構建真實、自然的 AI 語音交互體驗。目前多模態大模型在智能硬件場景的落地主要以智能眼鏡、智能手表、智能耳機等穿戴式設備為主,在生成式 AI 的趨勢下,還出現了智能陪伴機器人、智能兒童毛絨玩具、智能戒指等一系列場景,帶來不同硬件終端下的 AI 語音交互體驗。
教育領域,聲網 RTC+AI 教育超級雙擎解決方案,通過 RTC+AI 雙引擎驅動在線課堂教學體驗的升級以及教學場景的創新,該方案包含了超強互動、絲滑流暢、多維直播、教育硬件適配、AI沉浸課堂、大模型輔助教學等六大特性。可應用于直播大班課、智慧教室、學習機、AI口語老師等在線教育場景。支持大模型輔助教學,運用大模型構建 AI 口語老師場景,學生可通過實時語音與 AI 進行問答互動,從學生發言到 AI 對話響應延時可做到低于500ms。
未來聲網也將持續聚焦,打造一個更高效、更靈活的組織,更敏捷的抓住市場機遇,并打造生成式 AI 時代的下一代實時互動技術,鞏固聲網在實時互動領域的領導地位。