在生成式人工智能席卷全球的浪潮中,國內AI領域正經歷著從性能比拼到應用落地的深刻轉變。在這場變革中,智能硬件,尤其是具身機器人產品,以其獨特的方式融入了人們的日常生活,展現了人機共生的未來圖景。
眾所周知,AI如同一位高智商的“偏科生”,在理性邏輯方面表現出色,但在情商方面卻顯得力不從心。傳統的語音交互技術,盡管在復雜環境下已實現了較高的識別率,但一次失敗的體驗就足以讓用戶心生退意。科大訊飛,作為中國人工智能產業的先行者,深諳此道。在語音技術領域深耕二十余年后,科大訊飛于6月12日的智能交互產品升級發布會上,推出了AIUI、機器人超腦、虛擬數字人和訊飛星辰四大全面升級的開發平臺。
全新的AIUI平臺,以訊飛星火大模型為引擎,實現了技術上的飛躍。發布會上亮相的全雙工擬人交互方案,不僅能在嘈雜環境中精準捕捉指令,還賦予了硬件產品情緒識別、創意生成與深度語義理解等類人多模態能力。這一方案的應用,使得智能音箱等消費級智能語音交互產品,在多人場景中能夠屏蔽非人聲環境音,準確識別指令,并在用戶遲疑、等待時主動延長拾音,提供更高效、更具溫度的智能體驗。
而在智能眼鏡產品上,科大訊飛展示了最新的“三麥陣列降噪”方案,專為戶外移動場景設計。在清晰收音的基礎上,智能眼鏡能夠在大模型能力的加持下,在實時翻譯、專業導游、健康助理等多重角色間無縫切換,仿佛一位同行的真人伙伴。
面對兒童陪伴成長的場景,科大訊飛推出了兒童專屬交互方案。這一方案針對幼兒發音模糊、疊字代替正常詞匯等特征進行強化訓練,實現了邏輯跳躍、音字不準的識別,以及情緒信號與認知邏輯的匹配。這使得智能玩具與孩子的對話更像玩伴間的親密互動,而非簡單的發號施令。
除了消費級場景,科大訊飛同樣關注產業側的賦能。在具身智能機器人賽道上,訊飛機器人超腦平臺成為了眾多機器人客戶的共同選擇。宇樹G1機器人在發布會上的表現令人驚艷,它揮舞著金屬手臂,歡快地跟觀眾打招呼,背后的奧秘正是訊飛機器人超腦平臺上的“智能語音背包”。這一方案無需改造硬體,即插即用,為機器人提供了即時的語音交互能力。
訊飛機器人超腦平臺不僅為機器人提供了能聽會說、能理解會行動的中樞系統,還構建了“端-云協同”的AI架構。在端側,平臺提供多模態降噪、人臉識別等本地感知與計算能力;在云端,則依托語音大模型與具身智能技術,實現類人化交互與復雜任務理解。這一架構的應用,使得機器人在工廠巡檢、服務機器人等領域展現出了強大的能力。
科大訊飛還推出了虛擬人交互平臺和星辰Agent智能體構建平臺。虛擬人交互平臺依托領先的多模態感知與生成技術,實現了數字人構建的“極簡革命”。用戶只需輸入一句錄音、上傳一張圖片,即可生成專屬的數字分身。而星辰Agent平臺則是一站式的大模型精調與智能體構建平臺,廣泛兼容業界主流的開源大模型,助力企業高效構建專屬大模型和智能應用。
依托這些平臺,科大訊飛在AI大模型落地場景上取得了顯著成果。在C端市場上,科大訊飛覆蓋了11個核心賽道,推出了27款AI應用;在To B和To G市場上,更是領跑同行,累計中標項目超130個,總金額突破14億元。科大訊飛以星火大模型為核心,將各項語音智能技術融會貫通,構建起了一棵代表人機智能交互的生態大樹。