【ITBEAR科技資訊】6月1日消息,阿里云智能今日發布了一項名為"通義聽悟"的全新產品,該產品面向公眾開放公測。據ITBEAR科技資訊了解,這是阿里云智能推出的首個面向普通消費者的應用產品。
通義聽悟利用先進的語音AI技術,能夠將音頻和視頻內容準確轉寫為易讀的文字。在如今的多媒體時代,人們每天處理大量的音頻和視頻內容,通義聽悟為用戶提供了高效處理這些內容的工具。該產品借助通義千問大模型和音視頻AI模型的AI助手,實現實時語音識別、對話記錄、多語言翻譯、發言總結、PPT提取以及內容規整等功能。
通義聽悟不僅能夠將音頻視頻內容轉寫為文字,還結合了通義千問大語言模型的強大理解能力。通過全文摘要、章節速覽和發言總結等功能,用戶可以高效地閱讀和挖掘音視頻內容中的信息價值。隨著大模型能力的不斷進步,通義聽悟將為用戶提供更多先進的功能,幫助用戶整理和利用音視頻內容,并將其沉淀為有價值的知識資產。
阿里云CTO周靖人表示,通義聽悟瞄準了工作生活中日益增長的音頻視頻內容,旨在幫助用戶記錄重要會議要點、捕捉講座中的精彩知識以及整理訪談中的關鍵信息,為用戶提供更深入、更高效的智能服務。
據悉,通義聽悟的小程序版將在阿里旗下產品中推出,包括釘釘、阿里云盤和夸克等產品。它將與這些產品內部的場景功能及音視頻內容相融合。同時,通義聽悟的AI能力也將在阿里巴巴內部各類應用中得到應用,比如廣受用戶歡迎的"釘釘閃記"就集成了相關能力,為釘釘用戶提供智能音視頻會議、文檔速記等產品。
總之,通義聽悟作為一項創新的語音轉寫和內容管理工具,將為用戶帶來更便捷、高效的音視頻體驗,助力人們更好地處理和利用大量的音頻視頻內容。