【ITBEAR科技資訊】7月20日消息,ElevenLabs于昨日(7月19日)通過博文向世界宣布,他們已成功推出全新的Turbo v2.5文本到語音AI模型。這款新模型支持包括普通話在內的32種語言,覆蓋了全球近80%的地區,為用戶提供高品質、低延遲的AI對話體驗。
Turbo v2.5模型的一個顯著特點是新增了對越南語、匈牙利語和挪威語的支持。這三種語言分別被8500萬、1300萬和530萬人使用,此舉無疑將ElevenLabs的AI服務擴展到了更廣泛的用戶群體。
據ITBEAR科技資訊了解,此次更新不僅增加了新的語言支持,還顯著提高了印地語、法語、西班牙語、普通話等27種語言的響應速度,其中最高提升了3倍,英語的響應速度也提高了25%。這一改進得益于Turbo v2.5模型融合了尖端的文本到語音技術和最新的低延遲模型架構,使得用戶能夠在幾乎無需等待的情況下獲得高質量的AI生成音頻。
Turbo模型的快速語音合成功能,在保持音質流暢自然的同時,響應時間控制在400毫秒以內,為用戶提供了極佳的交互體驗。
ElevenLabs,這家總部位于倫敦的公司,自2022年成立以來,一直致力于開發先進的人工智能語音模型和工具。他們的服務能夠創建不同語言、口音和情感的合成語音,極大地豐富了AI語音的應用場景。
公司CEO Mati Staniszewski透露,ElevenLabs目前擁有一支由約40名分布在全球的遠程辦公員工組成的團隊,并計劃在年底前將團隊規模擴大至100人。
在推進AI技術的同時,ElevenLabs也非常重視人工智能內容的透明度。他們開發了如AI Speech Classifier等工具來輔助識別合成音頻,同時還在積極探索電影配音等新的應用領域。更令人期待的是,他們正在開發一個平臺,允許用戶生成AI語音并通過授權獲得收益,這無疑為AI語音技術的發展開辟了新的商業模式。