【ITBEAR科技資訊】7月31日消息,OpenAI公司近日揭曉了一項創新功能,即向部分付費訂閱的ChatGPT用戶開放了全新的高級語音模式(Advanced Voice Mode)。此模式旨在為用戶提供更為自然流暢的實時對話體驗。
這一高級語音模式的亮點在于其能夠理解并響應情緒及非語言暗示,顯著提升了與人工智能進行實時、自然對話的可能性。今年五月,OpenAI便首次向公眾展示了其GPT-4o模型以及這一令人矚目的“高級語音模式”。
據ITBEAR科技資訊了解,GPT-4o模型對音頻輸入的反應速度令人印象深刻,僅需232毫秒便能做出回應,而平均反應時間也維持在320毫秒左右,這與人類在日常對話中的反應速度相當。這一突破性的反應速度得益于高級語音模式的設計理念,它摒棄了傳統語音模式中將語音轉換為文本,再將文本轉回語音的繁瑣過程,從而大幅降低了交互的延遲。
OpenAI自展示高級語音模式以來,一直致力于增強語音對話的安全性與品質。為確保用戶體驗的安全與舒適,OpenAI已經實施了多項防護措施,以屏蔽涉及暴力或侵犯版權的內容請求。
盡管OpenAI原計劃在六月底就推出這一功能,但為確保產品的完善與成熟,公司決定延后一個月發布。目前,OpenAI已明確表示,高級語音模式將在今年秋季逐步向所有ChatGPT Plus訂閱用戶開放。這一創新功能的推出,無疑將為用戶帶來更加智能、高效的語音交互體驗。