【ITBEAR科技資訊】7月31日消息,OpenAI公司近日揭曉了一項創(chuàng)新功能,即向部分付費(fèi)訂閱的ChatGPT用戶開放了全新的高級語音模式(Advanced Voice Mode)。此模式旨在為用戶提供更為自然流暢的實(shí)時對話體驗。
這一高級語音模式的亮點(diǎn)在于其能夠理解并響應(yīng)情緒及非語言暗示,顯著提升了與人工智能進(jìn)行實(shí)時、自然對話的可能性。今年五月,OpenAI便首次向公眾展示了其GPT-4o模型以及這一令人矚目的“高級語音模式”。
據(jù)ITBEAR科技資訊了解,GPT-4o模型對音頻輸入的反應(yīng)速度令人印象深刻,僅需232毫秒便能做出回應(yīng),而平均反應(yīng)時間也維持在320毫秒左右,這與人類在日常對話中的反應(yīng)速度相當(dāng)。這一突破性的反應(yīng)速度得益于高級語音模式的設(shè)計理念,它摒棄了傳統(tǒng)語音模式中將語音轉(zhuǎn)換為文本,再將文本轉(zhuǎn)回語音的繁瑣過程,從而大幅降低了交互的延遲。
OpenAI自展示高級語音模式以來,一直致力于增強(qiáng)語音對話的安全性與品質(zhì)。為確保用戶體驗的安全與舒適,OpenAI已經(jīng)實(shí)施了多項防護(hù)措施,以屏蔽涉及暴力或侵犯版權(quán)的內(nèi)容請求。
盡管OpenAI原計劃在六月底就推出這一功能,但為確保產(chǎn)品的完善與成熟,公司決定延后一個月發(fā)布。目前,OpenAI已明確表示,高級語音模式將在今年秋季逐步向所有ChatGPT Plus訂閱用戶開放。這一創(chuàng)新功能的推出,無疑將為用戶帶來更加智能、高效的語音交互體驗。