【ITBEAR科技資訊】5月14日消息,OpenAI最新公布了其旗艦生成式AI模型GPT-4o,并計(jì)劃向所有用戶免費(fèi)提供,ChatGPT Plus用戶將在未來(lái)幾周內(nèi)優(yōu)先體驗(yàn)。
GPT-4o,其中的“o”蘊(yùn)含著“omni”即全面、全能的含義。這款模型被視為人機(jī)交互更自然化的重要進(jìn)步,因?yàn)樗粌H能處理文本,還能接受音頻和圖像的各種組合輸入,并產(chǎn)生相應(yīng)的組合輸出。這種跨模態(tài)的交互能力,無(wú)疑將為用戶帶來(lái)更為豐富和直觀的AI體驗(yàn)。
據(jù)ITBEAR科技資訊了解,GPT-4o的反應(yīng)速度令人印象深刻,它能在232毫秒內(nèi)對(duì)音頻輸入做出回應(yīng),平均反應(yīng)時(shí)間為320毫秒,這與人類在自然對(duì)話中的反應(yīng)時(shí)間非常接近。在性能上,GPT-4o在英語(yǔ)和代碼文本方面的表現(xiàn)與GPT-4 Turbo旗鼓相當(dāng),同時(shí)在非英語(yǔ)文本處理上也有顯著提升。更新模型在API調(diào)用上更為迅速,而且價(jià)格降低了50%,這無(wú)疑將極大地提升其市場(chǎng)競(jìng)爭(zhēng)力。在視覺(jué)和音頻理解方面,GPT-4o展現(xiàn)出了卓越的性能,明顯優(yōu)于現(xiàn)有的其他模型。
OpenAI介紹,使用GPT-4o時(shí),ChatGPT免費(fèi)版用戶將能體驗(yàn)到更多高級(jí)功能,如GPT-4級(jí)別的智能交互,從模型和網(wǎng)絡(luò)中獲取回復(fù),利用數(shù)據(jù)創(chuàng)建圖表,基于拍攝的照片進(jìn)行對(duì)話,以及上傳文件以獲取總結(jié)、撰寫或分析等。
在預(yù)熱階段,OpenAI的CEO阿爾特曼就對(duì)GPT-4o寄予了高度評(píng)價(jià),形容它“像魔法一樣”。他甚至在一次采訪中表示,希望最終能開(kāi)發(fā)出像科幻電影《她》中的那種AI助理,實(shí)現(xiàn)更為深入和自然的人機(jī)交互。
此次發(fā)布的新模型也引發(fā)了業(yè)界的高度關(guān)注。前DCCI互聯(lián)網(wǎng)數(shù)據(jù)中心創(chuàng)始人胡延平在微博上表示,“這是一次看似小幅更新,實(shí)則可能引發(fā)智能交互領(lǐng)域巨大變革的進(jìn)步。”他還暗示,這次發(fā)布可能不僅僅是GPT-4的后端能力與前端聊天機(jī)器人的結(jié)合,而是GPT-5能力的部分釋放,顯示出OpenAI在控制其技術(shù)發(fā)布的節(jié)奏上有著深思熟慮的策略。