【ITBEAR科技資訊】5月14日消息,OpenAI于今日凌晨正式推出了其新一代旗艦?zāi)P虶PT-4o,這款人工智能模型具備實(shí)時(shí)推理能力,可處理語音、視頻及文本信息。
GPT-4o在英文文本與代碼處理方面與GPT-4 Turbo性能相當(dāng),然而,其在處理非英文文本上的表現(xiàn)有了顯著增強(qiáng)。更相較于當(dāng)前市場(chǎng)上其他模型,GPT-4o在視頻與音頻理解方面展示出更優(yōu)越的能力。
據(jù)ITBEAR科技資訊了解,GPT-4o的另一亮點(diǎn)在于其快速響應(yīng)能力。該模型能以最快232毫秒的速度響應(yīng)音頻輸入,平均響應(yīng)時(shí)間為320毫秒,這一速度與人類在對(duì)話中的自然反應(yīng)速度基本持平。
OpenAI正積極推動(dòng)GPT-4o的廣泛應(yīng)用。自推出之日起,GPT-4o的文本與圖片處理功能便已集成至ChatGPT中,供用戶免費(fèi)使用。對(duì)于ChatGPT Plus用戶,其可處理的數(shù)據(jù)量上限將是免費(fèi)用戶的五倍。此外,新版本的音頻模式也將在未來數(shù)周內(nèi)向ChatGPT Plus用戶推送。
為驗(yàn)證GPT-4o的實(shí)際性能,ITBEAR科技資訊進(jìn)行了實(shí)地測(cè)試。盡管目前免費(fèi)用戶尚無法使用圖片生成功能,但我們通過GPT-4o對(duì)圖片進(jìn)行了描述與分析。測(cè)試中,GPT-4o能夠準(zhǔn)確描述圖片內(nèi)容,甚至能對(duì)圖片中的人物動(dòng)作進(jìn)行詳盡闡述,并最終以文字形式對(duì)圖片場(chǎng)景進(jìn)行深入解析。
在進(jìn)一步的測(cè)試中,我們使用了一張中文圖表和一張英文圖表對(duì)GPT-4o進(jìn)行了分析能力的考察。對(duì)于中文圖表,GPT-4o不僅能準(zhǔn)確讀取并解釋其中的數(shù)字含義,還能對(duì)數(shù)據(jù)的差異與趨勢(shì)進(jìn)行詳盡的分析。對(duì)于英文圖表,GPT-4o同樣展現(xiàn)出了強(qiáng)大的理解能力,能夠讀懂、翻譯并根據(jù)圖表數(shù)據(jù)得出分析結(jié)論。
總體而言,GPT-4o的性能有了顯著的提升,無疑將為人工智能領(lǐng)域帶來新的可能性。