【ITBEAR科技資訊】4月5日消息,谷歌近日推出了聊天機(jī)器人 Bard,并呼吁公司員工進(jìn)行內(nèi)部測試,同時也委托了許多外部承包商進(jìn)行評估。在 OpenAI 聊天機(jī)器人 ChatGPT 爆火后,谷歌也迅速跟進(jìn),在 3 月份推出了聊天機(jī)器人 Bard 的有限測試版。與 ChatGPT 類似,用戶可以向 Bard 提問或下達(dá)任務(wù)指令,Bard 會給出類似人類的答復(fù)。谷歌對此表示,聊天機(jī)器人會隨著時間的推移而變得越來越好,它不應(yīng)該被視為搜索的替代品。
據(jù)ITBEAR科技資訊了解,跨國 AI 訓(xùn)練數(shù)據(jù)服務(wù)公司 Appen 的承包商正在幫助改進(jìn)谷歌的聊天機(jī)器人。雖然這些人沒有被明確告知他們被分配的任務(wù)與 Bard 有關(guān),但是關(guān)于新任務(wù)的內(nèi)部討論可以追溯到 2 月 7 日,也就是在谷歌首次發(fā)布 Bard 的時候。Appen 內(nèi)部文件顯示承包商需要審查 AI 聊天機(jī)器人所提供的回應(yīng)質(zhì)量。
根據(jù)承包商指導(dǎo)文件,他們將收到用戶向 AI 聊天機(jī)器人發(fā)出的提示(例如提問、指令或陳述),以及兩個機(jī)器生成的回應(yīng)。承包商需要幫助確認(rèn)哪種回應(yīng)更好。他們還可以在文本框中詳細(xì)說明選擇的原因,以幫助聊天機(jī)器人學(xué)習(xí)在可接受的響應(yīng)中尋找特定屬性。聊天機(jī)器人給出的回答應(yīng)該連貫而準(zhǔn)確,并引入最新信息。
四名接受采訪的承包商表示,自 1 月份以來,他們的大部分工作已經(jīng)轉(zhuǎn)向?qū)彶?AI 聊天機(jī)器人的提示。在評估過程中,承包商們對聊天機(jī)器人的表現(xiàn)感到失望,并稱他們沒有足夠時間準(zhǔn)確評估聊天機(jī)器人對提示的響應(yīng)是否正確,有時只能憑借猜測。不過他們?nèi)匀豢梢阅玫綀蟪?。承包商表示,他們被設(shè)定固定的時間來完成每項任務(wù)。審查提示的任務(wù)時間從 60 秒到幾分鐘不等,差異很大。這些人承認(rèn),如果他們不熟悉聊天機(jī)器人談?wù)摰脑掝},比如區(qū)塊鏈等技術(shù),就很難給 AI 的回應(yīng)評分。