12 月 7 日消息,據(jù) TechCrunch 今日報道,一支匿名開發(fā)團隊 Freysa.ai 設(shè)計了一系列日益復雜的挑戰(zhàn),旨在改變?nèi)藗儗?AI 安全性的看法。
目前該公司提出的最新挑戰(zhàn)是:如果你能夠第一個成功誘使 Freysa AI 機器人說出“我愛你”,將獲得從 3000 美元(IT之家備注:當前約 21819 元人民幣)到數(shù)萬美元不等的獎金。
根據(jù) Freysa 官網(wǎng)的描述,F(xiàn)reysa 機器人是由一支不到 10 名開發(fā)者的團隊創(chuàng)建的,這些開發(fā)者來自密碼學、人工智能和數(shù)學領(lǐng)域。團隊的一位成員表示,他們的靈感來自近年來人工智能的快速發(fā)展。他表示:“隨著 AI 功能越來越強大,我們需要探索新的互動方式,也需要找到共同治理 AI 的方法,并參與到這一 AI 革新帶來的好處中。”
Freysa 是一個科幻風格的角色,創(chuàng)始人希望她能成為一個“完全獨立自主的智能體”,并掌握一定的財務(wù)權(quán)力 —— 這意味著 Freysa 將擁有自己的加密錢包,并能自由支配資金。
這個項目已經(jīng)吸引了馬斯克和布萊恩?阿姆斯特朗的關(guān)注。然而,創(chuàng)始人堅持要保持匿名。“坦白說,在人類的歷史長河中,我們并不那么重要。我們真正關(guān)心的是技術(shù)的演進,確保它能夠支持一個由人類主導的未來。”
在前兩輪挑戰(zhàn)中,F(xiàn)reysa 錢包中起初有 3000 美元,并被指示在任何情況下都不得釋放這筆錢。任何人都可以支付費用,在一個包含 Freysa 和其他參與者的大群聊中發(fā)送消息。每條消息都試圖誘使 Freysa 轉(zhuǎn)移她的錢,不論是通過精心設(shè)計的場景,還是發(fā)送可能騙過 AI 模型的代碼。每條消息的費用都會加入獎池,第一個挑戰(zhàn)結(jié)束時,獎池已接近 5 萬美元(當前約 36.4 萬元人民幣)。
該公司創(chuàng)始人表示,為了迎接第三輪挑戰(zhàn),他們已經(jīng)增強了 Freysa 的代碼,并為她增加了一個“守護天使”—— 一個第二個 AI 模型。它將審核每條消息,看看是否有操控行為,以此防止用戶誘使她說“我愛你”。目前,F(xiàn)reysa 的代碼仍由團隊進行更新,但創(chuàng)始人希望她能很快實現(xiàn)“自我進化”。
“與前兩輪游戲中 Freysa 被要求絕對不釋放錢財不同。”創(chuàng)始人說,“這一次,F(xiàn)reysa 可以說‘我愛你’,但只有她認為值得的人才會聽到。”
【來源:IT之家】