(ChinaZ.com)2月26日 消息:抄襲檢測器 Copyleaks 的一份報告顯示,OpenAI 的 GPT-3.5輸出中有60% 包含某種形式的抄襲。該公司使用了一種專有的評分方法,考慮相同的文本、微小的改動、釋義等來分配“相似性分?jǐn)?shù)”。
據(jù)悉,Copyleaks 專注于基于人工智能的文本分析,并為企業(yè)和學(xué)校提供抄襲檢測工具。該公司早在 ChatGPT 之前就已經(jīng)涉足這一領(lǐng)域。盡管 GPT-3.5是 ChatGPT 首次亮相的明星,但 OpenAI 此后已升級到更先進(jìn)的 GPT-4。
根據(jù)他們的最新發(fā)現(xiàn),GPT-3.5表現(xiàn)出45.7% 的相同文本、27.4% 的微小變化和46.5% 的釋義文本。根據(jù)報告,0% 意味著完全原創(chuàng),而100% 則表明沒有原創(chuàng)內(nèi)容。
圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney
Copyleaks 對 GPT-3.5進(jìn)行了各種測試,生成了大約1000個輸出,每個輸出大約400個單詞,涉及26個主題。相似度得分最高的結(jié)果屬于計(jì)算機(jī)科學(xué)(100%),其次是物理學(xué)(92%)和心理學(xué)(88%)。另一方面,戲劇(0.9%)、人文學(xué)科(2.8%)和英語(5.4%)的相似度得分最低。
OpenAI 發(fā)言人 Lindsey Held 告訴Axios:“我們的模型經(jīng)過設(shè)計(jì)和訓(xùn)練來學(xué)習(xí)概念,以幫助他們解決新問題。”“我們制定了措施來限制無意的記憶,并且我們的使用條款禁止故意使用我們的模型來反省內(nèi)容。”
剽竊不僅僅是剪切和粘貼整個句子和段落。《紐約時報》對 OpenAI提起訴訟,稱 OpenAI 的 AI 系統(tǒng)“大規(guī)模復(fù)制”構(gòu)成版權(quán)侵權(quán)。OpenAI對訴訟作出回應(yīng),稱“反流”是一種“罕見的錯誤”,并指責(zé)《紐約時報》“操縱提示”。
內(nèi)容創(chuàng)作者試圖辯稱,生成AI模型是在他們的作品上訓(xùn)練的,所以產(chǎn)出近似副本不應(yīng)構(gòu)成侵權(quán)。但目前相關(guān)法律裁決多支持公司而非創(chuàng)作者。紐約時報訴訟一案讓人看到希望,但結(jié)果仍未明朗。