(ChinaZ.com) 5月8日消息:OpenAI 此前成功安撫了意大利數(shù)據(jù)機(jī)構(gòu),解除了該國(guó)對(duì) ChatGPT 的禁令,但其在與歐洲監(jiān)管機(jī)構(gòu)的斗爭(zhēng)仍遠(yuǎn)未結(jié)束。
今年早些時(shí)候,OpenAI 備受爭(zhēng)議的 ChatGPT 聊天機(jī)器人遭遇了一個(gè)重大的法律障礙:在意大利被禁止。意大利數(shù)據(jù)保護(hù)機(jī)構(gòu)(GPDP)指控 OpenAI 違反了歐盟的數(shù)據(jù)保護(hù)規(guī)定,該公司同意限制在解決問(wèn)題的同時(shí),限制該服務(wù)在意大利的訪問(wèn)。4 月 28 日,ChatGPT 重回該國(guó),OpenAI 輕描淡寫(xiě)地解決了 GPDP 的擔(dān)憂,而未對(duì)其服務(wù)進(jìn)行重大改變,這是一場(chǎng)明顯的勝利。
GPDP 表示歡迎 ChatGPT 所做出的變化。然而,該公司的法律問(wèn)題——以及那些構(gòu)建類(lèi)似聊天機(jī)器人的公司的問(wèn)題——可能僅僅是開(kāi)始。多個(gè)國(guó)家的監(jiān)管機(jī)構(gòu)正在調(diào)查這些 AI 工具如何收集和生成信息,引用的關(guān)注點(diǎn)從公司收集未授權(quán)的訓(xùn)練數(shù)據(jù)到聊天機(jī)器人傾向于散布誤導(dǎo)信息。在歐盟,他們適用的是《通用數(shù)據(jù)保護(hù)條例》(GDPR),這是全球最強(qiáng)的法律隱私框架之一,其影響可能遠(yuǎn)遠(yuǎn)超出歐洲。同時(shí),歐盟的立法者正在制定一項(xiàng)專(zhuān)門(mén)針對(duì) AI 的法律,很可能引領(lǐng) ChatGPT 等系統(tǒng)的新時(shí)代法規(guī)。
ChatGPT 在誤導(dǎo)信息,版權(quán)和數(shù)據(jù)保護(hù)方面的各種問(wèn)題,使其成為了眾矢之的。ChatGPT 是生成 AI 的最流行的例子之一,它是一個(gè)涵蓋根據(jù)用戶(hù)提示生成文本,圖像,視頻和音頻等工具的籠統(tǒng)總稱(chēng)。據(jù)報(bào)道,在 2022 年 11 月推出后僅兩個(gè)月內(nèi)達(dá)到每月 1 億活躍用戶(hù),成為歷史上增長(zhǎng)最快的消費(fèi)者應(yīng)用之一(OpenAI 從未確認(rèn)這些數(shù)字)。人們使用它來(lái)將文本翻譯成不同的語(yǔ)言,寫(xiě)文章和生成代碼。但批評(píng)者——包括監(jiān)管機(jī)構(gòu)——已經(jīng)強(qiáng)調(diào)了 ChatGPT 不可靠的輸出,令人困惑的版權(quán)問(wèn)題和不透明的數(shù)據(jù)保護(hù)做法。
意大利是第一個(gè)采取行動(dòng)的國(guó)家。3 月 31 日,它指出了四種 OpenAI 違反 GDPR 的方式:允許 ChatGPT 提供不準(zhǔn)確或誤導(dǎo)性信息,未通知用戶(hù)其數(shù)據(jù)收集做法,未滿足六種可能的個(gè)人數(shù)據(jù)處理法律正當(dāng)理由,以及未適當(dāng)?shù)胤乐?13 歲以下的兒童使用該服務(wù)。GPDP 下令 OpenAI 立即停止使用在 ChatGPT 的訓(xùn)練數(shù)據(jù)中收集的個(gè)人信息。
其他國(guó)家尚未采取任何行動(dòng)。但是自 3 月以來(lái),至少有三個(gè)歐盟國(guó)家(德國(guó),法國(guó)和西班牙)對(duì) ChatGPT 發(fā)起了自己的調(diào)查。與此同時(shí),加拿大正在根據(jù)其《個(gè)人信息保護(hù)和電子文件法案》(PIPEDA)評(píng)估隱私問(wèn)題。歐洲數(shù)據(jù)保護(hù)委員會(huì)(EDPB)甚至建立了一個(gè)專(zhuān)門(mén)的任務(wù)組,幫助協(xié)調(diào)調(diào)查。如果這些機(jī)構(gòu)要求 OpenAI 進(jìn)行更改,它們可能會(huì)影響該服務(wù)對(duì)全球用戶(hù)的運(yùn)行。
監(jiān)管機(jī)構(gòu)的關(guān)注點(diǎn)可以被廣泛分為兩類(lèi):ChatGPT 的訓(xùn)練數(shù)據(jù)來(lái)自何處以及 OpenAI 如何向其用戶(hù)提供信息。
ChatGPT 使用的是 OpenAI 的 GPT-3.5 和 GPT-4 大型語(yǔ)言模型(LLM),這些模型基于大量的人類(lèi)產(chǎn)生的文本進(jìn)行訓(xùn)練。OpenAI 對(duì)使用的具體訓(xùn)練文本持保密態(tài)度,但表示其依靠「各種許可,創(chuàng)造和公開(kāi)可用的數(shù)據(jù)來(lái)源,其中可能包括公開(kāi)可用的個(gè)人信息。」
這可能會(huì)在 GDPR 下帶來(lái)巨大的問(wèn)題。該法律于 2018 年頒布,覆蓋從歐盟公民那里收集或處理數(shù)據(jù)的所有服務(wù),無(wú)論負(fù)責(zé)該服務(wù)的組織所在何處。GDPR 規(guī)定,公司在收集個(gè)人數(shù)據(jù)之前必須取得明確同意,并為收集數(shù)據(jù)提供法律合理性,并透明地說(shuō)明如何使用和存儲(chǔ)數(shù)據(jù)。
歐洲監(jiān)管機(jī)構(gòu)聲稱(chēng),圍繞 OpenAI 訓(xùn)練數(shù)據(jù)的保密性意味著無(wú)法確認(rèn)進(jìn)入其中的個(gè)人信息是否最初是在用戶(hù)同意的情況下提供的,GPDP 特別指出,OpenAI 一開(kāi)始就「沒(méi)有法律依據(jù)」收集這些信息。到目前為止,OpenAI 和其他公司幾乎沒(méi)有受到審查,但這一說(shuō)法給未來(lái)的數(shù)據(jù)抓取工作增加了一個(gè)大問(wèn)題。
此外,GDPR 的「被遺忘權(quán)」允許用戶(hù)要求公司糾正其個(gè)人信息或完全刪除它。OpenAI 預(yù)先更新了其隱私政策以促進(jìn)這些要求,但在將特定數(shù)據(jù)分離成這些大型語(yǔ)言模型后,處理它們可能非常復(fù)雜,這引發(fā)了爭(zhēng)議。OpenAI 還直接從用戶(hù)處收集信息。與任何互聯(lián)網(wǎng)平臺(tái)一樣,它收集各種標(biāo)準(zhǔn)用戶(hù)數(shù)據(jù)(例如姓名,聯(lián)系信息,銀行卡詳細(xì)信息等)。但是,更重要的是,它記錄用戶(hù)與 ChatGPT 的交互。正如 FAQ 中所述,該數(shù)據(jù)可以由 OpenAI 的員工進(jìn)行審核,并用于訓(xùn)練其模型的未來(lái)版本??紤]到人們使用 ChatGPT 提問(wèn)的親密問(wèn)題——將機(jī)器人當(dāng)作治療師或醫(yī)生使用——這意味著該公司正在收集各種敏感數(shù)據(jù)。
至少有一些數(shù)據(jù)可能是從未成年人那里收集的,因?yàn)?OpenAI 的政策規(guī)定「不會(huì)故意從 13 歲以下的兒童那里收集個(gè)人信息」,但沒(méi)有嚴(yán)格的年齡確認(rèn)門(mén)檻。對(duì)于不允許從 13 歲以下的人那里收集數(shù)據(jù),并且(在某些國(guó)家)要求 16 歲以下的未成年人獲得父母同意的歐盟規(guī)定來(lái)說(shuō),這并不是好的政策。在擔(dān)憂 ChatGPT 的未成年人篩選問(wèn)題方面,GPDP 聲稱(chēng),ChatGPT 缺乏年齡過(guò)濾,會(huì)暴露未成年人接觸「完全不適合其成長(zhǎng)和自我意識(shí)水平」的回答。OpenAI 在使用這些數(shù)據(jù)方面擁有廣泛的自由度,這讓一些監(jiān)管機(jī)構(gòu)感到擔(dān)憂,存儲(chǔ)數(shù)據(jù)也存在安全風(fēng)險(xiǎn)。像三星和 JPMorgan 這樣的公司已經(jīng)禁止員工使用生成 AI 工具,因?yàn)樗麄儞?dān)心員工會(huì)上傳敏感數(shù)據(jù)。實(shí)際上,在 ChatGPT 遭受?chē)?yán)重?cái)?shù)據(jù)泄露,暴露用戶(hù)的聊天記錄和電子郵件地址后,意大利宣布禁用該應(yīng)用。
ChatGPT 提供錯(cuò)誤信息的傾向也可能會(huì)帶來(lái)問(wèn)題。GDPR 法規(guī)規(guī)定所有個(gè)人數(shù)據(jù)必須準(zhǔn)確無(wú)誤,這一點(diǎn)在 GPDP 的聲明中得到強(qiáng)調(diào)。這可能會(huì)對(duì)大多數(shù) AI 文本生成器造成困擾,因?yàn)樗鼈內(nèi)菀壮霈F(xiàn)「幻覺(jué)」:即對(duì)問(wèn)題作出事實(shí)不正確或不相關(guān)的回答。在其他地方已經(jīng)看到這種現(xiàn)象帶來(lái)一些真實(shí)的后果,澳大利亞一個(gè)地區(qū)的市長(zhǎng)因 ChatGPT 錯(cuò)誤地聲稱(chēng)他因貪污入獄而威脅起訴 OpenAI 誹謗他。ChatGPT 的廣泛應(yīng)用和目前在 AI 市場(chǎng)上的主導(dǎo)地位使其成為一個(gè)特別有吸引力的目標(biāo),但它的競(jìng)爭(zhēng)對(duì)手和合作伙伴,如擁有 Bard 的谷歌或 OpenAI 的 Azure AI,也可能面臨審查。在 ChatGPT 之前,意大利還禁止了聊天機(jī)器人平臺(tái) Replika 收集未成年人信息,至今仍然被禁用。雖然 GDPR 是一套強(qiáng)大的法律,但它并不是為解決 AI 特定問(wèn)題而制定的。然而,一些可以解決這些問(wèn)題的規(guī)定可能已經(jīng)在視野范圍內(nèi)。
2021 年,歐盟提交了第一份《人工智能法》(AIA)的草案,這部立法將與 GDPR 一起制定。該法案根據(jù)人們對(duì) AI 工具的風(fēng)險(xiǎn)評(píng)估對(duì)其進(jìn)行管理,從「最小」(例如垃圾郵件過(guò)濾器)到「高」(用于執(zhí)法或教育的 AI 工具)或「不可接受」,并因此被禁用(如社會(huì)信用體系)。在去年出現(xiàn)像 ChatGPT 這樣的大型語(yǔ)言模型的激增之后,立法者現(xiàn)在正在趕快增加「基礎(chǔ)模型」和「通用人工智能系統(tǒng)(GPAIs)」的規(guī)則——這是指包括 LLMs 在內(nèi)的大規(guī)模 AI 系統(tǒng)——并有可能把它們歸為「高風(fēng)險(xiǎn)」服務(wù)。
AIA 的規(guī)定不僅超出了數(shù)據(jù)保護(hù)的范疇。最近提出的一項(xiàng)修正案將強(qiáng)制公司披露用于開(kāi)發(fā)生成 AI 工具的任何版權(quán)材料。這可能會(huì)暴露曾經(jīng)的機(jī)密數(shù)據(jù)集,使更多的公司容易受到侵權(quán)訴訟的攻擊,而這已經(jīng)打擊了一些服務(wù)。
專(zhuān)門(mén)制定 AI 法規(guī)的法律可能要等到 2024 年才會(huì)在歐洲生效,但達(dá)成該法律可能需要一段時(shí)間。歐盟立法者于 4 月 27 日就 AI 法案達(dá)成了臨時(shí)協(xié)議。委員會(huì)將在 5 月 11 日對(duì)草案進(jìn)行投票,最終提案預(yù)計(jì)在 6 月中旬公布。然后,歐洲理事會(huì)、議會(huì)和委員會(huì)將不得不解決任何懸而未決的爭(zhēng)議,然后才能實(shí)施該法律。如果一切順利,它可能會(huì)在 2024 年下半年被采納。
目前,意大利和 OpenAI 的爭(zhēng)議提供了一個(gè)早期的案例,展示了監(jiān)管機(jī)構(gòu)和 AI 公司如何進(jìn)行談判。如果 OpenAI 在 9 月 30 日之前無(wú)法創(chuàng)建一個(gè)更嚴(yán)格的年齡門(mén)檻以防止 13 歲以下的未成年人進(jìn)入,并要求年齡在 13 歲以上的未成年人獲得父母的同意,那么它可能會(huì)再次被封鎖。但這提供了一個(gè)示范,說(shuō)明歐洲認(rèn)為什么是一個(gè)合適的 AI 公司行為——至少在新法規(guī)發(fā)布之前是這樣。