ChatGPT 在意大利恢復上線但 OpenAI 在歐盟的監(jiān)管麻煩才剛剛開始-魔扣目錄

(ChinaZ.com) 5月8日消息:OpenAI 此前成功安撫了意大利數(shù)據(jù)機構(gòu)，解除了該國對 ChatGPT 的禁令，但其在與歐洲監(jiān)管機構(gòu)的斗爭仍遠未結(jié)束。

OpenAI，ChatGPT，人工智能，AI

今年早些時候，OpenAI 備受爭議的 ChatGPT 聊天機器人遭遇了一個重大的法律障礙：在意大利被禁止。意大利數(shù)據(jù)保護機構(gòu)（GPDP）指控 OpenAI 違反了歐盟的數(shù)據(jù)保護規(guī)定，該公司同意限制在解決問題的同時，限制該服務(wù)在意大利的訪問。4 月 28 日，ChatGPT 重回該國，OpenAI 輕描淡寫地解決了 GPDP 的擔憂，而未對其服務(wù)進行重大改變，這是一場明顯的勝利。

GPDP 表示歡迎 ChatGPT 所做出的變化。然而，該公司的法律問題——以及那些構(gòu)建類似聊天機器人的公司的問題——可能僅僅是開始。多個國家的監(jiān)管機構(gòu)正在調(diào)查這些 AI 工具如何收集和生成信息，引用的關(guān)注點從公司收集未授權(quán)的訓練數(shù)據(jù)到聊天機器人傾向于散布誤導信息。在歐盟，他們適用的是《通用數(shù)據(jù)保護條例》（GDPR），這是全球最強的法律隱私框架之一，其影響可能遠遠超出歐洲。同時，歐盟的立法者正在制定一項專門針對 AI 的法律，很可能引領(lǐng) ChatGPT 等系統(tǒng)的新時代法規(guī)。

ChatGPT 在誤導信息，版權(quán)和數(shù)據(jù)保護方面的各種問題，使其成為了眾矢之的。ChatGPT 是生成 AI 的最流行的例子之一，它是一個涵蓋根據(jù)用戶提示生成文本，圖像，視頻和音頻等工具的籠統(tǒng)總稱。據(jù)報道，在 2022 年 11 月推出后僅兩個月內(nèi)達到每月 1 億活躍用戶，成為歷史上增長最快的消費者應(yīng)用之一（OpenAI 從未確認這些數(shù)字）。人們使用它來將文本翻譯成不同的語言，寫文章和生成代碼。但批評者——包括監(jiān)管機構(gòu)——已經(jīng)強調(diào)了 ChatGPT 不可靠的輸出，令人困惑的版權(quán)問題和不透明的數(shù)據(jù)保護做法。

意大利是第一個采取行動的國家。3 月 31 日，它指出了四種 OpenAI 違反 GDPR 的方式：允許 ChatGPT 提供不準確或誤導性信息，未通知用戶其數(shù)據(jù)收集做法，未滿足六種可能的個人數(shù)據(jù)處理法律正當理由，以及未適當?shù)胤乐?13 歲以下的兒童使用該服務(wù)。GPDP 下令 OpenAI 立即停止使用在 ChatGPT 的訓練數(shù)據(jù)中收集的個人信息。

其他國家尚未采取任何行動。但是自 3 月以來，至少有三個歐盟國家（德國，法國和西班牙）對 ChatGPT 發(fā)起了自己的調(diào)查。與此同時，加拿大正在根據(jù)其《個人信息保護和電子文件法案》（PIPEDA）評估隱私問題。歐洲數(shù)據(jù)保護委員會（EDPB）甚至建立了一個專門的任務(wù)組，幫助協(xié)調(diào)調(diào)查。如果這些機構(gòu)要求 OpenAI 進行更改，它們可能會影響該服務(wù)對全球用戶的運行。

監(jiān)管機構(gòu)的關(guān)注點可以被廣泛分為兩類：ChatGPT 的訓練數(shù)據(jù)來自何處以及 OpenAI 如何向其用戶提供信息。

ChatGPT 使用的是 OpenAI 的 GPT-3.5 和 GPT-4 大型語言模型（LLM），這些模型基于大量的人類產(chǎn)生的文本進行訓練。OpenAI 對使用的具體訓練文本持保密態(tài)度，但表示其依靠「各種許可，創(chuàng)造和公開可用的數(shù)據(jù)來源，其中可能包括公開可用的個人信息。」

這可能會在 GDPR 下帶來巨大的問題。該法律于 2018 年頒布，覆蓋從歐盟公民那里收集或處理數(shù)據(jù)的所有服務(wù)，無論負責該服務(wù)的組織所在何處。GDPR 規(guī)定，公司在收集個人數(shù)據(jù)之前必須取得明確同意，并為收集數(shù)據(jù)提供法律合理性，并透明地說明如何使用和存儲數(shù)據(jù)。

歐洲監(jiān)管機構(gòu)聲稱，圍繞 OpenAI 訓練數(shù)據(jù)的保密性意味著無法確認進入其中的個人信息是否最初是在用戶同意的情況下提供的，GPDP 特別指出，OpenAI 一開始就「沒有法律依據(jù)」收集這些信息。到目前為止，OpenAI 和其他公司幾乎沒有受到審查，但這一說法給未來的數(shù)據(jù)抓取工作增加了一個大問題。

此外，GDPR 的「被遺忘權(quán)」允許用戶要求公司糾正其個人信息或完全刪除它。OpenAI 預先更新了其隱私政策以促進這些要求，但在將特定數(shù)據(jù)分離成這些大型語言模型后，處理它們可能非常復雜，這引發(fā)了爭議。OpenAI 還直接從用戶處收集信息。與任何互聯(lián)網(wǎng)平臺一樣，它收集各種標準用戶數(shù)據(jù)（例如姓名，聯(lián)系信息，銀行卡詳細信息等）。但是，更重要的是，它記錄用戶與 ChatGPT 的交互。正如 FAQ 中所述，該數(shù)據(jù)可以由 OpenAI 的員工進行審核，并用于訓練其模型的未來版本。考慮到人們使用 ChatGPT 提問的親密問題——將機器人當作治療師或醫(yī)生使用——這意味著該公司正在收集各種敏感數(shù)據(jù)。

至少有一些數(shù)據(jù)可能是從未成年人那里收集的，因為 OpenAI 的政策規(guī)定「不會故意從 13 歲以下的兒童那里收集個人信息」，但沒有嚴格的年齡確認門檻。對于不允許從 13 歲以下的人那里收集數(shù)據(jù)，并且（在某些國家）要求 16 歲以下的未成年人獲得父母同意的歐盟規(guī)定來說，這并不是好的政策。在擔憂 ChatGPT 的未成年人篩選問題方面，GPDP 聲稱，ChatGPT 缺乏年齡過濾，會暴露未成年人接觸「完全不適合其成長和自我意識水平」的回答。OpenAI 在使用這些數(shù)據(jù)方面擁有廣泛的自由度，這讓一些監(jiān)管機構(gòu)感到擔憂，存儲數(shù)據(jù)也存在安全風險。像三星和 JPMorgan 這樣的公司已經(jīng)禁止員工使用生成 AI 工具，因為他們擔心員工會上傳敏感數(shù)據(jù)。實際上，在 ChatGPT 遭受嚴重數(shù)據(jù)泄露，暴露用戶的聊天記錄和電子郵件地址后，意大利宣布禁用該應(yīng)用。

ChatGPT 提供錯誤信息的傾向也可能會帶來問題。GDPR 法規(guī)規(guī)定所有個人數(shù)據(jù)必須準確無誤，這一點在 GPDP 的聲明中得到強調(diào)。這可能會對大多數(shù) AI 文本生成器造成困擾，因為它們?nèi)菀壮霈F(xiàn)「幻覺」：即對問題作出事實不正確或不相關(guān)的回答。在其他地方已經(jīng)看到這種現(xiàn)象帶來一些真實的后果，澳大利亞一個地區(qū)的市長因 ChatGPT 錯誤地聲稱他因貪污入獄而威脅起訴 OpenAI 誹謗他。ChatGPT 的廣泛應(yīng)用和目前在 AI 市場上的主導地位使其成為一個特別有吸引力的目標，但它的競爭對手和合作伙伴，如擁有 Bard 的谷歌或 OpenAI 的 Azure AI，也可能面臨審查。在 ChatGPT 之前，意大利還禁止了聊天機器人平臺 Replika 收集未成年人信息，至今仍然被禁用。雖然 GDPR 是一套強大的法律，但它并不是為解決 AI 特定問題而制定的。然而，一些可以解決這些問題的規(guī)定可能已經(jīng)在視野范圍內(nèi)。

2021 年，歐盟提交了第一份《人工智能法》（AIA）的草案，這部立法將與 GDPR 一起制定。該法案根據(jù)人們對 AI 工具的風險評估對其進行管理，從「最小」（例如垃圾郵件過濾器）到「高」（用于執(zhí)法或教育的 AI 工具）或「不可接受」，并因此被禁用（如社會信用體系）。在去年出現(xiàn)像 ChatGPT 這樣的大型語言模型的激增之后，立法者現(xiàn)在正在趕快增加「基礎(chǔ)模型」和「通用人工智能系統(tǒng)（GPAIs）」的規(guī)則——這是指包括 LLMs 在內(nèi)的大規(guī)模 AI 系統(tǒng)——并有可能把它們歸為「高風險」服務(wù)。

AIA 的規(guī)定不僅超出了數(shù)據(jù)保護的范疇。最近提出的一項修正案將強制公司披露用于開發(fā)生成 AI 工具的任何版權(quán)材料。這可能會暴露曾經(jīng)的機密數(shù)據(jù)集，使更多的公司容易受到侵權(quán)訴訟的攻擊，而這已經(jīng)打擊了一些服務(wù)。

專門制定 AI 法規(guī)的法律可能要等到 2024 年才會在歐洲生效，但達成該法律可能需要一段時間。歐盟立法者于 4 月 27 日就 AI 法案達成了臨時協(xié)議。委員會將在 5 月 11 日對草案進行投票，最終提案預計在 6 月中旬公布。然后，歐洲理事會、議會和委員會將不得不解決任何懸而未決的爭議，然后才能實施該法律。如果一切順利，它可能會在 2024 年下半年被采納。

目前，意大利和 OpenAI 的爭議提供了一個早期的案例，展示了監(jiān)管機構(gòu)和 AI 公司如何進行談判。如果 OpenAI 在 9 月 30 日之前無法創(chuàng)建一個更嚴格的年齡門檻以防止 13 歲以下的未成年人進入，并要求年齡在 13 歲以上的未成年人獲得父母的同意，那么它可能會再次被封鎖。但這提供了一個示范，說明歐洲認為什么是一個合適的 AI 公司行為——至少在新法規(guī)發(fā)布之前是這樣。