日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

如今距離OpenAI第一次將ChatGPT帶給大眾用戶已經過去了半年之久,但畢竟再好的東西都有“保質期”,所以隨著時間的推移,大眾圍繞AI大模型的狂熱也逐漸褪去、其暗面也開始被大量討論。且不提早已被擺在臺面上的AI大模型生成內容可能存在版權風險,以及AI的倫理道德等過于虛無縹緲的話題,僅僅就其竊取用戶隱私這個問題,就足以讓外界對大模型提起十二萬分的注意了。

圖片

近日,美國一家律師事務所向加州北區聯邦法院提起集體訴訟,指控OpenAI和微軟使用互聯網抓取的信息來訓練ChatGPT時,嚴重侵犯了大量用戶的版權和隱私,要求后者賠償30億美元。在這份長達157頁的訴狀中,原告指責OpenAI盡管制定了購買和使用個人信息的協議,但包括賬戶信息、姓名、聯系方式、支付信息、聊天記錄等隱私數據都在未經許可的情況下,被OpenAI和微軟收集、存儲、共享和披露。

如果說這家律所指控OpenAI和微軟更多的是在博眼球,那么網絡安全公司Home Security Heroes公布的一份研究數據,則可能更具現實意義。在該公司對蘋果App Store的研究中發現,有四分之三的AI相關應用與第三方共享用戶數據。而在接受調查的159個應用中發現,64%的應用會跟蹤用戶的個人數據,其中監控用戶數據比例最大的一款AI應用是Brainly(一款數學求解應用)。

圖片

除此之外,Google Assistant與第三方共享了超過35.71%的用戶數據,語言教育應用Duolingo、圖像生成應用AI Arta和DaVinci,以及AI醫療應用K Health則分別與第三方共享了多達28.57%的用戶數據。根據Home Security Heroes方面的說法,從整體來看,有54%的AI應用會跟蹤用戶數據。

毫無疑問,這樣的一組數字是相當驚人的,畢竟App Store應該是目前對應用審核最為嚴格的應用商店,而蘋果也是當下對用戶隱私保護力度最強的消費電子企業。因此也可想而知,在Android生態中,AI應用竊取用戶數據的情況大概率只會更加嚴重。

事實上,與第三方分享用戶數據自Meta的“劍橋門”以來,就是被整個行業非常忌諱的一件事,也很容易讓用戶聯想到企業本身對于個人隱私持漠視態度,因此近年來也是各大應用商店嚴防死守的一點。

圖片

比如蘋果在App Store的審核指南中就明確寫到,“從App中收集的數據不能與第三方共享,用于與提升用戶體驗、軟件/硬件性能無關的功能,自助廣告必需遵守《蘋果開發者計劃許可協議》”。既然向第三方分享用戶數據是一個被蘋果禁止的行為,那么為什么這一大批AI應用會選擇糊弄蘋果的審核人員,冒著被移出App Store的風險也要這樣干呢?

其實這是因為AI應用對于數據有著幾乎永無止境的渴求,它們像饕餮一般吞噬數據、以訓練自家的模型。而AI的智能則是以數據為支撐的,機器學習/深度學習技術的底座就是大量數據,也就是著名AI科學家吳恩達教授倡導的Data-centric AI,它是一種以數據為中心的人工智能理念,強調數據在人工智能開發和應用中的重要性。

圖片

傳統搭建AI模型的方法主要是聚焦迭代模型,數據也相對固定,通常會聚焦于幾個基準數據集,然后設計各式各樣的模型去提高預測準確率。但這一模式的缺陷也非常突出,準確率高的模型只能確保“擬合”數據,并不一定意味著實際應用中會有很好的表現,如今也已經被邊緣化,目前用更大規模和更高質量的數據來訓練AI,則成為了主流。

以OpenAI的GPT模型為例,從GPT-1到ChatGPT、再到GPT-4,所用的訓練數據大體經歷了以下變化,小數據規模數據——大規模數據——更大規模、更高質量的數據——大規模的人類標注的高質量數據。畢竟所謂語言模型的訓練和學習,就是從大量的數據中學習復雜的上下文聯系。而為了獲得更多的數據,OpenAI更是四處出擊,例如它就以每年200萬美元的價格獲得了推特推文數據的訪問權限。

圖片

如果沒有持續的數據輸入,ChatGPT就不可能完成向GPT-4的“進化”,而兩者間的一個顯著區別,就是ChatGPT的數據只截止到2021年、缺乏2022年及之后的數據。沒錯,隨著AI大模型概念的走紅,AI相關企業如今已然成為了數據交易市場的大買家。

也正是因為這一事實,導致了現階段數據本身的價格水漲船高,掌握數據源頭的企業已經開始哄抬物價。以前段時間鬧出不小風波的Reddit為例,其所給出第三方抓取5000萬次內容需支付12000美元的價格,顯然就已經很高。

出于對數據的渴求,以及數據本身的價格原因,AI應用的開發者自然就有了強烈的從應用內收集用戶數據、并分享給第三方的動力。對于當下的絕大多數AI應用而言,變賣數據或許是它們現階段所能找到、最具可行性的掙錢方式。而且目前會去下載AI應用的用戶,基本都是對AI感興趣的人群,如何讓這一部分用戶的價值變得更大,顯然開發者沒有理由不動心。

圖片

事實上,肆意挖掘用戶隱私現象的泛濫,對于尚且稚嫩的AI生態本身而言有著極大的傷害,因此有識之士也紛紛站出來疾呼。谷歌DeepMind的首席商務官Colin Murdoch就表示,督促AI開發者專注于構建一個“強大而負責任”的社群。只是想要遏制AI應用的開發者違規挖掘用戶數據,還得應用商店加強審核才行。

【來源:三易生活】

分享到:
標簽:數據 用戶 模型 第三方 榮耀 蘋果 這一 開發者
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定