【ITBEAR科技資訊】7月6日消息,谷歌近日宣布其隱私政策最新調整,其中包括Bard和Cloud AI在內的人工智能服務可能會利用公開的網絡數據進行訓練。這一更新行動將使公眾更為清楚地了解谷歌在收集和使用數據方面的運作方式。
谷歌發言人克里斯塔·馬爾登(Christa Muldoon)對外表示,谷歌向來秉持隱私政策透明原則,開放網絡的公開信息是其訓練語言模型的重要資源。這次的政策更新,除了包含谷歌翻譯在內的傳統服務外,還明確包括了Bard等新服務。馬爾登強調,谷歌已將隱私原則和保障措施融入人工智能技術開發之中,以確保其與谷歌的人工智能原則保持一致。
據ITBEAR科技資訊了解,自2023年7月1日起,谷歌隱私政策的描述已明確指出,公司會“利用公開的信息來訓練谷歌人工智能模型,用于開發像谷歌翻譯、Bard以及Cloud AI等產品和功能”。新的政策也賦予了谷歌更多的自由度,允許其不僅使用公開數據訓練大型語言模型,還可以用于訓練其他類型的人工智能系統。
然而,新政策對如何防止受版權保護的內容進入訓練數據庫的具體做法并未明確。許多公開網站都明確禁止數據收集或網絡抓取行為,以避免其數據被用于訓練大型語言模型和其他人工智能工具。這也讓谷歌以及其他大型人工智能系統的開發商如GPT-4必須非常謹慎地選擇他們用于訓練模型的數據來源。
當前,法規的存在與市場競爭的加劇,使得對訓練模型的數據來源,包括社交媒體內容或藝術家作家的版權作品的使用,都需十分慎重。對于數據合理使用原則是否適用于這類人工智能應用,目前法律監管尚處于灰色地帶,諸多疑問和訴訟也隨之產生。
另一方面,包含大量公共信息的社交媒體平臺,如Twitter和Reddit近期已對其他公司獲取其平臺數據的行為采取了嚴格措施。盡管這一舉措在一定程度上減少了數據被濫用的風險,但也因改變了API現行機制,引發了用戶社區的強烈反對。
與此同時,美國最大的報紙出版商Gannett已向谷歌及其母公司Alphabet提起訴訟,認為谷歌憑借其人工智能技術在數字廣告市場中取得了進一步的壟斷地位。此外,谷歌的一些試驗性人工智能搜索產品也因被指稱為“抄襲引擎”而飽受爭議,批評者認為其導致其他網站的流量大幅減少。
面對眾多挑戰和爭議,人工智能公司如何在保護用戶隱私、尊重版權以及推動技術創新之間找到平衡,將是未來一個亟待解決的問題。