DeepMind 聯合創始人 Mustafa Suleyman 希望構建一個聊天機器人,其功能遠不止聊天。在我最近與他的一次談話中,他告訴我生成式人工智能只是一個階段。接下來是交互式人工智能:機器人可以通過調用其他軟件和其他人來完成你為他們設置的任務。他還呼吁加強監管,并且認為這并不難實現。
蘇萊曼并不是唯一一個談論未來充滿更多自主軟件的人。但與大多數人不同的是,他擁有一家價值數十億美元的新公司 Inflection,擁有一批從 DeepMind、Meta 和 AI target=_blank class=infotextkey>OpenAI 中挑選出來的頂級人才,并且由于與 Nvidia 達成的協議,成為最大的專業人工智能硬件庫存之一在世界上。蘇萊曼已經把他的錢放到了嘴邊——他告訴我他對此既不感興趣,又想賺更多錢。
至少自 2016 年初我們第一次交談以來,Suleyman 一直堅信技術是一種向善的力量。他剛剛推出了 DeepMind Health,并與英國一些國營的地區醫療保健提供商建立了研究合作關系。
我當時工作的雜志即將發表一篇文章,聲稱 DeepMind在訪問約 160 萬患者的記錄以建立這些合作時未能遵守數據保護法規——這一說法后來得到了政府調查的支持。蘇萊曼不明白我們為什么要發表一篇敵視他的公司改善醫療保健的努力的報道。他當時告訴我,從他記事起,他就只想在這個世界上行善。
自那通電話發出以來的七年里,蘇萊曼的使命沒有發生任何改變。他在位于帕洛阿爾托的辦公室通過 Zoom 說道:“我們的目標從來都不是別的,而是如何為世界做好事。”這位英國企業家現在大部分時間都在那里度過。
Suleyman 離開 DeepMind 并轉到谷歌,領導一個致力于人工智能政策的團隊。2022 年,他創立了 Inflection,這是最熱門的新型人工智能公司之一,得到了微軟、英偉達、比爾·蓋茨和 LinkedIn 創始人里德·霍夫曼 15 億美元投資的支持。今年早些時候,他發布了一個名為Pi的 ChatGPT 競爭對手,其獨特的賣點(根據 Suleyman 的說法)是它令人愉快且有禮貌。他剛剛與作家兼研究員 Michael Bhaskar 合著了一本關于人工智能未來的書,名為《即將到來的浪潮:技術、權力和 21 世紀最大的困境》。
許多人會嘲笑蘇萊曼的技術樂觀主義——甚至是天真。例如,他關于在線監管成功的一些說法讓人感覺不太對勁。但他仍然堅信自己的信念是真誠的和福音派的。
確實,作為科技千萬富翁,蘇萊曼有著不同尋常的背景。19 歲時,他從大學退學,成立了穆斯林青年熱線,提供電話咨詢服務。他還曾在當地政府工作。他說,他將這些努力中的許多價值觀帶到了 Inflection 中。不同的是,現在他可能能夠做出他一直想要的改變——無論是好是壞。
問:你早期的職業生涯,包括青年幫助熱線和當地政府工作,是最平庸、最不硅谷的。顯然,這些東西對你很重要。從那時起,您已經在人工智能領域工作了 15 年,并于今年共同創立了您的第二家價值 10 億美元的人工智能公司。你能把這些點連起來嗎?
Suleyman:我一直對權力、政治等感興趣。你知道,人權原則基本上是一種權衡,是所有這些不同的沖突緊張局勢之間不斷進行的談判。我可以看到人類正在努力解決這個問題——我們充滿了自己的偏見和盲點。激進分子的工作、地方、國家、國際政府等等——這一切都是緩慢、低效且容易出錯的。
想象一下,如果你沒有人類的錯誤。我認為有可能構建真正反映我們最好的集體自我的人工智能,并最終代表我們做出更好的權衡,更一致、更公平。
問:這仍然是你的動力嗎?
Suleyman:當然,我的意思是,在 DeepMind 之后我再也不用工作了。我當然不必寫一本書或類似的東西。金錢從來都不是動力。你知道,這始終只是副作用。
對我來說,目標從來不是別的,而是如何為世界做好事以及如何以健康、令人滿意的方式推動世界前進。即使早在 2009 年,當我開始考慮進入技術領域時,我就可以看到人工智能代表了一種在世界上提供服務的公平而準確的方式。
我不禁想到,在 10 或 15 年前,在我們看到這項技術的許多缺點之前,說這種話會更容易。你怎樣才能保持樂觀呢?
我認為我們很關心你是樂觀主義者還是悲觀主義者。這是一種完全帶有偏見的看待事物的方式。我也不想成為這樣的人。我想冷眼面對利益和威脅。從我的立場來看,我們可以非常清楚地看到,隨著這些大型語言模型規模的每一步擴大,它們變得更加可控。
所以兩年前,談話——我當時認為這是錯誤的——是“哦,他們只會發表有毒的、反胃的、有偏見的、種族主義的長篇大論。” 我當時想,這是時間的快照。我認為人們忽視的是年復一年的進步,以及這種進步的軌跡。
例如,現在我們有了像 Pi 這樣的模型,它們的可控性令人難以置信。你不能讓 Pi 產生種族主義、恐同、性別歧視等任何有毒的東西。你無法讓它指導你生產生物或化學武器,或者支持你向鄰居的窗戶扔一塊磚頭的愿望。
問:不掛斷。告訴我你是如何實現這一目標的,因為這通常被認為是一個未解決的問題。如何確保您的大型語言模型不會說出您不希望它說出的內容?
Suleyman:是的,很明顯我不想提出這樣的要求——你知道,請嘗試這樣做!Pi 已上線,您應該嘗試所有可能的攻擊。越獄、即時黑客或任何對 Pi 都不起作用的東西。我不會提出主張。這是客觀事實。
問:關于如何——我的意思是,我不會透露太多細節,因為它很敏感。但最重要的是,我們擁有世界上最強大的團隊之一,他們創建了過去三四年來所有最大的語言模型。令人驚嘆的人們,在極其勤奮的環境中,進行大量的計算。我們從一開始就把安全放在第一位,因此 Pi 并不像其他公司的模型那么辣。
Suleyman:看看Character.ai。[角色是一個聊天機器人,用戶可以為其打造不同的“個性”并在線分享以供其他人聊天。]它主要用于浪漫的角色扮演,我們從一開始就說過這是不可能的——我們不會”不要這樣做。如果你試圖對 Pi 說“嘿,親愛的”或“嘿,小可愛”之類的話,它會立即拒絕你。
但這將是令人難以置信的尊重。如果你開始抱怨你所在社區的移民搶走了你的工作,Pi 不會對你大喊大叫,也不會對你搖手指。Pi 會詢問并提供支持,并嘗試了解這些信息從何而來,并溫和地鼓勵您產生同理心。你知道,這是我 20 年來一直在思考的價值觀。
問:談論您的價值觀并希望讓世界變得更美好,為什么不分享您是如何做到這一點的,以便其他人也可以改進他們的模型呢?
Suleyman:嗯,因為我也是一個實用主義者,我正在努力賺錢。我正在努力創辦一家企業。我剛剛籌集了 15 億美元,我需要支付這些籌碼的費用。
看,開源生態系統正在火熱進行中,并且做得非常出色,人們正在發現類似的技巧。我總是假設我只領先六個月。
問:讓我們回到你想要實現的目標。大型語言模型顯然是當前的技術。但你為什么還要押注于他們呢?
Suleyman:人工智能的第一波浪潮是關于分類的。深度學習表明,我們可以訓練計算機對各種類型的輸入數據進行分類:圖像、視頻、音頻、語言?,F在我們正處于生成浪潮中,您可以獲取輸入數據并生成新數據。
第三波將是互動階段。這就是為什么我長期以來一直堅信對話是未來的界面。你知道,你將與你的人工智能交談,而不是僅僅點擊按鈕和打字。
這些人工智能將能夠采取行動。你只需給它一個總體的、高層次的目標,它就會使用它所擁有的所有工具來實現這一目標。他們會與其他人交談,與其他人工智能交談。這就是我們要對 Pi 做的事情。
這是技術所能實現的巨大轉變。這是技術史上一個非常非常深刻的時刻,我認為很多人都低估了這一時刻。當今的技術是靜態的。粗略地說,它會執行您告訴它執行的操作。
但現在技術將變得生動起來。如果你給予它,它將有潛在的自由來采取行動。我們正在創造具有這種代理作用的工具,這確實是我們物種歷史上的一步變化。
問:這正是讓很多人擔心的言論。你想賦予機器自主權——一種機構——來影響世界,但我們也希望能夠控制它們。你如何平衡這兩件事?感覺那里有一種緊張氣氛。
Suleyman:是的,這是一個很好的觀點。這正是緊張的原因。
這個想法是人類將永遠保持指揮權。從本質上講,它是關于設定人工智能無法跨越的邊界和限制。并確保這些邊界創造了可證明的安全性,從實際代碼到與其他人工智能(或人類)交互的方式,再到創建該技術的公司的動機和激勵。我們應該弄清楚獨立機構甚至政府如何直接進入以確保這些界限不被跨越。
問:誰設定這些界限?我認為它們需要在國家或國際層面上設定。他們是如何達成一致的?
Suleyman:我的意思是,目前它們正在國際層面上提出,并提出了關于新的監督機構的各種建議。但邊界也會在微觀層面發揮作用。你將給予你的人工智能一些有限的權限來處理你的個人數據,為你提供一些問題的答案,但不能回答其他問題。
總的來說,我認為在可預見的未來,我們應該對某些能力非常謹慎,甚至排除。
問:例如?
Suleyman:我猜想是遞歸自我完善之類的事情。你不會想讓你的小人工智能在沒有你監督的情況下啟動并更新自己的代碼。也許這甚至應該是一項獲得許可的活動——你知道,就像處理炭疽或核材料一樣。
或者,我們不允許無人機出現在任何公共場所,對嗎?這是一項獲得許可的活動。你不能把它們帶到任何你想去的地方,因為它們對人們的隱私構成威脅。
我認為每個人都非??只?,因為我們無法對此進行監管。這只是無稽之談。我們完全能夠對其進行監管。我們將應用以前成功的相同框架。
問:但是當無人機在天空中時你可以看到它們。認為公司只會透露他們正在生產的產品的想法顯得很天真。這難道不會讓監管變得棘手嗎?
Suleyman:我們在網上監管了很多事情,對嗎?網上欺詐和犯罪活動的數量很少。我們在垃圾郵件方面做得很好。你知道,總的來說,復仇色情的[問題]已經有所改善,盡管三五年前情況還很糟糕。在網上找到激進內容或恐怖分子材料非常困難。在網上購買武器和毒品非常困難。
[蘇萊曼的所有主張并非都有數字支持。網絡犯罪仍然是一個嚴重的全球問題。據一些估計,在過去十年中,僅美國的財務成本就增加了100 多倍。報告顯示,未經同意的深度偽造色情內容的經濟正在蓬勃發展。毒品和槍支在社交媒體上銷售。雖然一些在線平臺被迫更好地過濾有害內容,但它們可以做得更多。]
因此,互聯網并不是一個不受監管、難以駕馭的空間。它受到管轄。人工智能將成為治理的另一個組成部分。
這需要文化壓力、制度壓力以及政府監管的共同作用。但這讓我樂觀地認為我們以前已經做到了,而且我們可以再次做到。
控制人工智能將成為互聯網監管的一個分支——這比我們最近從一些備受矚目的末日論者那里聽到的樂觀得多。
我對風險非常樂觀。我的書里有很多黑暗的東西。我肯定也看到了。我只是認為存在風險的東西完全是一種瘋狂的干擾。我們都應該討論 101 個更實際的問題,從隱私到偏見,從面部識別到在線審核。
我們應該將談話的焦點重新集中在這樣一個事實上:我們在監管超級復雜的事物方面做得非常出色??纯绰摪詈娇展芾砭郑毫钊穗y以置信的是,我們都進入了 40,000 英尺高空的錫管,而且這是有史以來最安全的運輸方式之一。我們為什么不慶祝一下呢?或者想想汽車:每個部件都在其壽命的最后一刻進行壓力測試,并且您必須擁有駕駛執照。
一些行業(例如航空公司)一開始就在自我監管方面做得很好。他們知道,如果不確保安全,每個人都會感到害怕,他們也會失去生意。
但你也需要自上而下的監管。我愛民族國家。我相信公共利益,我相信稅收和再分配的好處,我相信監管的力量。我所呼吁的是民族國家采取行動來解決問題。考慮到事關重大,現在是采取行動的時候了。
本文源自MIT Technology Review《麻省理工科技評論》。