
3月14日,據國外媒體報道,谷歌(微博)旗下人工智能公司DeepMind的AlphaGo程序擊敗韓國圍棋冠軍李世石(Lee Se-dol),成為近年來人工智能領域少有的里程碑事件。但是AlphaGo至今還只是個程序,甚至不是谷歌的主要項目。但DeepMind創始人杰米斯·哈薩比斯(Demis Hassabis)不久前曾說過,DeepMind想要解決“智慧問題”,而他對如何實現這個目標有很多想法。
哈薩比斯本人擁有不同尋常的經歷,但對實現“解決智慧問題”的目標似乎非常有用。這位國際象棋神童曾五次獲得腦力奧林匹克運動會(Mind Sports Olympiad)全能腦力王(Pentamind)稱號,年輕時即在英國電腦游戲開發商Bullfrog和Lionhead中聲名鵲起,曾幫助研發人工智能游戲《主題公園》、《黑或白》等,此后組建了自己的工作室Elixir。在2000年中期,哈薩比斯離開游戲行業,并獲得神經系統科學博士學位,2010年創建了DeepMind。
AlphaGo首次戰勝李世石后,哈薩比斯接受了美國科技媒體網站The Verge記者薩姆·拜福德(Sam Byford)專訪,除了探討AlphaGo,他還暢談了視頻游戲、下一代智能手機助手、DeepMind在谷歌承擔的角色、機器人以及人工智能如何幫助科學研究等話題。文章摘要如下:
1.AlphaGo成為人工智能研究領域的“圣杯”
拜福德:對于那些不怎么了解人工智能或AlphaGo的人,你如何描述昨天發生的“文化共鳴”現象?
哈薩比斯:AlphaGo已經達到完美信息游戲的巔峰,圍棋遠比國際象棋復雜得多,所以它始終是人工智能研究面臨的“圣杯”或“巨大挑戰”,特別是自“深藍”以來。眾所周知,盡管我們進行了很多努力,但距離目標依然很遙遠。10年前,蒙特卡洛樹搜索研究是一大創新,但我認為AlphaGo引入了直覺方面的神經網絡,這才是區分最頂級棋手的關鍵。
拜福德:當你看到AlphaGo下棋時,你會為其特定動作感到驚訝嗎?
哈薩比斯:我會,我們都感到非常震驚。我認為李世石也是如此,這從他的面部表情就可看出來。比如當AlphaGo將棋子下入左側,深入李世石的領地后,我想那是個出人意料的舉動。
拜福德:因為這代表侵略性?
哈薩比斯:的確,代表著侵略性和無畏。此外,AlphaGo也在以李世石擅長的策略發動反擊。李世石向來以創造性攻擊戰聞名,而我們也正期望如此。游戲開始時,李世石開始在整個棋盤上布局,對于傳統電腦為其程序來說,它們在這方面始終存在短板。它們善于局部計算,但是當放眼全局時,它們的表現就會很糟糕。
拜福德:最初舉行次類比賽的重要原因是評估AlphaGo的能力,你從它與李世石的首場對戰中有什么感悟嗎?
哈薩比斯:我猜我們應該繼續沿著當前方向研究,這并未出乎我們的預料。我們曾告訴人們,我們認為比賽勝負難料。我認為任何事都可能發生,我知道李世石可能會采取不同的戰略。因此我認為接下來的比賽更值得期待。
剛剛談及了AlphaGo對于人工智能研究的重要意義,現在我回答你的第一個問題:AlphaGo與深藍的差異。深藍是“手工研發”的程序,程序員篩選國際象棋大師的信息,將其轉化為具體規則和啟發,而我們為AlphaGo植入了學習能力,它可以通過練習和學習積累更多經驗,這與人類更為相似。
2.最終將被用于解決現實世界大問題
拜福德:如果AlphaGo繼續以同樣方式獲勝,接下來要做什么,將來是否繼續人工智能PK人類的游戲?
哈薩比斯:我認為對于完美信息游戲來說,圍棋就是巔峰。當然,可能還有其他頂級圍棋大師與之對戰,有些游戲也非常困難,多名玩家參戰也將產生更大挑戰,因為那將不再是完美信息游戲。此外還有各種各樣的視頻游戲,人類的表現也遠超過計算機,比如韓國游戲《星際爭霸》。在非完美信息世界中,戰略游戲要求更高水平的策略能力,這被稱為“永遠不可能感知到整個世界”。在圍棋游戲中,你可以在棋盤上一目了然地看到全局,對于計算機來說相對容易。
拜福德:你對親手打贏《星際爭霸》游戲感興趣嗎?
哈薩比斯:或許。在一定程度上,我們只對那些有助于我們研究計劃的東西感興趣。DeepMind的目標不僅僅是獲得游戲勝利,還要從中獲得樂趣和啟發。但從個人角度來說,我喜歡玩游戲,我也曾開發過電腦游戲。可是從某種程度上說,它們又都是試驗臺,即嘗試編寫算法并對其進行測試的平臺。最終,我們希望能將技術應用于解決現實世界的難題。

拜福德:我在20世紀90年代末的英國長大,曾在電腦雜志上看到過你的名字,將其與許多雄心勃勃的游戲聯系起來。當我首次聽說DeepMind和看到你的名字時,我就想“它們很相配”。你能描述下你此前在游戲行業的經歷對你現在從事的工作的影響嗎?
哈薩比斯:創建類似DeepMind這樣的公司一直是我的終極目標,我已經為此準備了20多年。如果你了解我曾做過的全部事情,最后會發現它們都是人工智能研究的開始,這也是我選擇現在這條路的初衷。如果你熟悉我在Bullfrog的工作,你會發現人工智能是我所編寫所有代碼的核心。我16歲開始開發《主題公園》,對我來說,那是開創性的時刻,讓我意識到人工智能的強大,以及我們應該如何繼續擴展它。我們出售了數百萬份游戲拷貝,許多人都喜歡玩這款游戲,因為人工智能適應了你的游戲方式。我們繼續前進,試圖在我的游戲生涯中取得更大進展,此后我重返大學進修,因為我在2000時覺得通過開發游戲過程中留下的后門,會讓人工智能研究越走越遠。但這很難,畢竟開發商只希望開發流行游戲。
拜福德:游戲是人工智能最明顯的應用嗎?
哈薩比斯:我認為是如此,我們正研發非常先進的人工智能。在我20世紀90年代讀大學時,這些新技術還沒有真正流行起來,比如神經網絡、深度學習、強化學習等。因此,實際上最好的人工智能都被應用在游戲中。但它們不是我們正在研發的學習型人工智能,而是屬于有限態機器(finite-state machines),但它們依然十分復雜。《黑或白》等游戲使用了強化學習技術,我認為它依然是這款游戲中最復雜的技術。但是在2004年到2005年,游戲行業顯然與20世紀90年代不同,變得更有趣、更有創意,你只需想出創意,就可開發任何游戲。但這個行業也變得不再有趣,為此我開始收集不同信息,準備創建DeepMind。我希望從大腦如何解決問題方面獲得靈感,為此選擇了攻讀神經科學博士學位。
3.學習型人工智能將提升游戲行業整體水平
拜福德:這或許是短期可實現的目標,你將發揮人工智能優勢,并將它們應用到當今游戲中?
哈薩比斯:坦白地說,很多領域都可使用人工智能技術,我也很喜歡那樣做。但是限于帶寬的束縛,我們的重點將集中于醫療和推薦系統等。但我認為,這將是個巨大的市場,如果擁有智能適應性人工智能對手,我認為游戲開發者將會喜歡它,他們在開發每款游戲時無需再開發新的人工智能,或許他們只需在自己的游戲中訓練人工智能即可。
拜福德:我可以想到,當你在家中打視頻游戲時,可能因為沒有非玩家角色而到異常沮喪。
哈薩比斯:的確如此,在大型多玩家游戲中,這總是令我感到很沮喪,因為非玩家角色通常都非常沉默。他們沒有任何記憶,沒有任何改變,沒有任何背景。但我認為,如果有了學習型人工智能,視頻游戲的整體水平將獲得極大提高。
拜福德:將來你開發的人工智能將主要應用于醫療、智能手機助手以及機器人方面。在醫療方面,IBM的人工智能Watson已經在診斷癌癥方面取得很大進展,DeepMind的目標是什么?

哈薩比斯:DeepMind的開發還處于早期階段。我們已經與NHS結為合作伙伴,但才剛剛開始開發可用于醫療領域的機器學習平臺。我認為Watson的目標與我們完全不同,與我對人工智能的理解也有差異。它就像一個專家系統,屬于完全不同的人工智能。我認為你將看到我們的人工智能對圖片進行醫學診斷,然后縱向追蹤生命體征或量化自我,幫助人們過上更健康的生活方式。我認為那非常適合使用強化學習。
拜福德:與NHS合作后,你們推出的應用似乎并未太多使用人工智能或機器學習技術,這是為什么?為何NHS使用這款軟件,而其他組織未采用?
哈薩比斯:就我個人理解,NHS的軟件相當糟糕,因此我認為首先應幫助其實現現代化。他們的系統不支持移動技術,許多技術都非常落后,這令人十分沮喪。我認為,對于醫生、護士來說,這會導致他們效率低下。因此,首先需要幫助他們獲得更有用的工具,比如可視化和基本統計等工具。我們將開始研發這些軟件,此后更復雜的機器學習技術將被融入其中。
拜福德:推銷這種技術容易嗎?顯然,在英國投資醫療是個有爭議的話題。
哈薩比斯:我們都是免費提供技術,這應該令其更容易推銷。這與大多數軟件公司可能截然不同。幾乎開發這種軟件的都是跨國大公司,它們并非真正在乎用戶,而我們以初創企業的方式去設計它,真正傾聽來自用戶的反饋,并且不斷重新設計它。
4.智能手機助手應該變得更智能化
拜福德:我們再談談智能手機助手。我看到你曾在演示中播放科幻愛情片《她》的幻燈片,那是你的終極目標嗎?
哈薩比斯:我認為,《她》只是很容易流行和接受的主流觀點,我們都認為智能手機助手實際上應該更加智能化,能夠識別語境,可以深入了解你正嘗試要做的事情。但與此同時,大多數此類系統都是預編程的。這意味著,一旦你去掉了預編程,它們就變得全無用處。因此,我們將開發適應性更強、更靈活、更強大的智能手機助手。
拜福德:在這些改進中需要哪些技術突破?為何我們不能在近期內實現?
哈薩比斯:我只是認為你需要不同的方法。再次強調下,這是預編程與機器學習的重要區別。目前幾乎所有智能手機助手都是預編程的,那意味著它們相當脆弱,只能做些程序員設定的事情。而現實世界卻非常混亂和復雜,用戶會做各種各樣提前不可預知的事情。在DeepMind,我們認為這是基礎性原則,開發人工智能的唯一方式就是通過學習和練習積累經驗。
拜福德:AlphaGo也是從被教導許多游戲模式開始的,如何才能用于輸入方式各不相同的智能手機?
哈薩比斯:有無數相關數據,你可以從中學習。實際上,AlphaGo算法就是未來數月我們研發的重點,我們認為它可以擺脫最初的監督式學習,完全進入自我發揮的學習模式。這可能花費更長時間,因為當你隨機去玩游戲時需要更長時間訓練,期間還需要測試,有時候會出現錯誤。但我們認為,這才是純粹的學習方式。
拜福德:這是因為當前算法已經支持這種可能嗎?
哈薩比斯:不,我們以前曾做到過。它不會讓程序更強大,只是純粹的學習,無需進行監督。我們認為這種算法可在沒有監督的情況下運行。我們去年開發的雅達利(Atari)游戲不會啟動任何人類知識,僅僅在屏幕上隨機學習。
拜福德:這是否更容易,因為失敗狀態變得更明顯?
哈薩比斯:這的確更容易,因為分數變得更常見。在圍棋中,你真正需要的就是得分,不論你在最后輸贏。這就是所謂的“信貸分配問題”:當你在圍棋中走了100步后,你卻不知道哪一步是確保你獲勝或導致你輸棋的關鍵,因此信號相當弱。然而在雅達利游戲中,你正在做的大多數事情都會以分數的形式展示出來,因此更有跡可循。

拜福德:你能做出預測,人們使用的智能手機何時會出現明顯進步嗎?
哈薩比斯:我認為在未來2到3年中,你會看到智能手機發生巨大變化。我的意思是,手機將出現非常微妙的變化,某些方面變得更好。或許在4到5年后,你會開始看到智能手機性能發生更大改變。
5.谷歌支持對AlphaGo非常重要
拜福德:你已經確定了所有的未來可能性,這些是與谷歌存在的最明顯聯系。你認為這種技術適用于谷歌產品或業務模式嗎?
哈薩比斯:不,在優化研究進展方面,我們有相當大的自主權。這是我們的使命,也是我們加入谷歌的初衷。但這可能需要數年時間。當然,我們實際上也參與到許多谷歌內部產品開發中,但都處于早期階段,因此還不方便現在加以討論。智能手機助手是非常核心的部分,我認為桑達爾·皮查伊(Sundar Pichai)已經多次提及,這對谷歌的未來非常重要。
拜福德:谷歌還有其他項目,比如Google Brain。谷歌也在推出機器學習功能,比如Google Photos以及大批面向用戶的東西。你發現自己與Google Brain互動了嗎?是否存在重疊部分?
哈薩比斯:當然,實際上我們是互補的,每周都會進行交流。Google Brain主要集中在深度學習方面,擁有杰夫·迪恩(Jeff Dean)等優秀工程師,為此他們已經擴散至公司的每個角落,這也是我們為何對Google Photos搜索取得如此大的進展感到驚訝的原因。此外,他們駐扎在山景城,距離產品團隊更近,研究周期僅為12到18個月。而我們的算法開發周期更長,為此最初可能與產品沒有太多交集。
拜福德:谷歌對AlphaGo的支持有多重要,沒有這種支持你們能取得成功嗎?
哈薩比斯:谷歌的支持非常重要,AlphaGo實際上還沒有應用到硬件上,我們需要許多硬件訓練它。我們還需要研發不同版本,讓它們在云端互相對戰。這可能需要大量硬件支持才能有效,因此如果沒有谷歌提供的資源,我們無法短期內取得進展。
6.機器人將來或許會幫助找到新粒子
拜福德:談到機器人,我曾去過日本,這個國家將自己視為機器人的“精神家園”。我看到機器人在日本主要有兩種使用方式:Fanuc等公司制造的工業機器人,可以為固定目標做很多令人驚訝的事情。而軟銀開發的禮賓式機器人Pepper,在某些方面更具雄心,但使用有限。你對這種情況如何看待?
哈薩比斯:我認為,正如你所說,Fanuc的機器人擁有很強的物理能力,但它們缺少智慧。禮賓式機器人有點兒像智能手機助手,但也僅是根據預編程對固定問題做出解答。如果你不按常理出牌,它們就會陷入混亂。
拜福德:所以我想,顯而易見的問題是,機器學習等技術將提高機器人能力。
哈薩比斯:這只是完全不同的方法。你正在建立新的能力去學習新東西和處理意外事件,我認為你需要將機器人或軟件應用到現實世界中,與真實用戶互動,它們需要有這樣的能力并正確使用。我認為學習路徑最終必須是正確方式。
拜福德:你認為學習型機器人最直接的應用是什么?

哈薩比斯:實際上,我們對此還沒有太多考慮。顯然,無人駕駛汽車也是一種機器人,但它們只是狹隘的人工智能,盡管它們利用了學習型人工智能的某些功能充當計算機視覺。特斯拉的計算機視覺技術也是基于深度學習開發的。我相信,日本的老年護理機器人、家用清潔機器人也是如此,我認為它們都將非常有用。特別是在人口老齡化時代,它將有助于緩解社會壓力。
拜福德:為什么學習型人工智能如此重要?
哈薩比斯:你必須思考下:為何我們現在還沒有這些東西?為何我們還沒有能夠自動清理房屋的機器人?原因是,每個房屋的布局、家居等各不相同。即使在你自己的房子中,其每天的狀態也絕不一樣,有時候會顯得混亂不堪,有時候則十分整潔。因此你沒法對機器人進行預編程,以方便其幫你整理房間。此外,還需要考慮到你的個人喜好,比如你喜歡如何疊衣服等。實際上這是個非常復雜的問題,人類做這些事很容易,但機器人處理卻非常復雜。
拜福德:你有機器人真空吸塵器嗎?
哈薩比斯:我有一個,但它不是非常管用。
拜福德:我也有一個,它的確不是特別有用,但我發現自己好像已經習慣了使用它,因為我很懶惰,其帶來的好處顯而易見。因此,我想知道我們何時能夠獲得更先進的機器人?足夠好的機器人的臨界點在何處?
哈薩比斯:我認為每個人都可能購買定價合理的機器人,它可幫你清洗盤子和整理屋子。這些漂亮的真空吸塵器非常受歡迎,但它們還沒有智力。因此,我認為每次改進都將促使更先進的機器人誕生。
拜福德:你對人類、機器人以及人工智能將來的互動持何種愿景?
哈薩比斯:我本人沒有太多考慮過機器人的問題。但我對在科學中使用這種人工智能感到興奮,它可以促使科學以更快步伐前進。我希望看到人工智能輔助科學,你可以有效地使用人工智能助手,幫你完成單調乏味的工作,尋找看起來有趣的文章,在大量數據中發現規律,幫助人類科學家更快取得突破等。我認為,如果將來人工智能可以參與到發現新粒子的研究中,那將非常酷。