本文摘自杰夫·霍維茨(Jeff Horwitz)的新書《破碎的代碼:Facebook 的內(nèi)幕和揭露其有害秘密的斗爭(zhēng)》。經(jīng)企鵝蘭登書屋旗下的 Doubleday 出版社授權(quán)轉(zhuǎn)載。杰夫·霍維茨版權(quán)所有。
2006 年,美國(guó)專利局收到了一份申請(qǐng),專利內(nèi)容是“自動(dòng)生成的展示頁面,其中包含用戶所在社交關(guān)系網(wǎng)絡(luò)中的另一用戶的信息”。該系統(tǒng)可以避免人們?cè)?ldquo;分散且無序”的內(nèi)容中搜索感興趣的東西,而是會(huì)主動(dòng)按“偏好順序(preferred order)”生成“與其相關(guān)的”信息列表。
專利申請(qǐng)上列出的提出者是“扎克伯格等人”,對(duì)應(yīng)產(chǎn)品是新鮮事推送(新聞推送,News Feed)。
向用戶展示活動(dòng)流的想法并不新鮮,照片共享網(wǎng)站 Flickr 和其他網(wǎng)站一直在嘗試這種展示方式,但當(dāng)時(shí)在 Facebook 上帶來的變化是巨大的。在那以前,F(xiàn)acebook 用戶主要通過通知、戳一戳或查看朋友的個(gè)人資料來與網(wǎng)站互動(dòng)。
隨著新鮮事推送功能的推出,用戶可以看到不斷更新的帖子和狀態(tài)變化。這一轉(zhuǎn)變令當(dāng)時(shí)使用 Facebook 的 1000 萬用戶感到震驚,他們不喜歡自己的活動(dòng)被監(jiān)控,也不喜歡自己曾經(jīng)“沉寂已久的”個(gè)人資料被重新挖掘出來以更新信息流上的內(nèi)容。
面對(duì)廣泛的投訴,扎克伯格寫了一篇帖子,向用戶保證,“你們所做的一切不會(huì)被所有用戶看到,而是與關(guān)心你近況的人和朋友分享。”
聽見用戶的抱怨和傾聽他們的抱怨不是一回事。正如克瑞斯·考克斯(Chris Cox)后來在一次新聞發(fā)布會(huì)上指出的那樣,新鮮事推送在促進(jìn)平臺(tái)活躍度和連接用戶方面取得了立竿見影的積極效果。
用戶參與度迅速翻了一番。在該功能推出后的兩周內(nèi),超過 100 萬用戶首次共同對(duì)一件事情表現(xiàn)出了興趣。什么事情能讓這么多人團(tuán)結(jié)起來?答案是一份請(qǐng)?jiān)笗笠瞥@種“跟蹤狂”一樣的新鮮事推送功能。
事后看來,用戶反感的不透明系統(tǒng)非常簡(jiǎn)單。內(nèi)容大多按時(shí)間倒序出現(xiàn),并進(jìn)行手動(dòng)調(diào)整,以確保人們看到更受歡迎的帖子和一系列其他內(nèi)容。考克斯說:“一開始,新聞(新鮮事)推送的排名系統(tǒng)就出現(xiàn)了問題。”
在一段時(shí)間里,這種推送方式?jīng)]出現(xiàn)什么大問題。但每個(gè)人的朋友列表都在增加,F(xiàn)acebook 也推出了新功能,如廣告、頁面和興趣小組。隨著娛樂新聞、熱梗和商業(yè)內(nèi)容開始與朋友的新鮮事發(fā)生競(jìng)爭(zhēng),F(xiàn)acebook 需要確保剛剛登錄的用戶能夠在看到營(yíng)銷內(nèi)容之前看到他們最好朋友的訂婚照片,因?yàn)楹笳卟攀撬麄兏谝獾膬?nèi)容。
最初的內(nèi)容排序工作,最終被命名為“EdgeRank”排序法,是一個(gè)簡(jiǎn)單的公式,根據(jù)三個(gè)主要因素對(duì)內(nèi)容進(jìn)行優(yōu)先排序:帖子的發(fā)帖時(shí)間、參與度以及用戶和發(fā)帖者之間的相互聯(lián)系。作為一種算法,它考慮的東西并不多,只是將“帖子是新的?流行的?還是來自你關(guān)心的人的?”這三個(gè)問題轉(zhuǎn)化為數(shù)學(xué)的一次粗淺嘗試。
這背后沒什么“黑科技”或者“陰謀論”,但用戶再次對(duì) Facebook 試圖控制他們所看到的東西的舉動(dòng)表示反感。與此同時(shí),F(xiàn)acebook 的活躍度等指標(biāo)再次全面躍升。
Facebook 當(dāng)時(shí)的推薦系統(tǒng)仍處于初級(jí)階段,但用戶一面強(qiáng)烈反對(duì),一面又狂熱使用,兩者之間出現(xiàn)了巨大且不和諧的反差,這讓公司內(nèi)部出現(xiàn)了一種不可避免的結(jié)論:普通人對(duì) Facebook 機(jī)制的看法可以被忽視。用戶不停地要求“移除”這些功能,但 Facebook 不為所動(dòng),一切都在順利推進(jìn)。
到 2010 年,該公司希望改善 EdgeRank 背后粗糙的數(shù)學(xué)公式,轉(zhuǎn)而使用基于機(jī)器學(xué)習(xí)的技術(shù)推薦內(nèi)容,機(jī)器學(xué)習(xí)是人工智能技術(shù)的一個(gè)分支,專注于訓(xùn)練計(jì)算機(jī)設(shè)計(jì)自己的決策(推薦算法)。工程師們不會(huì)讓 Facebook 的系統(tǒng)根據(jù)簡(jiǎn)單的數(shù)學(xué)對(duì)內(nèi)容進(jìn)行排名,而是對(duì)其進(jìn)行編程,分析用戶行為并由其自己設(shè)計(jì)出排名公式。
人們所看到的將是不斷實(shí)驗(yàn)的結(jié)果,該平臺(tái)提供它預(yù)測(cè)的最有可能從用戶那里獲得贊的東西,并實(shí)時(shí)評(píng)估自己預(yù)測(cè)的結(jié)果。
盡管 Facebook 的產(chǎn)品越來越復(fù)雜,用戶數(shù)據(jù)的收集規(guī)模之大前所未有,但 Facebook 對(duì)用戶的了解仍然不夠,無法向他們展示個(gè)性化廣告。品牌喜歡在 Facebook 上創(chuàng)作內(nèi)容所帶來的關(guān)注和轟動(dòng),但他們覺得在該公司的平臺(tái)和產(chǎn)品上付費(fèi)沒有吸引力。
2012 年 5 月,通用汽車取消了其在 Facebook 上的全部廣告預(yù)算。一位著名的數(shù)字廣告高管宣稱,F(xiàn)acebook 廣告“從根本上說是網(wǎng)絡(luò)上表現(xiàn)最差的廣告服務(wù)之一”。
(來源:COURTESY OF THE AUTHOR)
解決這個(gè)問題的重任落在了由華金·奎諾內(nèi)羅·坎德拉(Joaquin Quiñonero Candela)管理的團(tuán)隊(duì)身上。奎諾內(nèi)羅是一名在摩洛哥長(zhǎng)大的西班牙人。2011 年,他在英國(guó)微軟從事人工智能相關(guān)工作時(shí),他的北非朋友們開始興奮地談?wù)撋缃幻襟w上瘋狂傳播的抗議活動(dòng)。
他用來優(yōu)化必應(yīng)搜索廣告的機(jī)器學(xué)習(xí)技術(shù)顯然可以用在社交網(wǎng)絡(luò)上。奎諾內(nèi)羅說:“我加入 Facebook 是因?yàn)榭吹搅税⒗骸?rdquo;
奎諾內(nèi)羅發(fā)現(xiàn),F(xiàn)acebook 構(gòu)建產(chǎn)品的方式幾乎與他們的結(jié)果一樣具有革命性。應(yīng)一位朋友的邀請(qǐng),他參觀了 Facebook 的門洛帕克園區(qū),當(dāng)他看到一位工程師對(duì) Facebook 的代碼進(jìn)行了一次重要但無監(jiān)督的更新時(shí),他感到十分震驚。
一周后,奎諾內(nèi)羅收到了 Facebook 的工作邀請(qǐng),這說明該公司的流程推進(jìn)速度比微軟快得多。奎諾內(nèi)羅開始從事廣告推薦算法相關(guān)的工作,他的時(shí)機(jī)再好不過了。
機(jī)器學(xué)習(xí)和計(jì)算速度的進(jìn)步使 Facebook 不僅可以將用戶分類到細(xì)致的人口統(tǒng)計(jì)領(lǐng)域,比如“舊金山 20 多歲的單身異性戀女性,對(duì)露營(yíng)和薩爾薩舞感興趣”,還可以發(fā)現(xiàn)他們點(diǎn)擊的內(nèi)容之間的相關(guān)性,然后利用這些信息猜測(cè)他們更適合看到哪些廣告。
最開始,這套系統(tǒng)對(duì)如何最大化廣告點(diǎn)擊率一無所知,它推送的廣告幾乎是隨機(jī)的猜測(cè)。該系統(tǒng)隨后會(huì)從點(diǎn)擊和未點(diǎn)擊的結(jié)果中吸取教訓(xùn),使用反饋來完善其預(yù)測(cè)哪些廣告最有可能成功的模型。它并非無所不知,推薦的廣告常常令人費(fèi)解。
但數(shù)字廣告的成功門檻很低:哪怕只有 2% 的用戶點(diǎn)擊了一個(gè)廣告,就可以算是成功的。由于 Facebook 平臺(tái)每天提供數(shù)十億條廣告,即使是只能產(chǎn)生一般收益的算法調(diào)整也可能增加數(shù)千萬或數(shù)億美元的收入。
奎諾內(nèi)羅的團(tuán)隊(duì)發(fā)現(xiàn),這種算法可以大量地修改和試錯(cuò)。“我告訴我的團(tuán)隊(duì)要行動(dòng)迅速,每周更新。”他說。
快速行動(dòng)很有效果。該團(tuán)隊(duì)的人工智能模型不僅改善了收入,還改善了人們對(duì)該平臺(tái)的感受。
更有針對(duì)性的廣告意味著,F(xiàn)acebook 可以在不增加廣告量的情況下提高自己從每個(gè)用戶身上賺到的錢,而且不會(huì)帶來更多問題。就算 Facebook 向青少年錯(cuò)誤地推銷假牙安固膏,也不會(huì)有人因此死掉。
廣告是 Facebook 應(yīng)用機(jī)器學(xué)習(xí)技術(shù)的前沿陣地,很快每個(gè)人都想從中分一杯羹。對(duì)于需要增加用戶活躍度的產(chǎn)品高管來說,包括加入群組、添加朋友和發(fā)布帖子數(shù)量,該技術(shù)的吸引力顯而易見。
如果奎諾內(nèi)羅的技術(shù)可以提高用戶點(diǎn)擊廣告的頻率,那么它們也可以提高用戶在平臺(tái)上參與其他一切活動(dòng)的頻率。
每一個(gè)負(fù)責(zé)內(nèi)容排名或推薦的團(tuán)隊(duì)都爭(zhēng)先恐后地對(duì)其系統(tǒng)進(jìn)行全面檢修,這引發(fā)了 Facebook 產(chǎn)品復(fù)雜性的爆炸性增長(zhǎng)。員工們發(fā)現(xiàn),最大的收獲往往不是來自深思熟慮的舉措,而是來自簡(jiǎn)單的“試錯(cuò)”。
工程師們沒有重新設(shè)計(jì)算法(因?yàn)檫@很慢),而是通過快速而骯臟的機(jī)器學(xué)習(xí)實(shí)驗(yàn)獲得了好結(jié)果。這些實(shí)驗(yàn)相當(dāng)于將數(shù)百種現(xiàn)有算法的變體扔到現(xiàn)實(shí)世界里,看看哪些版本行不通,哪些版本的用戶表現(xiàn)最好。
他們不一定知道為什么一個(gè)變量很重要,也不一定知道一種算法在預(yù)測(cè)評(píng)論的可能性方面如何優(yōu)于另一種算法。但他們可以繼續(xù)調(diào)試,直到機(jī)器學(xué)習(xí)模型產(chǎn)生了一種在統(tǒng)計(jì)學(xué)上優(yōu)于現(xiàn)有算法的算法,這就足夠了。
很難想象一種構(gòu)建系統(tǒng)的方法能更具體地體現(xiàn)“快速行動(dòng),打破一切”的口號(hào)。Facebook 還想要更多。扎克伯格向?qū)W⒂谏疃葘W(xué)習(xí)的法國(guó)計(jì)算機(jī)科學(xué)家楊立昆(Yann LeCun)示好,希望構(gòu)建能夠以受人類思維啟發(fā)的方式處理信息的計(jì)算機(jī)系統(tǒng)。
楊立昆因創(chuàng)造了使面部識(shí)別成為可能的基礎(chǔ)人工智能技術(shù)而聞名,他被扎克伯格任命負(fù)責(zé)一個(gè)部門,該部門旨在將 Facebook 置于人工智能基礎(chǔ)研究的前沿。
在廣告方面取得成功后,奎諾內(nèi)羅被賦予了同樣艱巨的任務(wù):盡快將機(jī)器學(xué)習(xí)融入公司的血液之中。
他最初領(lǐng)導(dǎo)了 20 多名員工,負(fù)責(zé)構(gòu)建新的核心機(jī)器學(xué)習(xí)工具并將其提供給公司其他部門的團(tuán)隊(duì),這個(gè)團(tuán)隊(duì)的規(guī)模在接下來的三年里不斷壯大。但它仍然遠(yuǎn)遠(yuǎn)不夠大,無法幫助每一個(gè)需要機(jī)器學(xué)習(xí)幫助的產(chǎn)品團(tuán)隊(duì)。
從頭開始構(gòu)建模型的技能太專業(yè)了,工程師們無法輕易掌握,而且你無法通過四處砸錢來增加機(jī)器學(xué)習(xí)博士的數(shù)量。
他們找到的解決方案是構(gòu)建 FB Learner,這是一種機(jī)器學(xué)習(xí)的“臨摹”版本。它將復(fù)雜深?yuàn)W的技術(shù)打包成一個(gè)模板,供那些完全不了解自己在做什么的工程師使用。
FBLearner 在 Facebook 內(nèi)部推進(jìn)機(jī)器學(xué)習(xí)的應(yīng)用,就像 wordPress/ target=_blank class=infotextkey>WordPress 等服務(wù)曾經(jīng)在網(wǎng)站構(gòu)建領(lǐng)域所做的那樣,它讓網(wǎng)站構(gòu)建不再需要使用 html 或配置服務(wù)器。
然而,這些良莠不齊的工程師正在擾亂這個(gè)迅速成為全球最大通信平臺(tái)的內(nèi)核。
Facebook 的許多員工都意識(shí)到公司外的人對(duì)人工智能的擔(dān)憂與日俱增。
由于算法的拙劣設(shè)計(jì),本來旨在獎(jiǎng)勵(lì)好醫(yī)院的算法變成了懲罰治療重病患者的醫(yī)院,而旨在量化假釋者再次犯罪風(fēng)險(xiǎn)的模型被證明會(huì)偏向于將黑人關(guān)進(jìn)監(jiān)獄。但在社交網(wǎng)絡(luò)上,這些問題似乎很遙遠(yuǎn)。
FBLearner 的一位重度用戶(員工)后來將機(jī)器學(xué)習(xí)在 Facebook 內(nèi)部的大規(guī)模傳播描述為“將火箭發(fā)射器送給 25 歲的工程師”。但當(dāng)時(shí),奎諾內(nèi)羅和該公司稱之為一場(chǎng)勝利。
Facebook 在 2016 年宣布:“工程師和團(tuán)隊(duì),即使幾乎沒有專業(yè)知識(shí),也可以輕松地構(gòu)建和運(yùn)行實(shí)驗(yàn),并比以往更快地將人工智能驅(qū)動(dòng)的產(chǎn)品部署到生產(chǎn)中。”Facebook 吹噓 FB Learner 每天攝入數(shù)萬億個(gè)用戶行為數(shù)據(jù)點(diǎn),工程師每月在這些數(shù)據(jù)點(diǎn)上進(jìn)行 50 萬次實(shí)驗(yàn)。
Facebook 收集的大量數(shù)據(jù),以及廣告定向投放結(jié)果如此之好,以至于用戶經(jīng)常(錯(cuò)誤地)懷疑該公司竊聽了他們的離線對(duì)話,甚至引發(fā)了“Facebook 了解你的一切”的說法。
這不太正確。機(jī)器學(xué)習(xí)的奇跡掩蓋了它的局限性。Facebook 的推薦系統(tǒng)是根據(jù)用戶行為之間的原始相關(guān)性來工作的,而不是通過識(shí)別用戶的口味和興趣,然后根據(jù)它們提供內(nèi)容。
新鮮事推送無法分辨你是喜歡滑冰還是騎越野自行車,喜歡嘻哈還是 K-pop,也無法用人的語言解釋為什么一個(gè)帖子出現(xiàn)在你的推送中,而不是另一個(gè)帖子。
盡管這種不可解釋性是一個(gè)明顯的缺點(diǎn),但基于機(jī)器學(xué)習(xí)的推薦系統(tǒng)表明了扎克伯格對(duì)數(shù)據(jù)、代碼和個(gè)性化的堅(jiān)定信念。他相信,F(xiàn)acebook 的算法擺脫了人類的局限、錯(cuò)誤和偏見,具有無與倫比的客觀性,也許更重要的是,它的高效率。
另一項(xiàng)機(jī)器學(xué)習(xí)工作致力于弄清楚 Facebook 推薦的帖子中到底有什么內(nèi)容。這些被稱為分類器的人工智能系統(tǒng)被訓(xùn)練用于對(duì)大量數(shù)據(jù)集進(jìn)行模式(規(guī)律)識(shí)別。
在 Facebook 創(chuàng)立的幾年前,分類器就已經(jīng)證明了自己在打擊垃圾郵件方面的重要作用。它使得電子郵件服務(wù)商不再依賴簡(jiǎn)單的關(guān)鍵詞過濾器,手段也不僅限于單純的屏蔽。
通過收集和比較大量的電子郵件,有些被標(biāo)記為垃圾郵件,有些不是垃圾郵件,機(jī)器學(xué)習(xí)系統(tǒng)可以開發(fā)自己的標(biāo)準(zhǔn)來區(qū)分它們。
一旦這個(gè)分類器被“訓(xùn)練”完成,它就會(huì)被部署到現(xiàn)實(shí)世界中,分析用戶收到的每一封電子郵件,并預(yù)測(cè)每封郵件屬于收件箱、垃圾箱或者應(yīng)該直接被屏蔽的可能性。
當(dāng)機(jī)器學(xué)習(xí)專家開始進(jìn)入 Facebook 時(shí),其分類器要回答的問題列表已經(jīng)遠(yuǎn)遠(yuǎn)超過了“這是垃圾郵件嗎?”,這在很大程度上要?dú)w功于像楊立昆這樣的人。扎克伯格看好該技術(shù)未來的進(jìn)展及其在 Facebook 產(chǎn)品中的應(yīng)用。
早在 2016 年,扎克伯格就預(yù)測(cè)分類器將在未來五到十年內(nèi)超越人類的感知、識(shí)別和理解能力,使公司能夠及時(shí)阻止不當(dāng)行為,在連接世界方面取得巨大飛躍。事實(shí)證明,這一預(yù)測(cè)過于樂觀。
即使技術(shù)進(jìn)步了,數(shù)據(jù)集增加了,處理速度加快了,機(jī)器學(xué)習(xí)的一個(gè)缺點(diǎn)仍然存在:該公司生產(chǎn)的算法一直無法解釋它做出的決策。
工程師可以通過測(cè)試分類器來評(píng)估它的成功,比如通過它的判斷結(jié)果來評(píng)估準(zhǔn)確率(precision)和召回率(recall)。(注:這兩個(gè)是機(jī)器學(xué)習(xí)領(lǐng)域常用的模型評(píng)估指標(biāo)。)
但由于該系統(tǒng)正在教會(huì)自己如何根據(jù)自己設(shè)計(jì)的邏輯來識(shí)別某些東西,所以當(dāng)它出錯(cuò)時(shí),很難找到符合人類認(rèn)知的原因。
有時(shí)錯(cuò)誤看起來毫無意義。其他時(shí)候,它們可能是系統(tǒng)性的,反映出了人為錯(cuò)誤。阿爾圖羅·貝加爾(Arturo Bejar)回憶道,在 Facebook 部署分類器來檢測(cè)色情內(nèi)容的早期,該系統(tǒng)經(jīng)常試圖選出床的圖像。
換句話說,模型沒有學(xué)會(huì)如何識(shí)別圖像中的色情內(nèi)容,而是教會(huì)了自己如何識(shí)別人們最經(jīng)常在哪些家具上進(jìn)行色情活動(dòng)。
這個(gè)問題很容易解決,工程師只需要用更多正常的床墊場(chǎng)景來訓(xùn)練模型。這聽起來有點(diǎn)搞笑,但你仔細(xì)想想,這些工程師剛剛搞砸的機(jī)器學(xué)習(xí)形式是 Facebook 內(nèi)部使用的最基本的形式之一。
類似的根本性錯(cuò)誤不斷出現(xiàn),盡管該公司開始依賴更先進(jìn)的人工智能技術(shù)來做出比“判斷色情/非色情”更重要、更復(fù)雜的決定。該公司全力投入人工智能,既要確定人們應(yīng)該看到什么,也要解決可能出現(xiàn)的任何問題。
毫無疑問,計(jì)算機(jī)科學(xué)散發(fā)著耀眼的光芒,其成果也是清晰可見的。但是 Facebook 采用機(jī)器學(xué)習(xí)的速度、廣度和規(guī)模是以可理解性為代價(jià)的。為什么 Facebook 的“猜你喜歡頁面”算法似乎如此專注于推薦某些主題?
一段關(guān)于種植牙的計(jì)算機(jī)動(dòng)畫片段是如何突破一億次瀏覽的?為什么一些新聞媒體只是重寫了其他媒體報(bào)道過的故事,卻能經(jīng)常保持病毒式的傳播量?
面對(duì)這些問題,F(xiàn)acebook 的溝通團(tuán)隊(duì)會(huì)注意到,該公司的系統(tǒng)對(duì)人們的行為做出了回應(yīng),但沒有考慮“品味”。
這些都是難以反駁的觀點(diǎn)。他們還掩蓋了一個(gè)令人不安的事實(shí):Facebook 正在以它不完全理解的方式實(shí)現(xiàn)其增長(zhǎng)。
在宣布開始使用機(jī)器學(xué)習(xí)推薦內(nèi)容和個(gè)性化廣告的五年內(nèi),F(xiàn)acebook 的系統(tǒng)將嚴(yán)重依賴那些自我訓(xùn)練的人工智能。楊立昆曾自豪地宣稱,如果沒有機(jī)器學(xué)習(xí)這項(xiàng)技術(shù),該公司的產(chǎn)品不過就是“一地塵土”而已。
支持:Ren