上周末,2018全球人工智能技術大會(GAITC)在北京國家會議中心舉行。大會以“交叉、融合、相生、共贏”為主題,力圖用新技術和科研成果繪制出最為清晰的AI新時代版圖。
會上,一點資訊技術副總裁王元元作了題為“信息流中的算法”的主題演講,并在隨后的互動環節中提醒年輕的工程師們,要用更長遠的眼光來優化算法,如果簡單粗暴處理,算法的上限會非常明顯。

算法助力信息流
從門戶網站到自媒體興起,如今網絡上每天產生的內容數以百萬計。王元元指出,信息流在某種意義上成為移動互聯網時代搜索的下一代,并通過算法取得巨大成功,其原因有兩個要素:
一、同樣都是信息分發,信息流領域有“清晰和簡單”的業務目標和商業目標。平臺的目標可以轉換成用戶的時長、用戶的刷新次數、用戶的廣告點擊次數、用戶的廣告轉換的次數。
二、流量越大,數據規模越大,反過來對達成更好的業務目標提供了非常重要的數據基礎。
王元元介紹說,一點資訊現在擁有5900萬日活,自媒體作者有68萬+,每天產生接近五六十萬的包括短視頻、圖文的內容。這些提供了非常重要的內容基礎。再加上每天人均接近1小時的使用時長,用戶產生了極其豐富的數據供工程師們進行優化。
“我從2012年開始做信息流相關的創業,經歷了信息流行業的興起、快速發展的階段,”王元元介紹說,算法目前主要用于處理以下問題:
一、內容結構化是否成熟?從早期的熱詞和主題的分析,再到后期對內容質量的分析、權威度的分析、熱度的分析,都是在對內容進行更深一步的理解,進行更多的結構化的工作。
隨著數據量的膨脹,系統對推薦內容的理解需要從傳統的簡單結構分析過渡到更多的富有“人的知識“的結構判定,這樣的結構背后所要做的算法工作十分龐大。
二、用戶畫像是否全面?平臺需要利用用戶的行為,包括用戶和產品的交互行為去分析用戶的一些基礎特征,包含用戶的人性屬性特征、興趣特征。
三、分發過程是否精準?用到的算法包括協同過濾、相關性模型、點擊率模型,這些是在搜索開始非常常見的問題。但是在信息流領域中,它可能結合著信息流的特點,有一些新的工作。協同過濾的推薦是在數據達到一定規模之后,會讓分發效率有一次質的飛躍,用戶都會覺得看到的內容更好玩、更有趣,協同過濾的效果是非常好的。
在一點資訊,“深度學習”的推薦技巧已經應用到整個內容分發層面,從技術上說,提升效率是算法和AI最擅長的。
效率和價值如何平衡:從單一化的休閑娛樂朝著多元化的價值滿足過渡
然而,隨著信息流行業的迅猛發展,信息流行業也遇到了監管問題。如果信息流單純提供一些抓人眼球的內容,用戶的黏性無法得到保證,監管風險也是非常巨大的。

如何平衡效率和價值?王元元指出,影響算法最關鍵的是兩個要素:數據、目標。現在效率的來源是大數據,但如果只依賴數據,最后一定會出現“指標優化“的情況。以一點資訊算法工作為例,王元元認為:“我們并不以點擊為單一目標,而是綜合如分享、時長這樣的目標,把一個單目標優化的問題變成了多目標優化的問題,這也是我們現在工作中一直在不停做的。”
事實上,一點資訊一直以來就選擇了“用戶正確”的路徑。當多數平臺全面擁抱機器算法時,以算法技術領先立足的一點資訊最先看到了“矯枉過正”的潛在風險,首家在業內提出了“人機結合”模式,讓掙扎于“信息繭房”中苦不得脫的用戶以盡量舒服的姿勢滿足眼睛和大腦對內容獲取的需求。所謂“人機結合”是一點資訊算法和人工編輯的雙重保障,是平臺對優質內容和用戶的雙向尊重。讓算法負責效率,讓人工掌舵內容;由算法開拓用戶對興趣內容的邊界,由人工把握對內容風險的控制。
青年科學家如何“智造”AI產業
在隨后的圓桌論壇上,王元元還就AI的未來發表自己的看法:隨著內容越來越豐富,用戶的需求也越來越復雜,我們越來越需要借助于AI的理解能力,以及用AI的方法去滿足。
作為一名青年算法工作者,他同時也對同行提出了一些建議:看到算法優勢的同時,也要深入理解我們所面臨要解決的問題。如果只去解決那些比較簡單的問題,用的方法又比較粗暴,算法的上限會非常明顯,同時很可能讓我們這個行業都面臨巨大的風險。
“近期以來看到,單純強調算法短期效率讓行業都遭受了一些困難,這個困難是非常大的。”他說,“在這個方面,AI的從業者應該在實際工作當中,更深入地思考、對算法的優化要更長遠。”
