——且看深度賦智全自動機器學習頂刊TPAMI論文
導讀:「深度賦智」首推以知識驅動的全自動機器學習架構,應用于2020四月結束的國際自動機器學習領域的頂級賽事 NeurIPS-AutoDL競賽,并以壓倒性優勢獲得世界冠軍,相關論文于近日被人工智能頂刊IEEE TPAMI接收。「深度賦智」已將該成果應用于天機自動機器學習平臺,致力于讓每家企業都具有開箱即用的AI能力。
作為國內AI行業的頂尖團隊,「深度賦智」一直專注于MetaAI技術的自主研發與落地。近日,「深度賦智」與廈門大學紀榮嶸教授聯合團隊的研究成果“Evolving Fully Automated Machine Learning via Life-Long Knowledge Anchors”(基于知識錨點進化的全自動機器學習)被IEEE TPAMI錄用。TPAMI全稱Transactions on Pattern Analysis and Machine Intelligence,是人工智能,機器視覺,模式識別等多個領域的頂尖國際期刊,對原創性有很高要求,側重于發表能引領廣泛興趣的突破性前沿研究,并以嚴苛的審稿過程著稱,收錄論文數量十分有限(當前影響因子17.861,在中國計算機學會認定的人工智能領域四個A類期刊中排名第一)。
困局
深度學習讓機器可以從大量的數據中學習經驗并加以應用,已經在圖像分類,序列標注等多個任務上取得了驚人的成果。但是,這一過程需要大量的人工干預,比如特征提取,模型選擇,參數調節等,既費時又費力。
所以專家們自然而然想到了引入自動化讓機器自己“學習如何學習”。然而機器學習的自動化離不開幾個關鍵難題:我們該教授什么知識和配備什么工具?在哪一部分實現自動化?自動化訓練如何保證穩定的效果?如何在最短時間內找到又簡單又高效的方案?
論文指出,當前的自動機器學習多是在整個流程中的某個或某幾個獨立分段實現自動化,這種“半自動”讓搜索自然受限于“次優”并導致最終結果的偏差。而且搜索空間往往“精心設計”,與自動學習的初衷相違背,實際落地時也易出現過擬合的情況。自動機器學習需要對整個網絡結構更高層、更進一步的理解。
破局
——論文提出的基于終身知識錨點的進化算法
作者創新性地提出了一種新型的全自動機器學習框架,首次打破了現有自動機器學習中各搜索空間的獨立設計,并使用數據集知識錨點加進化算法來加速搜索,解決了在超大空間搜索最優方案的設計難題。
圖1 全自動機器學習框架
承襲現有的終身學習與元學習思想,該框架中的知識錨點使用了全新的元特征和概率抽樣方法,極大減少了人工,緩解了搜索過程中的過擬合。該框架實現了全流程自動化,極大降低了機器學習應用門檻,用戶只需根據提示進行“傻瓜式”操作,自助服務,時間成本低,即使不懂算法和代碼,也不是問題。
從實驗結果可以發現,該框架在圖像/音頻/視頻/文本/表格五種模態的典型數據集上的效果都遠超當前SOTA方案,以下圖的圖像任務實驗為例:
表1 提出的框架(左)和AutoCV2第一(右)的對比
消融實驗也證明了知識錨點方法的有效性:
圖2 “各搜索方法+ 知識錨點”與原搜索方法的效果對比
使用該框架,「深度賦智」于2020年4月獲得國際自動機器學習領域的頂級賽事 NeurIPS-AutoDL系列競賽總決賽世界冠軍,在圖像/音頻/視頻/文本/表格不同場景的十個數據集上穩定獲得八項第一和均分第一,證明了該框架在不同場景的普適性。
圖3 競賽得分情況
價值
——降低AI應用門檻,助力企業走上智能化快車道
根據目前消息,「深度賦智」已將該成果應用于其自研的天機自動機器學習平臺,支持圖像/音頻/視頻/文本/表格模態的任務和多個復雜AI場景,并計劃向自動學習中引入更多數據集知識,提升搜索效率。
圖4 搜索空間設計示意
天機自動機器學習平臺是「深度賦智」產業智能化的前沿創新技術應用之一,已為零售/鞋服、工業、交易平臺、金融等行業的多個頭部客戶提供了相應服務。
在天機自動機器學習平臺的幫助下,無需花費高額的成本打造工程師團隊,有效避免AI應用成本高、周期長、效果難以保障等問題,降低時間成本和機會成本,助力企業走上智能化快車道,提升綜合競爭力。
在使用體驗上,用戶無需深入掌握數據知識,就能建立高質量的人工智能模型;無需深入學習編程知識,就能建立整套生產級人工智能應用,即使算法小白也能玩轉AI,實現事半功倍的效果。平臺從數據、模型、部署等多個方面進行了打磨,內含近百模塊組件,涉及內容理解,計算機視覺,音頻分析和數據預測等多領域國內頂尖方案,通過自動機器學習技術進行組件的銜接與調優,將復雜方案定制的成本降低到1%,克服了傳統AI產品的落地周期長、效果迭代久、投入產出比低的瓶頸,為用戶實現了超過60%的人力成本節約和顯著的凈利率提升。
圖5 全自動AI中臺=AI中臺+Full-AutoML
2021年1月,工信部印發《工業互聯網創新發展行動計劃(2021-2023年)》指出,要進一步完善新型基礎設施、彰顯融合應用成效、提升技術創新能力、健全產業發展生態和增強安全保障能力。智能化制造和個性化定制等新模式新業態的廣泛普及是融合應用成效的關鍵,智能化成為“新三年”的核心工作目標。
人工智能行業即將迎來政策紅利大年,充滿新的產業圖景、新的機遇和挑戰 。目前「深度賦智」已經匯聚了國內外高校頂尖人才,行內資深研究員、架構師,以SaaS產品提供端到端AI服務,具有豐富的行業賦能經驗,在2B/2C領域均有千億級數據的復雜AI場景定制與落地案例。在未來一段時間,將會充分發揮自己豐富的算法資源、深度的技術合作支持、不斷完善的生態資源等優勢,不斷完善MetaAI技術,持續建設全自動機器學習平臺,與更多開發者、服務商一起面向終端客戶推出更多的AI解決方案。(來源網易)