1月23日、24日,由中國計算機學會(CCF)主辦,CCF七大優秀專委會、教育部易班發展中心、長沙市科技局、長沙高新區管委會、湖南大學、數聯眾創共同承的2020 CCF大數據與計算智能大賽(簡稱CCF BDCI)決賽暨中國大數據技術大會在湖南長沙圓滿落幕。
中國大數據技術大會歷經13年,已成為大數據領域極具影響力的行業盛會。本屆大會邀請到中國科學院院士、CCF理事長梅宏,中國工程院院士桂衛華,中國科學院院士王懷民,中國工程院院士王耀南及多位學術專家、企業負責人等齊聚一堂,圍繞大數據產業前沿領域進行分享與交流。開幕式上,長沙市政府副市長邱繼興,中國科學院院士、CCF理事長梅宏和湖南大學校長段獻忠分別致辭,希冀通過此次活動搭建交流平臺,為技術創新、資源共享凝聚更多力量。中科院計算所副所長、CCF大數據專家委員會秘書長程學旗發表大賽影響力報告,探討了大賽呈現出大數據與AI交叉融合的趨勢。在以《大數據新十年-數字經濟機遇與挑戰》為主題的院士論壇上,梅宏、王懷民、桂衛華和王耀南四位院士分享了各自觀點。
(圖:《大數據新十年-數字經濟機遇與挑戰》院士論壇)
現場,來自高校、企業等行業內專家與負責人圍繞大數據與AI,從不同角度進行了精彩的分享。百度技術委員會主席吳華受邀參與,并作《知識與語言智能》主題演講。“自然語言處理是研究人和計算機之間有效溝通的理論和方法,要使計算機擁有人類的語言溝通以及超越人類的跨語言溝通能力。”吳華詳細介紹了百度自然語言處理方向的深耕與布局,并介紹了基于飛槳的NLP開源算法庫PaddleNLP。
(圖:百度技術委員會主席吳華進行演講)
吳華表示,目前自然語言的發展已經歷了符號邏輯階段、淺層學習階段,現在正經歷深度學習階段。在這樣的背景下,百度構建了完整的語言與知識技術布局,基于產業級開源深度學習平臺飛槳,研發了語義表示、序列標注、文本分類等核心技術,并對大眾開源開放。
自然語言處理實現基本常識和推理能力離不開知識圖譜。吳華介紹道,目前已經構建了十億級實體、千億級事實的多元異構知識圖譜,以醫療圖譜為例,已落地應用并輔助國內130余家基層醫院的基層醫生有效降低了誤診率。此外,百度知識增強的語義理解框架文心(ERNIE)大幅提升機器理解語言的水平,并持續推出知識增強視覺-語言預訓練模型ERNIE-VIL、多語言預訓練模型ERNIE-M、結合語義與結構信息的圖神經網絡模型ERNIESage等多個模型,持續有效提升視覺推斷、多語言任務、文本推斷的效果。
有了文本的基礎知識,百度還提出了基于隱式知識和顯式知識的知識對話系統:在隱式知識方面推出PLATO對話模型取得優異效果,在顯式知識系統中開發了首個基于千萬級節點的對話式推薦系統。通過嵌入知識的模型,人機對話、機機對話得以更加流暢。
機器翻譯一直是自然語言處理領域的熱點之一。“百度不僅提出了基于語義單元的順句翻譯,使機器翻譯效果可以說媲美人類同傳,還構建了目前最大的中英同傳語料庫進行開源。”吳華表示,為了促進同傳的發展,百度組織了國際同傳的Workshop和Tutorial,同時百度的同傳技術也在國內國際上服務了如服貿會、全球人工智能博覽會等重要國際會議,都收到了良好反饋。
在不斷提升自身技術實力的同時,百度聯合中國計算機學會、中文信息學會共同發布的“千言”數據共建計劃也在持續進行著數據集與算力的共建共享。現場,吳華再次發起號召,希望更多開發者參與到千言數據共建計劃,與學界、產業界共同推進技術進步。
在以《長沙大數據與人工智能產業發展戰略與對策》為主題的圓桌訪談環節中,來自湖南大學的主持人李肯立與嘉賓們圍繞“長沙應該怎樣發展大數據和人工智能產業”等問題進行了深度交流。嘉賓長沙市科技局總工程師盛湘饒首先介紹了長沙技術實力人才儲備強,但產業發展方面薄弱、缺少頭部企業的情況。對此,悉尼大學教授陶大程表示,長沙有機會通過政府、企業、高校三方合作促進可信人工智能在未來產業的落地。吳華認為湖南不缺人才,問題是能否抓住機會推進重點扶持創新創業的相關機制,長沙立足于自身優點孵化高尖企業的機會是非常大的。
(圖:《長沙大數據與人工智能產業發展戰略與對策》圓桌訪談合照)
除此之外,在決賽與大會主論壇開幕的第二天,九場精心策劃的線上專題技術和行業主題分論壇也相繼舉辦。百度深度學習技術平臺高級總監馬艷軍作為“人工智能分論壇”論壇主席,與中南大學計算機學院黨委委員、副院長奎曉燕,中國開源軟件群體協同研究中心主任尹剛,湖南湘江人工智能學院執行院長謝斌,湖南師范大學信息科學與工程學院人工智能系副教授江沸菠,天津飛騰信息技術有限公司飛騰大學執行校長任巨,以及北京東方國信科技股份有限公司深度學習算法總監李晶,在會上分享了關于人工智能下產業創新與人才培養的經驗與成果。馬艷軍表示,人工智能時代需要復合型人才,復合型人才需要了解掌握人工智能技術,同時對業務、行業甚至是商業有很好的理解,這樣的人才能真正把人工智能帶到行業,帶動整個國家實體經濟的產業化升級。而飛槳也正持續為復合型人才的培養提供著全面支持。
(圖:百度深度學習技術平臺高級總監馬艷軍)
大會舉辦的同時,2020 CCF大數據與計算智能大賽(簡稱CCF BDCI)也完成了總決賽的激烈角逐。本屆大賽吸引了全球3萬多支隊伍參賽,提交作品8萬余件,參賽人數與競賽成果質量再創新高。決賽共有64支隊伍獲得賽道一二三等獎和CCF BDCI四個特別獎項。百度作為本次比賽的唯一戰略級合作伙伴,在算法賽道設置“千言:多技能對話”賽題,并在大賽首次設立的自主平臺賽道首發“遙感影像地塊分割”賽題,飛槳作為該賽題的指定深度學習平臺為選手提供技術支持。該賽題的冠軍——中國科學院大學“隨緣分割”團隊摘取大賽含金量極高的CCF BDCI綜合特等獎。
作為國內首個開源開放、自主可控、功能完備的產業級深度學習平臺,百度飛槳目前凝聚了超過265萬開發者,創造了34萬個模型,服務10萬家企業;作為技術底座,飛槳通過百度智能云持續將AI能力輸出到各行各業實際應用場景中,在城市、工業、電力、通信等領域發揮了重要價值。
同時,作為國內AI頭雁企業,百度一直積極布局“人工智能+X”復合型人才培養生態,以百度飛槳為核心,圍繞學習、就業、認證、實踐、比賽等環節,將高??蒲腥瞬排c企業應用人才培養緊密結合,綜合素質與實踐能力培養雙管齊下,洞悉產業需求的人才培養標準、構建產教融合的人才培養體系。面向高校,百度飛槳通過AI Studio學習與實訓社區提供教學資源、實訓項目和算力等支持,并“以賽促學”,舉辦各類多項AI競賽。百度深度學習師資培訓班已累計培訓了1800多名AI專業教師,支持200余所高校開設AI學分課提升教學師資水平。面向企業,百度推出AI快車道、AI私享會、黃埔學院等進階式培訓渠道,讓前沿技術深入業務場景,為產業智能化賦能。截止目前,百度已經培養AI人才超過100萬,未來5年百度還將培養500萬AI技術與產業人才,為中國智能經濟和智能社會的發展提供AI人才保障。
未來,百度將持續技術創新,并將技術優勢通過開源開放平臺與智能云賦能行業與個人,積極聯動政府、企業、高校等多方將“產學研用”有機結合,加快讓AI滲透到產業、社會以及生活中,提速智能經濟發展。