1月23日、24日,由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,CCF七大優(yōu)秀專委會(huì)、教育部易班發(fā)展中心、長(zhǎng)沙市科技局、長(zhǎng)沙高新區(qū)管委會(huì)、湖南大學(xué)、數(shù)聯(lián)眾創(chuàng)共同承的2020 CCF大數(shù)據(jù)與計(jì)算智能大賽(簡(jiǎn)稱CCF BDCI)決賽暨中國(guó)大數(shù)據(jù)技術(shù)大會(huì)在湖南長(zhǎng)沙圓滿落幕。
中國(guó)大數(shù)據(jù)技術(shù)大會(huì)歷經(jīng)13年,已成為大數(shù)據(jù)領(lǐng)域極具影響力的行業(yè)盛會(huì)。本屆大會(huì)邀請(qǐng)到中國(guó)科學(xué)院院士、CCF理事長(zhǎng)梅宏,中國(guó)工程院院士桂衛(wèi)華,中國(guó)科學(xué)院院士王懷民,中國(guó)工程院院士王耀南及多位學(xué)術(shù)專家、企業(yè)負(fù)責(zé)人等齊聚一堂,圍繞大數(shù)據(jù)產(chǎn)業(yè)前沿領(lǐng)域進(jìn)行分享與交流。開(kāi)幕式上,長(zhǎng)沙市政府副市長(zhǎng)邱繼興,中國(guó)科學(xué)院院士、CCF理事長(zhǎng)梅宏和湖南大學(xué)校長(zhǎng)段獻(xiàn)忠分別致辭,希冀通過(guò)此次活動(dòng)搭建交流平臺(tái),為技術(shù)創(chuàng)新、資源共享凝聚更多力量。中科院計(jì)算所副所長(zhǎng)、CCF大數(shù)據(jù)專家委員會(huì)秘書長(zhǎng)程學(xué)旗發(fā)表大賽影響力報(bào)告,探討了大賽呈現(xiàn)出大數(shù)據(jù)與AI交叉融合的趨勢(shì)。在以《大數(shù)據(jù)新十年-數(shù)字經(jīng)濟(jì)機(jī)遇與挑戰(zhàn)》為主題的院士論壇上,梅宏、王懷民、桂衛(wèi)華和王耀南四位院士分享了各自觀點(diǎn)。
(圖:《大數(shù)據(jù)新十年-數(shù)字經(jīng)濟(jì)機(jī)遇與挑戰(zhàn)》院士論壇)
現(xiàn)場(chǎng),來(lái)自高校、企業(yè)等行業(yè)內(nèi)專家與負(fù)責(zé)人圍繞大數(shù)據(jù)與AI,從不同角度進(jìn)行了精彩的分享。百度技術(shù)委員會(huì)主席吳華受邀參與,并作《知識(shí)與語(yǔ)言智能》主題演講。“自然語(yǔ)言處理是研究人和計(jì)算機(jī)之間有效溝通的理論和方法,要使計(jì)算機(jī)擁有人類的語(yǔ)言溝通以及超越人類的跨語(yǔ)言溝通能力。”吳華詳細(xì)介紹了百度自然語(yǔ)言處理方向的深耕與布局,并介紹了基于飛槳的NLP開(kāi)源算法庫(kù)PaddleNLP。
(圖:百度技術(shù)委員會(huì)主席吳華進(jìn)行演講)
吳華表示,目前自然語(yǔ)言的發(fā)展已經(jīng)歷了符號(hào)邏輯階段、淺層學(xué)習(xí)階段,現(xiàn)在正經(jīng)歷深度學(xué)習(xí)階段。在這樣的背景下,百度構(gòu)建了完整的語(yǔ)言與知識(shí)技術(shù)布局,基于產(chǎn)業(yè)級(jí)開(kāi)源深度學(xué)習(xí)平臺(tái)飛槳,研發(fā)了語(yǔ)義表示、序列標(biāo)注、文本分類等核心技術(shù),并對(duì)大眾開(kāi)源開(kāi)放。
自然語(yǔ)言處理實(shí)現(xiàn)基本常識(shí)和推理能力離不開(kāi)知識(shí)圖譜。吳華介紹道,目前已經(jīng)構(gòu)建了十億級(jí)實(shí)體、千億級(jí)事實(shí)的多元異構(gòu)知識(shí)圖譜,以醫(yī)療圖譜為例,已落地應(yīng)用并輔助國(guó)內(nèi)130余家基層醫(yī)院的基層醫(yī)生有效降低了誤診率。此外,百度知識(shí)增強(qiáng)的語(yǔ)義理解框架文心(ERNIE)大幅提升機(jī)器理解語(yǔ)言的水平,并持續(xù)推出知識(shí)增強(qiáng)視覺(jué)-語(yǔ)言預(yù)訓(xùn)練模型ERNIE-VIL、多語(yǔ)言預(yù)訓(xùn)練模型ERNIE-M、結(jié)合語(yǔ)義與結(jié)構(gòu)信息的圖神經(jīng)網(wǎng)絡(luò)模型ERNIESage等多個(gè)模型,持續(xù)有效提升視覺(jué)推斷、多語(yǔ)言任務(wù)、文本推斷的效果。
有了文本的基礎(chǔ)知識(shí),百度還提出了基于隱式知識(shí)和顯式知識(shí)的知識(shí)對(duì)話系統(tǒng):在隱式知識(shí)方面推出PLATO對(duì)話模型取得優(yōu)異效果,在顯式知識(shí)系統(tǒng)中開(kāi)發(fā)了首個(gè)基于千萬(wàn)級(jí)節(jié)點(diǎn)的對(duì)話式推薦系統(tǒng)。通過(guò)嵌入知識(shí)的模型,人機(jī)對(duì)話、機(jī)機(jī)對(duì)話得以更加流暢。
機(jī)器翻譯一直是自然語(yǔ)言處理領(lǐng)域的熱點(diǎn)之一。“百度不僅提出了基于語(yǔ)義單元的順句翻譯,使機(jī)器翻譯效果可以說(shuō)媲美人類同傳,還構(gòu)建了目前最大的中英同傳語(yǔ)料庫(kù)進(jìn)行開(kāi)源。”吳華表示,為了促進(jìn)同傳的發(fā)展,百度組織了國(guó)際同傳的Workshop和Tutorial,同時(shí)百度的同傳技術(shù)也在國(guó)內(nèi)國(guó)際上服務(wù)了如服貿(mào)會(huì)、全球人工智能博覽會(huì)等重要國(guó)際會(huì)議,都收到了良好反饋。
在不斷提升自身技術(shù)實(shí)力的同時(shí),百度聯(lián)合中國(guó)計(jì)算機(jī)學(xué)會(huì)、中文信息學(xué)會(huì)共同發(fā)布的“千言”數(shù)據(jù)共建計(jì)劃也在持續(xù)進(jìn)行著數(shù)據(jù)集與算力的共建共享。現(xiàn)場(chǎng),吳華再次發(fā)起號(hào)召,希望更多開(kāi)發(fā)者參與到千言數(shù)據(jù)共建計(jì)劃,與學(xué)界、產(chǎn)業(yè)界共同推進(jìn)技術(shù)進(jìn)步。
在以《長(zhǎng)沙大數(shù)據(jù)與人工智能產(chǎn)業(yè)發(fā)展戰(zhàn)略與對(duì)策》為主題的圓桌訪談環(huán)節(jié)中,來(lái)自湖南大學(xué)的主持人李肯立與嘉賓們圍繞“長(zhǎng)沙應(yīng)該怎樣發(fā)展大數(shù)據(jù)和人工智能產(chǎn)業(yè)”等問(wèn)題進(jìn)行了深度交流。嘉賓長(zhǎng)沙市科技局總工程師盛湘饒首先介紹了長(zhǎng)沙技術(shù)實(shí)力人才儲(chǔ)備強(qiáng),但產(chǎn)業(yè)發(fā)展方面薄弱、缺少頭部企業(yè)的情況。對(duì)此,悉尼大學(xué)教授陶大程表示,長(zhǎng)沙有機(jī)會(huì)通過(guò)政府、企業(yè)、高校三方合作促進(jìn)可信人工智能在未來(lái)產(chǎn)業(yè)的落地。吳華認(rèn)為湖南不缺人才,問(wèn)題是能否抓住機(jī)會(huì)推進(jìn)重點(diǎn)扶持創(chuàng)新創(chuàng)業(yè)的相關(guān)機(jī)制,長(zhǎng)沙立足于自身優(yōu)點(diǎn)孵化高尖企業(yè)的機(jī)會(huì)是非常大的。
(圖:《長(zhǎng)沙大數(shù)據(jù)與人工智能產(chǎn)業(yè)發(fā)展戰(zhàn)略與對(duì)策》圓桌訪談合照)
除此之外,在決賽與大會(huì)主論壇開(kāi)幕的第二天,九場(chǎng)精心策劃的線上專題技術(shù)和行業(yè)主題分論壇也相繼舉辦。百度深度學(xué)習(xí)技術(shù)平臺(tái)高級(jí)總監(jiān)馬艷軍作為“人工智能分論壇”論壇主席,與中南大學(xué)計(jì)算機(jī)學(xué)院黨委委員、副院長(zhǎng)奎曉燕,中國(guó)開(kāi)源軟件群體協(xié)同研究中心主任尹剛,湖南湘江人工智能學(xué)院執(zhí)行院長(zhǎng)謝斌,湖南師范大學(xué)信息科學(xué)與工程學(xué)院人工智能系副教授江沸菠,天津飛騰信息技術(shù)有限公司飛騰大學(xué)執(zhí)行校長(zhǎng)任巨,以及北京東方國(guó)信科技股份有限公司深度學(xué)習(xí)算法總監(jiān)李晶,在會(huì)上分享了關(guān)于人工智能下產(chǎn)業(yè)創(chuàng)新與人才培養(yǎng)的經(jīng)驗(yàn)與成果。馬艷軍表示,人工智能時(shí)代需要復(fù)合型人才,復(fù)合型人才需要了解掌握人工智能技術(shù),同時(shí)對(duì)業(yè)務(wù)、行業(yè)甚至是商業(yè)有很好的理解,這樣的人才能真正把人工智能帶到行業(yè),帶動(dòng)整個(gè)國(guó)家實(shí)體經(jīng)濟(jì)的產(chǎn)業(yè)化升級(jí)。而飛槳也正持續(xù)為復(fù)合型人才的培養(yǎng)提供著全面支持。
(圖:百度深度學(xué)習(xí)技術(shù)平臺(tái)高級(jí)總監(jiān)馬艷軍)
大會(huì)舉辦的同時(shí),2020 CCF大數(shù)據(jù)與計(jì)算智能大賽(簡(jiǎn)稱CCF BDCI)也完成了總決賽的激烈角逐。本屆大賽吸引了全球3萬(wàn)多支隊(duì)伍參賽,提交作品8萬(wàn)余件,參賽人數(shù)與競(jìng)賽成果質(zhì)量再創(chuàng)新高。決賽共有64支隊(duì)伍獲得賽道一二三等獎(jiǎng)和CCF BDCI四個(gè)特別獎(jiǎng)項(xiàng)。百度作為本次比賽的唯一戰(zhàn)略級(jí)合作伙伴,在算法賽道設(shè)置“千言:多技能對(duì)話”賽題,并在大賽首次設(shè)立的自主平臺(tái)賽道首發(fā)“遙感影像地塊分割”賽題,飛槳作為該賽題的指定深度學(xué)習(xí)平臺(tái)為選手提供技術(shù)支持。該賽題的冠軍——中國(guó)科學(xué)院大學(xué)“隨緣分割”團(tuán)隊(duì)摘取大賽含金量極高的CCF BDCI綜合特等獎(jiǎng)。
作為國(guó)內(nèi)首個(gè)開(kāi)源開(kāi)放、自主可控、功能完備的產(chǎn)業(yè)級(jí)深度學(xué)習(xí)平臺(tái),百度飛槳目前凝聚了超過(guò)265萬(wàn)開(kāi)發(fā)者,創(chuàng)造了34萬(wàn)個(gè)模型,服務(wù)10萬(wàn)家企業(yè);作為技術(shù)底座,飛槳通過(guò)百度智能云持續(xù)將AI能力輸出到各行各業(yè)實(shí)際應(yīng)用場(chǎng)景中,在城市、工業(yè)、電力、通信等領(lǐng)域發(fā)揮了重要價(jià)值。
同時(shí),作為國(guó)內(nèi)AI頭雁企業(yè),百度一直積極布局“人工智能+X”復(fù)合型人才培養(yǎng)生態(tài),以百度飛槳為核心,圍繞學(xué)習(xí)、就業(yè)、認(rèn)證、實(shí)踐、比賽等環(huán)節(jié),將高校科研人才與企業(yè)應(yīng)用人才培養(yǎng)緊密結(jié)合,綜合素質(zhì)與實(shí)踐能力培養(yǎng)雙管齊下,洞悉產(chǎn)業(yè)需求的人才培養(yǎng)標(biāo)準(zhǔn)、構(gòu)建產(chǎn)教融合的人才培養(yǎng)體系。面向高校,百度飛槳通過(guò)AI Studio學(xué)習(xí)與實(shí)訓(xùn)社區(qū)提供教學(xué)資源、實(shí)訓(xùn)項(xiàng)目和算力等支持,并“以賽促學(xué)”,舉辦各類多項(xiàng)AI競(jìng)賽。百度深度學(xué)習(xí)師資培訓(xùn)班已累計(jì)培訓(xùn)了1800多名AI專業(yè)教師,支持200余所高校開(kāi)設(shè)AI學(xué)分課提升教學(xué)師資水平。面向企業(yè),百度推出AI快車道、AI私享會(huì)、黃埔學(xué)院等進(jìn)階式培訓(xùn)渠道,讓前沿技術(shù)深入業(yè)務(wù)場(chǎng)景,為產(chǎn)業(yè)智能化賦能。截止目前,百度已經(jīng)培養(yǎng)AI人才超過(guò)100萬(wàn),未來(lái)5年百度還將培養(yǎng)500萬(wàn)AI技術(shù)與產(chǎn)業(yè)人才,為中國(guó)智能經(jīng)濟(jì)和智能社會(huì)的發(fā)展提供AI人才保障。
未來(lái),百度將持續(xù)技術(shù)創(chuàng)新,并將技術(shù)優(yōu)勢(shì)通過(guò)開(kāi)源開(kāi)放平臺(tái)與智能云賦能行業(yè)與個(gè)人,積極聯(lián)動(dòng)政府、企業(yè)、高校等多方將“產(chǎn)學(xué)研用”有機(jī)結(jié)合,加快讓AI滲透到產(chǎn)業(yè)、社會(huì)以及生活中,提速智能經(jīng)濟(jì)發(fā)展。